Philosophiascientiae 1879

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 192

Philosophia Scientiæ

Travaux d'histoire et de philosophie des sciences

23-2 | 2019
Expérimentation dans les sciences de la nature
Expérimentation dans les sciences humaines et
sociales
Catherine Allamel-Raffin, Stéphanie Dupouy et Jean-Luc Gangloff (dir.)

Édition électronique
URL : http://journals.openedition.org/philosophiascientiae/1879
DOI : 10.4000/philosophiascientiae.1879
ISSN : 1775-4283

Éditeur
Éditions Kimé

Édition imprimée
Date de publication : 24 mai 2019
ISBN : 978-2-84174-933-1
ISSN : 1281-2463

Référence électronique
Catherine Allamel-Raffin, Stéphanie Dupouy et Jean-Luc Gangloff (dir.), Philosophia Scientiæ, 23-2 |
2019, « Expérimentation dans les sciences de la nature Expérimentation dans les sciences humaines
et sociales » [En ligne], mis en ligne le 01 janvier 2021, consulté le 30 mars 2021. URL : http://
journals.openedition.org/philosophiascientiae/1879 ; DOI : https://doi.org/10.4000/
philosophiascientiae.1879

Tous droits réservés


Expérimentation
dans les sciences de la nature

Expérimentation
dans les sciences humaines et sociales
Introduction.
Philosopher sur l’expérimentation
scientifique : bilan et perspectives

Catherine Allamel-Raffin
Université de Strasbourg, Archives Henri-Poincaré –
Philosophie et Recherches sur les Sciences et les Technologies
(AHP-PReST, UMR 7117) (France)

Stéphanie Dupouy
Université de Strasbourg, Archives Henri-Poincaré –
Philosophie et Recherches sur les Sciences et les Technologies
(AHP-PReST, UMR 7117) (France)

Jean-Luc Gangloff
Université de Strasbourg, Archives Henri-Poincaré –
Philosophie et Recherches sur les Sciences et les Technologies
(AHP-PReST, UMR 7117) (France)

Le projet à l’origine de ce dossier thématique est celui d’une étude compa-


rative de l’expérimentation telle qu’elle apparaît dans les sciences de la nature
et dans les sciences humaines et sociales. Il illustre et prolonge les réflexions
d’un séminaire de recherche sur le même sujet, organisé par Catherine Allamel-
Raffin, qui s’est tenu pendant deux ans (2017-2018) à l’université de Strasbourg
grâce à un financement de la Misha (Maison Interuniversitaire des Sciences de
l’Homme – Alsace). Les pages qui suivent présentent quelques-uns des constats
et des propositions qui ont constitué le point de départ de ce travail collectif.

Philosophia Scientiæ, 23(2), 2019, 5–18.


6 Catherine Allamel-Raffin, Stéphanie Dupouy & Jean-Luc Gangloff

1 Bref historique de la recherche sur


l’expérimentation au sein de la
philosophie générale des sciences

Parallèlement à celle des historiens et des sociologues, la contribution des


philosophes à la réflexion sur l’expérimentation scientifique a été importante
tout au long du xxe siècle. Durant la première moitié de celui-ci, l’expéri-
mentation (ou plutôt le couple observation/expérimentation, les deux concepts
étant alors englobés sous un concept plus général d’épreuve ou de confirmation
empirique) s’est vue conférer une fonction épistémologique centrale, celle de
fondement de la connaissance scientifique, lui permettant de se démarquer
de la métaphysique ou des pseudosciences. La place prépondérante accordée
à l’expérimentation ainsi qu’à l’observation par les positivistes logiques et
par Popper, dans les processus de vérification ou de corroboration-réfutation
des hypothèses, l’a toutefois été dans le cadre restrictif d’une méthodologie
déterminée, à savoir l’analyse logique du langage scientifique [Carnap 1934],
[Popper 1934], [Nagel 1961]. Une telle démarche, féconde à son échelle, pouvait
inciter à se pencher sur des questions telles que celles de la nature ou du statut
des énoncés protocolaires par exemple. Elle négligeait en revanche de mettre en
œuvre une réflexion approfondie sur les pratiques expérimentales effectives – et
ce de manière légitime en vertu de l’agenda philosophique qui la sous-tendait
et ne l’orientait pas dans cette direction. La philosophie des sciences de la fin
du xxe siècle, quant à elle, a peu à peu restitué son épaisseur et sa complexité
au moment expérimental, jusqu’alors réduit à un simple point de contact,
instantané et passif, avec la nature. Elle va s’intéresser aux savoir-faire, aux
ajustements progressifs, et aux décisions que l’expérimentation met en œuvre,
ainsi qu’à l’environnement matériel et social qui la rendent possible.

Comme on le sait, cette place de l’expérimentation en tant qu’objet d’étude


au sein de la philosophie des sciences a été reconsidérée en deux étapes au cours
du xxe siècle. La première étape a revêtu la forme de ce que l’on a appelé le
« tournant historique », initié notamment par l’ouvrage de Thomas S. Kuhn
[Kuhn 1962] qui recommandait l’abandon de la méthodologie normative au
profit de l’étude des communautés de scientifiques et des paradigmes au sein
desquels ceux-ci développent leurs recherches. Dans les années 1980, le « tour-
nant pratique » [Soler, Zwart et al. 2014], dans le cadre duquel Ian Hacking a
joué un rôle moteur, a permis de préciser, au travers de nombreuses études de
cas, en quel sens on peut considérer que « l’expérimentation a sa vie propre »
[Hacking 1983, 150]. Les travaux entrepris alors ont eu des visées multiples.
L’une d’entre elles a consisté à réévaluer la subordination de l’expérience à la
théorie généralement admise par les philosophes des sciences (aussi bien dans
la tradition positiviste que dans l’héritage de Kuhn qui insistait sur la charge
théorique des observations), avec pour finalité ultime de rendre compte de la
Introduction. Philosopher sur l’expérimentation scientifique 7

diversité des modes d’interaction entre théorie et expérience et de la variété


des styles de raisonnement scientifique :

En aucune manière je n’essaie de valoriser l’expérience au dé-


triment de la théorie. Je cherche avant tout à faire voir la ri-
chesse, la complexité et la variété de la vie scientifique. La théo-
rie n’est pas une, mais multiple, et l’expérimentation n’est pas
une, mais multiple. La philosophie des sciences a été appauvrie
non seulement par son obsession de la théorie, mais aussi par
l’idée orgueilleuse et vaine qu’il n’y aurait, si ce n’est un seul,
au plus deux types de théories, par exemple les vraies théories
[real theories] et les principes de liaison [bridge principles]. Le
mouvement de libération de l’expérimentation a eu non seulement
pour but de rendre compréhensible l’activité expérimentale, mais
aussi d’améliorer les conditions de réception des théories – tout
en rendant la distinction théorie/expérience, si ce n’est obsolète,
certainement moins univoque. [Hacking 2005, 68–69]

La lignée de philosophes des sciences s’inscrivant dans cette perspective


(parfois réunis sous l’étiquette de « nouvel expérimentalisme ») a effective-
ment tenté de saisir la complexité des relations entre théories et expérience
et a mis l’accent sur la diversité des fonctions de l’expérimentation tout en
répertoriant les ressources mobilisées dans le cadre de cette dernière [Galison
1987, 1997], [Franklin 1986, 1990, 2016], [Hon 1989, 2003], [Radder 2003],
[Galavotti 2004]. Quelles sont les contraintes théoriques et expérimentales à
l’œuvre dans le travail des chercheurs au sein du laboratoire ? Quel statut
épistémologique convient-il de conférer à l’instrumentation [Baird 2004], [Harré
2003] ? Quels sont plus généralement les constituants de l’investigation empi-
rique dans les sciences [Franklin 1986, 1990, 2016], [Hacking 1992], [Hon 1989,
2003] ? Parallèlement à ces interrogations nouvelles traitées par les philosophes
des sciences, la question de l’expérimentation a été abordée par des auteurs
appartenant au courant des « études sociales sur la science » (ESS) [Collins
1985], [Gooding, Pinch et al. 1989], [Latour & Woolgar 1979], [Pickering 1984,
1992, 1995]. Les conclusions des études de cas réalisées par ces auteurs ont
visé à récuser le principe selon lequel une preuve empirique en faveur d’une
hypothèse peut constituer un argument décisif dans le cadre d’une entreprise
de confirmation ou de réfutation de cette dernière. La perspective plus large
dans laquelle s’inscrivent les travaux des ESS est celle d’une remise en question
d’une conception atemporelle et désintéressée de la rationalité, au profit d’une
vision de la recherche scientifique comme essentiellement déterminée par le
contexte historique et social. Des lignes de fracture sont de ce fait apparues
entre nouveaux expérimentalistes et auteurs des ESS, et le débat s’est déplacé
d’une réflexion sur la place de l’expérimentation dans le cadre des processus
d’investigation scientifique, à l’affirmation ou au rejet d’un relativisme épis-
témique plus ou moins assumé, celui-ci prenant pour argument le caractère
8 Catherine Allamel-Raffin, Stéphanie Dupouy & Jean-Luc Gangloff

jugé non déterminant de certaines expérimentations effectives, observées par


les sociologues, dans la justification des résultats.
Ces dissensions n’ont pas cessé à ce jour. Or, on peut remarquer que, sauf
exception, les termes du débat ont toujours été posés au sein d’un champ
d’investigation empirique limité aux sciences de la nature [Pickering 1984],
[Collins 2001], [Allamel-Raffin & Gangloff 2015], [Soler, Zwart et al. 2014]. La
nature même de la controverse justifiait en effet ici de partir des sciences expé-
rimentales (la physique au premier chef) dans lesquelles l’idéal de falsifiabilité
empirique, pour la conception positiviste classique, paraissait le plus assuré. De
ce fait, sans constituer délibérément un point aveugle, l’expérimentation dans
les sciences humaines et sociales est donc très largement restée hors champ de
ces controverses entre philosophes et sociologues des sciences.

2 L’épistémologie des sciences humaines


et sociales et la question de
l’expérimentation
Bien qu’elle constitue aujourd’hui un domaine de recherche en pleine ex-
pansion, l’épistémologie générale des sciences humaines et sociales n’a pas
non plus fait de l’expérimentation (ni même de l’observation) un point fo-
cal de ses analyses. Faut-il rappeler d’abord que bon nombre de disciplines
des sciences humaines n’utilisent pas du tout l’expérimentation ou ne le font
que très marginalement ? L’épistémologie des sciences humaines a donc gé-
néralement privilégié d’autres objets et niveaux d’analyse : par exemple les
débats concernant le mode d’intelligibilité propre à ces sciences – leur na-
ture interprétative ou explicative ; le problème de savoir si leur visée dernière
consiste à connaître des généralités ou des singularités ; les questions d’on-
tologie relatives au mode d’existence des entités mentales ou collectives ; le
bien-fondé du postulat de la rationalité comme réquisit explicatif du compor-
tement humain ; ou encore l’objectivité qu’il convient d’attribuer aux sciences
humaines et sociales, plus susceptibles encore que les sciences de la nature de
confondre l’empirique et le normatif, la science et la politique [Ogien 2001]. La
question de l’expérimentation se trouve alors parfois posée dans ce champ
sous d’autres rubriques, par exemple dans le cadre d’une réflexion sur la
capacité des sciences humaines à tester leurs assertions [Popper 1965], ou
sur les effets d’interaction entre observateurs et sujets observés – prophé-
ties auto-réalisatrices, effets de boucle [Martin 1994]. De manière générale,
le tournant pratique de la philosophie des sciences n’a encore rencontré qu’as-
sez peu d’échos en épistémologie générale des sciences humaines et sociales1 .
En témoigne par exemple l’absence habituelle d’entrée « expérimentation »

1. Ian Hacking constitue là encore une exception [Hacking 1999].


Introduction. Philosopher sur l’expérimentation scientifique 9

dans les dictionnaires de philosophie des sciences sociales ou dans les manuels
classiques d’épistémologie des sciences sociales2 .
Au sein de telle ou telle discipline des sciences humaines, en revanche, la
thématique qui fait l’objet de ce numéro a donné lieu à des réflexions appro-
fondies. Les praticiens de certaines de ces disciplines ont en effet souvent, et
parfois de longue date, produit des réflexions méthodologiques riches et variées
sur la question de savoir si leur science était ou non susceptible d’utiliser la
méthode expérimentale, sur les différences de cette méthode avec l’observation,
s’il existait plusieurs formes, plus ou moins littérales, de méthodes expérimen-
tales, ou si l’expérimentation posait des biais particuliers (ou nécessitait des
précautions spécifiques) dans leur discipline par rapport aux sciences de la
nature. Plus généralement, ils se sont parfois intéressés à la « bonne manière »,
pour leur discipline, de conduire une expérimentation ou aux ficelles du métier
d’expérimentateur – ceci étant également vrai, mutatis mutandis, des pratiques
d’observation. La psychologie, notamment, devenue (pour partie) expérimen-
tale dès le milieu du xixe siècle, a non seulement développé une longue tradition
de réflexion sur l’expérimentation psychologique, mais présente l’originalité
d’avoir fait de cette question un objet d’étude lui-même expérimental, par
exemple dans les travaux précoces d’Alfred Binet sur la suggestibilité du sujet
d’expérience [Binet 1900], ou dans les recherches systématiques entreprises,
dans le sillage de la psychologie sociale des années 1970, par des psychologues
expérimentalistes tels que Martin Orne ou Robert A. Rosenthal [Orne 1962],
[Rosenthal, Jacobson et al. 1971] sur les biais de la situation expérimentale en
psychologie. La sociologie, quant à elle, a d’emblée défini sa méthode d’enquête
par comparaison avec la méthode expérimentale des sciences de la nature, en
la caractérisant, chez Emile Durkheim notamment [Durkheim 1894], comme
un substitut de méthode expérimentale [post hoc] et reposant sur l’utilisation
de statistiques – avant de commencer à recourir aussi à l’expérimentation
de terrain dans les années vingt et trente du xxe siècle siècle [Mayo 1933].

2. Par exemple, pour les manuels : [Hollis 2002], [Berthelot 2001]. Dans ce dernier,
le mot « expérimentation » apparaît seulement à trois reprises (dans les 594 pages de
l’ouvrage), dans un article portant sur la science économique. Il est vrai que l’adjectif
« expérimental », en revanche, est présent à cinq reprises, en particulier dans un
chapitre qui contient une présentation par Berthelot lui-même de ce qu’il appelle
« un modèle de scientificité commun fondé sur la raison expérimentale » [Berthelot
2001, 217]. Dans le volume Philosophy of Anthropology and Sociology [Turner &
Risjord 2007], paru dans la collection Handbook of the Philosophy of Science, le mot
« experiment » n’apparaît qu’une fois sur l’ensemble des 884 pages du volume et
figure dans un article consacré à la théorie de la mesure en psychologie. Enfin, dans
le Dictionnaire des sciences humaines [Mesure & Savidan 2006], sur l’ensemble de ses
1280 pages, on trouve cinq références seulement aux termes appartenant au champ
lexical de l’expérimentation : de surcroît, celles-ci apparaissent le plus souvent dans
des articles consacrés à des thèmes tels que « Biologie et société » (« expérimentation
animale » et « expérimentation in vitro »). L’expérimentation, en tant qu’objet de
réflexion intrinsèquement pertinent pour l’épistémologie des sciences humaines et
sociales, ne donne pas lieu à un article qui lui serait exclusivement consacré.
10 Catherine Allamel-Raffin, Stéphanie Dupouy & Jean-Luc Gangloff

L’applicabilité du modèle expérimental à la sociologie a depuis suscité une


riche réflexion épistémologique chez les sociologues [Passeron 1991]. Au mi-
lieu du xxe siècle, la linguistique et l’économie sont venues grossir les rangs
des sciences humaines pratiquant des expérimentations de laboratoire [Serra
2015] ; l’économie a elle aussi pratiqué l’expérimentation de terrain de manière
massive dans les années 1960-1970 [Monnier 1992], [Gueron & Rolston 2013],
cette méthode revenant en force aujourd’hui à travers la promotion des ERC
(Essais Randomisés Contrôlés) dans le domaine de l’économie du dévelop-
pement impulsée notamment par les économistes de J-PAL, le laboratoire
d’Esther Duflo [Duflo 2009]. Plus récemment enfin, la philosophie morale
elle-même a commencé à recourir à des formes diverses d’expérimentations
(expériences de pensée ou expériences de laboratoire) [Knobe & Nichols 2008],
[Ogien 2011]. Il n’est pas jusqu’aux sciences historiques à n’intégrer aujourd’hui
les pratiques expérimentales à leur arsenal méthodologique, qu’il s’agisse de la
fabrication d’objets selon les savoir-faire anciens en histoire des techniques et
archéologie [Monteix & Poidevin 2019], ou des expériences de pensée pratiquées
par l’histoire contrefactuelle [Bourgeois-Gironde 2012]. Si cette diffusion de
la méthodologie expérimentale (sous des formes très variées) procède parfois
d’un idéal naïf d’imitation des sciences de la nature, de la conviction non-
interrogée que l’expérimentation constituerait nécessairement la voie royale
de toute science, ou encore de stratégies plus obscures liées à la recherche
de financements, elle a également favorisé l’analyse méthodologique et épis-
témologique fine des particularités de l’expérimentation dans ces disciplines
elles-mêmes (ou chez les philosophes des sciences qui s’y intéressent3 ).

3 Qu’appelle-t-on « expérimentation » ?
Une question liminaire s’est posée dans notre travail : à quelles conditions une
pratique de recherche en sciences humaines et sociales peut-elle légitimement
être qualifiée d’expérimentale ? En fonction de ce que l’on acceptera ou non
d’introduire dans ce champ, on sera amené à ajouter ou à refuser des carac-
téristiques dans la définition en intension. Classiquement, l’expérimentation
suppose l’intervention délibérée dans le cours des phénomènes, et la manipu-
lation contrôlée de ces phénomènes, notamment en vue de déterminer quels
paramètres sont pertinents quant à la production d’un effet donné [Nadeau
1999, 235], [Soler 2009, 64], [Dupouy 2011, 213]. En ce sens, l’expérimentation
diffère de l’observation par le fait que le chercheur opère une modification par
rapport au déroulement ordinaire des événements. Par conséquent, et comme
le remarquait déjà Claude Bernard [Bernard 1865], le critère pertinent qui
permet de distinguer l’expérimentation de l’observation n’est pas constitué
par le couple activité/passivité, mais par le fait que la première suppose la

3. Pour des exemples empruntés au développement des expérimentations aléatoires


en économie, voir [Labrousse 2010], [Cartwright & Hardy 2013].
Introduction. Philosopher sur l’expérimentation scientifique 11

création d’une situation artificielle, tandis que la seconde tend à laisser (dans
la mesure du possible) toutes choses en l’état. En s’inspirant des analyses
classiques de John Stuart Mill et d’Ernest Nagel, on pourrait ainsi énoncer
trois conditions à satisfaire pour qu’une expérimentation puisse avoir lieu :
La première est que le chercheur puisse manipuler à volonté cer-
taines variables considérées comme pertinentes pour produire les
phénomènes qui l’intéressent ; la seconde, que ces variables puissent
être manipulées isolément les unes des autres ; la troisième, que
ces manipulations et leurs effets soient reproductibles. [Dupouy
2011, 216]
La distinction entre expérimentation et observation s’est également appuyée
sur leur rôle dans le raisonnement causal : alors que l’observation permettrait
de trouver les causes (en remontant des effets aux causes), l’expérimentation,
par la méthode des différences [sublata causa, tollitur effectus], permettrait de
prouver les causes (en allant des causes aux effets). Cette définition de l’expéri-
mentation au sens strict peut être distinguée de ce que Claude Bernard appelle
plus largement le « raisonnement expérimental » : il « n’est rien d’autre qu’un
raisonnement à l’aide duquel nous soumettons méthodiquement nos idées à
l’expérience des faits » [Bernard 1865, 103]. Le raisonnement expérimental est
de ce fait absolument le même dans les sciences d’observation et les sciences
expérimentales [Bernard 1865, 125].
Les sciences humaines et sociales se livrent-elles à des expérimentations au
sens strict, ou à des raisonnements expérimentaux au sens de Claude Bernard ?
Quelles en sont alors les caractéristiques, voire les inflexions nécessaires pour
une adaptation à leurs objets d’étude, par rapport à ce qui se fait dans les
sciences de la nature ? On peut rappeler brièvement ici que l’expérimentation
en sciences humaines et sociales paraît soulever certains problèmes spécifiques
d’ordre épistémologique, méthodologique, éthique, politique ou tout simple-
ment pratique – quoique certains d’entre eux se posent également aux sciences
biologiques et médicales. La multitude indéfinie des variables qui constituent
un contexte social, la non-récurrence de leur configuration (leur historicité ?)
et la complexité de leurs interactions sont autant de facteurs qui paraissent
de prime abord s’opposer à la simplification, à l’isolement des facteurs, à la
variation contrôlée et à la réplication qui sont attendus d’un dispositif expéri-
mental. Lorsqu’elles sont possibles, les expérimentations en sciences humaines
et sociales rencontrent également souvent le problème de la « validité externe »
de l’expérience, c’est-à-dire la représentativité à large échelle d’un dispositif
expérimental mis en œuvre dans un contexte très singulier (et dont on peut
parfois contester l’artificialité). Les expérimentations sur des sujets humains se
caractérisent en outre en général, tout particulièrement en sciences humaines
et sociales, par des biais résultant des interactions inconscientes et des inter-
férences inaperçues entre les attentes ou les présupposés des expérimentateurs
et ceux des sujets. Enfin, elles peuvent parfois poser des problèmes éthiques ou
politiques : dommages ou risques « psychologiques » pour les sujets, problèmes
12 Catherine Allamel-Raffin, Stéphanie Dupouy & Jean-Luc Gangloff

résultant de la tromperie ou de l’injustice dans la situation expérimentale, ou


encore, plus fondamentalement, difficultés que pourrait entraîner la décision de
« tester » empiriquement un dispositif qui pourrait par ailleurs légitimement
relever d’un choix purement politique ou déontologique [pour une brève syn-
thèse sur ces différents problèmes, voir Dupouy 2011]. Les questions soulevées
par le fait de mener une expérimentation ou un raisonnement expérimental
en sciences humaines et sociales sont ainsi nombreuses et méritent d’être
approfondies à la lumière de comparaisons entre disciplines.
Chacune des contributions qui suivent apporte à ce questionnement un
éclairage emprunté à une discipline des sciences humaines, ou à une comparai-
son entre disciplines, ou encore à une technique expérimentale commune aux
sciences humaines et naturelles.
L’article de Dominique Raynaud propose une étude comparative entre
la sociologie et les sciences physiques. La sociologie est fréquemment perçue
comme une science non expérimentale et interprétative, contrairement aux
sciences physiques, qui elles seraient expérimentales et explicatives. Cet article
nuance ces affirmations puisqu’il montre que le raisonnement expérimental,
tel que défini par Claude Bernard et repris par Emile Durkheim, est bien
présent en sociologie et en physique. L’argumentation de Dominique Raynaud
se développe à travers deux études de cas : 1) la prédiction d’une déviation des
rayons lumineux dans un champ de gravitation effectuée en 1919 (physique) et
2) le test de la prédiction d’un taux de cosmopolitisme de 8 % de l’université
de Cambridge dans la période 1250-1350 (sociologie).
C’est toujours le raisonnement expérimental au sens bernardien qui est
questionné par Vincent Israël-Jost, mais cette fois-ci à travers l’étude des
images produites dans le domaine des sciences biomédicales – à la frontière
des sciences biologiques et des sciences humaines – à la fois pour des visées
diagnostiques et expérimentales. Il s’intéresse plus précisément aux images
produites grâce à la scintigraphie. Les images créées dans ce cadre à l’aide
d’un instrument complexe revêtent toujours un caractère expérimental, et ce
même quand elles sont utilisées à des fins diagnostiques. Vincent Israël-Jost
nous montre que « l’observation est encadrée par l’expérimentation ». De ce
fait, la position de Claude Bernard, qui considère le raisonnement expérimental
comme une catégorie englobante (ne cherchant pas à établir une distinction
nette entre observation et expérimentation), est toujours très éclairante pour
comprendre les images produites dans le domaine des sciences biomédicales,
et plus généralement les processus d’observation dans ce domaine.
Les deux articles suivants sont consacrés à l’économie et à ses rapports
à l’expérimentation. Le premier, celui de Michel Le Du, porte sur l’économie
comportementale. Ce domaine de recherche, qui se présente comme un nou-
veau paradigme recourant à l’expérimentation (de terrain ou en laboratoire),
prétend s’affranchir des processus interprétatifs menant à la compréhension
qui sont souvent considérés comme une caractéristique méthodologique propre
aux sciences humaines et sociales. S’appuyant sur les travaux de Dan Ariely
Introduction. Philosopher sur l’expérimentation scientifique 13

en économie comportementale (notamment), Michel Le Du formule la thèse


suivante : si changement de paradigme il y a, ce n’est pas tant en raison
du recours à des expérimentations qu’à cause de l’abandon de la présomp-
tion de rationalité (même s’il s’agit, selon lui, d’un abandon partiel). D’autre
part, l’auteur nous montre également qu’expérimentation et compréhension
ne peuvent être dissociées dans le cas de l’économie comportementale. Les
décisions et les choix que l’expérimentation en économie comportementale
permet d’étudier (notamment dans nos rapports à l’argent) s’expliquent par
des biais qui doivent être compris. La compréhension a donc encore de beaux
jours devant elle, même en économie comportementale.
Le second article sur l’économie est celui d’Arthur Jatteau. Il effectue une
comparaison entre la médecine et l’économie du développement sur la question
de l’utilisation des essais randomisés contrôlés (ERC). En effet, l’économie du
développement s’est appropriée depuis les années 2000 ce type de méthodologie
expérimentale, en s’inspirant du modèle de l’Evidence Based Medicine (EBM).
Dans le domaine médical, même si les ERC sont placés très haut dans la
hiérarchie des preuves, on trouve de multiples critiques très bien documentées :
le fait qu’il existe d’autres méthodes, comme les méthodes observationnelles,
qui sont fructueuses, le fait que nombre de traitements sont reconnus en
médecine alors qu’ils ne sont pas passés sous les fourches caudines des ERC,
le problème de la généralisation des résultats produits par les ERC, etc. Selon
Arthur Jatteau, ces critiques, très mal connues des économistes, mériteraient
d’être prises en compte en économie du développement afin de nuancer l’intérêt
de la méthode en économie.
L’article de Pascal Ludwig & Michel Matthias porte sur le rôle de l’in-
trospection en psychologie, celle-ci étant définie comme la capacité des sujets
à former des croyances sur leurs propres états mentaux. La question que
posent les auteurs consiste à savoir si l’utilisation de l’introspection dans les
expériences de psychologie implique pour la psychologie expérimentale de se
fonder sur une méthode radicalement hétérogène à celles des sciences de la
nature, au sens où l’introspection fournirait des données en première per-
sonne qui ne seraient pas publiquement observables. L’argument des auteurs
pour contester à l’introspection (et par voie de conséquence à la psychologie
qui l’utilise) ce statut d’exception consiste à affirmer que l’introspection en
psychologie ne constitue pas une méthode de justification des hypothèses
scientifiques (hypothèses qui porteraient sur des objets mentaux accessibles
au seul sujet), mais une méthode de production de données (de nature ver-
bale et comportementale) permettant au psychologue de faire des inférences
sur ces objets mentaux internes. Ainsi, l’introspection jouerait plutôt le rôle
d’un instrument permettant à la fois de mesurer et de manipuler les états et
processus mentaux des sujets, instrument susceptible d’être calibré, à la façon
dont les instruments de mesure utilisés dans les sciences de la nature peuvent
l’être. De ce fait, en tant qu’instrument de mesure, l’introspection peut donner
lieu à des investigations expérimentales et certaines équipes de recherche ont
commencé à étudier expérimentalement l’introspection comme un mécanisme
14 Catherine Allamel-Raffin, Stéphanie Dupouy & Jean-Luc Gangloff

susceptible d’être manipulé. Si l’introspection est bel et bien un instrument


de mesure, cela rapprocherait considérablement la psychologie et les sciences
humaines et sociales des sciences de la nature.
L’article de Thomas Bonnin & Jonathan Lombard propose l’étude d’une
pratique scientifique en biologie de l’évolution : la phylogénie moléculaire. La
phylogénie moléculaire permet de produire des arbres phylogénétiques qui nous
donnent des informations sur les relations évolutives entre différentes espèces
ou organismes. Les auteurs se demandent dans quelle mesure cette pratique
relève, d’une part, de l’expérimentation et du style de laboratoire tels qu’ils
ont été définis par Ian Hacking, et, d’autre part, d’une méthodologie typique
des sciences historiques, telle que définie par Carol E. Cleland. Ils concluent
que la phylogénie moléculaire ne relève à proprement parler d’aucune de ces
deux méthodes, mais qu’elles sont toutes deux utiles pour définir différents
aspects de cette pratique scientifique. L’analyse phylogénétique partage avec
une expérimentation typique le soin apporté dans la définition du système cible
et dans l’amélioration de la reproductibilité des résultats. L’idée de style de
laboratoire permet de mettre en avant certaines composantes de cette pratique,
et d’ouvrir la réflexion sur ses dynamiques d’autolégitimation. Par ailleurs,
la phylogénie moléculaire partage avec une science historique typique l’effort
pour relier des traces contemporaines par des causes communes situées dans
le passé. Néanmoins, aucune de ces deux catégories n’est pleinement adéquate
pour penser la démarche de l’analyse phylogénétique. Ceci amène les auteurs à
rejeter l’idée d’une distinction méthodologique forte entre sciences historiques
et sciences expérimentales.
Enfin, le dernier article, celui d’Yves Serra, porte sur un domaine qui, de
prime abord, passe pour non scientifique et non expérimental : la philosophie
morale. Mais depuis une vingtaine d’années, on constate le développement
d’une philosophie morale expérimentale qui s’inspire des méthodes que l’on
trouve en psychologie afin d’éclairer les débats plus classiques de la philosophie
morale. La question qui se pose alors est de savoir en quoi la philosophie morale
expérimentale est expérimentale. Après avoir présenté un aperçu de ce qu’est
la philosophie morale expérimentale, l’auteur aborde les difficultés liées aux
processus expérimentaux dans ce domaine, et à la dimension normative de la
philosophie morale. Il effectue également de manière assez systématique une
comparaison entre les rôles de l’expérimentation en sciences de la nature et en
philosophie morale expérimentale (l’expérimentation en appui du développe-
ment des théories, le développement autonome du domaine expérimental, la
spécificité de l’apport de l’expérimentation).

Bibliographie
Allamel-Raffin, Catherine & Gangloff, Jean-Luc [2015], Some remarks
about the definitions of contingentism and inevitabilism, dans : Science as
Introduction. Philosopher sur l’expérimentation scientifique 15

it Could Have Been, édité par L. Soler, E. Trizio & A. Pickering, Pittsburgh :
Pittsburgh University Press, 99–113.

Baird, Davis [2004], Thing Knowledge. A Philosophy of Scientific Instruments,


Berkeley : University of California Press.

Bernard, Claude [1865], Introduction à l’étude de la médecine expérimentale,


Paris : J. B. Baillière.

Berthelot, Jean-Michel [2001], Épistémologie des sciences sociales, Paris :


PUF.

Binet, Alfred [1900], La Suggestibilité, Paris : Schleicher.

Bourgeois-Gironde, Sacha (éd.) [2012], « Et si... ? ». La cause du contrefac-


tuel, Labyrinthe, t. 39(2), Hermann, https://journals.openedition.org/
labyrinthe/4257.

Carnap, Rudolf [1934], La tâche de la logique de la science, dans : Philosophie


des sciences, édité par S. Laugier & P. Wagner, Paris : Vrin, t. 1, 194–229,
trad. S. Colas, D. Chapuis-Schmitz et P. Wagner, 2004.

Cartwright, Nancy & Hardy, Jeremy [2013], Evidence-Based Policy : A


Practical Guide to Doing it Better, Oxford : Oxford University Press.

Collins, Harry M. [1985], Changing Order : Replication and Induction in


Scientific Practice, Beverly Hills : Sage Publications.

—— [2001], Tacit Knowledge, Trust and the Q of Sapphire, Social Studies of


Science, 31(1), 71–85, doi : 10.1177/030631201031001004.

Duflo, Esther [2009], Expérience, science et lutte contre la pauvreté, Paris :


Fayard.

Dupouy, Stéphanie [2011], L’expérimentation, dans : Philosophie des sciences


humaines, édité par Fl. Hulak & Ch. Girard, Paris : Vrin, 213–241.

Durkheim, Émile [1894], Les Règles de la méthode sociologique, Paris : PUF,


1967.

Franklin, Alan [1990], Experiment, Right or Wrong ?, Cambridge :


Cambridge University Press.

Franklin, Allan [1986], The Neglect of Experiment, Cambridge : Cambridge


University Press.

—— [2016], What makes a “good” experiment ?, The British Journal for the
Philosophy of Science, 32(4), 367–374, doi : 10.1093/bjps/32.4.367.
16 Catherine Allamel-Raffin, Stéphanie Dupouy & Jean-Luc Gangloff

Galavotti, Maria Carla (éd.) [2004], Observation and Experiment in the


Natural and Social Sciences, New York : Kluwer Academic Publishers.

Galison, Peter [1987], How Experiments End, Chicago : University of Chicago


Press, trad. fr. par B. Nicquevert, Ainsi s’achèvent les expériences, Paris :
La Découverte, 2002.

—— [1997], Image and Logic, Chicago : University of Chicago Press.

Gooding, David, Pinch, Trevor et al. [1989], The Uses of Experiment : Studies
in the Natural Sciences, Cambridge : Cambridge University Press.

Gueron, Judith M. & Rolston, Howard [2013], Fighting for Reliable


Evidence, New York : Russell Sage Foundation Publications.

Hacking, Ian [1983], Representing and Intervening : Introductory Topics


in the Philosophy of Natural Science, Cambridge : Cambridge University
Press, trad. fr. par B. Ducrest, Concevoir et experimenter, Paris : Christian
Bourgois, 1989.

—— [1992], The self-vindication of the laboratory sciences, dans : Science as


Practice and Culture, édité par A. Pickering, Chicago : University of Chicago
Press, 29–64.

—— [1999], The Social Construction of What ?, Cambridge : Cambridge


University Press.

—— [2005], Les philosophes de l’expérience, Tracés, 9, 67–82, doi : 10.4000/


traces.201, trad. fr de Philosophers of Experiment, PSA : Proceedings of the
Biennial Meeting of the Philosophy of Science Association, 1988/2, 147–156,
1988.

Harré, Rom [2003], The materiality of instruments in a metaphysics of


experiment, dans : The Philosophy of Scientific Experimentation, édité par
H. Radder, Pittsburgh : University of Pittsburgh Press, 19–38.

Hollis, Martin [2002], The Philosophy of Social Science. An introduction,


Cambridge : Cambridge University Press.

Hon, Giora [1989], Towards a typology of experimental errors : An epistemo-


logical view, Studies in History and Philosophy of Science Part A, 20(4),
469–504, doi : 10.1016/0039-3681(89)90020-4.

—— [2003], The idols of experiment. Transcending the “etc. list”, dans : The
Philosophy of Scientific Experimentation, édité par H. Radder, Pittsburgh :
University of Pittsburgh Press, 174–197.

Knobe, Joshua Michael & Nichols, Shaun (éds.) [2008], Experimental


Philosophy, Oxford : Oxford University Press.
Introduction. Philosopher sur l’expérimentation scientifique 17

Kuhn, Thomas [1962], The Structure of Scientific Revolutions, Chicago :


University of Chicago Press.

Labrousse, Agnès [2010], Nouvelle économie du développement et essais


cliniques randomisés : une mise en perspective d’un outil de preuve et de
gouvernement, Revue de la régulation, 7, 2–32, doi : 10.4000/regulation.7818.

Latour, Bruno & Woolgar, Steve [1979], Laboratory Life. The Construction
of Laboratory Facts, Sage, trad. fr par M. Biezunski, La Vie de laboratoire,
Paris : La Découverte, 1996.

Martin, Michael [1994], The philosophical importance of the Rosenthal Effect,


dans : Readings in the Philosophy of Social Science, édité par M. Martin &
L. C. Mc Intyre, Cambridge : MIT Press, 585–596.

Mayo, Elton [1933], The Human Problems of an Industrial Civilization, New


York : Routledge.

Mesure, Sylvie & Savidan, Patrick [2006], Dictionnaire des sciences hu-
maines, Paris : PUF.

Monnier, Éric [1992], Évaluations de l’action des pouvoirs publics, Paris :


Economica.

Monteix, Nicolas & Poidevin, Aurélien (éds.) [2019], L’Expérimentation, un


matériau de l’histoire, Rouen ; Le Havre : Presses Universitaires de Rouen
et du Havre.

Nadeau, Robert [1999], Vocabulaire technique et analytique de l’épistémologie,


Paris : Presses Universitaires de France.

Nagel, Ernst [1961], The Structure of Science, New York : Routledge.

Ogien, Ruwen [2001], Philosophie des sciences sociales, dans : Epistémologie


des sciences sociales, édité par J.-M. Berthelot, Paris : Presses Universitaires
de France, 521–575.

—— [2011], L’Influence de l’odeur des croissants chauds sur la bonté humaine


et autres questions de philosophie morale expérimentale, Paris : Grasset.

Orne, Martin T. [1962], On the social psychology of the psychological


experiment : With particular reference to demand characteristics and
their implications., American Psychologist, 17(11), 776–783, doi : 10.1037/
h0043424.

Passeron, Jean-Claude [1991], Le Raisonnement sociologique. L’espace non-


poppérien du raisonnement naturel, Paris : Nathan.

Pickering, Andrew [1984], Constructing Quarks, Chicago : University of


Chicago Press.
18 Catherine Allamel-Raffin, Stéphanie Dupouy & Jean-Luc Gangloff

Pickering, Andrew (éd.) [1992], Science as Practice and Culture, Chicago :


University of Chicago Press.

Pickering, Andrew [1995], The Mangle of Practice. Time, Agency, and


Science, Chicago : University of Chicago Press.

Popper, K. [1934], The Logic of Scientific Discovery, Londres ; New York :


Routledge Classics.

—— [1965], Conjectures et réfutations, Paris : Payot, trad. fr. par M. I. et


M. B. de Launay, 1985.

Radder, Hans [2003], The Philosophy of Scientific Experimentation,


Pittsburgh : University of Pittsburgh Press.

Rosenthal, Robert A., Jacobson, Leonore et al. [1971], Pygmalion à l’école,


Paris : Casterman, trad. fr. par S. Audebert et Y. Rickards, titre original
Pygmalion in the Classroom, New York : Holt Rinehart and Winston,1968.

Serra, Daniel [2015], Histoire de l’économie expérimentale, Saarbruck :


Éditions Universitaires Européennes.

Soler, Léna [2009], Introduction à l’épistémologie, Paris : Ellipses.

Soler, Léna, Zwart, Sjoerd et al. [2014], Science After the Practice Turn in
the Philosophy, History, and Social, Studies of Science, Londres : Routledge.

Turner, Stephen P. & Risjord, Mark W. [2007], Philosophy of Anthropology


and Sociology, Amsterdam : Elsevier.
Le raisonnement expérimental en sociologie

Dominique Raynaud
Université Grenoble-Alpes (France)

Résumé : Au contraire des sciences physiques, la sociologie est souvent dé-


crite comme une science interprétative et non-expérimentale. L’épistémologie
apporte un éclairage nouveau sur cette position : 1) L’expérimentation n’est
pas un trait constant des sciences physiques ; 2) Le raisonnement expérimental
(hypothético-déductif, incluant le test d’une prédiction) est également ap-
plicable en sociologie. L’argument est développé en comparant en détail le
test de la prédiction d’une déviation des rayons lumineux dans un champ de
gravitation effectué en 1919 (physique) et le test de la prédiction d’un taux
de cosmopolitisme de 8 % de l’université de Cambridge dans la période 1250-
1350 (sociologie). Le dépouillement des notices prosopographiques des maîtres
régents donne un résultat de 9,5 % proche de la prédiction théorique initiale.

Abstract: Unlike the physical sciences, sociology is frequently described as


an interpretative non-experimental science. Comparative epistemology sheds
new light on this claim. 1. Experimentation is not a constant character of the
physical sciences; 2. Experimental hypothetical-deductive reasoning, including
the test of predictions, is also practicable in sociology. The argument is
developed by a detailed step-wise comparison of the prediction of light ray
deviation within the Sun’s gravitational field made in 1919 (physics) and
the prediction of 8% cosmopolitanism of Cambridge University between 1250
and 1350 (sociology). Extensive analysis of regent masters’ prosopographic
notes yields the result of 9.5 percent cosmopolitanism, which is close to the
theoretical prediction.

Philosophia Scientiæ, 23(2), 2019, 19–45.


20 Dominique Raynaud

1 Introduction1
L’idée de Durkheim que la sociologie n’aurait pas « à s’inscrire dans une
épistémologie spécifique, distincte de celle des autres sciences expérimentales »
a été contestée depuis les années 1990 en vue de doter la sociologie d’un statut
épistémologique spécial [en particulier Passeron 1991, 555]. La singularité des
faits sociaux étant un socle commun de la sociologie, de l’anthropologie et de
l’histoire, la sociologie a été assignée à produire un savoir singulier, descriptif,
interprétatif, non expérimental – opposé à l’espace analytique, démonstratif,
explicatif, expérimental des sciences de la nature. Il n’y aurait pas de sens
à parler de réfutation en sociologie car ses « résultats restent indexés sur
une période et sur un lieu ». La sociologie n’utiliserait pas le raisonnement
expérimental mais l’exemplification [Passeron 1991, 366, 386] réhabilitant ainsi
l’illustration jadis condamnée par Durkheim [Durkheim 1895, 165].
Notre point de départ sera que l’épistémologie comparée, développée par
Gilles-Gaston Granger, permet de tester les thèses épistémologiques. Pour que
la méthode expérimentale soit un critère de démarcation, il faut qu’elle soit
présente dans les sciences de la nature et absente dans les sciences de l’homme.
Mais comme la méthode expérimentale se décline en : 1) expérimentation ;
2) méthode hypothético-déductive ; 3) recours à des prédictions2 , chacune
de ces trois conditions peut être passée en revue. Commençons par les
sciences de la nature.

La première condition est fausse. Les sciences de la nature ne


sont pas toujours fondées sur l’expérimentation. Quoiqu’on ait parlé d’une
« astronomie expérimentale » [Pecker 1969], l’astronomie est une science ob-
servationnelle. Elle n’est expérimentale qu’indirectement, lorsqu’elle s’appuie
sur l’expérimentation dans les sciences connexes. Le développement de la
spectroscopie est exemplaire des échanges entre la physique et l’astrophysique.
S’appuyant sur les études du spectre solaire de Fraunhofer en 1814, puis la
mise en correspondance des spectres d’émission et d’absorption par Kirchhoff
et Bunsen en 1859, Janssen découvre dans le spectre solaire en 1868 une raie
inconnue que Lockyer et Frankland nommeront l’hélium. En 1895, son exis-
tence terrestre sera confirmée par Ramsay. Réciproquement, Zeeman a montré
en 1896 qu’une source de lumière (terrestre) était marquée par un champ
magnétique, l’écart des composantes spectroscopiques étant proportionnel à
l’intensité du champ. En 1908, l’astronome George E. Hale démontrera que les

1. Cet article est adapté d’un chapitre de La Sociologie et sa vocation scientifique


[Raynaud 2006, 165–194] avec l’aimable autorisation des www.editions-Hermann.fr
© 2006.
2. « Le terme de prédiction (prévision) tel qu’il est utilisé ici, comprend des
énoncés concernant le passé (“rétrodictions”) ou même des énoncés “donnés” que
nous désirons expliquer [explicanda] » [Popper 1935, 58]. L’auteur distingue ailleurs
prophéties inconditionnelles et prédictions conditionnelles [Popper 1963, 490–505].
Le raisonnement expérimental en sociologie 21

taches solaires sont le siège d’un champ magnétique intense. En 1848, Fizeau
a prédit l’existence d’un décalage des raies spectrales des étoiles présentant
une vitesse radiale par rapport à l’observateur (effet Doppler-Fizeau). Vingt
ans plus tard, Huggins observera le décalage des raies de l’hydrogène de Sirius.
L’astrophysique n’est pas une science expérimentale au sens où elle procéderait
à des expérimentations propres.

La deuxième condition est également fausse. Les sciences phy-


siques ne raisonnent pas toujours dans un cadre hypothético-déductif. Quantité
de lois ont été découvertes par induction, sans hypothèse d’arrière-plan. C’est
vrai des lois de la réfraction, établies par Snell et Descartes à partir des tables
de valeurs constituées depuis Ptolémée jusqu’à Harriott ; c’est vrai des lois de
la capillarité ; c’est vrai de la loi distance/vitesse, inférée de l’étude du spectre
de quarante-six galaxies [Hubble 1929]. Du point de vue historique, tous ces
cas illustrent une démarche inductive dans laquelle la théorie ne précède pas
les observations.

La troisième condition est fausse. Les sciences physiques ne re-


courrent pas toujours à un raisonnement fondé sur des prédictions. La physique
statistique s’est développée sur tous les sujets où il était impossible de
déterminer le comportement des objets physiques. On ne peut pas prédire
le comportement individuel des molécules d’un gaz, à cause de leur nombre
(2 g d’hydrogène contiennent N = 6, 02 × 1023 molécules) et des interactions
innombrables entre ces molécules. Toutefois, dans un gaz peu dense, la théorie
cinétique de Bolzmann en fournit une description statistique. La physique n’a
pas perdu son caractère prédictif, mais certaines grandeurs ne peuvent pas
être prédites.
L’erreur de ceux qui mettent en avant l’impossibilité du raisonnement
expérimental dans les sciences de l’homme est donc de mesurer ces disciplines
à une science-étalon fortement idéalisée. Ni l’expérimentation proprement dite,
ni la méthode hypothético-déductive, ni la prédiction ne sont des caractères
constants des sciences de la nature.
Il reste donc à examiner l’absence et/ou l’impossibilité du raisonnement
expérimental en sociologie. Afin de ne pas survoler les conditions précédentes,
nous nous en tiendrons à la seule question des prédictions (ce choix sera
expliqué plus loin). L’exposé sera divisé en trois parties : 1) étude du
raisonnement expérimental sur un cas paradigmatique ; 2) description des
formes du raisonnement expérimental ; 3) test du raisonnement expérimental
en sociologie.
22 Dominique Raynaud

2 La découverte des effets gravitationnels


en physique
La comparaison des raisonnements en physique et en sociologie doit se fonder
sur l’examen de cas typiques de ces disciplines. Afin de ne pas forcer la
comparaison, le premier terme de la comparaison répondra à la description
poppérienne du raisonnement scientifique – ces motivations méthodologiques
ne nous engagent évidemment pas à être poppériens. Ce cas est aisé à trouver :
il s’agit de la prédiction de la déviation des rayons lumineux dans un champ de
gravitation qui a apporté la première confirmation de la théorie de la relativité
en 1919. Popper attribue à cette expérience une valeur paradigmatique dont il
est clair qu’elle est au fondement de sa réflexion sur le critère de démarcation
[Popper 1963, 64].
Les cas où la théorie de la relativité prédit des résultats différents de la
mécanique newtonienne sont assez peu nombreux. L’un d’eux est l’influence
que doit exercer un champ gravitationnel sur la trajectoire des rayons
lumineux. L’hypothèse apparaît pour la première fois dans l’article de 1911 :
« De l’influence de la pesanteur sur la propagation de la lumière » [Einstein
1911]. Au § 4, Einstein introduit la relation :

2kM
α= ,
c2 ∆
dans laquelle la déviation α est fonction de k (constante de gravita-
tion), M (masse du corps), ∆ (distance du rayon lumineux au centre du
corps), c (vitesse de la lumière). Il montre alors qu’« un rayon lumineux
passant au voisinage du Soleil subirait en conséquence une déviation de
4 × 10−6 rd [= 0,85 seconde d’arc, dans la direction du potentiel de gravitation
décroissant, donc tournée vers le corps céleste] ». La suite explique comment
tester cette prédiction :

Comme les étoiles fixes appartenant à des parties du ciel situées


près du Soleil deviennent visibles lors des éclipses totales du
Soleil, cette conséquence de la théorie peut être confrontée à
l’expérience. [...] Il serait urgent que des astronomes s’occupent de
la question examinée ici, même si les raisonnements dans ce qui
précède doivent apparaître comme insuffisamment fondés, voire
aventureux. [Einstein 1911, trad. fr. 1993, 134–142]

L’astronome berlinois Erwin Freundlich se proposa d’armer une expédition


pour tester cet effet lors de l’éclipse totale de Soleil visible en Ukraine
en août 1914. D’autres équipes, françaises et britanniques, firent de même.
Einstein se réjouit de ces initiatives dans une lettre à Ernst Mach datée du
25 juin 1913. Cependant, les expéditions se solderont par un échec : Freundlich
Le raisonnement expérimental en sociologie 23

sera retenu par l’Armée russe ; les astronomes anglais et français ne pourront
pas faire les observations en raison des mauvaises conditions atmosphériques
[Earman & Glymour 1980].
Entre 1911 et 1916, Einstein introduit la courbure de l’espace-temps,
laquelle conduit à prédire un effet double du précédent. Dans l’article de
1915 : « Explication du périhélie de Mercure par la théorie de la relativité
générale » [Einstein 1915], il montre que la déviation totale du rayon lumineux
à proximité du Soleil est due pour moitié au champ d’attraction newtonien
exercé par le Soleil, pour moitié à la courbure de la métrique d’espace. Un
test pourrait départager la théorie newtonienne (000 85) et la relativité générale
(100 70)3 [Einstein 1915, 172, 196]. L’hypothèse de la déviation de la lumière,
qui n’a pas été observée, est répétée dans le livre de 1916 :

Dans les champs de gravitation les rayons lumineux se propagent


généralement en décrivant des trajectoires curvilignes. [...] C’est
ainsi que les étoiles fixes qui sont placées près du Soleil et que nous
pouvons observer quand celui-ci subit une éclipse totale devront
paraître éloignées de lui de la distance indiquée plus haut par
rapport à la position qu’elles occupent dans le ciel quand le Soleil
se trouve dans un autre endroit de l’espace céleste. L’examen de
l’exactitude ou de la non exactitude de cette conséquence est une
tâche de la plus haute importance, dont il est à espérer que les
astronomes nous fourniront prochainement la solution. [Einstein
1916, trad. fr. 1976, 83–84]

Le test expérimental de cette hypothèse n’aura lieu finalement qu’en 1919.


Préparées dès 1917 par l’astronome britannique Franck Dyson, deux ex-
péditions sont équipées par la Société astronomique royale de Londres et
placées sous la responsabilité d’Arthur Eddington. Les expéditions prendront
des photographies de l’éclipse totale du 29 mai 1919 à Sobral (Brésil) et
dans l’île au Prince (au large de la Guinée espagnole), dans des conditions
exceptionnelles puisque l’éclipse doit occulter l’amas des Hyades, dans le
Taureau, qui compte une dizaine d’étoiles brillantes.
De retour en Europe, les plaques de l’éclipse sont développées et comparées
à celles des mêmes régions prises de nuit à quelques mois d’intervalle : on
superpose les plaques et on mesure, à l’aide d’un micromètre à réticule, la
distance entre les deux positions de la même étoile : cela conduit aux valeurs
des déviations observées. Parallèlement, connaissant la position du Soleil et des
étoiles à l’instant de l’éclipse, les déviations théoriques sont calculées à partir
de la formule (1). Le Tableau 1 ci-dessous présente les déviations théoriques

3. Les valeurs actuelles seraient 000 875 et 100 75. Les constantes ayant été affinées,
le calcul fait à partir des données du Bureau des Longitudes [Bureau des Longitudes
1998], donne une valeur un peu supérieure. Avec : k = 6, 672 × 10−11 m3 kg −1 s−2 ,
M = 1, 9889 × 1030 kg, c = 299 792 458 ms−1 , ∆ = 6, 96 × 108 m, on obtient
α = 4, 242758 × 10−6 rd = 000 875.
24 Dominique Raynaud
Première coordonnée Deuxième coordonnée
z }| { z }| {
obs. théo. obs. théo.
No Nom de l’étoile
11 56 Tauri −0, 19 −0, 22 +0, 16 +0, 02
5 Piazzi IV. 61 −0, 29 −0, 31 −0, 46 −0, 43
1
4 k Tauri −0, 11 −0, 10 +0, 83 +0, 74
3 k 2 Tauri −0, 20 −0, 12 +1, 00 +0, 87
6 υ Tauri −0, 10 −0, 04 +0, 57 +0, 40
10 72 Tauri −0, 08 −0, 09 +0, 35 +0, 32
2 Piazzi IV. 82 +0, 95 +0, 85 −0, 27 −0, 09

Tableau 1

et observées de sept étoiles sur les treize qui pouvaient se prêter à une mesure,
valeurs exprimées en secondes d’arc.
Einstein – qui n’avait pas jugé utile de se déplacer – sera informé des
premiers résultats par Hendrick Lorentz. Les mesures ayant été contrôlées,
les résultats seront présentés le 6 novembre 1919 devant la Royal Society.
Les principes de la relativité générale venaient de recevoir leur première
confirmation expérimentale.
Les rééditions successives du petit livre de 1916 comporteront dès lors
un Appendice : « La confirmation de la théorie de la relativité générale par
l’expérience », exposant les résultats du test. Einstein conclut : « Le résultat de
la mesure confirma la théorie d’une façon tout à fait satisfaisante » [Eisenstaedt
2005, 173–175] (en omettant de mentionner l’erreur relative avec laquelle
les déviations observées s’écartaient des valeurs attendues). Les angles de
déviation étant petits, l’écart entre la valeur théorique et la valeur observée
peut être calculé sur le plan tangent à la sphère. L’erreur relative, écart
entre la prédiction et le résultat le plus éloigné de la prédiction (absence de
déviation) était admissible pour le 4-inch installé à Sobral (100 98±0, 12 = 6 %),
rédhibitoire pour l’astrographe de l’Île au Prince (100 61±0, 30 = 18 %), dont les
mesures ne furent pas exploitées. La déflection de la lumière n’a été confirmée
que beaucoup plus tard par VLB Interferometry (déviations de l’ordre de
10−6 secondes d’arc) et par la découverte des lentilles gravitationnelles.
Le raisonnement expérimental en sociologie 25

3 Caractères généraux du raisonnement


expérimental
Popper prend en exemple cet épisode pour exposer ce qui distingue une théorie
scientifique de la psychanalyse. Tout ou presque peut être interprété par la
théorie freudienne. Selon Popper, ce « pouvoir explicatif apparent » est en
réalité un signe de faiblesse. La force d’une théorie physique tient au fait
qu’elle vaut seulement pour une classe de faits définis – propriété qu’elle tire
d’une confrontation permanente de ses hypothèses à l’expérience. Popper écrit
à propos de la déviation de la lumière :

Ce qui est frappant, c’est le risque assumé par une prédiction


de ce type. Si l’observation montre que l’effet prévu n’apparaît
absolument pas, la théorie est tout simplement réfutée. [...] Il y a là
une situation bien différente de celle précédemment décrite, d’où il
ressortait que les théories en question [de Freud et d’Adler] étaient
compatibles avec les comportements les plus opposés, au point
qu’il devenait à peu près impossible de produire un comportement
humain qu’on ne pût revendiquer comme vérification de ces
théories. [Popper 1963, 64, trad. fr. 1985, 64]

Mais il est une autre raison pour laquelle cet exemple intéresse l’épistémolo-
gie comparée. C’est qu’il exige de distinguer expérimentation et raisonnement
expérimental. En effet, il n’y eut pas d’expérimentation proprement dite lors de
l’éclipse de 1919, dérogeant à la définition bernardienne de l’expérimentation :

L’expérimentateur emploie des procédés d’investigation [...] pour


faire varier ou modifier, dans un but quelconque, les phénomènes
naturels et les faire apparaître dans des circonstances ou dans
des conditions dans lesquelles la nature ne les lui présentait pas.
[Bernard 1865, 29]

Cela ne met que mieux en valeur l’idée de Bernard selon laquelle ce qui importe
en science n’est pas l’expérimentation mais le raisonnement expérimental.
Durkheim reprendra ce point de vue :

Quand [les faits] peuvent être artificiellement produits au gré de


l’observateur, la méthode est l’expérimentation proprement dite.
Quand, au contraire [...], nous ne pouvons que les rapprocher tels
qu’ils se sont spontanément produits, la méthode que l’on emploie
est celle de l’expérimentation indirecte ou méthode comparative.
[...] Puisque les phénomènes sociaux échappent à l’action de
l’opérateur, la méthode comparative est la seule qui convienne à
la sociologie. [...] Cette différence peut bien impliquer que l’emploi
du raisonnement expérimental en sociologie offre plus de difficultés
26 Dominique Raynaud

que dans les autres sciences ; mais on ne voit pas pourquoi il y


serait radicalement impossible. [Durkheim 1895, 153]4

Qu’est-ce que le raisonnement expérimental ? Il semble judicieux


d’en emprunter la définition à Bernard parce que : 1) l’épistémologie de
Bernard anticipe celle de Popper, si bien qu’il y a continuité sur certains points.
Bernard soutient une conception de la vérité relative [Bernard 1865, 53, 56] ;
critique l’induction [Bernard 1865, 78] ; affirme la libre création des hypothèses
[Bernard 1865, 40, 64] ; écarte la confirmation [Bernard 1865, 66–67] ; reconnaît
dans les tests expérimentaux un moyen de contrôler l’hypothèse ; 2) la situation
rencontrée par Bernard – la médecine d’orientation vitaliste-hippocratique –
peut être rapportée facilement à la situation actuelle de la sociologie, parce que
la méthode expérimentale y est également tenue pour suspecte, et parce que
ces sciences sont identiquement confrontées aux caractères de « spontanéité du
vivant » et de « totalité » des organismes complexes.
Claude Bernard introduit le critère de « modification » pour distinguer
l’observateur de l’expérimentateur. Mais les « sciences observationnelles »
et les « sciences expérimentales » pratiquent uniformément le raisonnement
expérimental que l’auteur définit ainsi :

Pour raisonner expérimentalement, il faut généralement avoir


une idée et invoquer ou provoquer ensuite des faits, c’est-à-dire
des observations, pour contrôler cette idée préconçue. [Bernard
1865, 36]

L’introducteur de la médecine expérimentale reconnaît incidemment l’exis-


tence de formes plus ou moins abouties de raisonnement expérimental.
Explicitons ces degrés.
Le premier stade consiste à comparer des observations faites dans des cir-
constances diverses de manière à « raisonner sur l’influence des circonstances ».
Bernard mentionne les expériences de Pascal sur la pression atmosphérique.
Le deuxième stade apparaît lorsqu’un chercheur tire une hypothèse d’une
théorie existante. Relèvent de ce cas de figure les travaux de Bernard quant à
l’influence des nerfs sympathiques sur le réchauffement ou le refroidissement
du corps.
Le troisième stade, plus confusément reconnu par Bernard, tient au fait que
l’hypothèse est une prédiction mesurable. La prédiction mesurable remplace
l’hypothèse qualitative du stade précédent. Exemple-type : la planète Neptune,
découverte par Galle le 23 septembre 1846, sur la base des éléments orbitaux
publiés par Le Verrier en août 1846.

4. En sociologie, l’impossibilité de l’expérimentation directe est une idée d’Auguste


Comte : « Il est évident qu’un tel genre d’expérience [directe] ne saurait aucunement
convenir à la sociologie » [Comte 1839, 429].
Le raisonnement expérimental en sociologie 27

Le quatrième stade est lié au caractère contre-intuitif de la prédiction


mesurable [Popper 1935, 46–47], [Popper 1963, 96]. La prédiction de la
déviation de la lumière est exemplaire ici : pourquoi un photon de masse
nulle subirait-il l’influence d’un champ de gravitation ? (C’est une source
d’incompréhension courante ; seule la masse inertielle du photon est nulle).
Le raisonnement expérimental, suivant l’orientation de la méthode
hypothético-déductive, la forme la plus aboutie de raisonnement expérimental
peut être explicité en tant que méthode hypothético-déductive donnant lieu à
une prédiction contre-intuitive. Connaît-on des cas de ce genre en sociologie ?

4 L’explication sociologique du
cosmopolitisme universitaire
Pour suivre les partisans d’une épistémologie non-expérimentale aussi loin que
possible, il faut choisir un exemple de recherche où la singularité des faits
sociaux est patente. Cette singularité étant souvent décrite comme caractère
historique (de Windelband à Passeron), le choix d’un cas relevant de la
sociologie historique paraît optimal.
L’hypothèse d’une influence du cosmopolitisme du personnel universitaire
sur la diffusion de l’optique dans les universités médiévales a été émise
en 2002 [Raynaud 2014]. Le taux de cosmopolitisme (fraction des lecteurs
étrangers li au nombre total de lecteurs Li ) a été calculé pour les universités
d’Oxford, Paris et Bologne dans la période 1230-1350 à partir des notices
prosopographiques des lecteurs. Le cosmopolitisme est plus élevé à Bologne
(69 % < CB < 76 %) qu’à Paris (63 % < CP < 65 %) et à Oxford
(6 % < CO < 10 %). Cette variation résulte des propriétés structurales
du réseau des universités médiévales, et en particulier de la « centralité de
proximité », redéfinie par Lin [Lin 1976] sur un graphe orienté [Wasserman
& Faust 1994], qui mesure le nombre de sommets que peut atteindre un
autre sommet du graphe. Considérons le graphe orienté associé au réseau
des universités médiévales (Figure 1). Soit g le nombre total de sommets du
graphe ; Ji le nombre de sommets du graphe dont le sommet i peut recevoir
des informations en un nombre fini de pas, dij la distance géodésique entre les
sommets i et j. Les deux indices sont :
∗ Ji
CC =
i
g−1
et
o Ji /(g − 1)
CC i
= Pg .
(d /Ji )
j=1 ij

Le premier mesure le rapport du nombre de sommets en contact avec i au


nombre total de sommets pouvant joindre i. Le deuxième est un raffinement
28 Dominique Raynaud

Figure 1
Le raisonnement expérimental en sociologie 29

du premier, tenant compte de la distance à franchir pour établir le contact


entre i et j. Connaissant la structure du réseau, on calcule ces indices pour
tous les studia generalia (Tableau 2).

Studium generale C*Ci C° Ci


Pisa/Tuscia** 1,000 0,285
Siena/Tuscia** 1,000 0,262
Firenze/Tuscia** 1,000 0,251
Perugia/s. Francisci** 1,000 0,244
Bologna/Bononia** 1,000 0,238
Assisi/s. Francisci** 1,000 0,213
Todi/s. Francisci** 1,000 0,208
Rimini/Bononia** 1,000 0,195
Padova/Marchie Taruisine** 1,000 0,194
Ascoli/Marchie Anconitane** 1,000 0,181
Roma/Romana** 1,000 0,180
Venezia/Marchie Taruisine* 1,000 0,163
Asti/Ianua* 0,558 0,200
Milano/Mediolanum* 0,558 0,151
Genova/Ianua* 0,558 0,151
Strasbourg/Argentina 0,488 0,190
Dijon/Burgundia 0,488 0,190
Paris/Francia 0,488 0,171
Regensburg/Argentina 0,488 0,160
Angers/Turonia 0,488 0,155
Köln/Colonia 0,488 0,149
Toulouse/Aquitania 0,488 0,139
Erfurt/Saxonia 0,488 0,133
Praha/Boemia 0,488 0,133
Magdeburg/Saxonia 0,488 0,127
Avignon/Prouincia 0,488 0,110
Montpellier/Prouincia 0,488 0,110
Wien/Austria 0,488 0,107
Esztergom/Ungaria 0,488 0,088
Napoli/TerreLaboris* 0,140 0,105
Chieti/Pennensis* 0,140 0,105
Cività/s.Angelus* 0,140 0,105
Barletta/Apulie* 0,140 0,105
Valencia/Aragonia 0,070 0,070
Sevilla/Castella 0,070 0,070
Salamanca/s. Iacobus 0,070 0,070
Lisboa/s. Iacobus 0,070 0,052
30 Dominique Raynaud

Oxford/Anglia 0,047 0,047


Cambridge/Anglia 0,047 0,047
Dublin/Ybernia 0,047 0,047
Palermo/Sicilia* 0,023 0,023
Reggio/Calabria* 0,023 0,023
Djurazci/Sclauonia 0,000 0,000
Røskilde/Dacia. 0,000 0,000
**provinces d’Italie centrale, *provinces d’Italie

Tableau 2 – Centralité de proximité des studia generalia

La relation entre cosmopolitisme et centralité de proximité de Lin peut


être représentée sur le graphique de la (Figure 2).

Figure 2

Discernons la forme de la fonction liant cosmopolitisme C et centralité


de Lin CC ∗ . Cette fonction C = f (CC ∗ ) est strictement croissante : plus le
Le raisonnement expérimental en sociologie 31

studium est central, plus il lui est facile de recruter des lecteurs étrangers. Aux
valeurs connues, on peut ajouter f (0) = 0. En effet, si CC ∗ = 0, le studium n’est
en contact avec aucun autre : il ne peut recruter que des lecteurs autochtones.
Pour constituer une explication sociologique bien formée, cette proposition
doit être réécrite : plus un studium est central dans le réseau, plus il est aisé
à ses membres de nouer des relations avec les autres studia et d’attirer à eux
les lecteurs étrangers jugés les plus compétents. Un studium central devient
ainsi une organisation plus cosmopolite que les studia excentrés. Cette relation
fait appel aux « règles de l’expérience » de Weber, mais ne sollicite pas de
« désignateurs semi-rigides » procédant d’« une indexation mobile sur une série
de cas singuliers » [Passeron 1991, 61]. Les données sont pour l’instant trop
lacunaires pour s’assurer de la forme exacte de cette relation, mais la fonction
pourrait être du type :
li ∗
Ci = = Cmax [1 − exp(−λCC i
)],
Li
où λ ∼ 4 est un paramètre du réseau. Cette équation signifie que le taux de
cosmopolitisme d’un studium generale varie en fonction directe de sa centralité
de Lin.
On peut s’assurer de la valeur de cette relation en la soumettant à un test.
Le raisonnement expérimental préconise de faire une prédiction à propos d’un
studia generalia dont le taux de cosmopolitisme est inconnu :
En prenant comme base de prédiction les deux indices de centralité
de Lin, on devrait attendre – si ces relations ont un sens –
un taux de cosmopolitisme de 72–75 % pour Assise, 68–75 %
pour Padoue [...] et 8 % environ pour Cambridge. Le test de ces
hypothèses devra probablement attendre des progrès importants
de l’historiographie des studia generalia 5 .
Cette prédiction, qui se déduit de la relation entre cosmopolitisme et
centralité de Lin a été présentée en mai 2002, à une époque où le résultat
était inconnu. Ayant pris l’engagement de faire le test, j’ai cherché un studium
dont les lecteurs pouvaient être déterminés et j’ai trouvé la liste suivante :
Magistri Fratrum Minorum Cantebrigiae (Cambridge, MS Cotton Nero, A.IX,
fol. 78r) [Little 1943, 133–134]. Cette liste couvre la même période (1236-1358)
et comporte environ le même nombre de lecteurs que les précédentes (i.e., 74).
Nous avons suivi la même méthode que dans la détermination des taux de
cosmopolitisme d’Oxford, Paris et Bologne6 . L’application de cette méthode,
5. Prédiction adressée à J.-M. Berthelot le 1er octobre 2003 : « Pour savoir si
l’explication [du cosmopolitisme universitaire à partir de la centralité de proximité
de Lin] est correcte, il suffit de mettre à l’épreuve la prédiction du cosmopolitisme
d’un studium que je n’ai pas étudié. Je me propose d’étudier l’origine des lecteurs
d’un studium afin de calculer son cosmopolitisme (par exemple Cambridge 8 % ou
Padoue 70 %). L’explication donnée en 2002 sera alors soit réfutée, soit corroborée. »
6. Cette méthode affecte le résultat d’un indice de confiance qui permet d’intégrer
l’incertitude au raisonnement plutôt que de feindre un résultat sûr. Li = |{lecteursi }|,
32 Dominique Raynaud

dont le détail est exposé en Annexe, donne un taux de cosmopolitisme du


studium de Cambridge de 9, 5 % (i.e., 8 % < CC < 11 %). Le résultat est
à peine supérieur à la valeur théorique de 8 %7 . Les relations entre studia
n’étant pas bien documentées, la centralité de Lin a été calculée sur un réseau
k+ -régulier. En dépit du caractère rudimentaire de la modélisation retenue, le
test expérimental corrobore la prédiction de 2002.

5 Conclusion
Le test de la prédiction du taux de cosmopolitisme du studium de Cambridge
a deux sens distincts. Il a d’abord une signification sociologique : il conforte
le programme de l’analyse des réseaux [social network analysis]. Il a aussi une
signification épistémologique puisque, en établissant la possibilité de raisonner
expérimentalement en sociologie historique – il invalide la thèse que ces
disciplines ne sont pas des sciences expérimentales.
La principale différence entre le raisonnement expérimental en physique et
en sociologie historique tient au fait que l’influence du champ de gravitation
sur la lumière pouvait passer pour contre-intuitive8 dans la physique du début
du siècle (niveau 4), alors que la découverte que le taux de cosmopolitisme
suit la centralité de proximité est – en dépit de sa nouveauté – relativement
conforme aux attentes (niveau 3).
Pourquoi la sociologie est-elle si souvent prise pour une science de
l’interprétation ? Son investissement des pôles « expressif » et « critique » n’est
sans doute pas étranger à cette idée. Mais une part de responsabilité revient
ai = |{lecteurs autochtonesi }|, li = |{lecteurs étrangersi }| permettent la détermi-
nation des valeurs extrêmes Ci max et Ci min :
 min(ai ) certo(ai )+probabiliter(ai )
Ci max = 1 −
 Li
=1− Li

max(ai ) certo(li )+probabiliter(li )



=1− =1−
C .
i min Li Li

On retiendra Ci valeur moyenne entre ces extrema.


7. La valeur précise pour Oxford est : CO = [(5, 48 − 5, 59)/2] = 7, 53 %. Pour
Cambridge, les notices de l’Annexe donnent : c. Angleterre (66) ; p. Angleterre (0) ;
f.-d. Angleterre (0) ; c. étrangers (4) ; p. étrangers (2) ; f .-d. étrangers (0) ; inconnus
(2) total des lecteurs (74), lecteurs anglais (68–66). D’où CC = [8, 11 − 10, 81)/2] =
9, 46 %. L’écart entre ces taux de cosmopolitisme est de 1,93 %. Si l’on admet que le
cosmopolitisme varie librement de 0 à 100, l’écart de 1,93 entre les valeurs observée et
théorique représente une erreur de 1, 93/100 = 1, 93 %. On obtient une valeur à peine
plus élevée si l’on suppose une distribution géographique homogène des capacités
de lecteur (hypothèse nulle). Le risque d’erreur affectant la prédiction était donc de
98 chances sur 100.
8. Ce n’est pas tout à fait exact. L’hypothèse remonte à John Mitchell (1784) et
Johann G. von Soldner (1804) qui prévoyait déjà une déviation de 000 84 d’arc sur le
limbe solaire [Jaki 1978] ; [Eisenstaedt 2005, 139–144].
Le raisonnement expérimental en sociologie 33

aussi à Durkheim, qui commet deux erreurs dans les Règles : 1) il répète
l’opinion de Comte quant à l’impossibilité d’une expérimentation directe en
sociologie, ce qui est faux (il existe des expérimentations stricto sensu en
sociologie) ; 2) il identifie abusivement expérimentation indirecte et méthode
comparative, ce qui barre l’accès aux formes les plus avancées du raisonnement
expérimental, qui sont pourtant – malgré leur rareté – attestées en sociologie9 .
Plus généralement, ce résultat engage à douter de l’idée que chaque science
disposerait de normes spéciales de scientificité, puisque ces normes ne peuvent
être décrites qu’à partir des travaux existants, et que les chercheurs sont libres
de suivre un raisonnement expérimental ou non.

Bibliographie
Barbut, Marc [1998], Une famille de distributions : des paretiennes aux
« contra-paretiennes ». Applications à l’étude de la concentration urbaine
et de son évolution, Mathématiques et Sciences humaines, 141, 43–72,
www.numdam.org/item/MSH_1998__141__43_0.

Bernard, Claude [1865], Introduction à l’étude de la médecine expérimentale,


Paris : J. B. Baillière.

Bureau des Longitudes [1998], Introduction aux éphémérides astrono-


miques, Paris : EDP Sciences.

Comte, Auguste [1839], Cours de philosophie positive, t. 4. La partie dogma-


tique de la philosophie sociale, Paris : Bachelier.

Durkheim, Émile [1895], Les Règles de la méthode sociologique, Paris :


G. Baillière.

Earman, John & Glymour, Clark [1980], Relativity and eclipses : The British
eclipse expeditions of 1919 and their predecessors, Historical Studies in the
Physical Sciences, 11(1), 49–85, doi : 10.2307/27757471.

Einstein, Albert [1911], Über den Einfluß der Schwerkraft auf die Ausbreitung
des Lichtes, Annalen der Physik, 35, 898–908, doi : 10.1002/andp.200590033,
trad. fr. par Fr. Balibar et al., Œuvres choisies, 2, Paris : Seuil/CNRS, 1993,
134–142.

—— [1915], Erklärung der Perihelbewegung des Merkur aus der allge-


meinen Relativitätstheorie, dans : Königliche Preussische Akademie der
Wissenschaften. Sitzungsberichte, 831–839, trad. fr. par F. Balibar et al.,
Œuvres choisies, 2, Paris : Seuil/CNRS, 1993, 172–196.
9. Marc Barbut [Barbut 1998, 71] a ainsi prédit que l’agglomération parisienne
devrait compter quelques 10,4 millions d’habitants en 2010, ce qui s’est avéré exact.
34 Dominique Raynaud

—— [1916], Über die spezielle und die allgemeine Relativitätstheorie,


Braunschweig : Vieweg, trad. fr. par M. Solovine, La Théorie de la relativité
restreinte et générale, Paris : Gauthier-Villars, 1976.

Eisenstaedt, Jean [2005], Avant Einstein, Paris : Seuil.

Hubble, Edwin P. [1929], A relation between distance and radial velocity


among extra-galactic nebulae, Proceedings of the National Academy of
Sciences, 15(3), 168–173, doi : 10.1073/pnas.15.3.168.

Jaki, Stanley L. [1978], Johann Georg von Soldner and the gravitational
bending of light, with an English translation of his essay on it published
in 1801, Foundations of Physics, 8(11), 927–950, doi : 10.1007/BF00715064.

Laeder, Damian Riehl [1988], A History of the University of Cambridge,


Cambridge : Cambridge University Press.

Lin, Nan [1976], Foundations of Social Research, New York : McGraw Hill.

Little, Andrew G. [1943], Franciscan Papers, Lists, and Documents,


Manchester : Manchester University Press.

Passeron, Jean-Claude [1991], Le Raisonnement sociologique. L’espace non-


poppérien du raisonnement naturel, Paris : Nathan.

Pecker, Jean-Claude [1969], Astronomie expérimentale, Paris : PUF.

Popper, Karl [1935], Logik der Forschung, Vienne : Springer, trad. fr. par
N. Thyssen-Rutten and P. Devaux, La Logique de la découverte scientifique,
Paris : Payot, 1973.

—— [1963], Conjectures and Refutations. The Growth of Scientific Knowledge,


Londres : Routledge & Kegan Paul, trad. fr. par M.-I. et M. B. de Launay,
Conjectures et réfutations, Paris : Payot, 1985.

Rashdall, Hastings [1936], The Universities of Europe in the Middle Ages,


Oxford : Clarendon Press, 3 vol., édité par F. M. Powicke and A. B. Emden.

Raynaud, Dominique [2006], La Sociologie et sa vocation scientifique, Paris :


Hermann.

—— [2014], Optics and the Rise of Perspective. A Study in Network Knowledge


Diffusion, Oxford : Bardwell Press.

Wasserman, Stanley & Faust, Katherine [1994], Social Network Analysis.


Methods and Applications, Cambridge : Cambridge University Press.
Le raisonnement expérimental en sociologie 35

Annexe : Magistri Fratrum Minorum


Cantebrigiae (ca. 1236-1358)
L’incertitude des notices prosopographiques est contenue par un système
de règles uniformes, de manière à permettre une comparaison du taux de
cosmopolitisme avec ceux obtenus sur les studia d’Oxford, Paris et Bologne.
Règle 1 : Lorsque plusieurs toponymes répondent au nom du lecteur, la custodie
retenue est celle dans laquelle le toponyme est le plus fréquent. Règle 2 :
Lorsqu’il existe autant de toponymes dans plusieurs custodies, la custodie
retenue est celle qui est la plus proche du studium. La détermination des lieux
et provinces est affectée d’un indice de confiance : c. (certo), p. (probabiliter),
f. (fortasse), d. (dubio)10 .
Dans la suite du texte, les références bibliographiques sont abrégées ainsi :
E1 A. B. Emden, A Biographical Register of the University of Oxford to A.D. 1500,
3 vols, Oxford, Clarendon Press, 1957-1959.
E2 A. B. Emden, A Biographical Register of the University of Cambridge to 1500,
Cambridge, Cambridge University Press, 1963.
G1 P. Glorieux, Répertoire des maîtres en théologie de Paris au xiiie siècle, 2 vols.,
Paris, Librairie J. Vrin, 1934.
G2 P. Glorieux, Maîtres franciscains régents à Paris. Mise au point, Recherches de
Théologie Ancienne et Médiévale, 1951, 18 : 324–332.
K R. E. Kuenzel, D. P. Blok, J. M. Verhoeff, Lexicon van Nederlandse toponiemen
tot 1200, Amsterdam, Meertens Instituut, 1989.
L1 A. G. Little, The Franciscan school at Oxford in the thirteenth century, Archivum
Franciscanum Historicum, 1926, 19 : 803–874.
L2 A. G. Little, Franciscan Papers, Lists, and Documents, Manchester, Manchester
University Press, 1943.
M Michelin Régional (501-504).
Mi A. D. Mills, A Dictionary of English Place-Names, Oxford, Oxford University Press,
1991.
Mo J. H. R. Moorman, Grey Friars in Cambridge, 1225-1538, Cambridge, Cambridge
University Press, 1952.
P Parliamentary Burgesses for Colchester, Ipswich, etc. (www.trytel.com).
R A. Room, A Concise Dictionary of Modern Place-Names in Great Britain and
Ireland, Oxford, Oxford University Press, 1983.
Ro B. Roest, M. van der Heijden, Franciscan Authors, 13-18th century, A Catalogue in
Progress (users.bart.nl/~roestb/Franciscan).
T Thomas of Eccleston, De Adventu Fratrum Minorum in Angliam. The Chronicle of
Thomas of Eccleston, ed. A. G. Little, Manchester University Press, 1951.
Y The Yorkshire Genealogist (www.blunham.demon.co.uk).
V Virtual Norfolks (www.virtualnorfolk.uea.ac.uk), [s.o.] = sans objet.

10. Pour une histoire générale des universités médiévales, voir [Rashdall 1936]. Pour
une histoire de l’université de Cambridge, voir [Laeder 1988].
36
Date Lecteur Province d’origine
post 1236 Primus Fr. Vincencius de Couentre1 c. Angleterre
Mag. ant. 1225, ofm 1225 c. Coventry, cust. Worcester
ca 1251 2us Fr. W[illelmus] Pictauensis2 c. Touraine
p. D.Th, ofm c. Poitiers, cust. Niort
ca 1252 3us Fr. Eustachius de Normanuile qui inc. Oxon’ 3 c. Angleterre
M.A., D.Cn., ofm 1251 c. Normanton, cust. York
ca 1253-54 4us Fr. I[ohannis] de Westone4 c. Angleterre
D.Th, ofm p. Weston, cust. Worcester
ca 1254 5us Fr. W[illelmus] de Milton 5 c. Angleterre
D.Th, ofm c. Milton, cust. Cambridge
ca 1255-57 6us Fr. T[homas] de Eboraco sed incepit Oxon’ 6 c. Angleterre
D.Th, ofm 1245, ob. 1269 c. York, cust. York
ca 1257-59 7us Fr. Vmfridus de Hautboys7 c. Angleterre
D.Th, ofm p. Suffolk, cust. Cambridge
ca 1261-63 8us Fr. W[alterus?] de Wynbourne8 c. Angleterre
D.Th, ofm p. Wimborne, cust. Bristol
ca 1263-66 9us Fr. Robertus de Roiston’ 9 c. Angleterre
D.Th, ofm c. Royston, cust. York
ca 1265-67 10us Fr. Walterus de Rauigham 10 c. Angleterre
D.Th, ofm c. Raveningham, cust. Cambridge
ca 1267-69 11us Fr. W[illelmus] de Assewelle11 c. Angleterre
D.Th, ofm p. Haswell, cust. Newcastle
ca 1269-71 12us Fr. Rogerus de Merston’ incepit Oxon’ 12 c. Angleterre
D.Th, ofm, ob. 1303? c. Marston, cust. Oxford
Dominique Raynaud
ca 1271-73 13us Fr. [H?] de Brisigham sed incepit Oxon’ 13 c. Angleterre
D.Th, ofm c. Brisingham (Norf.), cust. Cambridge
ca 1273-75 14us Fr. I. de Letheringset 14 c. Angleterre
B.Th, ofm c. Letheringsett, cust. Cambridge
ca 1275-79 15us Fr. T[homas] de Bungeya sed incepit Oxon’ 15 c. Angleterre
D.Th, ofm c. Bungay, cust. Cambridge
ca 1277-79 16us Fr. Robertus de Worstede16 c. Angleterre
D.Th, ofm c. Worstead, cust. Cambridge
ca 1279-81 17us Fr. Henricus de Apeltre17 p. Cologne
D.Th, ofm p. Appeltern, cust. Deventer
ca 1281-83 18us Fr. Batholomeus de Stalam 18 c. Angleterre
D.Th, ofm c. Stalham, cust. Cambridge
ca 1283-85 19us Fr. Ricardus de Soutwerk 19 c. Angleterre
D.Th, ofm c. Southwark, cust. London
ca 1285-87 20us Fr. Ricardus de Burton’ 20 c. Angleterre
Le raisonnement expérimental en sociologie

D.Th, ofm c. Burton, cust. Oxford


ca 1287-89 21us Galfridus de Tudington’ 21 c. Angleterre
D.Th, ofm p. Toddington, cust. Oxford
ca 1289-91 22us Fr. I[ohannis] Russel 22 c. Angleterre
D.Th, ofm [?]
ca 1291-93 23us Fr. Walt’ de Knolle, sed incepit Oxon’ 23 c. Angleterre
D.Th 1287-8, ofm c. Knowle, cust. Worcester
ca 1293-95 24us Fr. I[ohannis] de Kymberley 24 c. Angleterre
D.Th, ofm c. Kimberley, cust. Cambridge
37
38
ca 1295-97 25us Fr. W[illelmus] de Fingringho25 c. Angleterre
D.Th, ofm p. Fingringho (Cornw.), cust. Bristol
ca 1297-99 26us Fr. I[ohannis] de Linpenho26 c. Angleterre
ofm c. Limpenhoe (Norf.), cust. Cambridge
ca 1299-00 27us Fr. Ricardus de Templo27 c. Angleterre
D.Th, ofm p. Temple, cust. London
ca 1301-03 28us Fr. Galfridus Heyroun 28 c. Angleterre
ofm p. Suffolk, cust. Cambridge
ca 1303-? 29us Fr. Adam de Houeden’ sed incepit Oxon’ 29 c. Angleterre
D.Th, ofm c. Howden, cust. York
ca 1306-08 30us Ricardus de Trillek 30 c. Angleterre
D.Th, ofm p. Trelech, cust. Bristol
ca 1308-10 31us Fr. Ricardus de Coniton’ sed inc. Oxon’ 31 c. Angleterre
D.Th 1306, ofm, ob. 1330 c. Conington, cust. Cambridge
ca 1310-12 32us Fr. Symon de Saxlinham 32 c. Angleterre
ofm c. Saxlingham, cust. Cambridge
ca 1312 33us Fr. Ricardus de Grymeston’ 33 c. Angleterre
ofm c. Grimston, cust. Cambridge
us 34
ca 1313 34 Fr. I[ohannis] de Wateley c. Angleterre
D.Th, ofm c. Wheatley, cust. York
ca 1314 35us Fr. [Willelmus] de Doffeld 35 c. Angleterre
D.Th, ofm c. Duffield, cust. Oxford
ca 1316 36us Fr. Rogerus Dunemede36 c. Angleterre
D.Th, ofm c. Dunmede (Falmouth), cust. Bristol
Dominique Raynaud
ca 1317-18 37us Fr. Walterus Beafou 37 c. Angleterre
D.Th, ofm f. Cornwall, cust. Bristol
ca 1318 38us Fr. Ricardus de Slolee38 c. Angleterre
ofm f. Slough, cust. London
ca 1319 39us Fr. Robertus de Caue39 c. Angleterre
D.Th, ofm p. S.-N. Cave, cust. York
ca 1320 40us Fr. Radulphus de Grenton’ 40 c. Angleterre
D.Th, ofm p. Gretton, cust. Oxford
ca 1321 41us Fr. Thomas de Hyndringham 41 c. Angleterre
D.Th, ofm c. Hyndringham, cust. Cambridge
ca 1322 42us Fr. Symon de Hussebourne42 c. Angleterre
D.Th, ofm p. Hurstbourne, cust. London
ca 1323 43us Fr. Edmundus Marchal 43 [?]
D.Th, ofm, ob. 1334 [?]
ca 1324 44us Fr. Walt’ de Blockeswourthe44 c. Angleterre
Le raisonnement expérimental en sociologie

D.Th, ofm c. Blocksworth, cust. Bristol


ca 1325 45us Fr. Thomas de Elmedene45 c. Angleterre
D.Th, ofm p. Helmdon (Northamp.) cust. Oxford
ca 1325-26 46us Fr. Henricus de Costesey 46 c. Angleterre
D.Th, ofm c. Costessey, cust. Cambridge
ca 1327 47us Fr. Robertus de Yrton’ 47 c. Angleterre
D.Th, ofm p. Yrton, cust. Newcastle
39
40
1329 48us Fr. Thomas de Canynge48 c. Angleterre
D.Th, ofm p. Cannich, cust. Newcastle
ca 1329 49us Fr. Radulphus Pigaz 49 [?]
ofm [?]
ca 1330 49us (sic) Fr. W[illelmus] de Lilleford’ 50 c. Angleterre
D.Th, ofm c. Lilleford/Lyford, cust. Oxford
ca 1331 50us Fr. R[?] Beuercote51 c. Angleterre
D.Th, ofm c. Beavercote (Bexley), cust. York
ca 1332-33 51us Fr. Bartholomeus de Rippes52 c. Angleterre
D.Th, ofm c. Ripe, cust. London
ca 1333 52us Fr. Henricus de Hychintone53 c. Angleterre
D.Th, ofm f. Heckinton (Lincls.), cust. York
ca 1330 53us Fr. Willelmus de Chitterne54 c. Angleterre
ofm c. Chitterne, cust. Bristol
ca 1335 54us Fr. Willelmus Staunton 55 c. Angleterre
D.Th, ofm c. Staunton, cust. Bristol
ca 1336 55us Fr. Robertus Alifax 56 c. Angleterre
D.Th, ofm c. Halifax, cust. York
ca 1337 56us Fr. Ricardus Kellawe57 c. Angleterre
D.Th, ofm c. Kellaw (Carlisle), cust. Newcastle
ca 1338 57us Fr. Iohannes Russel 58 c. Angleterre
D.Th, ofm [?]
ca 1339 58us Fr. Gilbertus Peckam 59 c. Angleterre
D.Th, ofm p. Peckham, cust. London
Dominique Raynaud
ca 1340-41 59us Fr. Iohannes de Casale de prouincia Ianue60 c. Gênes
D.Th, ofm c. Casale M., cust. Alessandria
ca 1341-42 60us Fr. Willelmus Tithemers de custodia Oxon’ 61 c. Angleterre
D.Th 1341, ofm c. Tythemersh., cust. Oxford
ca 1342-43 61 Fr. Willelmus Dermyntone de cust. Bristoll’ 62 c. Angleterre
D.Th, ofm c. Dormington (Herefs.), cust. Bristol
ca 1343 62us Fr. Ricardus de Haltone63 c. Angleterre
ofm p. Holton, cust. Cambridge
us 64
ca 1344 63 Fr. Iohannes Kellaw c. Angleterre
D.Th, ofm p. Kellaw (Darlington), cust. York
ca. 1345 64us Fr. Iacobus de Pennis postea episcopus65 p. Toscane
L.Th, ofm p. Sienne, cust. Sienne.
ca 1346 64us (sic) Fr. Adam de Hely 66 c. Angleterre
D.Th, ofm c. Ely, cust. Cambridge
ca 1348-49 65us Fr. Petrus de Arragonia 67 c. Aragon
Le raisonnement expérimental en sociologie

D.Th, ofm c. Aragon, cust. Barcelone


ca 1347 67us (sic) Fr. Walterus de Bykertone68 c. Angleterre
D.Th, ofm c. Bykerton, cust. York
ca 1349 68us Fr. Iohannes de Antingham 69 c. Angleterre
ofm c. Antingham (Norf.), cust. Cambridge
ca 1350 69us Fr. Walterus de Stowe70 c. Angleterre
D.Th, ofm c. Stowe, cust. Worcester
ca 1351 70us Fr. Rogerius de Cicilia 71 c. Sicile
D.Th, ofm c. Sicile, cust. inc.
41
42
ca 1352 71us Fr. Willelmus de Harlestone72 c. Angleterre
ofm c. Harleston, cust. Cambridge
ca 1353 72us Fr. Iohannes de Walsham 73 c. Angleterre
D.Th, ofm c. Walsham W., cust. Cambridge
ca 1354-58 73us Fr. Willelmus de Foleuile74 c. Angleterrre
D.Th, ofm, ob. 1384 c. Lincoln, cust. York
Dominique Raynaud
Le raisonnement expérimental en sociologie 43
1
[E2 : 164, M : 504, Mo : 30–31, 91, 143, 166, T : 16, 49, 57–58]. Lecteur au studium
londoniense, ca. 1236.
2
[E2 : 456, Mo : 30–31 passim, T : 57–58, loc. s.o.].
3
[E1 : 1545, E2 : 426, L1 : 810, M : 502, Mo : 30–31, 143, 197, T : 58]. 3e lecteur à Oxford,
ca. 1251.
4
[E2 : 631, M : 504, Mo : 31, 143, 201, T : 57–58].
5
[E1 : 1258, E2 : 407, G2 : 324, M : 504, Mo : 31, 144, 195, T : 58]. Études à Paris, B. Th.
(1245), D. Th. (1248), magister regens à Paris la même année 1248. E2 : « Possibly
same as fr Wm de Milton (Melitona, Mideltona, Mideltoun, Mildditone, Militona,
Militone, Milletona, Milletoni).
6
[E1 : 2139, E2 : 666, L1 : 839, M : 502, Mo : 144, 225, T : 58]. 4e lecteur à Oxford (1253–
1254).
7
[E2 : 293, Mo : 31, 144, 182–183, P, T : 58].
8
[E2 : 660, M : 504, Mo : 31, 144, 225, T : 58]. E2 : « Possibly same as fr Walter de Wiburn
(Wimborne). »
9
[E2 : 485, M : 504, Mo : 31, 144, 204, T : 58].
10
[E2 : 473, M : 504, Mo : 31, 80, 144, 204, T : 58]. E2 : Walter de Raveningham
(Ravigham, Ravingham).
11
[E2 : 20, M : 502, Mo : 148–149, T : 59]. E2 : à la même page : Asshewell (Aschwell...)
et Atwell (Athwell, Hatwell).
12
[E1 : 1230, E2 : 393–394, L1 : 857, M : 504, Mo : 31–32, 91, 144, 194, Ro, T : 59]. E2–Ro :
Rogerus Marston de Anglia (Merscheton, Merston, Meston, -e, Mirstun, -e).
13
[E1 : 269, E2 : 94, L1 : 850, M : 503, Mo : 32, 91, 144, 156–157]. 8e lecteur à Oxford (1266–
68). E2 : « Possibly same as fr Hugh de Brisingham, warden or lector of Salisbury
Convent », Brisingham (Brisigham, Brisingamius).
14
[E2 : 365, M : 504, Mo : 32, 34, 80, 144, 191, T : 59]. E2 : Letheringset (Letherigfot,
Letheringsent).
15
[E1 : 305, E2 : 106, L2 : 136–137, M : 504, Mo : 32, 34, 144, 157–158, 211]. 10e lecteur à
Oxford (ca. 1270–1272), ministre provincial d’Angleterre (ca. 1272–1275). E2 : Bungey
(Bon’, Bong’, Bongeius, Bongeye, Bung’, Bungeius, Bungeya).
16
[E2 : 651, M : 504, Mo : 32, 34, 80, 144, T : 59].
17
[E1 : 39, E2 : 14, K; L1 : 855, Mo : 32, 144, 147, T : 59]. 12e lecteur à Oxford.
18
[E2 : 548, M : 504, Mo : 32, 144, 211, T : 59]. E2 : « Very possibly same as
fr Bartholomew, OFM (“Bartol. minor”) who engaged in disputation in the faculty
of theology at Cambridge ca. 1282. »
19
[E2 : 542, M : 504, Mo : 32, 34, 144, 210, T : 59]. E2 : « Possibly the same as a friar with
the abbreviated name “So” [...] at Cambridge, ca. 1282 ».
20
[E2 : 110, M : 504, Mo : 144, 158, T : 59].
21
[E2 : 596, M : 504, Mo : 32, 34, 144, 218, T : 59]. E2 : Tudington (Tudigton).
22
[E2 : 496, Mo : 144, 205–206, Ro]. E2 : Oxford ca. 1293, Leicester ca 1300. Ro : « Engels
theoloog », ob. ca. 1305. Russel (Rossel).
23
[E1 : 1059, E2 : 340, L1 : 858, M : 504, Mo : 33, 81, 144, 188–189]. 19e lecteur à Oxford
(ca. 1288–89). Knolle (Cnol, Kinille, Knull, -e).
24
[E2 : 342, M : 504, Mo : 33, 144, 189].
25
[E2 : 228, Mo : 176, T : 59].
26
[E2 : 368, M : 504, Mo : 33, 80, 144, 192, T : 59]. E2 : Limpenho (Linpenho).
27
[E2 : 578–579, M : 504, Mo : 33, 144, 215, T : 59]. E2 : Richard Temple (de Templo).
28
[E2 : 304, Mo : 33, 86, 144, 184, P, T : 59]. E2 : « Winchester Conv. by 1318; lector in
1326. »
29
[E1 : 976, E2 : 317, L1 : 862, M : 502, Mo : 33, 144, 184, T : 59]. 28e lecteur à Oxford (ca.
1298). E2 : Adam of Howden (Haudene, Hofdenen Houden, -e, Hoveden).
30
[E2 : 595, M : 503, Mo : 144, 217, T : 59].
31
[E1 : 477, E2 : 154–155, L1 : 863, M : 504, Mo : 58, 94–97, 144, 165, T : 59]. 34e lecteur à
Oxford (ca. 1306). Ministre provincial d’Angleterre (1310–16). E2 : Conington.
32
[E2 : 509, M : 504, Mo : 144, 208, T : 59]. E2 : Saxlingham (Saxlinham).
33
[E2 : 274, M : 504, Mo : 144, 180, T : 59, Y]. E2 : Grymston.
34
[E2 : 621, M : 502, Mo : 87, 144, 221, T : 60]. Couvent d’Exeter (1320). E2 : Wateley
(Whatele).
35
[E2 : 197, M : 504, Mo : 172, T : 60]. E2 : W(illiam) de Duffeld (Doffeld), infra :
Duffilde, Duffylde.
44 Dominique Raynaud
36
[E2 : 197, Mo : 169, T : 60]. Ministre provincial d’Angleterre ca. 1330–1336. Couvent de
Salisbury ca. 1330. E2 : Roger de Dunemede (Denemed).
37
[E2 : 46, Mo : 144, 152, T : 60]. E2 : Walter Beafou (Beafon). La dernière graphie
interdit de reconnaître un origine française : Beaufou, ca. Pont-l’Évêque, cust. Rouen.
Le patronyme Beefon, Beeson est attesté en Cornouailles.
38
[E2 : 533, M : 504, Mo : 144, 210, T : 60]. E2 : Richard de Slolea, infra : John Sloley
(Slole, -e). On ne dépasse pas le niveau des conjectures avec Slough (Berks.), de
graphie : “Slo” (1196), “Sloo” (1336).
39
[E2 : 128, M : 502, Mo : 162, T : 60, Y]. E2 : de Cave.
40
[E2 : 270, M : 504, Mo : 144, 180, T : 60].
41
[E2 : 324, Mo : 144, 185, T : 60].
42
[E2 : 323, M : 504, Mo : 81, 86, 144, 185, T : 60]. Couvent de Canterbury (1326–1328).
E2 : Hussebourne (Husseburn, Husstebourum).
43
[E2 : 389, Mo : 99, 144, 193, T : 60]. E2 : « One of the Masters of Theology at Avignon
deputed by John XXII to investigate the question of the Beatific Vision 1333. Died at
Avignon ca. 1334 », Marchal (Marreschalli). Ce nom, qui dérive d’une fonction sociale
et non d’un toponyme, interdit toute localisation.
44
[E2 : 66, Mo : 144, 153, T : 60].
45
[E2 : 208, Mo : 97–99, T : 60]. Le h disparaît comme dans Elmesley (Hemslay), Elteslee
(Heltisle), etc.
46
[E1 : 495, E2 : 161, M : 504, Mo : 97–99, 121, 144, 166, T : 60]. Forte “Oxoniensis
gymnasii cultor”. E2 : Henry Costesey (Cosseius, Cossey, Costesaius, Costesay,
Costeseye, Costeshey, Costesie, Costesy).
47
[E2 : 328, Mo : 144, 225–226, T : 60]. E2 : Robert de Ireton (Yrtone).
48
[E2 : 121, M : 501, Mo : 161, T : 60]. E2 : « Buried in London Convent. »
49
[E2 : 454, Mo : 145, 201, T : 60], loc. s.o.
50
[E2 : 368, Mo : 86, 145, 191, T : 60].
51
[E2 : 60, Mo : 145, 153, T : 60].
52
[E2 : 482, M : 504, Mo : 145, 204, T : 60]. Lecteur à Norwich (1337). E2 : Barth. de
Rippes (Reps).
53
[E2 : 324, M : 504, Mo : 81, 145, 185, T : 60]. E2 : Hychintone (Ychinton).
54
[E2 : 135, M : 504, Mo : 145, 163, T : 60–61]. Lecteur à Winchester (1326). E2 : William
Chitterne (Chiterne, Chytterne).
55
[E2 : 552, M : 503, Mo : 86, 145, 212–213, T : 61]. Couvent de Leicester (1338–1347). Mo :
identifié à fr Stanthone.
56
[E2 : 280, M : 502, Mo : 146, T : 61]. E2 : Robert Halifax (Alifas, Alifax, Aliphat...
Haliphax).
57
[E2 : 335, M : 502, Mo : 80, 85, 145, 188, T : 61]. E2 : originaire du diocèse de Carlisle.
Couvent de Carlisle (1317), gardien de Cambridge 1338–1341? E2 : Richard de Kellawe
(Kellowe).
58
[E2 : 496, Mo : 85, 145, 206, T : 61]. E2 : John Russel (Russell).
59
[E2 : 446, M : 504, Mo : 86, 145, 199, T : 61]. E2 : « Possibly same as Gilbert de Pecham,
M.A., fell. of Merton College, Oxford, in 1324; still in 1331 », de Pecham (Peckam,
Pekham).
60
[E2 : 125, L1 : 822–826, Mo : 85, 100, 145, 162, T : 61]. E2 : de Casali (Casale,
Casalensis, Kasaly).
61
[E2 : 588, Mo : 219, T : 61]. E2 : « Provincial minister of the Order in England (1348–
1356) [...] Buried in the church of Bedford Convent », Tichemerch (Tithemers, –ch,
Tychemersch).
62
[E2 : 192, Mo : 172, T : 61]. E2 : de Dormyngton (Cermytone, Dormynton, -e).
63
[E2 : 282, M : 504, Mo : 85, 100, 145, 182, T : 61].
64
[E2 : 335, M : 502, Mo : 80, 85, 100, 145, 187–188]. E2 : Richmond, Catterick, dioc. York
(1349), York (1351).
65
[E2 : 449, L1 : 822–826, Mo : 100, 145, 199, T : 61] E2 : « Sugested by Little [L1] with a
strong probability that he should be identified with fr Giacomo de’ Tolomei di Siena,
OFM, bishop of Narni. As this bishop’s surname in latin was rendered “Tholomeis de
Senis”, it seems likely that “Pennis” is a mistake for “Senis” [...] Died 26 Jan. 1390 ».
L1 : « The only one among Franciscan bishops in Italy between 1348 and 1374 who is
described as magister theologiae. »
66
[E2 : 211, M : 504, Mo : 174, T : 61]. E2 : Couvent de Norwich (1337). Ely (Hely).
Le raisonnement expérimental en sociologie 45
67
[E2 : 15, L1 : 822–826, Mo : 100, 145, 148, Ro, T : 61]. E2 : « Erroneously identified by
Dr Moorman [Mo, Ro] with the eminent fr Peter of Aragon, OFM, son of James II,
king of Aragon, and brother of Alfonso III, known usually by his Catalan title, “Infant
en Pere d’Arago”, who entered the Franciscan Order on 12 Sept. 1358 at the age of
44 » [et qui n’a donc pas pu enseigner au studium OFM de Cambridge en 1348].
68
[E2 : 114, Mo : 145, 159–160, T : 61, Y]. E2 : Bykerton.
69
[E2 : 13, M : 504, Mo : 147, T : 61, V].
70
[E2 : 561, M : 504, Mo : 100, 145, 213, T : 61].
71
[E2 : 136, L1 : 822–826, Mo : 163, T : 61].
72
[E2 : 287, M : 504, Mo : 100, 145, 182, T : 61]. E2 : Couvent de York (1347), dioc. d’Ely
(1352).
73
[E2 : 613, M : 504, Mo : 89, 100, 145, 220, T : 61]. E2 : dioc. de Canterbury (1358).
74
[E2 : 236, Mo : 87, 100, 112, 145, 176–177, T : 61]. E2 : « Lincoln [...] Buried at Stamford,
Lincs. », William de Folville (Folvyle).
Voir, c’est expérimenter. Une leçon reçue
de l’utilisation d’instruments d’observation
dans les sciences biomédicales

Vincent Israel-Jost
Institut Supérieur de Philosophie,
Université Catholique de Louvain (Belgique)

Résumé : En sciences biomédicales, diverses techniques d’imagerie permettent


l’exploration d’organismes vivants, aussi bien pour le diagnostic que pour
l’expérimentation. En se penchant sur l’une d’entre elles, la scintigraphie, on
montre que l’utilisation d’un instrument complexe revêt toujours un caractère
expérimental, même lorsque l’on entend l’utiliser à des fins d’observation diag-
nostique. La liste des tests qui sont à entreprendre sur la machine à diverses
échelles de temps (quotidienne à annuelle) démontre que les chercheurs ne
peuvent jamais l’utiliser en lui accordant leur confiance de manière incondi-
tionnelle. L’observation est encadrée par l’expérimentation, démontrant aussi
l’actualité du cadre de Claude Bernard qui met en avant le raisonnement expé-
rimental comme catégorie englobante, plutôt qu’une distinction qui demeure
toujours floue entre observation et expérience.

Abstract: In the biomedical sciences, several imaging techniques are used


to study living organisms, either for diagnosis or in experimental contexts.
I focus on one of these, scintigraphy, to demonstrate that using a sophisticated
instrument is always akin to experimenting, even when one only intends to
employ it for routine diagnosis or mere observation. A list of the tests that
are recommended for one such instrument shows that their frequency ranges
from daily to annually, leaving researchers with virtually no unconditional
trust in the instrument. Observation is framed by experimentation, and
this demonstrates that Claude Bernard’s idea to put forward experimental
reasoning as a broad, encompassing category, rather than a blurry distinction
between observation and experimentation, remains very current.

Philosophia Scientiæ, 23(2), 2019, 47–66.


48 Vincent Israel-Jost

Le domaine des sciences biomédicales consiste en l’exploration des orga-


nismes, de leurs physiologies et pathologies, ainsi que des réactions à certaines
conditions extérieures ou à l’administration de traitements. On s’y intéresse
particulièrement à l’homme et à la connaissance accrue que peuvent apporter
les méthodes de la biologie en médecine. L’organisme humain y est étudié
en comparaison avec celui d’animaux-modèles, ou en groupes soumis à des
conditions différentes, par exemple avec traitement ou placebo. Il s’agit donc
d’un domaine qui repose sur l’expérimentation, et sur les moyens techniques
d’évaluer les effets des conditions expérimentales mises en œuvre. C’est ce
deuxième aspect qui fera principalement l’objet des analyses proposées dans
cet article : le fait que pour valider les effets d’une expérimentation, il faille
disposer d’instruments permettant de mettre en évidence ces effets.
Parmi l’ensemble des techniques qui sont à la disposition des chercheurs
en sciences biomédicales, qui couvrent l’observation à l’œil nu, la biopsie, les
analyses sanguines et bien d’autres, je me concentrerai ici sur les moyens
permettant l’exploration ciblée des organismes par l’imagerie fonctionnelle.
Il s’agit d’un ensemble de techniques par lesquelles les praticiens peuvent
obtenir des images qui les renseignent non pas tellement sur la morphologie
des organes (leur résolution spatiale est assez faible), mais sur la manière
dont ils accomplissent certaines fonctions. De tels examens peuvent s’inscrire
dans une démarche expérimentale au long cours pour évaluer, par exemple,
l’efficacité d’un traitement médicamenteux sur un échantillon significatif de
patients. Ils sont également largement utilisés pour le diagnostic, dans une
démarche individuelle d’observation qui apporte une connaissance singulière.
La manière dont ces techniques s’inscrivent dans la démarche expérimentale
sera analysée à partir de la discussion que Bernard entreprend dans la première
partie de l’Introduction à l’étude de la médecine expérimentale [Bernard 1865]
sur la distinction entre « expérience » et « observation ». Cependant, en me
concentrant sur les moyens d’accès à la connaissance expérimentale, je ferai
un pas de côté par rapport à Bernard, mon objet d’investigation n’étant plus
tant le vivant que le dispositif d’exploration du vivant. Mon but est de montrer
comment l’acte de voir ou d’observer, c’est-à-dire d’enregistrer un phénomène
isolé, s’entrecroise toujours avec l’expérimentation dans le contexte biomédical.
Dans la première section de cet article, je présenterai l’imagerie fonction-
nelle en prenant l’exemple de la scintigraphie en médecine nucléaire. Dans
la deuxième section, je convoquerai les sens restreints établis par Bernard
des notions d’expérience et d’observation pour les appliquer à trois types
d’exploration : l’examen de routine à visée diagnostique, l’examen à visée
expérimentale et la mise en place d’une nouvelle méthode d’investigation ou
d’un nouveau protocole pouvant à terme être utilisé pour l’expérimentation
ou le diagnostic. Dans la troisième section, je montrerai que le sens général,
englobant, du raisonnement expérimental que Bernard établit permet de
comprendre en quoi l’observation, en ce qu’elle a de plus singulier et relatif
à un phénomène particulier, est néanmoins toujours liée à l’expérience du
praticien et, partant à une forme d’expérimentation. J’entends revenir d’une
Voir, c’est expérimenter 49

part sur les connaissances qui ont été acquises au sujet de l’organisme par
la voie expérimentale, et qui sont nécessaires à l’instruction de l’observation,
mais aussi à l’expérimentation qui a permis le développement d’une technique
d’investigation. Ce faisant, je tisserai un lien entre le cadre de Bernard, et
celui de la philosophie de la connaissance et de la philosophie des sciences
du xxe siècle, au sein duquel s’est joué le débat sur l’autonomie de la
connaissance observationnelle, le fondationnalisme et la charge théorique de
l’observation. Dans la quatrième section, je montrerai que des difficultés
d’ordre méthodologique, éthique et politique imposent un travail en sciences
humaines venant compléter celui relevant des sciences de la nature.

1 Présentation du champ : l’imagerie


fonctionnelle en médecine nucléaire
L’exploration du vivant, comme par ailleurs celle des autres domaines de
phénomènes, a été profondément modifiée par les développements des ins-
truments, notamment d’imagerie. L’imagerie médicale se décline désormais
en de nombreuses techniques parmi lesquelles la radiographie, le scanner,
l’échographie, l’IRM ou encore la médecine nucléaire (Tomographie par
Émission de Position, TEP, ou Tomographie par Émission Mono-Photonique,
TEMP). C’est cette dernière technique, appelée aussi scintigraphique, que je
vais présenter maintenant et qui servira de support aux analyses qui suivront.
Le propre de la médecine nucléaire est d’utiliser des traceurs radio-
pharmaceutiques, c’est-à-dire des produits alliant une molécule-vecteur, ayant
un certain parcours dans l’organisme, et un isotope radioactif. Ces deux aspects
sont cruciaux pour la TEMP : d’une part, l’affinité que présente la molécule-
vecteur avec une certaine fonction détermine la distribution du traceur radio-
pharmaceutique dans l’organisme. D’autre part, l’isotope radioactif qui lui
est attaché est une source de rayonnement qui rend possible la détection du
produit. Sans le premier aspect, le ciblage fonctionnel serait impossible, et
sans le second, on ne pourrait accéder à la distribution du traceur radio-
pharmaceutique dans l’organisme. En scintigraphie, le radio-isotope émet un
rayonnement gamma et c’est ce rayonnement qui est détecté pour former
une image. L’instrument utilisé est la gamma-caméra, un détecteur plan du
rayonnement gamma émis depuis l’intérieur de l’organisme.
La TEMP se rapproche de la radiographie dont elle est évidemment
dérivée. Les deux techniques ont en commun de produire des images qui
reposent sur la détection d’un rayonnement ionisant ayant interagi avec
l’organisme. Mais tandis que pour la radiographie, les rayons X sont émis
depuis une source extérieure au patient, traversent celui-ci, et enfin sont
détectés, la source de rayonnement est ici à l’intérieur du patient. Ce n’est
pas son atténuation par les structures plus ou moins opaques de l’organisme
qui est mesurée mais sa présence, la manière dont elle est distribuée, que l’on
50 Vincent Israel-Jost

sait indicative d’une certaine fonction. Par exemple, un traceur myocardique


(thallium ou technécium) est administré par voie veineuse. Emmené par le
flux sanguin, le traceur se distribue graduellement dans l’organisme et met
particulièrement en évidence la paroi du myocarde et son irrigation sanguine.
Cette paroi n’est pas toujours irriguée normalement car la maladie coronaire
peut obstruer partiellement (ischémie) ou complètement (infarctus) une artère.
L’obstruction partielle ou totale sera révélée par l’examen puisqu’elle empêche
l’acheminement normal du traceur dans certains territoires du myocarde. En
outre, un second examen durant lequel le patient est soumis à un effort
physique peut révéler une faiblesse de la perfusion myocardique là où l’examen
au repos semblait normal (Figure 1).

Le choix d’un traceur permet de mettre en lumière différentes fonctions :


myocardique, pulmonaire, hépato-biliaire, osseuse, rénale, etc. Une fois le
traceur diffusé dans l’organisme et à l’équilibre, l’examen consiste à faire poser
le patient devant la gamma-caméra. Devant le détecteur de cet instrument,
un dispositif plombé filtre le rayonnement de sorte à ne sélectionner que les
photons gamma qui arrivent à la perpendiculaire du détecteur. Cela permet
d’obtenir une image beaucoup plus claire dans laquelle chaque point de l’image
correspond à une ligne de l’organisme qui lui est perpendiculaire. C’est une
image de projection, qui montre l’intérieur de l’organisme à tous les niveaux
de profondeur superposés, comme en radiographie.

Comme toutes les techniques d’imagerie médicale qui permettent de voir


à l’intérieur du corps, la superposition des structures sur une seule image
peut nuire à son interprétation, notamment lorsqu’il s’agit de détecter des
phénomènes assez fins. Ici intervient alors un autre type de développement qui
justifie le nom de la technique tomographique (qui signifie que l’on peut voir
tranche par tranche). Au lieu de limiter l’examen à une seule image, prise sous
un seul angle, la gamma-caméra est montée sur un support rotatif qui permet
de prendre de nombreuses images autour du patient. En multipliant ces points
de vue, on obtient suffisamment d’information1 pour pouvoir reconstruire en
trois dimensions la distribution du traceur et visualiser tranche par tranche
des images qui nous font pénétrer à différents niveaux de profondeur dans
l’organisme. Les calculs sont assez lourds pour cela mais la mise en œuvre de
cette idée, qui correspond au passage de la radiologie classique au scanner dans
les années 1970 et qui s’est naturellement perfectionnée depuis, a profondément
changé le champ médical puisque l’opacité du corps n’est désormais plus un
obstacle. Dans la suite de ce texte, je m’appuie sur les deux moments de
discussion proposés par Bernard au sujet de l’observation et de l’expérience
pour évaluer le statut des images produites avec la TEMP.

1. Il s’agit d’un résultat mathématique obtenu par J. Radon en 1916 et que je


n’expose pas ici. Voir par exemple [Israel-Jost 2015].
Voir, c’est expérimenter 51

Figure 1 – Scintigraphie cardiaque montrant différentes coupes du myocarde


chez un patient. La ligne du dessous correspond à l’examen au repos et indique
une perfusion normale (couleur homogène). Sur la ligne du haut, lorsque le
patient est mis à l’effort, cela révèle un défaut de perfusion vers la pointe du
myocarde (région antéro-apicale) : la distribution du traceur parvenant dans
cette région paraît amincie sur l’image.
52 Vincent Israel-Jost

2 Expérience et observation au sens


restreint chez Bernard
Les images biomédicales produites à l’aide d’un dispositif d’imagerie complexe
tel que la TEMP sont devenues omniprésentes autant dans la pratique
clinique que dans l’expérimentation humaine et animale. Cependant, leur
statut épistémique mérite discussion. D’un côté, leur utilisation massive
suggère qu’elles participent d’une routine d’observation relativement peu
problématique, qui permet d’identifier des phénomènes bien répertoriés. D’un
autre côté, la complexité même de ces dispositifs d’imagerie, la chaîne
de production d’images dans laquelle ils s’inscrivent, la manière dont ils
montrent les phénomènes, placent plutôt les images médicales du côté de
l’expérimentation. Que pouvons-nous alors conclure à partir de cette tension ?
Y a-t-il des cas où les images TEMP relèvent de l’observation et d’autres
où elles relèvent de l’expérimentation ? Ou bien les contextes d’utilisation
divers ne font-ils que masquer le fait que la TEMP s’inscrirait toujours dans
l’observation ou dans l’expérimentation ? Ou encore devrait-on plutôt parler
d’un statut intermédiaire ?
Plusieurs corpus pourraient être convoqués ici pour traiter ces questions,
mais l’Introduction à l’étude de la médecine expérimentale [Bernard 1865]
semble particulièrement pertinente pour les aborder. C’est en premier lieu
la discussion que Bernard entreprend sur la distinction entre observation et
expérience qui est intéressante pour étudier les images scientifiques puisqu’il
dégage les sens classiquement admis de ces deux notions. Ce sont là les sens
que nous pouvons qualifier de « restreints » qui émergent et qui seront utilisés
dans cette section pour mieux cerner différents cas d’utilisation de la TEMP.
Cette discussion s’enrichit ensuite d’un sens beaucoup plus englobant qui
sera abordé dans la section suivante, et qui constitue l’une des articulations
fondamentales chez Bernard pour démontrer le caractère expérimental de
la médecine. Reprendre Bernard nous permet donc de soulever la question
du statut des images scientifiques actuelles et de l’appréhender dans une
perspective large, celle de la médecine en général. Enfin, Bernard anticipe
d’importants débats qui animeront toute l’histoire et la philosophie des sciences
au xxe siècle, sur l’évolution du concept d’observation, entre pure réceptivité
au monde et construction informée du monde.
Dans cette section, je vais établir une distinction entre trois cas principaux
de l’utilisation d’un dispositif d’imagerie complexe tel que la TEMP. Ces cas
vont être construits selon le contexte, expérimental ou de routine, appliqué
respectivement à l’organisme et à l’instrumentation. Ainsi, nous pouvons avoir
un dispositif d’imagerie très bien au point (on peut parler d’un contexte
de routine pour l’instrument) mais que l’on peut utiliser, soit dans un
contexte expérimental (par exemple, déterminer l’effet d’un traitement sur
une population souffrant d’une même pathologie), soit dans un contexte de
diagnostic qui relève de la routine. Le troisième cas est celui où le dispositif
Voir, c’est expérimenter 53

fait lui-même l’objet d’une investigation et de développements expérimentaux,


indépendamment des utilisations futures qui en seront faites (expérimentales
ou de routine).
Commençons par le premier cas, celui où le dispositif instrumenté est
au point et peut être utilisé de manière fiable, régulière et bien comprise.
Intéressons-nous alors aux approches expérimentales que l’on peut mener
sur le vivant avec un tel dispositif. Comme je l’ai présenté dans la section
précédente, l’examen scintigraphique révèle des informations fonctionnelles
sur les organes. Reprenons alors l’exemple de l’examen cardio-scintigraphique
grâce auquel on obtient une image de perfusion myocardique, et supposons que
des chercheurs s’attèlent à étudier l’efficacité d’un traitement médicamenteux
de l’ischémie. Le phénomène étudié ici est donc l’ischémie, l’obstruction
partielle d’une artère, et l’on va tenter de modifier systématiquement ce
phénomène par un traitement. La variable sera par exemple la quantité de
principe actif administrée quotidiennement et l’imagerie pourra révéler l’état
de l’artère après trois mois, puis six mois. Je reviendrai par la suite sur
certaines des difficultés méthodologiques liées à ce genre d’expérimentations.
Pour le moment, contentons-nous d’en mentionner l’aspect statistique. Sur un
seul patient, ni un résultat parfaitement positif, ni un résultat parfaitement
négatif ne sauraient être concluants. Le premier pourrait n’être dû qu’à une
récupération du patient causée par un mode de vie plus sain, par exemple un
changement de régime alimentaire ou le retour à une pratique sportive. Le
second pourrait être dû à une non-réceptivité du traitement par le patient, à
un stade trop avancé de sa maladie devenue irréversible, ou encore là aussi à
un mode de vie devenu plus sédentaire. Seule l’évaluation sur un échantillon
significatif de patients nous renseignera sur l’efficacité du traitement et rendra
donc l’expérimentation concluante.
Nous sommes ici très précisément dans ce que Bernard discute comme
étant l’expérience (l’expérimentation ou expérience de laboratoire) au sens
restreint, et ce pour tous les angles qu’il discute. Le premier d’entre eux, celui
de Cuvier & Zimmermann, repose sur la distinction entre actif et passif et
peut être appliqué ici puisqu’une action est entreprise contre la maladie, à
l’opposé d’un examen qui serait à visée uniquement diagnostique. De même,
la proposition de Bernard selon laquelle l’expérience implique une variation, un
trouble intentionnellement apporté par l’investigateur, s’applique parfaitement
ici, sous l’action du traitement qui a pour but d’améliorer l’état du patient,
tandis que le simple diagnostic constaterait sans les troubler les phénomènes.
Enfin, il y a la comparaison que l’esprit veut faire, troisième angle de Bernard,
et qui s’applique également à notre cas. Ce que nous voulons ici, c’est comparer
l’état du patient soumis à un traitement à celui du patient non traité. Il se
pourrait, comme Bernard le mentionne, que la variation en question procède
d’un accident et non d’une intention, et que l’on se rende compte fortuitement,
par exemple, que des patients qui partent vivre en Crète se retrouvent, par la
grâce d’un régime fondé sur l’huile d’olive et les légumes frais, aller beaucoup
mieux. Cependant, la véritable entrée dans l’expérimentation prendrait ici la
54 Vincent Israel-Jost

forme d’un contrôle sur l’envoi des patients en Crète et, comme le relève
Bernard, d’une comparaison que l’esprit entreprendrait d’effectuer entre les
patients soumis à deux régimes bien différents. Sous ces trois angles différents,
le sens restreint de l’expérience s’applique aussi bien au cas qui nous intéresse.
Le deuxième cas est celui où un dispositif instrumenté bien maîtrisé est
utilisé à des fins diagnostiques. Ici, il s’agit de faire subir à chaque patient un
examen pour évaluer sa fonction cardiaque. Des interventions ne seront pas
exclues si l’examen révèle une maladie, mais en lui-même, il n’a d’autre visée
que diagnostique pour orienter dans un second temps le patient vers un possible
traitement. Cet examen ne procède donc pas d’une intention de modifier le
phénomène. Bien au contraire, il s’agit d’évaluer la fonction exactement telle
qu’elle est. Ainsi, la réalisation d’un double examen au repos et à l’effort,
décrite dans la section précédente, ne devrait pas être comprise comme relevant
de l’expérimentation, bien qu’une perturbation semble entreprise entre l’état
au repos et à l’effort. En réalité, l’épreuve d’effort ne vise pas à perturber
le phénomène mais au contraire à le révéler tel qu’il est et qu’il ne s’était
pas manifesté au repos. C’est en cela que nous sommes ici dans le cas d’une
observation que l’on peut qualifier de passive puisque rien n’est entrepris pour
modifier le phénomène. On constate quelque chose et l’on tente de rapporter
cette chose à des pathologies bien répertoriées.
Le dernier cas considéré ici s’abstrait de l’intention vis-à-vis du patient
(expérimentation ou diagnostic) pour considérer le dispositif d’investigation.
Celui-ci repose, on l’a vu, sur l’administration d’un traceur, une molécule
ayant un certain parcours dans l’organisme et qui sert de support à un atome
radioactif, mais aussi sur l’utilisation d’un instrument détecteur, la gamma-
caméra, et d’un protocole d’utilisation qui indique le dosage du traceur, le
positionnement du patient, la durée d’examen, les algorithmes appliqués aux
données pour les reconstruire et les afficher, etc. Ce qui est en jeu ici, c’est la
compréhension des effets d’une variation quantitative ou qualitative de l’une
des dimensions du dispositif d’investigation. Il peut s’agir du développement
d’un nouveau traceur sur lequel on fonde l’espoir qu’il révèlera une fonction
de manière plus précise ou avec un plus faible dosage, ou encore à moindre
coût pour sa fabrication. Une équipe peut aussi recevoir une nouvelle gamma-
caméra ayant un meilleur taux de détection ou une meilleure résolution spatiale
mais qui nécessitera néanmoins de réaliser toute une série de tests. C’est ce cas
que je vais présenter rapidement. Pour plus de détails, je renvoie au dernier
chapitre de [Israel-Jost 2015].
L’arrivée d’un nouvel instrument dans un laboratoire biomédical ne marque
pas l’emploi direct et immédiat de celui-ci en vue d’obtenir des résultats
expérimentaux et d’observation tels que ceux qui viennent d’être évoqués.
L’instrument a certes déjà été testé par le constructeur, mais il s’agit de
machines tellement complexes et fragiles que leur transport dans un autre
endroit aux conditions différentes (température et hygrométrie par exemple)
peut modifier leur performance. Un défaut peut aussi avoir échappé aux tests
Voir, c’est expérimenter 55

standards ou peut évoluer au gré du temps comme nous le verrons plus


précisément dans la section 3.
Il est utile, pour saisir le travail de calibrage entrepris pour rendre un
nouvel instrument utilisable en routine, de se concentrer sur un unique aspect
du dispositif. Cet aspect doit être précisément caractérisé et éventuellement
rectifié si nécessaire. Prenons pour exemple l’homogénéité spatiale du détec-
teur, c’est-à-dire sa propriété d’avoir des performances identiques en chaque
point de sa surface. Bien que le détecteur d’une gamma-caméra ne compte
pas tous les photons gamma qui parviennent à sa surface mais un certain ratio
d’entre eux, on attend un ratio identique sur toute la surface de détection. Sans
cela, les variations de performance viendraient interagir avec les variations de
signal dues au phénomène et nous ne saurions plus séparer le phénomène de cet
artefact. Dans notre cas de l’examen de perfusion myocardique, des variations
d’intensité pourraient apparaître sur la paroi du myocarde, qui ne révèleraient
pas une variation de la perfusion, une ischémie par exemple, mais un défaut
d’homogénéité du détecteur. Pour s’assurer que ce défaut n’est pas là, ou pour
le détecter puis le corriger, on procède sans patient, à l’aide d’une source
homogène de rayonnement. Cette source étant placée face au détecteur, une
image homogène devrait être obtenue. C’est ici que la comparaison qui fonde
l’expérience a lieu : on va comparer l’image effectivement obtenue (Figure 2) à
celle qu’elle devrait être, c’est-à-dire parfaitement homogène. Si l’homogénéité
n’est pas obtenue, on déplace la source latéralement. Si l’inhomogénéité était
due à la source, elle devrait être déplacée sur l’image. Si elle reste stable, c’est
bien le détecteur qui porte le défaut. En menant ce test, une caractérisation
précise du défaut est obtenue et peut directement servir à le corriger.
Il suffira désormais de multiplier point par point les images obtenues par
l’inverse de l’image de test qui a révélé l’inhomogénéité pour obtenir des images
rectifiées sur ce plan.
On le voit, ici aussi, l’expérience qui a cours, marquée par « la comparaison
que l’esprit veut faire » peut également être lue sous les deux autres angles
discutés par Claude Bernard. Il y a celui de la variation, puisque nous avons
placé une source devant conduire à l’obtention d’un certain phénomène (une
image homogène) et que nous pouvons déplacer pour vérifier que la cause de
l’inhomogénéité est dans l’instrument. Et il y a celui de l’activité, contre la
passivité, interprétée ici comme un refus de considérer le dispositif instrumenté
comme étant transparent, sans le questionner, passivement. Nous entreprenons
une investigation pour caractériser cet instrument, en identifier les défauts.
Nous demeurons en alerte devant cet instrument.
En conclusion à cette section, nous voyons que les notions d’observation
et d’expérience prises dans les sens restreints de Bernard s’appliquent très
directement aux pratiques de l’investigation en sciences biomédicales par
l’imagerie. L’expérience ou expérimentation y trouve une double application :
le niveau distal, ultime, celui de l’objet des sciences biomédicales, c’est-à-
dire l’organisme ; et le niveau proximal, celui du dispositif instrumenté. Cet
usage dédoublé de l’expérimentation en sciences du vivant nous conduit, dans
56 Vincent Israel-Jost

Figure 2 – Une source radioactive placée face au détecteur émet du rayon-


nement gamma de manière homogène dans toutes les directions. La partie
du rayonnement qui atteint le détecteur est représentée par les flèches de
la Figure (a). L’image de détection obtenue Figure (b) peut montrer des
motifs d’inhomogénéité qui révèlent un défaut systématique du détecteur qu’il
convient de corriger.

la section 3, à revenir sur la distinction entre observation et expérience, en


convoquant cette fois la notion englobante d’expérience élaborée par Bernard.

3 L’expérience au sens englobant


L’ambition de Bernard est double dans son Introduction à l’étude de la méde-
cine expérimentale. Il entend d’une part démontrer que la médecine s’appuie
sur des méthodes expérimentales, dépassant ainsi l’ancien paradigme selon
Voir, c’est expérimenter 57

lequel la médecine, comme la physique, devraient essentiellement s’appuyer


sur des observations bien menées. D’autre part, c’est le statut de science de
la nature qui est en jeu pour la médecine. En montrant que les méthodes
de la médecine se rangent du côté de celles des autres sciences de la nature,
Bernard engage une voie qui ne sera plus démentie, et qui relève aujourd’hui
de l’évidence. Or pour ouvrir cette voie, et se détacher du paradigme de la
médecine comme science fondée sur l’observation, un mouvement d’inflexion
est opéré par Bernard dans sa discussion élargie des notions d’observation et
d’expérience. Cette discussion est rendue nécessaire selon lui parce que les
sens classiquement admis des deux notions d’observation et d’expérience lui
semblent manquer de clarté et de généralité. Ce reproche ne nous saute pas aux
yeux puisque nous avons pu retrouver des catégories assez bien distinguées chez
les praticiens en usant des définitions d’observation et d’expérience discutées
par Bernard dans leur sens restreint.
Pourtant, Bernard évoque un cadre trop circonscrit. En effet, les notions
d’observation et d’expérience appartiennent selon lui à une catégorie plus
générale, celle du raisonnement expérimental. Observation et expérience en
marquent même les extrêmes, la première montrant les faits tandis que la
seconde les instruit. Quel sens faut-il attribuer à cette nouvelle distinction entre
montrer et instruire ? Selon Bernard, on peut en revenir à l’usage courant du
mot expérience qui signifie, d’une manière générale et abstraite, l’instruction
acquise par l’usage de la vie. Il poursuit en ciblant cette fois le médecin pour
définir son expérience comme l’instruction qu’il a acquise par l’exercice de la
médecine. Dès lors, il nous est permis de fonder la distinction entre montrer et
instruire les faits sur cette conception de l’expérience : l’instruction que tout
praticien d’un domaine acquiert dans la pratique même de son domaine. Or
que permet cette instruction ? Que change-t-elle par rapport à celui qui ne
la possède pas ? Précisément ceci que l’on peut montrer la même chose au
praticien et au non-praticien, mais que seul le premier sera capable de donner
non seulement une caractérisation précise, mais aussi et surtout du sens à la
chose vue. Lorsque Bernard évoque le physiologiste qui coupe le nerf facial
pour en connaître les fonctions, il faut se mettre dans la peau, successivement,
du novice qui ne voit et ne comprend qu’une scène insoutenable qui lui est
montrée, puis du physiologiste qui perçoit, lui, le sens de ce geste parce qu’il
l’instruit. Pour le premier, pas de raisonnement, on s’arrête aux faits bruts de
l’observation quasi-indicible. Pour le second, cette opération s’inscrit dans un
raisonnement. Il sait pourquoi elle est faite et ce qu’elle pourra montrer. Alors
l’observation montre les faits, certes, mais pour aller jusqu’au bout et conclure
sur un rapport d’observation qui nous apprend quelque chose, il faut de toute
façon instruire l’observation en y faisant jouer l’expérience déjà acquise. D’où
un rapprochement qui s’opère entre l’observation et l’expérience. La première
n’est pas tellement passive puisqu’elle est instruite par l’expérience-instruction,
et cela la déplace vers l’expérience de laboratoire, définie comme nous l’avons
rappelé précédemment comme une entreprise active. C’est ainsi que Bernard
aboutit à deux niveaux de vocabulaire concernant l’expérience : concret et
58 Vincent Israel-Jost

abstrait. L’expérience de laboratoire, celle que l’on fait, est concrète, tandis
que l’expérience de la vie ou d’un domaine, celle que l’on acquiert, est abstraite.
Mais sans cette expérience-instruction, il n’est pas de réelle connaissance, ni
observationnelle ni expérimentale, nous dit Bernard.
Le cadre englobant étant posé, que modifie-t-il à notre compréhension des
exemples d’images médicales scintigraphiques ? La frontière entre observation
et expérience s’en trouve déplacée ou plus exactement, elle devient beaucoup
moins nette. Rappelons que dans le cadre restreint de Claude Bernard,
nous n’avons identifié qu’un seul cas d’observation (passif, sans trouble
intentionnellement apporté au phénomène, sans qu’une comparaison soit
entreprise par l’esprit), celui de l’utilisation en routine du dispositif d’imagerie
à des fins diagnostiques. Il s’agissait d’une pure constatation et non d’une
expérience comme les deux autres cas. Or cette constatation, nous devons
maintenant reconnaître qu’elle doit être instruite si nous espérons en tirer
des éléments d’intérêt pour le patient. Ne pas l’instruire revient à se placer
à nouveau dans la peau du novice, et à interpréter les images de la Figure 1
à un niveau élémentaire qui ne peut rien déceler d’autre que des formes et
des couleurs dénuées de sens. Pour en arriver à une interprétation encore peu
élaborée, il a fallu au minimum une courte section présentant les principes
de la technique et l’on peut supposer que leur analyse plus détaillée exigerait
encore davantage d’expérience-instruction, tandis que l’exercice quotidien de
la médecine nous mettrait face à toutes sortes de cas ambigus, complexes
et problématiques qui requerraient encore bien davantage d’expérience. Dès
lors, nous ne pouvons plus considérer un sujet passif, purement récepteur des
faits. Si observation il y a, elle est maintenant incluse dans le raisonnement
expérimental, c’est-à-dire dans la même catégorie que l’expérience. Elle appelle
chez le sujet des capacités tout à fait similaires à celles qui sont requises dans
l’expérience de laboratoire.
Ce nouveau cadre ayant été posé par Bernard, on peut s’interroger sur
son évolution dans le paysage épistémologique qui s’est dessiné au xxe siècle,
et sur son actualité pour analyser la recherche biomédicale telle qu’elle se
pratique aujourd’hui. À ce titre, on peut inscrire tout le mouvement post-
positiviste qui naîtra autour des années 1960, c’est-à-dire environ un siècle
après l’Introduction à l’étude de la médecine expérimentale, dans la lignée de
Bernard. Il s’agit des auteurs qui s’opposeront aux conceptions empiristes
de l’observation pour en nier le caractère autonome, indépendant de la
connaissance déjà acquise, c’est-à-dire de l’expérience-instruction. On pense
à Hanson et à la « charge théorique de l’observation » [Hanson 1958] et aux
autres post-positivistes : Kuhn, Feyerabend ou Toulmin. Tous affirment que
l’observation, pour dévoiler quelque chose, doit reposer non pas seulement sur
la perception (« ce qui est montré » chez Bernard), mais aussi sur l’instruction,
via le langage mais aussi des connaissances plus ou moins spécialisées. Parmi
ces connaissances, sur le cas qui nous occupe ici, il y a d’abord celles qui
portent sur l’objet d’investigation, le corps humain. À tout le moins, il faut
savoir que dans ce corps, le sang circule et irrigue les organes ; ensuite que l’un
Voir, c’est expérimenter 59

d’entre eux, le cœur, est irrigué pour fonctionner. C’est un muscle, alimenté en
sang. Tout cela est important pour parvenir d’une part à identifier l’organe sur
l’image, et d’autre part à comprendre la manière dont il est vu, par le traceur
qui y a été apporté.
Dès le début des années 1960 avec Maxwell, les considérations sur
l’expérience-instruction que doit posséder et faire jouer l’investigateur pour
mener ses observations vont s’enrichir d’une nouvelle dimension [Maxwell
1962]. Il ne s’agit plus seulement de mettre en évidence les connaissances
qui portent sur le domaine de phénomènes considéré, c’est-à-dire ici la
physiologie et la pathologie humaine, il faut compléter cette instruction avec
la compréhension des instruments qui sont utilisés. Le texte de Maxwell,
comme une vingtaine d’années plus tard celui de Hacking [Hacking 1983],
développent un argumentaire visant à montrer que le microscope est un
instrument d’observation. Or, puisqu’un microscope montre les phénomènes
d’une manière tout à fait particulière qu’il faut d’ailleurs décliner en autant
de techniques diverses (microscopie à transmission, à fluorescence, électro-
nique...), il est indispensable que l’utilisateur s’appuie sur une connaissance
rigoureuse de son instrument pour instruire ses observations. Ainsi, bien qu’ils
défendent le rôle observationnel du microscope, ces auteurs ne présentent
plus l’observation dans la perspective empiriste classique. C’est bien une
observation instruite, c’est-à-dire incluse dans le raisonnement expérimental,
qui a cours chez les praticiens.
Ce sont dès lors des questions similaires qui doivent être les nôtres quand
nous considérons les instruments apparus depuis. Qu’est-ce qu’une gamma-
caméra, que détecte-t-elle ? Les réponses à ces questions se trouvent dans ce
que l’on nomme dans la littérature consacrée la « théorie de l’instrument » et
que se doit de posséder quiconque fait usage d’un instrument pour produire
des images. Ces connaissances sont indispensables pour instruire l’observation,
même si la routine et l’aisance, que l’expert dégage dans des situations qui
lui sont familières, peuvent masquer cette instruction à l’observateur. Il n’est
pas passif mais se sent passif parce qu’il applique des schémas d’instruction
de manière quasi-automatique. En soutenant l’idée d’une charge théorique
toujours présente dans l’observation, les post-positivistes se sont opposés au
courant empiriste qui, notamment dans sa forme positiviste logique, avait
proposé une épistémologie fondée sur des connaissances premières, observa-
tionnelles. Dans cette épistémologie fondationnaliste développée notamment
dans [Carnap 1932], l’observation était conceptualisée comme étant directe,
a-théorique ou encore immédiate [Israel-Jost 2015]. Mais aussi attrayante
qu’ait pu paraître cette épistémologie qui construit la connaissance de bas en
haut, du simple au complexe, de l’expérience pure aux élaborations théoriques
les plus sophistiquées, des voix s’élèvent depuis longtemps contre elle, dont
celle de Bernard chez lequel sont discutées les deux positions : l’observation
passive puis instruite.
Le double niveau d’analyse (sens restreint et englobant de l’expérience) de
Bernard se retrouve donc à la fois sur le terrain, dans les investigations en ima-
60 Vincent Israel-Jost

gerie biomédicales, et, on vient de le voir, dans les théories épistémologiques.


La discussion qu’il entreprend dans un premier temps au sujet de la distinction
entre observation et expérience rend compte de notre phénoménologie de
l’observation. Directe, passive, elle est pure réception des phénomènes et
s’oppose en cela à l’expérience de laboratoire, au cours de laquelle l’esprit est
actif et entreprend des variations et des comparaisons. C’est la compréhension
peut-être la plus intuitive que l’on peut avoir de l’observation, au cours de
laquelle des processus inconscients ou demandant du moins très peu d’efforts,
paraissent absents. C’est en ce sens que l’on peut parler d’un sens restreint
pris par l’observation dans cette discussion, puisqu’il ne tient pas compte d’un
raisonnement qui a pourtant bien lieu.
Au sens général ou englobant, deuxième moment de la discussion de
Bernard, l’image doit être instruite par l’expérience. Elle montre, mais pas
de manière féconde si l’on ne dispose pas du minimum d’instruction qui
permet de saisir le sens profond de ce que l’on voit, instruction qui porte aussi
bien sur l’organisme que sur l’instrumentation. Or, même si ce raisonnement
expérimental est toujours présent, il est des moments au cours desquels
il est rendu manifeste. Un examen d’imagerie qui conduit à un résultat
inattendu, bizarre, remet toujours au premier plan l’exigence d’instruction de
l’observation. S’agit-il d’un artefact dû à la machine ou d’une anomalie chez le
patient ? Et pour l’une ou l’autre possibilité, comment est-elle survenue, quelle
en est la cause ? En tentant de répondre à ces questions, l’observateur reprend
forcément conscience du raisonnement expérimental.
Pour faire nôtre le choix de Bernard de privilégier en médecine l’inclusion
de l’observation dans le raisonnement expérimental, et démontrer son actualité
dans le contexte de l’imagerie médicale contemporaine, nous pouvons nous
appuyer sur les documents qui encadrent les activités d’un laboratoire
de médecine nucléaire. Ces documents font la liste des tests qui doivent
être entrepris dans le cadre d’une utilisation en routine des appareils de
scintigraphie, les gamma-caméras. Une telle liste est proposée sur la Figure 3
et montre tout d’abord que les facteurs à contrôler sur l’instrument sont
nombreux. La partie supérieure du tableau répertorie une dizaine de tests
dont l’un reprend celui que j’ai décrit dans la section précédente, le test
d’homogénéité du détecteur. Ce test est à réaliser quotidiennement, de même
que l’inspection visuelle du collimateur, c’est-à-dire du dispositif plombé qui
sélectionne la direction des photons incidents. Le contrôle du centre de rotation
de la gamma-caméra, qui tourne autour du patient, doit avoir lieu toutes
les une à deux semaines pour vérifier que l’instrument se déplace le long
d’une trajectoire exactement circulaire. D’autres tests, enfin, ont lieu tous les
trimestres, tous les semestres ou tous les ans. Ainsi, ce tableau montre que
des échelles de temps très différentes sont en jeu. Cela vient confirmer que
les observations qui sont permises par des dispositifs d’investigation ne sont
jamais déconnectées des préoccupations expérimentales qui visent à évaluer,
comprendre et rectifier ces dispositifs. Le calendrier des contrôles à effectuer
vient rappeler à tout moment combien l’observation en sciences biomédicales,
Voir, c’est expérimenter 61

même de routine, s’intègre toujours dans une démarche expérimentale plus


large. L’instrument ne fonctionne jamais de manière transparente, c’est-à-dire
que les images qu’il produit ne sont jamais prises comme non problématiques
de manière inconditionnelle. Même une fois les tests quotidiens effectués, une
anomalie décelée sur une image pourra souvent être interprétée aussi bien
comme étant liée au patient que comme le signe d’une détérioration du matériel
expérimental qu’un test devrait confirmer ou infirmer. C’est là le signe que la
passivité de l’observation n’existe pas, ou seulement dans le cas où tout semble
parfaitement normal et régulier. Mais l’évaluation des conditions normales,
pour l’instrument comme pour le patient requiert elle-même une comparaison,
c’est-à-dire l’inscription de l’observation dans un raisonnement expérimental.

Recommended Quality Control Procedures for SPECT Tomographs


Test Recommended Frequency
Uniformity Daily
Collimator visual inspection Daily
Center of rotation Weekly-biweekly
Spatial resolution/ linearity (bar phantom) Weekly-biweekly
High-count flood/uniformity correction map Weekly-biweekly
Tomographic spatial resolution Quarterly-annually
Jaszczak phantom Quarterly-annually
Pixel size Quarterly-semiannually
Tilt-angle check Quarterly
Collimator-hole angulation Annually
62 Vincent Israel-Jost

Additional Acceptance Tests for Tomographic Gamma Camera


Systems

– Rotational capabilities and – Collimator-hole angulation


limits
– Patient-contour positioning
– Angle indicators – Tomographic slice uniformity
– Step-size accuracy – Tomographic spatial resolution
– Timing
– Transverse without
– Radical motion scatter
– Gantry controls – Transverse with scatter
– Safety features (especially
emergency stops and – Axial-slice thickness
pressure-sensitive – System volume sensitivity
collimator covers)
– System performance (Jaszczak
– Pixel calibration phantom)
– Center of rotation performance
– Lesion contrast
– Rotational uniformity stability

Figure 3 – Liste des facteurs à contrôler lors des contrôles réguliers, principaux
(tableau du haut) et additionnels (tableau du bas). Le premier test (« Uniformity »)
est celui qui a été présenté à la fin de la section 2 (voir Figure 2) et est indiqué comme
devant être réalisé quotidiennement. Certains tests requièrent l’utilisation de divers
objets appelés « fantômes » (Jaszczak phantom et bar phantom). La conception de ces
objets est adapté à la technique qui repose sur l’usage d’un produit liquide radioactif.
Ils sont creusés pour recevoir le traceur et permettent ainsi de tester la résolution
spatiale du système.

Le document que je présente ici doit être considéré comme un instantané.


Il propose des normes de contrôle qui sont adaptées à la situation présente
qui est celle de notre technologie, et de nos connaissances relatives à cette
technologie. Ces normes elles-mêmes évoluent perpétuellement. Elles sont
mises à jour lorsque de nouveaux instruments plus robustes sont disponibles,
reculant les échéances de tests autrefois entrepris plus souvent. Des facteurs
de tests apparaissent tandis que d’autres disparaissent. Elles sont également
susceptibles d’évoluer alors que la technologie est la même, mais que l’on
réalise que la fréquence de certains tests est à revoir dans un sens ou
dans l’autre. La connaissance observationnelle que permettent les dispositifs
d’imagerie est donc non seulement toujours subordonnée à des préoccupations
expérimentales, mais la forme que prennent ces préoccupations est sujette
à de perpétuelles renégociations qui mettent encore davantage en évidence
le raisonnement expérimental qui encadre toujours l’observation. Voir c’est
Voir, c’est expérimenter 63

expérimenter, c’est-à-dire déjà procéder à des comparaisons, des raisonnements


et des jugements.

4 Au carrefour des sciences de la nature


et des sciences humaines : épistémologie
et éthique de la recherche biomédicale
Si l’expérience est toujours convoquée dans l’acte d’observer, il reste à
en tirer les conséquences au-delà de la simple qualification des images
biomédicales comme relevant d’une démarche expérimentale. L’inscription de
l’observation dans un raisonnement expérimental donne un éclairage sur la
manière d’aborder un certain nombre de problèmes rencontrés dans la pratique
expérimentale. Puisqu’une image est un complexe qui témoigne de l’état du
patient et de celui de l’instrument, et que de nombreux facteurs contribuent
à l’image, l’expérience-instruction du chercheur joue à plein pour démêler ces
facteurs. Il émerge une certaine figure du scientifique qui doit être en phase
avec ces difficultés de l’expérimentation : il n’est pas question de se limiter
à être pur récepteur passif de la connaissance délivrée par l’instrument ; c’est
au contraire un scientifique en alerte, à l’affût de tout nouvel élément qui le
renseignerait mieux sur son dispositif, qui saura le mieux démêler ces facteurs
qui contribuent à la production d’une image. À l’éthique du scientifique neutre,
restreignant toute subjectivité, et décrite notamment par Daston & Galison
comme accompagnant une certaine conception de l’objectivité dite mécanique
[Daston & Galison 2007], répond une autre éthique qui met en avant la
responsabilité des scientifiques et les qualités qu’ils auront à déployer pour
résoudre les problèmes posés par les pratiques instrumentées.
Les aspects technologiques ne sont cependant pas les seuls à convoquer
un travail d’évaluation critique. Si l’on élargit la focale pour s’intéresser à
d’autres aspects de la recherche en sciences biomédicales, on constate que les
aspects épistémologiques, méthodologiques et éthiques sont fortement mêlés
et que ce champ appelle un travail constant de détection des problèmes qui
affectent la qualité de la recherche. En effet, la recherche biomédicale s’inscrit
dans un complexe qui mêle une préoccupation de soin à des considérations
de rentabilité. Dès lors, son succès est partagé entre les effets bénéfiques
des traitements pour la population et le profit financier qui est espéré par
des laboratoires pharmaceutiques. Or il est courant que le profit passe au
premier plan et que la méthodologie scientifique soit utilisée comme caution
pour prétendre à une recherche objective. Il s’agit pourtant seulement des
apparences de l’objectivité puisque ces firmes cherchent à montrer, souvent
abusivement, que les molécules développées sont efficaces pour soigner une
maladie sans avoir d’effets secondaires trop sévères par rapport au bénéfice
avéré. Les scandales successifs de ces dernières décennies (Dépakine, Mediator,
64 Vincent Israel-Jost

Vioxx, Requip...) rappellent les défaillances d’un système dans lequel les
bénéfices sont surévalués et les risques sous-évalués. Dans de nombreux
cas qui sont désormais bien documentés, tout est ainsi fait pour obtenir
l’autorisation de mise sur le marché en optimisant les résultats positifs et
le processus de publication.
Je renvoie aux travaux de Stegenga pour une discussion approfondie
portant sur les méthodes des laboratoires pharmaceutiques pour obtenir des
résultats qui sont favorables à leurs produits. L’une d’entre elle consiste à
sélectionner les patients de sorte à faire figurer dans l’étude ceux dont la santé
est en moyenne meilleure que celle des personnes typiques qui sont affectées
par la même maladie. On y trouve des patients plus jeunes, prenant moins de
médicaments et ayant moins de maladies que la population moyenne des gens
atteints par la maladie que le nouveau traitement est censé soigner [Stegenga
2017, 24]. Il est donc possible de mettre toutes ses chances de son côté, en
comptant sur des patients plus solides que la moyenne, aussi bien pour une
rémission de la maladie que pour affronter les effets secondaires du traitement.
Les essais cliniques sont en outre trop courts et n’impliquent pas assez de
patients pour pouvoir détecter des affections rares ou qui apparaissent après
des années, dues au traitement [Stegenga 2016].
Un autre problème éthique est celui bien connu des méthodes d’op-
timisation du processus de publication. Les laboratoires pharmaceutiques
externalisent souvent la rédaction des articles pour les confier à des structures
dédiées qu’on recense désormais par dizaines [Sismondo 2007], à qui les
données sont confiées, et qui rédigent un article en optimisant sa rhétorique.
Ces structures disposent de l’expertise qui leur permet de publier dans les
meilleures revues scientifiques, là où de véritables équipes de chercheurs
s’attelant à l’écriture d’articles seraient beaucoup moins efficaces. Mieux, c’est
parfois tout le calendrier de la publication qui est prévu bien en amont par
ces structures, au point que l’on ne parle plus seulement de ghost writing
(c’est-à-dire de rédaction fantôme, en sous-main) mais de ghost management
(c’est-à-dire de management ou de gestion fantôme, en sous-main). Ce n’est
qu’en bout de chaîne que des scientifiques sont contactés pour leur « aide »,
leur signature servant de caution scientifique tandis qu’eux-mêmes bénéficient
de publications à leur nom dans des journaux prestigieux.
Ces stratégies sont autant de problèmes à affronter pour la science. Or leur
mise en œuvre, tout comme le combat qui est mené contre elles, relèvent autant
des sciences de la nature que des sciences humaines. Les travaux mentionnés
ici sont l’œuvre de deux philosophes (Stegenga et Sismondo) mais pourraient
aussi bien être ceux de sociologues, anthropologues ou scientifiques. Au-delà
de leurs appartenances disciplinaires, l’approche de ces auteurs passe par une
compréhension approfondie des méthodes qui ont cours actuellement, pour
ensuite mettre au jour la manière dont elles sont détournées. Enfin, leurs visées
sont aussi normatives et ils proposent de revoir les normes scientifiques pour
prévenir les détournements qu’ils ont observés. Cette approche s’appuie donc
sur des éléments scientifiques, par exemple des considérations mathématiques
Voir, c’est expérimenter 65

sur le bon échantillonnage d’une population (sa taille, la diversité des individus
qui la composent, etc.), mais aussi sur des aspects extra-scientifiques qui
relèvent de l’épistémologie et de l’éthique. C’est peut-être une conséquence
paradoxale de l’inscription de la médecine et des sciences du vivant dans les
sciences expérimentales à laquelle Bernard a tellement contribué. Ces sciences
sont comptées parmi les sciences de la nature puisqu’elles en adaptent les
méthodes ; mais dans le même mouvement, le caractère expérimental impose
un cadre réflexif qui ne relève pas strictement des sciences de la nature.
L’évolution de la recherche en sciences biomédicales repose non seulement
sur celle des technologies et de la connaissance scientifique, mais aussi
sur l’articulation de ces avancées avec un travail mené par des chercheurs
en sciences humaines, ou par les scientifiques capables d’élaborer ce cadre
épistémologique et éthique, et dont Bernard demeure avec quelques autres
(Duhem, Canguilhem, Fleck...) l’une des personnalités marquantes.

Bibliographie
Bernard, Claude [1865], Introduction à l’étude de la médecine expérimentale,
Paris : J. B. Baillière.

Carnap, Rudolf [1932], Über Protokollsätze, Erkenntnis, 3(1), 215–228, doi :


10.1007/BF01886421, trad. angl. par R. Creath et R. Nollan,“On Protocol
Sentences”, Noûs, 21, 457–470, 1987.

Daston, Lorraine & Galison, Peter [2007], Objectivity, New York : Zone
Books.

Hacking, Ian [1983], Representing and Intervening : Introductory Topics in


the Philosophy of Natural Science, Cambridge : Cambridge University Press.

Hanson, Norwood Russell [1958], Patterns of Discovery, Cambridge :


Cambridge University Press.

Israel-Jost, Vincent [2015], L’Observation scientifique, aspects philoso-


phiques et pratiques, Paris : Classiques Garnier.

Maxwell, Grover [1962], On the ontological status of theoretical entities,


dans : Scientific Explanation, Space, and Time, Minneapolis : Minnesota
for Philosophy of Science, 3–27.

Sismondo, Sergio [2007], Ghost management : How much of the medical


literature is shaped behind the scenes by the pharmaceutical industry ?,
PLOS Medicine, 4(9), e286, doi : 10.1371/journal.pmed.0040286.

Stegenga, Jacob [2016], Hollow hunt for harms, Perspectives on Science,


24(5), 481–504, doi : 10.1162/POSC_a_00220.
66 Vincent Israel-Jost

—— [2017], Drug regulation and the inductive risk calculus, dans : Case
Studies of Values in Science Exploring, édité par K. C. C. Elliott &
T. Richards, Oxford : Oxford University Press, 17–36.
Compréhension et expérimentation
face à l’irrationalité

Michel Le Du
Université d’Aix-Marseille –
Centre Gilles-Gaston-Granger, UMR 7304 (France)

Résumé : Le présent texte a pour objet de discuter les prétentions de l’écono-


mie comportementale, notamment la nature des résultats qu’elle revendique.
Cette nouvelle branche du savoir s’affiche souvent comme un nouveau para-
digme, mais il est aisé de montrer qu’elle ne peut rompre entièrement avec
les ambitions interprétatives qui sont traditionnellement celles des sciences
sociales. En conséquence, il est faux de penser que l’expérimentation est desti-
née à remplacer la compréhension, et une mise en perspective historique nous
aidera à voir pourquoi.

Abstract: This paper’s main goal is to assess the ambitions of behavioral


economics, especially the nature of its results. This new branch of knowledge
is often presented as a new paradigm, but it is easy to show that it can’t
break with away from the interpretative stance, which is traditional among
social scientists. Accordingly, it is a mistake to think that experimentation
can substitute for understanding, and a historical perspective will help us to
understand why.

1 Genèse du problème
1.1 Empathie
Selon une tradition déjà ancienne, les sciences sociales sont compréhensives et
mettent en œuvre une méthode qui leur est propre. Cette tradition s’oppose au
monisme méthodologique (lequel est souvent d’inspiration positiviste). L’un des
traits caractéristiques du positivisme réside, en effet, dans l’idée que les sciences

Philosophia Scientiæ, 23(2), 2019, 67–84.


68 Michel Le Du

de la nature et, spécialement, la physique mathématique fournissent un idéal à


l’aune duquel le développement de l’ensemble des sciences doit être apprécié.
Si l’on suit cette voie, les explications finalistes (qui semblent, à première
vue, centrales dans les sciences humaines), doivent être soit éliminées, soit
« purifiées » de façon à devenir des explications conformes au standard décrit
à l’instant [Von Wright 1971, 4]. Dans un tel contexte, le modèle d’explication
promu est nomologico-déductif, et fait intervenir l’idée de « lois de couverture »
[covering laws 1 ].
Le dualisme méthodologique, qui refuse d’accorder une position d’exclu-
sivité à l’idéal naturaliste qui vient d’être rappelé, a souvent été exprimé
à travers l’opposition expliquer/comprendre2 . Il importe de noter que cette
dichotomie ne fait nullement écho à l’emploi usuel de ces termes, lequel ne les
oppose pas de manière aussi nette. On dit par exemple couramment « Je vais
t’expliquer, tu vas comprendre » (relevons également que « comprendre » est un
verbe de succès et qu’ « expliquer » peut recouvrir une démarche). Cependant,
dans le contexte qui nous occupe, le point principal n’est pas la liberté prise
par rapport aux finesses du langage ordinaire mais plutôt la nature exacte de
ce que l’on entend, au sein des sciences de l’esprit, par « compréhension3 ».
Sur ce point, certains auteurs ont marqué la différence entre comprendre
une proposition et comprendre quelqu’un et insisté sur l’idée que cette dernière
forme de compréhension requiert une sorte de recréation, au sein de l’esprit
de l’interprète, des pensées et états mentaux de la personne – ou du groupe
de personnes – qu’il appréhende. Se trouve ainsi mis en circulation un concept
psychologique de compréhension. Il est d’usage d’associer, à cette conception

1. L’article d’Hempel offre une présentation compacte de ce modèle avec l’ambition


de l’appliquer à l’histoire [Hempel 1942, 42–43]. Il aboutit toutefois à une conclusion
nuancée. S’il défend le monisme épistémologique, il explique en même temps que
l’histoire ne parvient à produire que des esquisses d’explication [explanation sketches]
et non des lois en bonne et due forme. L’expression covering laws a été introduite
par William Dray dans Laws and Explanations in History [Dray 1957], pour qualifier
la position d’Hempel qu’il rejette. L’idée qui sous-tend cette expression est qu’il est
impossible d’expliquer un événement singulier (la mort de Socrate suite à l’absorption
de la ciguë) sans faire un détour (au moins implicite) par un énoncé général
« couvrant » les deux événements (= « Tous les hommes ayant bu la ciguë en sont
morts »).
2. Cette opposition vient à l’origine de l’historien Johann Droysen (1808-1884).
Cet auteur avançait, en réalité, une double distinction entre erkennen, erklären et
verstehen. Le premier de ces termes renvoie à la méthode philosophique, le second à
la méthode physique, le troisième à la méthode historique.
3. L’expression « science de l’esprit » a elle-même connu une histoire contrastée.
Pour nombre de lecteurs, elle demeure associée aux Geisteswissenschaften, mais il ne
faut pas perdre de vue que ce dernier terme a d’abord été introduit pour traduire
en allemand l’expression anglaise moral sciences qu’employait notamment Mill dans
le livre VI de son Système de logique en 1843 [Mill 1843]. De nos jours, l’expression
« sciences de l’esprit » (ou des expressions voisines) est employée pour qualifier des
programmes d’inspiration naturaliste qui ne doivent rien à la tradition herméneutique
(voir, par exemple, [Flanagan 1991] et, dans le domaine français, [Dehaene 2006]).
Compréhension et expérimentation face à l’irrationalité 69

psychologique de la compréhension, les noms de Wilhelm Dilthey et Georg


Simmel4 . Il convient toutefois de noter que c’est, à l’origine, au sein de la
théorie esthétique que le terme consacré, Einfühlung, fut forgé [Elie 2009]. En
effet, Robert Vischer [Vischer 2009, (original 1873)], l’employa dans le but de
désigner la relation d’un spectateur à une œuvre d’art et à son sens. L’usage de
ce même terme (par Lipps) pour désigner le processus par lequel l’observation
de l’expression corporelle d’une émotion déclencherait chez l’observateur une
émotion semblable (comme lorsque l’on s’identifie à l’acrobate en s’imaginant
soi-même sur le fil) s’est, par la suite, imposé et c’est ce dernier usage qui
a été couramment rendu en français par le terme « empathie ». Ces points
méritent d’être rappelés afin que soient rendus intelligibles les débats au sein
de ce courant. Faut-il étendre l’empathie au-delà des états émotionnels (par
exemple aux croyances) ? Faut-il imaginer, comme l’a fait Dilthey, une capacité
intellectuelle plus large de se « mettre à la place de » et pour laquelle il forgea
le terme hineinversetzen, que l’on a traduit également par « empathie » ?

1.2 Tournant sémantique


Reste que le concept de compréhension a, par la suite, connu un semantic
turn : on comprend la signification d’un symbole, celle d’une pratique, d’une
institution, ou encore les buts d’un agent (notamment à travers ses propos),
de sorte que même la compréhension d’une personne passe finalement, elle
aussi, par la médiation de signes5 . Les actes d’une personnalité se déchiffrent
comme un texte, à l’intérieur d’un « modèle de vie » où ils prennent sens,
et un tel déchiffrement ne doit rien à l’exercice d’une capacité intellectuelle
spéciale. Ce qui occupe dès lors le devant de la scène, c’est l’idée d’une relation
interne (qu’on ne retrouve pas du côté de l’explication) entre compréhension
et intentionnalité 6 . Et, à partir du moment où la compréhension est décantée
de toute référence à une faculté psychologique distincte (ou à nos propres

4. Dilthey explique, par exemple, que « l’ensemble de la vie psychique forme la base
de la cognition, [...] or nous avons vu que l’avantage méthodologique de la psychologie
tient à ce que l’ensemble psychique lui est donné de façon immédiate et vivante en
tant que réalité vécue » [Dilthey 1924, 157].
5. Il convient notamment de mettre ce semantic turn en rapport avec le travail
de Peter Winch mais, évidemment aussi, celui du second Wittgenstein. L’anti-
mentalisme de ce dernier a inspiré une notion de compréhension articulée à celles
de règle, de pratique et de formes de vie. Comme l’observait Clifford Geertz « La
culture est publique parce que la signification l’est » [Geertz 1973, 216].
6. Geertz est sans doute, parmi les anthropologues, celui qui a mené le plus
loin l’idée selon laquelle « la culture consiste en structures de sens socialement
établies » [Geertz 1973, 216]. Au sein de ces structures, un clin d’œil prend une
valeur symbolique au lieu d’être un simple clignement : c’est pourquoi, à ses yeux,
la culture relève d’une « science interprétative en quête de sens » [Geertz 1973, 210],
sens que l’on trouve même dans les conduites les plus furtives. Il convient donc saisir
le point de vue de l’indigène (ce qui ne signifie pas en devenir un), ce qui a du sens
pour lui, plutôt que d’appréhender ce dernier à travers le cadre fourni par nos propres
70 Michel Le Du

expériences appréhendées par introspection), le concept acquiert un statut


avant tout épistémologique : il permet de faire droit à l’intelligence ordinaire
que nous avons de nos semblables et des situations, en même temps qu’à
l’idée que celle-ci doit être prise en compte dans le traitement savant des
faits sociaux. Le modèle nomologico-déductif ne peut donc prétendre épuiser
la représentation scientifique que nous avons du monde.

1.3 Psychologie ordinaire vs psychologie


« scientifique »
Par ailleurs, il convient de distinguer la démarche consistant à confier à la
psychologie une tâche explicative de celle consistant simplement à utiliser
des concepts psychologiques. Si, par impossible, nos comptes rendus les plus
ordinaires de l’action humaine étaient décantés des concepts en question, ils
traiteraient des actions concernées en des termes entièrement impersonnels,
comme s’il s’agissait de processus purement naturels. Or, il est difficile
d’accomplir le moindre pas explicatif en sciences sociales sans faire intervenir,
à un moment ou à un autre, des concepts psychologiques, autrement dit sans
faire référence à des intentions, des croyances, etc. Mais le simple emploi
de ces termes ne suffit pas, on l’aura compris, à faire de l’explication en
question une explication relevant de la psychologie. C’est, en réalité, du côté
du courant naturaliste (que l’on peut faire remonter à Mill et, au delà, à
Hume) que l’on trouve l’idée que les « Lois de l’esprit » (et donc la psycho-
logie) jouent un rôle matriciel dans l’explication de la conduite humaine7 .
Le point intéressant est qu’en réalité les Geisteswissenschaften, au terme de
leur tournant sémantique, en sont venues à établir une ligne de démarcation
nette entre psychologie et sciences sociales.
Par ailleurs, à rebours des orientations « herméneutiques » qui viennent
d’être décrites, s’est développé depuis un certain nombre d’années un courant
expérimental en sciences sociales (notamment en économie), lequel renoue avec
la psychologie et semble s’éloigner de la démarche compréhensive. Son lien
avec la psychologie se voit notamment à l’usage de l’épithète comportemental.
Ainsi en est-on venu à parler d’économie comportementale, de finance com-

conceptions – ce à quoi, observe Geertz, se ramène souvent ce que l’on place sous le
terme d’empathie [Geertz 1983, 59].
7. Mill soutient par exemple que « les êtres humains en société n’ont pas d’autres
propriétés que celles qui sont dérivées et peuvent se réduire aux lois de la nature de
l’homme individuel » [Mill 1843, 65]. Au nombre de ces lois de la nature individuelle il
faut compter au premier chef les « lois de l’esprit » et notamment les lois d’association.
Mill admettait toutefois que certains faits mentaux, à l’image des instincts, ne
pouvaient s’expliquer par les lois de l’esprit mais seulement par « une connexion
directe et immédiate avec les caractéristiques physiques du cerveau et des nerfs »
[Mill 1843, 45].
Compréhension et expérimentation face à l’irrationalité 71

portementale, etc.8 . Bien entendu, la psychologie ainsi réintroduite ne doit


rien à la psychologie d’association sur laquelle s’appuyait Mill. Ce courant a
donné lieu à quelques livres à succès et s’est employé à montrer à quel point
nos décisions, notamment en matière de consommation ou de vote, pouvaient
être irrationnelles. Certains ouvrages issus de cette mouvance entendent
également montrer comment parvenir à de meilleures décisions [Ariely 2008],
[Sunstein & Thaler 2009].
Les expérimentations sont soit conduites en laboratoire, soit menées sur
le terrain. Les premières ont souvent été critiquées, au motif qu’elles portent
souvent sur les étudiants de l’expérimentateur, ce qui soulève le problème de la
« représentativité » de ces cobayes. La question de savoir dans quelle mesure ces
situations artificielles nous renseignent vraiment sur ce que feraient les agents
confrontés à des alternatives réelles a été également soulevée. Mais le choix des
personnes testées dans le cadre des recherches de terrain soulève également de
délicates questions9 . L’expérimentation de terrain, dans la mesure où elle traite
ce qu’elle considère comme des biais ou des préjugés de la part des agents
comme autant d’obstacles à l’établissement d’un comportement économique
bénéfique, s’emploie à trouver des incitations susceptibles de réorienter la
conduite des agents (c’est ce que l’on appelle désormais nudge).
Dans ce qui suit, nous allons, pour l’essentiel, poursuivre deux objectifs :
(1) repérer dans le détail comment a été tracée cette ligne de démarcation
entre psychologie et sciences sociales et comment celle-ci a informé le concept
de compréhension ; (2) saisir jusqu’à quel point l’orientation expérimentale que
nous avons mentionnée peut être présentée comme un paradigme nouveau. Ce
second objectif suppose de cerner la nature exacte des expérimentations et de
ce qu’elles mettent en lumière. On devine au passage qu’il serait trop rapide
de conclure, sur la base de cette littérature récente, que l’expérimentation a
désormais tous les titres pour remplacer la compréhension.

8. L’expression anglaise est behavioral economics. Le lien entre ce courant et la


tradition béhavioriste en psychologie (Watson, Skinner) n’est cependant pas évident.
On sait que le comportementalisme considère l’esprit comme une « boîte noire » et
tend à soutenir que les termes mentaux se réfèrent, en réalité, à des comportements ou
à des dispositions comportementales (par exemple, le terme pensée à une disposition
à parler). On ne lit rien d’aussi radical sous la plume des auteurs-phares en économie
comportementale. En réalité, à partir du moment où, comme nous le verrons, ils
thématisent des biais qui infléchissent nos jugements, nos raisonnements et, in fine,
nos choix, ils font bel et bien des hypothèses sur l’esprit, sur ce qui induit nos
comportements.
9. On peut notamment songer aux recherches sur la pauvreté menées par Esther
Duflo [Duflo 2009], [Duflo & Banerjee 2012].
72 Michel Le Du

2 La compréhension sans la psychologie


La compréhension, entendue en son sens épistémologique, s’oppose, on l’aura
compris, à la démarche consistant à penser que son noyau consiste en une forme
ou une autre d’intropathie ou d’Einfühlung (voir les critiques de Weber contre
Lipps). Weber considère que le caractère fictif de l’intropathie l’empêche, en
réalité, d’être une connaissance. Mais, au-delà de cela, il y a le fait que la
compréhension ne porte pas réellement, selon lui, sur des caractères ou des
espèces psychologiques.
Les seules différences dans les qualités psychologiques d’un com-
portement ne sont donc pas comme telles importantes pour nous.
[...] Une catégorie comme celle de la « recherche du profit »
n’appartient vraiment à aucune espèce de psychologie. En effet, la
« même » recherche de la « rentabilité » dans une « même » entre-
prise commerciale peut non seulement rester la même en cas d’un
changement de propriétaire dont les traits de caractère seraient
absolument hétérogènes, mais elle peut aussi être déterminée
directement, en ce qui concerne l’identité de son développement
et son résultat final, par des constellations « psychiques » et des
traits de caractère opposés. [Weber 1913, 306–307]
L’idée importante est donc qu’il n’est pas nécessaire de faire référence à
la psychologie de la personnalité de l’agent car il s’agit avant tout de
l’analyse d’une situation, par ailleurs donnée objectivement. Weber insiste,
en conséquence, sur le fait que l’explication compréhensive ne consiste pas à
mettre en lumière des « constellations psychiques ». Hayek a, me semble-t-il,
fait faire à cette ligne d’analyse un pas supplémentaire :
Dans les sciences sociales, les attitudes individuelles sont des
éléments familiers et nous essayons par leur combinaison de
reproduire des phénomènes complexes, les résultats des actions in-
dividuelles, qui nous sont beaucoup moins connus ; cette démarche
conduit souvent à découvrir dans des phénomènes complexes
des principes de cohérence structurelle qui n’avaient pas été
établis par l’observation directe. [...] Dans les sciences sociales,
ce sont les éléments des phénomènes qui sont connus sans aucune
contestation possible. Dans les sciences naturelles, ils peuvent,
en mettant les choses au mieux, seulement être supposés. [...]
Alors que la méthode des sciences de la nature est, en ce sens,
analytique, celle des sciences sociales se définit mieux comme
“synthétique” [compositive]. [...] Pour autant que dans les sciences
sociales nous analysions la pensée individuelle, ce n’est pas dans
le but de l’expliquer, mais seulement de distinguer des types
possibles d’éléments avec lesquels nous devons compter dans la
construction de différents modèles de relations sociales. C’est
Compréhension et expérimentation face à l’irrationalité 73

une erreur souvent accréditée par les expressions négligentes des


chercheurs, de croire que le but des sciences sociales est d’expliquer
une action consciente. C’est là, si on peut le faire, une tâche
différente, celle de la psychologie. [Hayek 1952, 52–57]

L’élément significatif est ici que l’auteur considère les éléments psycholo-
giques dont les sciences sociales font mention comme « familiers ». Il fournit
sur ce point un exemple intuitif. Des marcheurs perdus auront tendance à
prendre un sentier déjà visible. C’est ce qui fera que, sur le long terme, le
sentier en question sera de plus en plus nettement tracé, alors même que les
différents marcheurs ne se seront jamais donnés un tel objectif : leur seul but
était de rentrer chez eux10 . Ainsi, comprendre une régularité sociale revient-
il à montrer de quelle manière elle se réalise par la combinaison d’actions
individuelles, même si aucune de ces actions n’avait pour fin déclarée cette
réalisation11 . La question qui se pose est, en réalité, de savoir si les attitudes
concernées sont toujours aussi « familières » que celle avancée pour expliquer
la formation progressive du chemin. Nous allons revenir sur ce point.

3 La présomption de rationalité

3.1 Des agents très spéciaux ?


Avant cela, il convient de relever qu’un principe vient s’ajouter au caractère
familier des éléments psychologiques introduits pour faciliter la tâche du
chercheur en sciences sociales : la présomption de rationalité. En effet, la
rationalité (et notamment la rationalité téléologique) fournit à l’approche
compréhensive une sorte de paradigme idéal. Weber écrit :

Il est vrai, cependant, que le comportement qui se laisse interpré-


ter rationnellement constitue la plupart du temps « l’idéaltype »
le plus approprié dans les analyses sociologiques d’enchaînements
compréhensibles. [Weber 1913, 307]

10. Il est important de noter que l’explication de la formation du sentier, telle


qu’esquissée à l’instant, ne procède en rien d’une induction faite à partir de
l’observation de sentiers particuliers.
11. Le terme « forme » est, dans le présent contexte, très important. On le
trouve déjà dans les écrits de Georg Simmel qui prenait comme exemple les formes
de politesse. Celles-ci résultent d’un ajustement progressif entre comportements
individuels (certains agents suivent un usage établi, d’autres choisissent de faire
sécession). Une forme de politesse est ainsi un point d’équilibre entre ces différentes
tendances. L’élément essentiel est que cet équilibre, s’il résulte évidemment des actions
humaines, ne procède pas d’une planification préalable. Hayek réserve précisément le
terme « institution » à celles, parmi les formations, qui résultent d’une planification
[Hayek 1967]. Hayek emprunte à Adam Ferguson la formule qui donne son titre à son
article.
74 Michel Le Du

Ainsi les comportements réels (par exemple les comportements écono-


miques) sont-ils considérés comme des approximations de ce qui est présenté
comme idéaltypique. Un point similaire est avancé de manière plus candide
par Popper :

En réalité, il y a des raisons de croire non seulement que la science


sociale est moins compliquée que la physique, mais aussi que les
situations sociales concrètes sont en général moins compliquées
que les situations physiques concrètes. En effet, dans la plupart
des situations sociales – sinon dans toutes – il y a un élément de
rationalité. De l’aveu de tous, les êtres humains n’agissent presque
jamais d’une façon tout à fait rationnelle (c’est-à-dire, comme
ils le feraient s’ils pouvaient faire le meilleur usage de toutes
les informations disponibles pour atteindre toutes les fins qu’ils
peuvent se proposer), mais ils n’en agissent pas moins d’une façon
plus ou moins (approximativement) rationnelle ; aussi devient-il
possible de construire des modèles comparativement simples de
leurs actions et interactions, et d’utiliser ces modèles comme des
approximations. [Popper 1957, 138]

On peut rester sceptique devant l’idée que les situations sociales concrètes
seraient moins compliquées que les situations physiques concrètes : il faudrait
disposer, pour l’affirmer, d’une échelle unique à l’aune de laquelle pourrait
s’apprécier la complication des unes et des autres. La seule chose qu’on puisse
raisonnablement soutenir est que, dans certains cas, nous disposons de modèles
idéaux permettant de rendre compte de manière simple des situations sociales.
Mais cela ne suffit pas pour conclure qu’elles sont intrinsèquement moins
compliquées que celles que nous présente la nature physique.
Il serait par ailleurs trop simple de résumer la position qui vient d’être re-
tracée en disant qu’elle assimile purement et simplement « action rationnelle »
et « action compréhensible ». Il y a à cela plusieurs raisons.

1. Weber souligne, par exemple, que l’on ne peut pas ignorer le rôle de
certaines émotions et états affectifs.

2. Il souligne également que la « rationalisation téléologique » peut, in fine,


se heurter à des buts qui ne sont plus des moyens en vue d’autres buts,
mais des « directions de l’activité qui échappent à une interprétation
rationnelle plus complète » [Weber 1913, 305].

3. Enfin, il mentionne le fait que certaines actions sinnhaft orientiert ont un


sens qui ne peut être saisi que par un « expert » : il y a ainsi des actions
qui peuvent être ajustées à un but mais dans lesquelles l’agent lui-même
ne voit pas spontanément de but. La lecture de la Psychopathologie de la
vie quotidienne nous a familiarisés avec ce genre de choses [Freud 1901].
Compréhension et expérimentation face à l’irrationalité 75

Ces actions, au même titre que celles mentionnées en (1) et en (2) ne sont
pas pour autant soustraites par principe au travail de compréhension12 .

3.2 Bonnes et mauvaises raisons


On pourrait objecter qu’une action ayant un sens caché n’est pas forcément
irrationnelle, mais tout dépend évidemment de ce que l’on entend par cette
épithète. L’idée de sens caché renvoie à celle d’une raison qui serait implicite.
Mais une raison implicite n’est pas automatiquement une « mauvaise » raison.
En d’autres termes, si une raison (qu’elle soit ou non cachée) n’est pas une
« bonne raison », c’est que, du point de vue même de l’agent, elle ne justifie
pas l’action effectuée. Dans cette perspective, il ne suffit pas qu’une action
résulte d’une raison pour qu’elle soit rationnelle : il faut, de surcroît, que la
raison soit une justification (= qu’elle soit bonne). Nous voyons, du coup, aussi
qu’une action peut être intelligible sans pour autant être rationnelle (= nous
pouvons lui trouver des raisons, mais ces dernières ne sont que des motifs, et
non des justifications). Cela dit, la reconnaissance de ce point n’invalide pas
la présomption de rationalité, dans la mesure où l’on peut tenir qu’il convient
d’abord de chercher aux actions et décisions de « bonnes » raisons, avant de
leur chercher des motifs en un sens plus général.

4 Rationalité limitée et biais


de raisonnement
4.1 Raisonner en un temps limité
À ce qui précède, il convient d’ajouter le fait suivant : qui souscrit à cette
présomption doit opérer un ajustement dans son image de la rationalité.
En un mot, la rationalité à laquelle nous devons nous attendre n’est pas
celle des théories du choix rationnel, ni même une approximation de celle-
ci. Nous avons appris, depuis les travaux d’Herbert Simon, à prendre en
compte le fait que la rationalité est limitée [Simon 1947, 1957], [Gigerenzer
12. Dray avait opposé un type d’explication qu’il appelait « rationnelle » à celle
conforme au modèle nomologico-déductif [Dray 1957]. Mais la notion de raison ainsi
convoquée est équivoque. On peut entendre faire un usage normatif du concept de
raison et pointer, ce faisant, le fait qu’une action peut être justifiée (= on peut lui
trouver de bonnes raisons). Mais il arrive que le même terme soit employé comme un
équivalent de motif. Une action portée par un motif n’est pas forcément justifiée, elle
n’en est pas pour autant incompréhensible : il se peut tout à fait qu’on lui trouve
aisément un sens. Donagan, discutant de la position de Dray, a avancé une distinction
entre being rational et being intelligible. On pourrait suggérer qu’une action sous-
tendue par un motif (comme la jalousie) est intelligible sans être forcément rationnelle
[Donagan 1964].
76 Michel Le Du

& Goldstein 1996]. Lorsque nous devons effectuer un achat ou un choix (par
exemple dans le cadre d’un vote) en un temps bref, nous n’examinons pas
l’ensemble des possibilités, car nous sommes limités en termes d’information
et de capacités cognitives. Nous optons le plus souvent pour une solution
raisonnable en situation d’incertitude, même si cette solution n’est pas, dans
l’absolu, la solution optimale.
Des décisions qui ont l’air irrationnelles peuvent ainsi s’avérer être les
produits de choix effectués sous contrainte : rapportées à leur contexte,
elles ne sont pas exemptes de bonnes raisons. Il se peut également que nos
préférences ne soient pas clairement établies, qu’elles soient floues et chan-
geantes au gré des situations. Les recherches expérimentales sur ces thèmes ont
conduit à la mise en lumière de raccourcis cognitifs (on parle ordinairement
aujourd’hui d’heuristiques de jugements) [Simon 1955]. Le problème de ces
heuristiques est qu’elles peuvent, si l’on en croit notamment Kahneman &
Tversky [Tversky & Kahneman 1974], conduire à des biais de raisonnement.
Plus on se persuade que ces biais sont nombreux et récurrents, plus on a de
raisons de penser que la rationalité des agents en est affectée, et la présomption
de rationalité semble en être ébranlée.

4.2 Quelques exemples de biais


1. Biais de confirmation : tendance à ne retenir que ce qui confirme
certaines croyances plutôt que ce qui les invalide.
2. Biais d’auto-complaisance : tendance à s’attribuer les réussites et à
imputer les échecs aux circonstances extérieures.
3. Effet de dotation [endowment effect] : imputation d’une valeur plus
grande à une chose que l’on possède que celle que l’on accorderait à
un objet identique que l’on ne possède pas.
4. Erreur fondamentale d’attribution : imputation de la conduite des autres
personnes à un principe permanent (la personnalité) alors qu’elle est
souvent, pour l’essentiel, le fruit des circonstances.

Il est important de noter que les biais figurant dans cette liste n’ont, dans
l’ensemble, nul besoin d’expérimentations pour être entrevus. On s’aperçoit
que beaucoup d’entre eux ont été repérés par les moralistes et les écrivains.
Qui peut s’étonner, par exemple, de la tendance à s’attribuer ses réussites
et à imputer aux circonstances extérieures ses échecs ? L’endowment effect
(également appelé « aversion à la perte ») appelle des remarques similaires.
Si l’on en croit Richard Thaler, l’exhumation du fait que les gens accordent
plus de valeur à ce qu’ils possèdent déjà qu’à ce qu’ils pourraient posséder
constitue une des grandes découvertes de l’économie comportementale. Mais,
comme le fait remarquer Jean-Michel Servet, le contenu de cette assertion
Compréhension et expérimentation face à l’irrationalité 77

savante recoupe celui d’un vénérable dicton lyonnais : « C’est toujours trop
cher quand on achète et jamais assez quand on y vend » [Servet 2018, 29]13 .
Autrement dit, les attitudes en question ne sont pas exotiques : nous
restons, en fait, dans le domaine de la psychologie personnelle14 . Du coup,
l’explication ainsi avancée ne diffère qu’en degré (et non en nature) de celle
qui consiste à expliquer une régularité en la rapportant à la simple tendance à
suivre un chemin déjà emprunté. En un mot, on explique le comportement et
les décisions des êtres humains par des éléments qui, sans être absolument
familiers, ne sont pas pour autant des mécanismes cognitifs occultes ou
« subdoxastiques ». Ce qui précède nous amène à la question suivante : si
l’expérimentation n’a pas pour résultat d’exhumer les biais, au sens où l’on
exhume un mécanisme caché et soustrait de façon permanente à l’introspection,
alors quelle est exactement sa fonction ? Pour le comprendre, il convient de
s’arrêter sur un type tout différent d’expérimentation en science humaine.

5 Mécanismes cognitifs cachés


Cet exemple est emprunté à une étude de Juan Segui [Segui 1992]. Cet auteur
cherche à mettre à l’épreuve une hypothèse simple selon laquelle, plus un
mot est rare, plus sa reconnaissance visuelle (qui n’est pas sa compréhension)
demande de temps. Il s’avère que l’expérimentation valide une hypothèse
différente. Un mot a des voisins (poisson et boisson, paix et prix, paix et pain).
Un voisin est un mot qui diffère du terme de référence par une seule lettre.
On parle alors de « contexte virtuel ». C’est ce dernier qui est déterminant.
La bonne hypothèse s’avère être la suivante : si un mot a un voisin plus
fréquent que lui, cela rallonge le temps de reconnaissance. Ce n’est donc pas
la fréquence du mot dans l’absolu qui compte. L’expérimentation débouche
ici sur une loi générale (= l’énoncé en italiques ci-dessus) et met en lumière

13. L’aversion pour la perte, dont il vient d’être question, n’est en rien un trait
universalisable de psychologie des individus : s’il en était ainsi, des phénomènes
comme le potlatch, qui sont thématisés par l’anthropologie depuis des décennies,
seraient proprement inintelligibles [Servet 2018, 30].
14. L’épithète « personnelle » n’est pas dépourvue d’ambiguïtés. Elle est employée
afin de faire référence à des choses (pensées, intentions, etc.) dont l’agent peut faire
état. Pour le dire autrement, les pensées et les intentions tombent sous ce qu’il est
désormais convenu d’appeler l’autorité de la première personne. Ce qui tombe sous
cette autorité relève, dans cette perspective, de la psychologie personnelle, à l’inverse,
par exemple, du mécanisme de reconnaissance visuelle dont nous parlons plus loin.
Néanmoins, les mécanismes cognitifs inconscients sont, eux aussi, personnels (mais
dans un autre sens) à partir du moment où c’est à une personne qu’on les attribue,
quand bien même elle n’en n’a pas la connaissance. Les tendances constituent un cas
intermédiaire : une tendance échappe à l’autorité de la première personne (je n’en
fais pas état comme je fais état de mes intentions), néanmoins, elle n’est pas, par
principe, soustraite à ma conscience : je peux la découvrir en observant mes propres
réactions.
78 Michel Le Du

un mécanisme soustrait à l’introspection et sur lequel la volonté n’a pas


de prise. Ce mécanisme, qui relève de la psychologie sub-personnelle, n’a
rien à voir avec les attitudes psychologiques auxquelles s’attache l’économie
comportementale, lesquelles ne sont pas étrangères à notre intuition de nous-
mêmes. Dans l’exemple de la reconnaissance visuelle des mots se trouve
introduite l’hypothèse d’un module spécialisé dans le traitement d’un type
d’information et fonctionnant de façon automatique. On peut encoder le
fonctionnement de ce module sous une loi générale.
Revenons maintenant aux expérimentations permettant de mettre en
évidence les effets de biais de raisonnement. Contrairement à celle du cas
précédent, ces expérimentations, on l’aura compris, ne mettent pas en lumière
un mécanisme jusque-là inconnu. Mais elles permettent de repérer le degré
auquel les biais décrits informent nos décisions et nos choix ordinaires. Elles
amènent à voir l’ampleur de l’influence que ces derniers exercent, autrement
dit leur puissance. Sans les expérimentations, nous pourrions entrevoir les biais
mais non apprécier leur empire.

6 Irrationalité prédictible
6.1 You are so predictable
Comme nous l’avons précédemment indiqué, l’économiste comportemental
Dan Ariely a donné pour titre à son ouvrage Predictably Irrational [Ariely
2008]. Ce titre est l’indication d’une volonté de rupture par rapport à ce
dont nous avons parlé, notamment à la section 3, dans la mesure où l’auteur
considère que, dans un nombre impressionnant de cas, les agents ne sont pas
même approximativement rationnels. Il retient donc des travaux de Kahneman
& Tversky l’idée que différents types de biais affectent la rationalité de
nos décisions. L’irrationalité prédictible prend donc le pas sur la rationalité
limitée. Les comportements concernés ne sont pas plus imprévisibles que ne
le sont des conduites inspirées par de bonnes raisons ; ils ne sont pas moins
compréhensibles non plus : on peut déceler en eux des patterns identifiables.
Ariely illustre notamment son propos par l’examen de deux exemples : les
phénomènes de leurre et d’ancrage 15 .

6.2 Le leurre et l’argent du leurre


(a) Abonnement à Economist.com : 59 dollars.
(b) Abonnement à la version imprimée de The Economist : 125 dollars.
(c) Abonnement à la version imprimée + à la version online : 125 dollars.
15. Le second de ces deux phénomènes a déjà été thématisé par Kahneman &
Tversky.
Compréhension et expérimentation face à l’irrationalité 79

Ariely présente ces différentes options à un groupe d’étudiants dans le cadre


d’une expérimentation. Sur 100 étudiants testés, 84 choisissent l’option (c),
aucun ne choisit l’option (b) et 16 optent pour la proposition (a). Le point
intéressant est qu’au sein d’un autre groupe de cent étudiants, auxquels on
propose de choisir cette fois entre (a) et (c), l’option (b) ayant été supprimée,
les choix se répartissent très différemment. Cette fois, 68 étudiants choisissent
l’option internet seule et seulement 32 (contre 84 précédemment) l’option
version papier + version online.
L’explication est que, dans la première situation, la seconde option est un
leurre, inventé par les spécialistes en marketing consultés par The Economist,
et destiné à orienter le choix. Le but recherché est de dissuader les lecteurs de
l’annonce d’opter pour la version exclusivement en ligne, afin de préserver les
ventes de la version papier. Le comportement des étudiants, de son côté, est
parfaitement compréhensible. Il est plus facile de choisir lorsqu’il est possible
de comparer. La comparaison entre (b) et (c) est aisée, il est donc facile
de hiérarchiser ces deux options et de conclure que, rationnellement, (c) est
préférable à (b). L’irrationalité s’introduit lorsque l’on étend la hiérarchisation
à (a) et que l’on conclut que (c) doit être placé en 1, (a) en 2 et (b) en
3, alors que rien dans le fait de préférer (c) à (b) n’impose de placer, de
surcroît, (a) entre les deux : on pourrait, dans l’absolu, préférer (c) à (b)
tout en classant, par ordre de préférence, (a) en tête. Cette irrationalité
saute aux yeux lorsque le leurre est retiré des options : les préférences sont
alors hiérarchisées différemment.
En introduisant le −A (le leurre), on crée une comparaison rela-
tivement simple avec A, dans laquelle celle-ci apparaît supérieure
non seulement à −A mais aussi à tous les choix proposés. [Ariely
2008, 9]

6.3 L’ancrage
Un individu nommé Assael réussit à mettre en vente des perles noires
provenant de Polynésie dans des boutiques huppées de Manhattan. Elles n’ont
jamais été mises en vente avant, de sorte qu’il n’existe aucun précédent dont
on puisse s’autoriser pour fixer leur prix. En réussissant le « coup de bluff »
consistant à obtenir qu’elles soient placées dans des vitrines au milieu de
produits de luxe, on crée une empreinte permettant de faire passer l’idée
qu’elles sont coûteuses. C’est en cela que consiste l’ancrage.
Ariely parle, à propos de ce phénomène, de « cohérence arbitraire » [Ariely
2008, 23–26]. Une fois la « pilule » de l’ancrage initial avalée, les agents se
comportent de façon cohérente en acceptant de payer ensuite un certain prix
pour des perles similaires. Bien évidemment, ce n’est pas en soi le fait d’agir
en cohérence avec des décisions et des acceptations passées qui est irrationnel.
Si irrationalité il y a, elle est à chercher dans l’acceptation de l’ancrage initial.
Mais ne pourrions-nous pas dire simplement que le consommateur étant sans
80 Michel Le Du

compétence en matière de valeur des perles, son comportement s’explique par


l’ignorance plutôt que par l’irrationalité ? Ce point est très important et riche
en implications. Pour les mesurer, il convient de procéder à des comparaisons.
Raymond Boudon a plusieurs fois insisté sur le fait que les théories savantes
sont le plus souvent, pour le grand public, des boîtes noires. Transformer
les boîtes noires en question en boîtes blanches suppose de se plier à
l’apprentissage académique des théories concernées. Mais ce n’est pas, en
général, ce que fait l’homme de la rue. Celui-ci, si la question l’intéresse, se
contente de recueillir l’opinion d’une personne « autorisée ». Ainsi quelqu’un
ignorant tout de la théorie de la relativité générale recevra-t-il, auprès d’un
physicien professionnel, la confirmation que cette théorie est à la fois valide
et importante. Cette démarche a le mérite de s’adresser à quelqu’un pour qui
la théorie est une boîte blanche. Dans ces conditions, conclut Boudon, il est
normal de dire que, quoique novice, le sujet croit à la théorie de la relativité
générale pour de bonnes raisons [Boudon 1986, 121–122].
Le point essentiel est que, dans le cas du prix des perles noires, ce passage
de la boîte noire à la boîte blanche est impossible : on ne trouvera nulle
part un expert susceptible de montrer en quoi les propriétés intrinsèques des
perles justifient le prix auquel elles sont vendues. On trouvera, en revanche,
des experts en marketing capables d’expliquer comment le prix a été fixé16 .
Autrement dit, le fait que les perles soient exhibées dans la vitrine d’une
enseigne de luxe ne peut pas jouer le rôle que joue la consultation du physicien
professionnel dans l’exemple précédent, car une telle exhibition ne peut, par
elle-même, constituer une bonne raison de penser que leur prix est fondé. Par
conséquent, l’acheteur des perles n’est pas seulement ignorant (comme peut
l’être le novice en physique), il est irrationnel dans la mesure où il accepte sans
sourciller un prix, alors qu’il ne pense sans doute pas que l’exhibition dans une
vitrine luxueuse soit une raison valable de le croire justifié. Dans cet exemple,
comme dans le précédent, « être irrationnel » ne signifie nullement « être fou »
ou « ne plus être soi-même ». C’est, pour ainsi dire, à une irrationalité « au
petit pied » que nous avons affaire. Finalement, s’il n’a aucune bonne raison
d’accepter le prix des perles, notre acheteur peut (mais c’est une autre histoire)
en avoir une de se procurer un produit coûteux – si, par exemple, il veut séduire
une femme en le lui offrant.

6.4 Biais et illusions


Dans un passage de son ouvrage, Ariely établit un rapprochement entre les
biais qu’il examine et les illusions d’optique. Ce rapprochement tend à suggérer
16. Les spécialistes en marketing connaissent très bien le phénomène d’ancrage et
savent parfaitement l’exploiter. Ariely s’arrête sur un autre exemple similaire – et
plus familier : Starbuck a réussi son ancrage en persuadant les clients de payer leur
café deux fois son prix chez MacDonald’s ou Dunkin’s Donuts (pour ne rien dire de
Nespresso qui est parvenu à convaincre le chaland que ses capsules de café sont des
produits de luxe).
Compréhension et expérimentation face à l’irrationalité 81

que les biais sont incorrigibles (prendre conscience d’une illusion d’optique
comme celle de Müller-Lyer ne la supprime pas). Or, le fait que nous soyons
souvent plus sensibles aux biais d’autrui qu’aux nôtres ouvre la possibilité
d’une correction mutuelle qui n’a pas d’équivalent dans le cas d’une illusion
d’optique. Il arrive également que le comportement s’avère, sur le long terme,
plus rationnel qu’il ne l’est sur le moment.

7 Conclusions
7.1 Expérimentation vs compréhension ?
Ce qui précède suggère assez qu’il ne saurait être question de mettre les
démarches « compréhensives » et « expérimentales » dans deux enveloppes
distinctes. Les décisions et les choix que l’expérimentation permet d’étudier
s’expliquent par des biais qui doivent être compris. Par rapport à la distinction
que nous avons posée plus haut (explication fournie par la psychologie vs
explication recourant à des concepts psychologiques), nous sommes à la
charnière : une certaine psychologie « scientifique » est ici à l’œuvre, dans
les protocoles expérimentaux comme dans la manière dont les phénomènes
sont labellisés (« heuristiques de jugements », « effet de dotation », etc.),
mais il reste que les phénomènes ainsi élucidés ne sont pas étrangers à notre
compréhension ordinaire de nous-mêmes et de nos erreurs. Il serait d’ailleurs
aisé de reformuler certains biais, de manière à en faire des maximes mettant
en garde le lecteur contre certaines inclinations. Une de ces maximes (inspirée
du second exemple que l’on trouve plus haut) pourrait être : « Garde toi, tant
que tu vivras, de penser d’emblée que tes succès sont imputables à ton talent
et tes échecs aux circonstances. »

7.2 Un changement de paradigme ?


Comme nous l’avons vu, l’économie comportementale se présente volontiers
comme un nouveau paradigme. La justification de cette assertion n’est pas
principalement à chercher du côté du recours à l’expérimentation, mais plutôt
dans l’abandon affiché de la présomption de rationalité. Cet abandon n’est
toutefois pas complet. Les promoteurs de l’économie comportementale disent
qu’en tant qu’acheteurs, vendeurs, consommateurs nous sommes bien plus
fréquemment irrationnels qu’on pourrait le croire ; ils ne disent pas que nous
sommes purement et simplement incapables de rationalité. Et, comme nous
l’avons vu, le fait que les comportements irrationnels (qu’ils soient économiques
ou non) ne sont pas forcément inintelligibles a été relevé depuis longtemps :
on peut comprendre les « mauvaises » raisons qui les sous-tendent. Ajoutons
que lorsque l’on parvient à inhiber un choix de consommation irrationnel, il
arrive qu’un choix différé soit soutenu par de meilleures raisons.
82 Michel Le Du

La thèse d’un paradigm shift serait plus défendable si les auteurs


concernés pouvaient se targuer d’avoir ancré leur propos dans « une psy-
chologie partagée par les sujets économiques face à l’argent » [Servet 2018,
84]. C’est peut-être ce qu’ils pensent avoir fait mais, en l’occurrence,
c’est un préjugé. Qui plus est, ce préjugé tend à assimiler les pratiques
économiques de certains agents (et notamment des plus pauvres) à un
« illettrisme financier » dont il conviendrait de les sortir [Servet 2018, 80].
Dans cette perspective, corriger les biais dont souffrent leurs comportements
économiques revient à mettre les agents concernés en conformité avec une
conduite économique orthodoxe, dont on pense qu’elle est de nature à améliorer
leur situation, conduite que l’on répute décantée de tout un ensemble de
préjugés et de particularisme culturels futiles.
La principale objection qu’appelle cette démarche est qu’elle occulte le fait
que le « sens commun » économique, que l’on tend ainsi à promouvoir, est lui
aussi un produit culturel : l’argent déposé sur un compte dans une institution
n’est pas naturellement destinée à l’épargne et, dans certains pays, détenir du
cash permet des prêts qui constituent une forme d’épargne [Servet 2018, 84–
85]. Les critères de rationalité économique changent selon les aires culturelles.
Comme le rappelle Jean-Michel Servet,

En Inde, accumuler sous forme d’or apparaît, même du point de


vue économique, parfaitement rationnel. [Servet 2018, 89]

L’or peut, en effet, être déposé chez un prêteur sur gage en échange
de liquide, et une telle opération peut s’avérer plus aisée, dans bien des
régions, que celle qui consiste à se rendre dans une succursale de banque,
pour ne rien dire de son cours qui peut être objet de spéculation. Croire
que la rationalité économique ne peut s’incarner que dans les seuls critères
qu’on nous présente comme orthodoxes revient à rejeter comme irrationnels et
assujettis à des biais invisibles des comportements qui sont peut-être informés
par des critères différents de rationalité économique. Sous couvert d’être
expérimentale, l’approche risque de s’avérer impositive et normative.

7.3 Retour vers le futur


Au bout du compte, un travail de compréhension authentique doit nous
faire distinguer les conduites que l’on peut à bon droit considérer comme
irrationnelles de celles qu’il convient de rattacher à des critères différents de
rationalité économique. Et l’expérimentation ne peut sûrement pas, à elle seule,
nous apprendre cette distinction. Ainsi, l’idée que les enchaînements et les
régularités propres au comportement humain « se laissent interpréter de façon
compréhensible » [Weber 1913] ne peut-elle pas être purement et simplement
mise de côté. La compréhension a de l’avenir.
Compréhension et expérimentation face à l’irrationalité 83

Bibliographie
Ariely, Dan [2008], Predictably Irrational : The Hidden Forces That Shape
Our Decisions, Harper and Collins, trad. fr. par C. Rosson, C’est (vrai-
ment ?) moi qui décide, Paris : Flammarion, 2011.

Boudon, Raymond [1986], L’Idéologie, Paris : Fayard.

Dehaene, Stanislas [2006], Pour une science de la vie mentale, Paris : Fayard.

Dilthey, Wilhelm [1924], Die geistige Welt, Leipzig ; Berlin : B. G. Teubner,


trad. fr. par M. Remy, t.1, Le Monde de l’esprit, Paris : Aubier, 1947.

Donagan, Alan [1964], Historical explanation : The Popper-Hempel theory


reconsidered, History and Theory, 4(1), 3–26, doi : 10.2307/2504200.

Dray, William [1957], Laws and Explanations in History, Oxford : Oxford


University Press.

Duflo, Esther [2009], Expérience, science et lutte contre la pauvreté, Paris :


Fayard.

Duflo, Esther & Banerjee, Abhijit [2012], Poor Economics, New York :
Public Affairs, trad. fr. par J. Maistre, Repenser la pauvreté, Paris : Le
Seuil, 2012.

Elie, Maurice [2009], Aux origines de l’empathie, Nice : Ovadia.

Flanagan, Owen [1991], The New Science of the Mind, Cambridge : MIT
Press.

Freud, Sigmund [1901], Zur Psychopathologie des Alltagslebens, Berlin :


Verlag von S. Karger, trad. fr. par D. Messier, La Psychopathologie de la vie
quotidienne, Paris : Gallimard, 1997.

Geertz, Clifford [1973], La description dense, dans : L’Enquête de terrain,


édité par D. Cefaï, Paris : La Découverte, 208–233, trad. fr. de D. Cefaï,
2003.

—— [1983], Local Knowledge, Londres : Fontana Press, trad. fr. par D. Paulme,
Savoir local, savoir global, Paris : PUF, 2012.

Gigerenzer, Gerd & Goldstein, Daniel G. [1996], Reasoning the fast and
frugal way : Models of bounded rationality, Psychological Review, 103(4),
650–669, doi : 10.1037/0033-295X.103.4.650.

Hayek, Friedrich [1952], The Counter-Revolution of Science, Glencoe : The


Free Press, chap. Scientism and the Study of Society, 1–94, trad. fr. par
R. Barre, Scientisme et sciences sociales, Paris : Plon, 1991.
84 Michel Le Du

—— [1967], Essais de philosophie, de science politique et d’économie, Paris :


Les Belles Lettres, chap. Le résultat de l’action humaine mais non d’un
dessein humain, 159–172, trad. fr. par C. Piton, 2007.

Hempel, Carl G. [1942], The function of general laws in history, The Journal
of Philosophy, 39(2), 35–48, doi : 10.2307/2017635.

Mill, John-Stuart [1843], On the Logic of Moral Sciences, Peru : Open Court,
1988.

Popper, Karl [1957], The Poverty of Historicism, Londres : Routledge, trad. fr.
par H. Rousseau, Misère de l’historicisme, Paris : Plon, 1991.

Segui, Juan [1992], Les composantes cognitives de la lecture, dans : La Lecture,


processus, apprentissage, troubles, édité par P. Lecoq, Lille : PUL, 43–52.

Servet, Jean-Michel [2018], L’Économie comportementale en question, Paris :


Charles Léopold Meyer.

Simon, Herbert [1947], Administrative Behaviour, New York : MacMillan,


trad. fr. par X. Greffe, Administration et processus de décision, Paris :
Economica, 1983.

—— [1957], Models of Man, Social and Rational, New York : Wiley.

Simon, Herbert A. [1955], A behavioral model of rational choice, The Quarterly


Journal of Economics, 69(1), 99–118, doi : 10.2307/1884852.

Sunstein, Cass & Thaler, Richard [2009], Nudge, Improving Decisions about
Health, Wealth and Happiness, Londres : Penguin Books, trad. fr. par M.-
F. Pavillet, Nudge : la méthode douce pour inspirer la bonne décision, Paris :
Vuibert, 2010.

Tversky, Amos & Kahneman, Daniel [1974], Judgment under uncertainty :


Heuristics and biases, Science, 185(4157), 1124–1131, doi : 10.1126/science.
185.4157.1124.

Vischer, Robert [2009], Sur le sens optique de la Forme, contribution à


l’esthétique, dans : Aux origines de l’empathie, édité par M. Elie, Nice :
Ovadia, 57–100, publication originale 1873.

Von Wright, Georg Henrik [1971], Explanation and Understanding, Ithaca :


Cornell University Press.

Weber, Max [1913], Essais sur la théorie de la science, Paris : Plon, chap.
Essai sur quelques catégories de la sociologie compréhensive, 301–364,
trad. fr. par J. Freund, Paris : Plon, 1965.
Les essais contrôlés randomisés.
Une comparaison entre
la médecine et l’économie

Arthur Jatteau
Université de Lille,
CLERSÉ, UMR 8019 –
ENS Paris Saclay, IDHE.S, UMR 8533 (France)

Résumé : Depuis le début des années 2000, les essais randomisés contrôlés ont
connu un fulgurant retour sur le devant de la scène académique dans le domaine
de l’économie du développement et plus généralement dans celui de l’évaluation
des politiques publiques. Alors que ses partisans revendiquent une filiation
avec les essais cliniques randomisés en médecine, ces derniers demeurent mal
connus par les économistes. Cet article vise à combler ce manque en proposant
une comparaison de l’usage et des limites des essais contrôlés randomisés
entre la médecine et l’économie. Nous montrons ainsi que si cette méthode
est bien souvent placée au sommet de la hiérarchie des preuves en médecine,
des voix critiques existent et méritent d’être prises en compte pour penser
son application en économie. Nous soulignons également que le traitement du
problème de la généralisation des résultats, très bien documenté en médecine,
permet de nuancer l’intérêt de la méthode en économie.

Abstract: Since the beginning of the 2000s, Randomized Controlled Trials


(RCTs) have returned to center stage, both in the economics of development
and in the evaluation of public policy. Despite the fact that RCT promoters
claim a filiation with medicine, these economists seem unfamiliar with the
literature around clinical trials. This article aims to overcome this limitation,
by comparing the use and the limits of RCTs between medicine and economics.
I show that while this method is considered to be the “gold standard” of
evidence in medicine, some limits exist and have to be taken into account in
economics. I also show how the way in which the problem of external validity
is addressed in medicine provides arguments to obtain a more nuanced picture
of the interest of RCTs in economics.

Philosophia Scientiæ, 23(2), 2019, 85–109.


86 Arthur Jatteau

Depuis le début des années 2000, une méthode d’évaluation d’impact,


basée sur le tirage au sort de groupes (témoin et test), connaît un vif
succès en économie, en particulier dans le champ du développement : les
expérimentations aléatoires1 [Duflo 2010b,a]. Méthodologiquement similaire
aux essais cliniques randomisés en médecine, elle s’appuie sur le tirage au sort
pour former des groupes semblables, dont l’un jouera le rôle de « contrôle » afin
d’être comparé au(x) groupe(s) test(s), à qui sera distribué le « traitement »
dont on souhaite mesurer l’effet. Cette méthode avait déjà été utilisée pour
évaluer les politiques publiques aux États-Unis dans les années 1960-1970,
dans des proportions massives [Gueron & Rolston 2013]. Les résultats furent en
partie jugés décevants par les décideurs publics, en particulier à cause de leurs
difficultés d’interprétation et de généralisation [Monnier 1992]. La méthode
des essais contrôlés randomisés est donc passée de mode, sans toutefois
disparaître [Gueron 2002].
Elle est néanmoins réapparue sur le devant de la scène en économie depuis
une quinzaine d’années, par le biais de la figure montante de l’économiste
franco-américaine, Esther Duflo, professeure au MIT et co-fondatrice du
laboratoire de recherche J-PAL (Poverty Action Lab). Ce dernier a lancé près
d’un millier d’expérimentations aléatoires depuis sa création en 2003. Cette
méthode est ainsi régulièrement présentée comme le nouveau « gold standard »
[Banerjee 2007], tant en matière d’évaluation que de lutte contre la pauvreté.
Enfin, une approche permettrait d’apporter des arguments scientifiquement
robustes aux meilleures voies à suivre en la matière. Les articles de recherche
relatant des expérimentations aléatoires sont aujourd’hui publiés dans les
revues les plus cotées de la science économique [Duflo, Kremer et al. 2008],
[Thornton 2008], [Ashraf, Berry et al. 2010].
La liste impressionnante de récompenses obtenues par Esther Duflo atteste
de ce succès. Le « Nobel » d’économie semble être la seule qui ne lui est pas
encore attribuée, alors que son nom revient avec insistance à chaque remise de
ce prix. En 2017, il a d’ailleurs été décerné à Richard Thaler pour ses travaux
en finance expérimentale, quinze ans après celui obtenu par Daniel Kahneman
et Vernon Smith pour leurs recherches en économie expérimentale.
Les raisons de ce succès sont diverses : érosion du consensus de Washington,
crise économique, doutes sur l’efficacité de l’aide publique au développement,
contraction des dépenses publiques, retour de l’empirie dans la science
économique... Mais il en est une qui a permis de contribuer à la légitimation de
sa méthode : la revendication d’une filiation avec la médecine [Banerjee 2007].
Il s’agissait pour les promoteurs d’une telle méthode en économie de profiter
1. Ce terme ne rencontre pas d’acception pleinement stabilisée en français.
On trouve « évaluation par assignation aléatoire », « expérimentations contrôlées
randomisées », « expérimentations sociales », etc. Tous recouvrent une même méthode
d’évaluation qui s’appuie sur la constitution aléatoire de groupes. Nous privilégierons
le terme d’expérimentation aléatoire pour les travaux en économie, celui d’essai
clinique randomisé en médecine et d’essai contrôlé randomisé quand nous ne
souhaitons pas les inscrire dans une discipline en particulier.
Les essais randomisés contrôlés 87

de son aura de scientificité en insistant sur le versant « médecine des preuves »


[Marks 1997]. Un tel prolongement de qui est vu comme la transposition en
économie d’une méthode centrale de l’« Evidence-Based Medicine » (EBM) est
d’ailleurs salué par une grande revue médicale britannique dans un éditorial
daté de 2004 [The Lancet 2004]. En s’appropriant la randomisation, c’est-à-
dire l’utilisation de l’aléatoire à des fins évaluatives, l’économie deviendrait
aussi scientifique que la médecine, selon le schéma intellectuel défendu par les
économistes qui la promeuvent.
Un tel rapprochement avec la médecine mérite d’être questionné. Du point
de vue historique d’abord, une recherche originale montre que l’histoire des
essais contrôlés randomisés est largement pluridisciplinaire et que la médecine
ne saurait prétendre à une quelconque primauté [Jatteau 2016]. La psychologie,
les sciences de l’éducation, l’agronomie, la science politique, en sont au moins
autant à l’origine. Du point de vue proprement épistémologique, cette filiation
peut être plus classiquement contestée par ceux qui pensent l’économie comme
une science sociale. À ce titre, elle ne relèverait pas du même registre qu’une
science expérimentale comme la médecine [Coriat, Coutrot et al. 2017]. Pour
les économistes des expérimentations aléatoires2 , il s’agit en effet d’ancrer
l’économie du côté des sciences « dures », adjectif que certains d’entre eux
emploient d’ailleurs sans guillemets [L’Horty & Petit 2011], par opposition à
des sciences qui seraient « molles », comme les sciences sociales que la pratique
actuelle des expérimentations aléatoires – et au-delà une bonne partie de
la science économique contemporaine –, renie. C’est ce que Frédéric Lordon
appelle le « désir de “faire science” » [Lordon 1997]. Il s’agit donc de conserver
une certaine distance avec l’argumentation développée par les randomistes
pour défendre et promouvoir les essais contrôlés randomisés en médecine.
Certes, la filiation avec la médecine n’a que peu de fondement du point de
vue de l’histoire des sciences, mais elle demeure intéressante à relever dans
une optique sociologique de justification.
La revendication d’un tel héritage, par les effets performatifs qu’il entraîne
nécessairement, notamment un effet de fascination très net sur les décideurs
publics et sur les financeurs, mérite d’être prise au sérieux. En effet, ce parallèle
artificiel que font les randomistes avec la médecine explique une partie de leur
succès, outre les raisons déjà évoquées [Picciotto 2012]. Ensuite, parce qu’une
étude serrée de l’utilisation des essais cliniques randomisés en médecine est à
même d’éclairer leur transposition en économie. C’est l’hypothèse de travail de
cet article. En effet, comme l’a noté précocement Agnès Labrousse, ce transfert
de méthode cherche à agir comme un transfert de scientificité [Labrousse 2010].
L’objet des lignes qui vont suivre est de montrer que le chemin n’a été fait qu’à
moitié, dans la mesure où ce transfert s’est opéré sans transfert des débats
existant en médecine sur les essais cliniques randomisés. C’est un transfert qui

2. Pour souligner leur attrait pour la randomisation, nous appellerons ces écono-
mistes, s’inspirant de Deaton [Deaton 2010], les « randomistes ».
88 Arthur Jatteau

se veut partiel et partial, en particulier en ce qui concerne les limites propres


à la méthode en médecine, qui sont largement laissées de côté.
Il s’agit donc pour nous ici de revenir plus précisément sur les conditions
de ce transfert, en menant une recherche comparative entre la médecine et
l’économie du point de vue de la méthode des essais contrôlés randomisés.
Les essais cliniques randomisés étant utilisés en médecine depuis la fin des
années 1940 [Armitage 2003], la littérature à ce sujet est bien plus conséquente
que celle autour des expérimentations aléatoires en économie. L’expérience de
leur pratique n’est pas la même non plus. La médecine a accumulé à la fois
plus de connaissances, tant théoriques qu’empiriques, et plus d’expériences
sur l’usage de la randomisation. Il est dès lors intéressant de s’en inspirer, en
essayant d’en tirer toute la substance utile à une meilleure appréciation des
expérimentations aléatoires en économie, sans pour autant croire que tous les
problèmes sont identiques de part et d’autre. Précisons que notre propos se
restreint volontairement aux expérimentations qui utilisent à la fois un groupe
de contrôle et un tirage au sort (qui constituent le cœur des essais contrôlés
randomisés), et qu’il ne saurait embrasser l’ensemble des expérimentations, en
particulier celles se déroulant en laboratoire [Eber & Willinger 2012], sujet
qui mériterait plusieurs autres articles, tant la littérature est abondante et
ancienne [Levitt & List 2009]. Deux points justifient que l’on centre la réflexion
sur les essais contrôlés randomisés in vivo : leur omniprésence dans le domaine
de l’évaluation des projets de développement [Rodrik 2008] et leur domination
académique [Jatteau 2018].
À notre connaissance, un travail comparatif entre l’usage de ces essais
en médecine d’une part et en économie de l’autre n’a pas été fait jusqu’à
maintenant. La médecine a peu regardé du côté de l’économie, ce qui se
comprend aisément quand on sait l’antériorité de son usage massif de la
randomisation. L’économie ne s’est que peu penchée sur les travaux utilisant
également la randomisation en médecine. Les rares articles qui existent sur
le sujet portent sur des points précis [Bruhn & McKenzie 2009], [Bulte, Pan
et al. 2012], [Eble, Boone et al. 2014], mais aucun n’adopte une posture que
l’on pourrait qualifier d’épistémologie comparée. Une approche exhaustive qui
viserait à lister les différentes limites établies en médecine et applicables en
économie dépasserait largement le cadre de cet article3 . Il nous a semblé plus
pertinent de se centrer sur les plus importantes. Cela implique donc d’en laisser
de côté un certain nombre, en particulier celles relevant des difficultés de mise
en œuvre d’une telle méthode (respect du secret de la séquence d’assignation
[Schulz 1995], [Schulz & Grimes 2002], placebo, double-aveugle...) et d’autres
mettant au jour le rôle des acteurs participant aux essais cliniques randomisés
[Abraham & Reed 2002], [Dodier & Barbot 2000].
Les questionnements quant à la place des essais cliniques randomisés dans
la hiérarchie des preuves nous semblent en effet de première importance. S’ils y
figurent généralement au sommet dans le cadre de la « médecine des preuves »,
3. Sur ce point, on peut se référer au chapitre 1 de la thèse [Jatteau 2016].
Les essais randomisés contrôlés 89

des débats existent et permettent d’éclairer la supériorité revendiquée par les


randomistes en économie. Cette discussion de la hiérarchie des preuves fait écho
à la valorisation de méthodes autres que la randomisation afin de mesurer des
effets. Un autre point central des débats est la question de la généralisation
des résultats obtenus par une telle méthode, connue sous le terme de « validité
externe ». Elle renvoie à la nature des savoirs ainsi obtenus, à leur application
à d’autres contextes et à leur potentielle cumulativité. La validité externe
demeure un problème tout aussi aigu en médecine qu’en économie. Là aussi,
sa caractérisation et les pistes de solution apportées par et pour la première
peuvent utilement éclairer sa transposition à la seconde.

1 La remise en cause de la supériorité


des essais contrôlés randomisés
1.1 Une hiérarchie des preuves en débat
Dans le cadre de l’Evidence Based-Medicine, souvent traduit en français par
« médecine des preuves », les essais cliniques randomisés sont généralement
considérés comme le plus haut niveau de preuves [Charlton & Miles 1998],
[Concato, Shah et al. 2000], [SIGN 50 2008]. Ce qui nous intéresse ici
est d’interroger la transposition de cette hiérarchie en économie, et en
particulier dans l’étude des politiques publiques, à travers le mouvement de
l’Evidence Based-Policy (EBP), dans lequel s’inscrivent les randomistes
[Laurent, Baudry et al. 2009].
Les randomistes reprennent à leur compte de manière explicite cette
hiérarchie en soulignant la supériorité des expérimentations aléatoires sur
toute autre méthode d’évaluation [Banerjee 2007]. À la supériorité des essais
cliniques en médecine correspondrait celle des expérimentations aléatoires
dans l’évaluation de programmes ou de projets publics. Sur ce point,
soulignons que les randomistes franchissent une étape supplémentaire, ce
que se gardent bien de faire la plupart des tenants de l’EBM. En effet,
l’argumentation des premiers tend à délégitimer toute autre approche que
la randomisation. Cette dernière serait la seule véritablement scientifique,
les études quantitatives non-randomisées ou les études observationnelles ne
relevant pas du domaine scientifique. Plus qu’une hiérarchie, il convient de
parler chez les randomistes de monisme méthodologique [Labrousse 2016], où
une seule méthode est reconnue comme étant pleinement scientifique. Fait
rare dans la recherche, le laboratoire d’Esther Duflo, le J-PAL, leader dans
le champ des expérimentations aléatoires, ne pratique que cette méthode.
Tous les projets qu’ils lancent doivent suivre ainsi un même protocole
s’appuyant sur le tirage au sort de groupes.
Or, il convient de préciser qu’une hiérarchie ne suppose pas une négation
des méthodes qui n’occuperaient pas la première place et rend donc possible
90 Arthur Jatteau

leur utilisation en même temps qu’elle reconnaît leur utilité. C’est le cas en
médecine, notamment lorsqu’il n’est pas possible, pour des raisons éthiques
ou techniques, de mettre en place un essai clinique randomisé. Le recours aux
autres méthodes est alors légitimé. C’est une première différence entre l’usage
de la randomisation en médecine et en économie.
Si cette hiérarchie semble solidement installée en médecine, il n’en reste
pas moins qu’elle suscite de nombreux débats, parfois dans des termes violents
(certains allant jusqu’à parler de « fascisme » de l’Evidence-Based Discourse
[Holmes, Murray et al. 2006]. Des chercheurs remettent ainsi directement en
cause la randomisation et mettent en garde contre leur glorification [Feinstein
1984].
La raison principale est que les essais cliniques randomisés ne sauraient
être employés pour tout de manière indifférenciée. Pour certaines pathologies
par exemple, c’est souvent impossible ou très compliqué à réaliser, comme en
chirurgie [Abel & Koch 1999]. Dans le cas des cancers du poumon, Michael
Scriven note que l’on n’a jamais établi le lien avec le tabac à l’aide d’essais
cliniques randomisés, pour des raisons éthiques, mais aussi parce que cela
s’avère plus délicat pour des maladies à étiologie multifactorielle [Scriven 2008].
Pour autant, on a su prouver ce lien en l’absence de randomisation avec un
degré de certitude tel qu’aucun chercheur ne s’aventurerait à remettre en
cause le rôle du tabac dans ces cancers. Gordon Smith & Jill Pell traitent
la question avec humour en évoquant la « dramatique » absence d’essais
cliniques randomisés à même de montrer les bienfaits sur la santé de l’usage
d’un parachute lors d’une chute libre [Smith & Pell 2003]. Bien en peine
de trouver ne serait-ce qu’un seul essai à ce sujet, les auteurs critiquent
dans leur conclusion les tenants du « tout essai clinique randomisé », et plus
généralement les partisans de l’EBM, selon lesquels on ne peut rien tirer
d’une étude observationnelle. En médecine, il existe donc une « zone grise »
dans laquelle les canons de l’EBM, en particulier la randomisation, peuvent
difficilement opérer, lorsque ce qui intéresse les chercheurs est peu testable et
a fortiori impossible à prouver [Naylor 1995].
Or, les raisons de l’existence d’une telle « zone grise » sont globalement
ignorées par les économistes qui pratiquent des essais contrôlés randomisés
aujourd’hui, s’appuyant sur une vision simplifiée de l’état de la littérature
autour de ces essais en médecine. Des expérimentations aléatoires sont alors
menées au sujet de politiques dont les bienfaits sont unanimement reconnus
depuis longtemps, comme la distribution gratuite de vermifuges contre les
vers intestinaux [Miguel & Kremer 2004]. Dans certains cas, les résultats
apportés par ces essais contrôlés randomisés viennent simplement confirmer
des connaissances pourtant considérées comme acquises par les acteurs du
développement [Quentin & Guérin 2013].
Les essais randomisés contrôlés 91

1.2 La valorisation d’autres methodes


Des chercheurs en médecine invitent ainsi à reconsidérer les méthodes autres
que les essais cliniques randomisés, comme les méthodes observationnelles
[Black 1996]. De telles méthodes seraient ainsi complémentaires plutôt que
concurrentes. Ainsi, en économie comme en médecine, les critiques de la
suprématie des essais cliniques randomisés prônent une idée simple : plutôt
que de présupposer la supériorité de la méthode randomisée, faisons du cas
par cas, quelle que soit la discipline considérée [Cartwright 2007]. Ils ont
bien sûr leur place, mais celle-ci ne se situe pas nécessairement au-dessus
des autres méthodes. D’autres chercheurs vont eux combiner des approches
quantitatives (en l’occurrence des essais cliniques randomisés) et des approches
qualitatives, afin d’améliorer la compréhension des effets qui touchent le groupe
de traitement [Thomas, Harden et al. 2004].
De fait, de nombreux traitements (médicaments, techniques...) sont au-
jourd’hui utilisés en médecine sans que leur efficacité ait été démontrée à
l’aide d’essais cliniques randomisés [Worrall 2007], ce qui n’empêche pas
leur reconnaissance par la communauté médicale. Aussi, les essais cliniques
randomisés ne constituent un point de passage ni nécessaire, ni suffisant, en
médecine, au regard de la littérature et de la pratique médicales. La prise en
compte de ces dernières doit inviter les randomistes en économie à s’interroger
sur le statut de cette méthode.
Cela nous amène à considérer la prise en compte de l’EBM dans la
clinique des médecins. En prescrivant certains traitements dont l’efficacité n’a
pas été prouvée par des essais cliniques randomisés, beaucoup reconnaissent
en effet implicitement que d’autres modes d’administration de la preuve
que la randomisation sont acceptables. L’interprétation de la hiérarchie des
preuves que font les praticiens n’est pas si étroite que prônent les tenants de
l’EBM. Les patients qu’ils ont en face d’eux ne sauraient être réductibles aux
moyennes auxquelles aboutissent ces essais. Dès lors, les praticiens doivent
mobiliser d’autres modes d’administration de la preuve comme autant de
guides thérapeutiques.
Dans la littérature, il existe ainsi des situations pour lesquelles un essai
clinique randomisé ne s’impose pas, voire serait même contraire à l’éthique.
L’étude de la nocivité de certains aliments ou produits en rend le recours
délicat : il paraît inconcevable de monter un essai où le « traitement »
consisterait à consommer de la drogue ou de l’alcool, pour en mesurer les effets
sur l’organisme... Lorsque l’effet du traitement est très élevé se pose également
la question de l’utilisation (et de l’utilité) des essais randomisés [Henry-
Amar 2005]. En la matière, des débats parfois violents ont lieu concernant
les médicaments contre le sida : alors que certains médicaments donnaient des
résultats rapides et spectaculaires, certains médecins souhaitaient s’en tenir
à une stricte application du protocole alors que des associations de malades
jugeaient les preuves d’efficacité suffisantes et invitaient à diffuser sans plus
92 Arthur Jatteau

attendre le médicament, alors que la maladie se diffusait extrêmement vite


[Dodier & Barbot 2000].

La reconnaissance implicite d’une pluralité de preuves acceptables (plus


que d’une hiérarchie) doit être également pensée en économie. Il en va ainsi,
par exemple, des politiques lancées en Chine qui ont abouti à un incontestable
succès sur le plan macroéconomique [Rodrik 2008]. Elles ne procèdent pas
d’expérimentations aléatoires qui auraient permis de trouver la bonne marche
à suivre, et pourtant leur efficacité est incontestable. Certes, il demeure
délicat d’isoler les différentes mesures ayant donné des résultats positifs et
donc de mettre au jour les chaînes causales, mais l’efficacité des politiques
macroéconomiques apparaît largement reconnue, sans qu’il y ait eu de recours à
la randomisation. Pourtant, les randomistes tendent à affirmer qu’une politique
économique qui ne serait pas évaluée scientifiquement – c’est-à-dire à les lire,
en toute rigueur, évaluée par un essai randomisé contrôlé –, comme le suggèrent
les économistes Marc Ferracci & Étienne Wasmer [Ferracci & Wasmer 2011],
n’aurait pas lieu d’être.

On peut aller plus loin dans le parallèle avec la médecine. Certains acteurs
du « mouvement randomiste » (le plus souvent les assistants de recherche, c’est-
à-dire précisément ceux qui sont les plus proches de la pratique expérimentale,
à l’instar des médecins pratiquant les essais, les économistes pratiquant
des expérimentations aléatoires se rapprochant quant à eux davantage des
biostatisticiens faisant essentiellement un « travail de bureau ») reconnaissent
eux-mêmes, implicitement ou explicitement, le caractère flottant de cette
hiérarchie qui placerait la randomisation tout en haut de l’évaluation [Jatteau
2016]. En effet, lorsque l’on écoute leurs discours, on se rend compte qu’en
pratique, loin des discours officiels et de ce que l’on pourrait qualifier de « doxa
randomiste », certains nuancent la supériorité de cette méthode. Pourtant,
dans la littérature comme dans l’orientation de la recherche et des budgets,
force est de constater qu’une seule méthode semble avoir droit de cité.

D’autres exemples de questionnements en médecine peuvent enrichir les


pratiques expérimentales en économie. C’est le cas de ce que l’on appelle
les « horror stories », c’est-à-dire les « histoires » qui montrent que pendant
longtemps, en s’appuyant sur des études non randomisées, on a cru à l’efficacité
d’un médicament jusqu’au jour où un essai clinique randomisé a montré qu’il
était inefficace, voire, dans le pire des cas, qu’il était néfaste. Or ces études
souffrent d’un certain nombre de biais : tentation de publier les horror stories
uniquement si elles montrent que les essais cliniques randomisés obtiennent
des résultats différents de ceux d’essais non randomisés inclus dans l’étude
(dans certains cas, d’ailleurs, les premiers montrent que le traitement est
efficace quand les seconds le voyaient inefficace [Rothwell 2005], chances de
publication plus importantes pour les essais randomisés montrant l’inefficacité
d’un traitement que pour les essais non randomisés montrant également
l’inefficacité d’un traitement [Abel & Koch 1999].
Les essais randomisés contrôlés 93

Dans de nombreux articles relatant des expérimentations aléatoires en


économie, on retrouve cette idée de l’horror story, dans une version nuancée
avec des conséquences moins dramatiques qu’en médecine. Enfin, avec la
randomisation, on allait pouvoir obtenir des réponses définitives sur certains
sujets, éventuellement en contradiction avec ce que l’on croyait auparavant.
C’était ainsi l’ambition de Jessica Cohen & Pascaline Dupas, lorsqu’elles
ont lancé une expérimentation aléatoire afin de savoir s’il fallait distri-
buer gratuitement des moustiquaires ou les vendre à prix subventionné
[Cohen & Dupas 2010]. Avec la randomisation, elles souhaitaient apporter
un argument d’un niveau de preuve jamais atteint jusqu’alors en matière de
tarification des biens de santé.
Or la comparaison entre les essais randomisés et les essais non randomisés
n’aboutit pas systématiquement à montrer que les résultats diffèrent et que
les seconds obtiennent un effet plus important que les premiers, comme on
le lit souvent dans la littérature médicale4 . Nous pouvons prendre l’exemple
d’une étude qui va précisément chercher à vérifier ces assertions en compa-
rant sur cinq maladies différentes (tuberculose, cancer du sein, cholestérol,
hypertension...) près d’une centaine d’articles relatant des essais cliniques
randomisés et des études d’observation de cohortes ou de cas contrôlés
[Concato, Shah et al. 2000]. Les chercheurs montrent ainsi que les résultats
issus de méthodes non randomisées (mais « well-designed ») ne diffèrent pas
significativement de la méthode randomisée. Leur démonstration va même
plus loin, puisqu’elle montre que les études observationnelles ont une variance
moins grande dans leurs résultats, comme on le voit sur le graphique ci-dessous
de la figure 1. Une hypothèse pourrait être que ces dernières sont davantage
financées par des fonds publics et ainsi moins soumises à la nécessité de trouver
des résultats positifs, à l’inverse des essais cliniques randomisés massivement
financés par les laboratoires privés et dont la recherche de résultats obéit à des
impératifs économiques.
Sur le graphique, Les points noirs représentent les études randomisées, les
points blancs les études observationnelles. On voit aisément que la dispersion
des premiers est bien supérieure à celle des seconds. Autrement dit, avec les
essais randomisés, on a plus de chance de trouver un chiffre éloigné de ce que
l’on pense être le « vrai » résultat, en admettant que le « vrai » résultat se
situe au niveau du point moyen. Sur l’axe des abscisses figurent les risques
relatifs. Lorsque l’on se situe à droite de la limite pointillée (avec un risque
relatif supérieur à 1), cela signifie que le groupe de traitement est davantage
sujet à la maladie que le groupe de contrôle. Si la majorité des essais se situe
bien à gauche, montrant ainsi l’efficacité du traitement, et laissant à penser
que le « vrai » résultat se situe de ce côté, on remarque qu’à droite, on trouve
4. Comme le trouvent par exemple [Ioannidis, Haidich et al. 2001]. Ils montrent
néanmoins que les effets vont globalement dans le même sens, que les essais soient
randomisés ou non. C’est leur ampleur qui change. Il existe également des cas où les
essais cliniques randomisés trouvent des effets de plus grande ampleur que les études
non-randomisées [Boruch, Snyder et al. 2000].
94 Arthur Jatteau

Figure 1 – Source de l’image [Concato, Shah et al. 2000], reproduction avec l’aimable
autorisation de la MMS – Massachusetts Medical Society.

uniquement des essais randomisés. Comme le notent les auteurs, cela signifie
que ce sont les seuls à aboutir à un résultat de sens opposé à celui du point
moyen (c’est-à-dire de la majorité des essais) : les seuls à se tromper si l’on
admet que la majorité des essais identifient le bon signe du « vrai » effet5 .
Les études non randomisées trouvent quant à elles toujours le bon « sens » de
l’effet, et avec une variance bien moindre. Elles produisent donc des résultats
à la fois plus justes et plus précis.
Que peut-on en retenir ? Que la supériorité des essais cliniques randomisés
en matière d’évaluation n’est pas si unanimement reconnue et que le débat
existe en médecine. Les randomistes, convaincus des bienfaits de la méthode
qu’ils ont adoptée, semblent réfuter a priori les questionnements sur la
hiérarchisation des preuves. Certes, la façon d’utiliser la randomisation en
économie diffère partiellement de celle utilisée en médecine (absence d’usage
de placebos, notamment6 ), mais les points communs sont bien plus nombreux.
5. Précisons que d’autres études trouvent à l’inverse que la variance des essais
randomisés est moindre que les essais non randomisés [Kunz & Oxman 1998], [Benson
& Hartz 2000]. La littérature ne montre ainsi pas une direction univoque en matière
de comparaison entre les deux.
6. On compte cependant au moins une exception [Bulte, Pan et al. 2012].
Les essais randomisés contrôlés 95

Aussi ne peut-on que s’étonner que ces débats autour de la hiérarchie des
preuves en médecine ne trouvent pas davantage d’écho chez les randomistes.
En conclusion provisoire, on peut dire que si la hiérarchie des preuves,
et à travers elle la suprématie des essais cliniques randomisés, ne souffre pas
de remise en cause généralisée en médecine, des questionnements existent,
assortis d’arguments sérieux en faveur de l’utilisation d’une pluralité de modes
d’administration de la preuve. La randomisation, malgré ses qualités qui ne
doivent pas être niées, ne saurait être la solution idéale à tout problème
d’évaluation, et quand elle en constitue une, elle n’est pas toujours la seule.
C’est un enseignement clair que l’on peut tirer de la littérature médicale, et
qui doit nous éclairer sur l’usage qui est fait de la méthode en économie.

2 Le problème de la généralisation des


résultats
2.1 La validité externe, de la médecine à l’économie
Il existe un autre problème central en matière d’expérimentation : la géné-
ralisation des résultats, connue sous le terme de « validité externe » dans la
littérature, par opposition à la « validité interne », qui renvoie à la certitude
que l’on peut avoir que l’effet mesuré provient bien du traitement testé. Il
est en effet fondamental de savoir si les effets procurés par un traitement
sont susceptibles de se reproduire dans un autre contexte (temps, époque,
population concernée). Par exemple, on se demande ce que l’administration
d’un médicament est susceptible de produire dans un autre pays que celui où il
a été testé, à une autre période et sur une population différente, ou alors dans
le même pays mais sur une autre population, ou encore une population plus
large. L’importance de la transposition d’un tel questionnement en économie
est évidente.
Si la supériorité des expérimentations aléatoires n’est guère remise en cause
par les randomistes, le problème de la validité externe est quant à lui bien
documenté [Duflo & Kremer 2005], [Duflo 2004], [Duflo, Glennerster et al.
2008], [Banerjee & Duflo 2009], [Glennerster & Takavarasha 2013]. Mais il
apparaît que ces économistes ne semblent pas prendre la mesure de cette
potentielle limite de leur méthode. Ils considèrent – à juste titre – qu’il ne
s’agit pas d’un problème spécifique aux expérimentations aléatoires7 . Cela
n’enlève pourtant rien de sa centralité, pour qui prétend avoir un impact sur
les politiques publiques et la lutte contre la pauvreté – ce qui est bien l’objectif
affiché des randomistes.
7. On peut juger que les essais cliniques randomisés comme les expérimentations
aléatoires en économie ont toutefois tendance à l’exacerber, dans la mesure où ils
se placent dans un cadre particulier, construit, à la différence de méthodes relevant
davantage de l’observation qui ne s’inscrivent pas dans une logique expérimentale.
96 Arthur Jatteau

La validité externe est un problème bien connu en médecine. Cette question


se pose depuis longtemps dans les recherches médicales, aussi bien dans les
colonies au xviiie siècle [Chamayou 2013] que dans les premiers essais cliniques
randomisés [Rothwell 2005]. Mais si le problème est documenté, il demeure
pour certains négligé en médecine [Glasgow, Lichtenstein et al. 2003], [Rothwell
2006], voire sacrifié au profit de la validité interne [Solomon, Cavanaugh et al.
2009]. Pourtant, dans une perspective clinique, le fait de savoir si un résultat
est transposable est une question de première importance pour les médecins,
d’autant que certains effets cliniques comportent des biais importants (selon
que le patient est une femme, un enfant...). L’effet bénéfique d’un traitement
mesuré par un essai clinique randomisé est-il suffisant pour qu’un praticien
l’applique directement sur un patient ?
Dans la pratique médicale, la question de la transposabilité clinique de la
recherche est tout à fait primordiale [Glasgow, Green et al. 2006]. En effet, il
ne s’agit pas seulement d’obtenir des résultats positifs des traitements testés,
encore faut-il que ceux-ci soient applicables et appliqués hors du cadre dans
lequel ils ont été obtenus [Rothwell 2005]. Or les essais cliniques randomisés
manquent souvent de pertinence dans une optique clinique [Jacobson, Edwards
et al. 1997]. Les recherches visant à prouver l’efficacité d’un traitement (preuve
d’efficacité) sont bien plus nombreuses que les recherches cherchant à cerner
l’effectivité d’un traitement (dans quelle mesure peut-il effectivement être
utilisé dans la clinique et plus généralement sur une population différente de
celle de l’essai ?). Cela revient à privilégier la validité interne au détriment de
la validité externe [Black 1996], comme les grilles de lecture reconnues dans la
profession le montrent, en privilégiant la première sur la seconde.
Si la traduction « sur le terrain » des résultats de la recherche est
si importante, c’est que dans sa clinique, un médecin ne considère pas
un « individu moyen », mais bien un patient particulier, avec son histoire
médicale, ses pathologies prises dans leur globalité, ses attentes... Dès lors, les
essais cliniques randomisés ne pouvant fournir des résultats qu’en moyenne
(par la comparaison de moyennes entre les groupes), leur transposabilité
à la clinique apparaît problématique. Il est tout à fait possible que des
résultats globalement positifs cachent de fortes disparités entre les individus
participant à une expérimentation (on parle d’hétérogénéité des effets).
On peut imaginer un médicament qui permettrait de soigner une majeure
partie d’une population, mais serait létal pour une petite minorité, par
exemple. Si « en moyenne » il marche, peut-on néanmoins y avoir recours,
sans connaître précisément la distribution de ces effets ? Appliquer des preuves
apportées par les essais cliniques randomisés à des cas particuliers doit donc
être fait avec précaution [Kravitz, Duan et al. 2004], comme le percevait déjà
Claude Bernard [Supiot 2015].
Le parallèle avec l’économie est ici fondamental. Si le problème y est connu,
il n’en reste pas moins que sa documentation en médecine peut être tout à
fait utile. La question de l’applicabilité des résultats obtenus en économie est
centrale, dans la mesure où les commanditaires de ces expérimentations (bien
Les essais randomisés contrôlés 97

souvent des organismes gouvernementaux ou internationaux, des fondations


pour le développement, etc.) visent précisément une généralisation à terme
des éventuels bienfaits montrés à l’aide d’une randomisation. Les acteurs
locaux du développement cherchent avant tout des résultats opérationnels
[Quentin & Guérin 2013]. Les questionnements posés en médecine à propos
du transfert dans la pratique des résultats démontrés par les essais cliniques
randomisés se posent donc avec acuité en économie. Cette facette de la validité
externe conduit à s’interroger sur les conditions d’application d’un résultat
à un autre contexte. De plus, se limiter à comparer des moyennes entre
groupes peut être très insatisfaisant en termes de politiques publiques, car
les gouvernants sont nécessairement intéressés autant par l’effet moyen d’une
mesure que par les distributions de l’effet. Alors que les inégalités économiques
s’avèrent croissantes dans les pays riches comme dans les pays pauvres,
la prise en compte de l’hétérogénéité des effets apparaît incontournable
[Gonzalez Alvaredo, Chancel et al. 2018].

2.2 Les contours de la validité externe


En médecine, la validité externe peut être abordée selon plusieurs points de
vue, que l’on se place du côté de l’équipe médicale, des patients, du traitement
lui-même ou en fonction du contexte [Rothwell 2005].
Prenons le cas des équipes médicales qui mettent en place les essais
cliniques [Black 1996]. Les cliniciens qui participent à l’essai clinique peuvent
ne pas être représentatifs de l’ensemble de ceux qui appliqueront ensuite
éventuellement le traitement testé (c’est particulièrement vrai en chirurgie,
mais pas seulement), par exemple, comme cela arrive, si seuls les meilleurs
sont sélectionnés. Cela peut biaiser positivement les résultats qui, en cas de
généralisation, risqueraient d’être moins bons dans la mesure où les praticiens
seraient d’un niveau moindre que celui de ceux ayant participé à l’étude.
En économie, on retrouve des inquiétudes similaires. Les équipes chargées
de mettre en place les expérimentations aléatoires bénéficient généralement
d’une certaine expérience et peuvent être particulièrement enthousiastes,
souhaitant que « ça marche », là où celles éventuellement chargées de
généraliser ensuite peuvent avoir un comportement différent. On peut évoquer
le cas d’une étude qui vise à voir si l’extension à tout un pays d’une
expérience randomisée produit les mêmes effets [Bold, Kimenyi et al. 2013].
Une expérimentation aléatoire avait en effet montré, dans une petite région
du Kenya, que l’embauche d’enseignants contractuels (et non fonctionnaires)
améliorait les résultats des élèves aux tests scolaires [Duflo, Dupas et al. 2015].
Lors de l’expérimentation, c’était une ONG qui était chargée d’appliquer
le programme. Lorsqu’on l’a étendu, le ministère kényan de l’Éducation
en a été chargé et l’on s’est aperçu que les effets positifs, présents loca-
lement dans la phase expérimentale, disparaissaient lors de cette phase de
généralisation. La résistance des syndicats des enseignants fonctionnaires à
98 Arthur Jatteau

cette extension à l’échelle nationale du programme, ainsi que la moindre


implication du personnel du ministère de l’Éducation, sont avancées comme
autant de pistes pour expliquer l’inefficacité du « traitement » une fois étendu.
Ainsi, la généralisation d’un programme en dehors du contexte où il a été
élaboré ne garantit pas la permanence des effets mesurés dans un certain
contexte. Or, à l’heure actuelle en économie, on ne compte que très peu
d’études comme celle-ci sur les effets de la généralisation d’un programme
à une plus grande échelle.
La sélection des patients des essais, à l’instar de celle des cliniciens, doit
également être questionnée du point de vue de la validité externe. S’ils diffèrent
trop de la population cible (celle pour laquelle on pense que le traitement peut
être bénéfique), alors la généralisation des résultats risque de poser problème
[Kravitz, Duan et al. 2004]. Les critères de participation aux essais sont parfois
si précis qu’ils excluent un très grand nombre de patients et que ceux retenus
pour l’étude diffèrent significativement de ceux n’y participant pas [Batifoulier
2015]. De nombreuses études excluent les femmes et les personnes âgées, tandis
que d’autres privilégient les patients qui sont les plus susceptibles de répondre
favorablement au traitement.
On peut prendre l’exemple de deux essais menés sur des thérapies antirétro-
virales [Moore, Goodall et al. 2000]. Les auteurs de l’article s’intéressent à leur
potentiel de généralisation. La méthode qu’ils adoptent consiste à comparer
les participants à l’étude à des malades qui y sont éligibles, mais qui n’y ont
finalement pas participé. Cela revient à se demander si l’on peut généraliser les
résultats à l’ensemble de la population d’intérêt. Or, les auteurs montrent que
ces deux groupes diffèrent significativement selon des caractéristiques qu’ils
jugent importantes (proportion d’homosexuels ou de toxicomanes, variété des
pays de naissance...).
Une fois de plus, le parallèle avec l’économie est intéressant. Comment
prétendre généraliser à une population qui diffère de celle à laquelle le
programme testé est destiné ? La question de la représentativité est peu traitée
par les randomistes, même si elle ne se pose pas toujours avec la même acuité :
la représentativité d’une étude multicentrique menée en France dans différentes
régions, comme celle sur la subvention des permis de conduire [L’Horty, Duguet
et al. 2012], paraît meilleure qu’une expérimentation conduite dans une petite
partie d’une région à l’ouest du Kenya [Glewwe, Kremer et al. 2009].
Les caractéristiques elles-mêmes du traitement peuvent limiter sa validité
externe, par exemple lorsqu’elles sont trop originales par rapport à ce qu’il
est possible de faire dans des conditions normales [Black 1996] ou lorsque le
protocole utilisé diffère trop de ceux habituellement suivis [Rothwell 2005].
Le choix des « outcomes », ces variables qui permettent de mesurer les
effets, peut également poser problème. Dans bon nombre d’essais cliniques ran-
domisés, les outcomes retenus sont des « surrogate outcomes », autrement dit
des outcomes de substitution ou outcomes intermédiaires (utilisés quand il n’est
pas possible d’en obtenir de meilleurs). Or, ils peuvent être trompeurs quant
Les essais randomisés contrôlés 99

à l’impact sur les véritables variables d’intérêt [Labrousse 2010]. Envisager de


généraliser à partir de ces outcomes peut alors avoir des effets néfastes. De
plus, les outcomes retenus par les chercheurs ne sont pas toujours ceux qui
intéressent le plus les praticiens, ni même les patients, en médecine comme
en économie, particulièrement dans le monde du développement [Quentin &
Guérin 2013].
Les problèmes que ces différents points soulèvent se retrouvent en écono-
mie. Pour certaines expérimentations aléatoires, le traitement apparaît trop
original pour envisager une généralisation. L’expérimentation visant à limiter
l’absentéisme des instituteurs en Inde à l’aide d’incitations financières, leur
présence en classe étant contrôlée à l’aide de photographies qu’ils doivent
prendre de leurs élèves et d’eux-mêmes à différents moments de la journée en
est un bon exemple [Duflo, Hanna et al. 2012]. Bien que l’article montre que
les incitations « marchent », on peut douter d’une généralisation qui verrait
le gouvernement indien acheter des millions d’appareils photographiques... Ce
même exemple peut être utile pour illustrer la difficulté à choisir les « bons »
outcomes. Certes, le taux de présence s’accroît, mais à quel prix en termes
d’estime de soi et de motivation intrinsèque ? D’autres outcomes auraient peut-
être pu donner un sens différent aux conclusions avancées par les auteurs.
Enfin, il convient de prendre en compte également le contexte dans lequel se
déroulent les essais cliniques randomisés, celui-ci étant à même d’avoir un effet
qui altère la validité externe [Solomon, Cavanaugh et al. 2009]. Le cadre dans
lequel a lieu un essai clinique n’est certainement pas neutre et généraliser un
traitement dans un autre contexte peut modifier les effets qu’il produit. Ainsi,
les différences entre les systèmes de santé peuvent mettre à mal la validité
externe. Un médicament dont un essai aura montré qu’il est efficace contre
une maladie ne sera pas nécessairement consommé par les patients, en fonction
de son prix, de sa disponibilité et plus généralement de la présence et de
la forme d’une sécurité sociale. La localisation est donc à même d’avoir un
impact sur les effets mesurés et une généralisation à un autre système de
santé ne garantit pas des résultats similaires. Même pour des systèmes de
santé proches, les différences entre les pays peuvent miner la validité externe.
Là encore, dans une perspective de lutte contre la pauvreté, la question du
contexte dans les expérimentations aléatoires est tout à fait primordiale afin
d’essayer d’approcher au mieux les réels effets d’un « traitement ».

2.3 Dépasser le problème


Toutes les limites quant à la validité externe que nous avons décrites amènent
à considérer les pistes qui peuvent être suivies pour répondre à ce problème.
Il ne s’agit pas tant de rejeter les essais contrôlés randomisés parce que leurs
résultats ne sont pas valables pour tous, en tout temps et en tout lieu, que
de préciser pour qui, quand et dans quel contexte ces résultats sont valables.
L’objectif n’est ainsi pas d’avoir nécessairement une forte validité externe, mais
100 Arthur Jatteau

de pouvoir juger de la généralisation potentielle du traitement. Un résultat


qui ne serait que peu généralisable n’est pas inintéressant, pour peu qu’on soit
conscient de sa faible validité externe.
Dans cette optique, certains auteurs proposent de chercher des preuves
d’applicabilité des solutions testées, à l’aide d’études non randomisées, en
cherchant les effets non pas pour un groupe de patients particulier, mais bien
pour la population susceptible de bénéficier des traitements dans son ensemble
[Kravitz, Duan et al. 2004]. Pour espérer de l’Evidence-Based Practice, il
convient de faire de la Practice-Based Evidence [Glasgow, Green et al. 2006].
La distinction entre efficacité et effectivité, la première regardant uniquement
s’il y a un effet, quand la deuxième se demande s’il peut y avoir un effet dans
les conditions réelles [Barrett & Carter 2014], qui est bien établie en médecine,
devrait inspirer les économistes.
L’hétérogénéité géographique des effets peut mettre à mal la validité
externe [Horwitz, Singer et al. 1996]. Elle peut provenir d’une disparité
géographique des centres où sont pratiqués les essais. En médecine, on
préconise ainsi souvent des essais dans différents lieux. Cela constitue souvent
une condition requise par les revues et/ou les financeurs. Elle est aussi très
ancienne, puisque l’on trouve des essais multicentriques dès 1934 [Isambert
1987]. Le rôle des éditeurs de revue doit également être mentionné. Plusieurs
militent pour une meilleure prise en compte dans les journaux scientifiques du
problème de la validité externe, invitant ainsi à toujours vérifier que la question
« à qui ces résultats s’appliquent-ils ? » est bien posée dans les articles qu’ils
publient [Rothwell 2005].
Les recommandations formulées à propos des essais cliniques randomisés
en médecine sont pour la plupart transposables à l’économie. Un principe de
précaution doit tout d’abord se faire jour : il s’agit de ne jamais laisser entendre
que les résultats obtenus à l’aide d’une expérimentation aléatoire possèdent
a priori une validité externe. Or nombreux sont les articles les relatant où
l’on peut constater des glissements à ce sujet [Jatteau 2011]. Une preuve
d’efficacité ne vaut pas preuve de généralisation. La rigueur scientifique impose
la circonscription des résultats à leur contexte et invite à donner des éléments
qui permettent de juger la validité externe. Trop souvent, la généralisation est
laissée à l’appréciation des chercheurs qui, notamment dans leurs conclusions,
peuvent avoir tendance à exagérer la validité externe. Il ne s’agit pas de dénier
toute valeur à une expérimentation aléatoire si elle n’a pas de validité externe
forte, c’est-à-dire qu’on ne peut généraliser le « traitement » sans être certain
que les effets aillent toujours dans le sens mis en avant par l’expérimentation.
Mais elle n’a que peu d’intérêt si elle n’informe pas sur les contours possibles
d’une généralisation. Il ne faut pas négliger l’opérationnalité des résultats
obtenus par des expérimentations aléatoires. S’ils devaient rester cantonnés au
monde de la recherche, leur utilité en serait amoindrie, en particulier aux yeux
des financeurs de ces études, que ce soit des agences d’aide au développement,
des fondations privées ou des gouvernements. L’applicabilité des résultats doit
être pensée à hauteur de l’importance que lui accordent les parties prenantes
Les essais randomisés contrôlés 101

autres que les chercheurs, aussi bien au niveau du design de l’expérimentation


que des résultats [Quentin & Guérin 2013]. Il faut dire un mot des individus
qui sont engagés dans ces expérimentations, qu’ils soient dans le groupe de
contrôle ou dans celui de traitement. Paradoxalement, ils apparaissent assez
absents des essais contrôlés randomisés et ils ne sont approchés qu’à travers
les données quantitatives collectées à partir des questionnaires auxquels ils
répondent. Or c’est bien à travers eux d’abord que doit être saisie l’importance
de la validité externe, dans la mesure où ils sont potentiellement les premiers
bénéficiaires d’une telle extension, au-delà des retombées académiques en
termes de publications dont peuvent bénéficier les chercheurs qui lancent ces
essais et dont l’attente peut d’ailleurs entrer en conflit avec bienfaits pour les
populations [Jatteau 2013].
Il s’agit de faire preuve de vigilance quant aux généralisations qui se font
à partir d’une seule étude, comme c’est le cas en médecine, d’autant que les
conditions de généralisation sont rarement pensées avec les expérimentations
aléatoires. Pour mieux prendre en compte la validité externe, sans doute faut-il
plus que de la randomisation, pour reprendre le titre d’un article à ce sujet
[Glasgow, Green et al. 2006]. D’autres types d’études doivent être considérés, et
la méfiance qui est celle des randomistes à l’égard des méthodes qualitatives
doit être levée. C’est dans une pluralité de méthodes, plutôt que dans une
stricte hiérarchie, que certains chercheurs sur les essais cliniques randomisés
voient le salut en matière de validité externe. D’après eux, elles permettent
une contextualisation plus fine, mieux à même de fournir des éléments pour
permettre de juger d’une généralisation potentielle. Un tel pluralisme doit être
considéré en économie.

3 Conclusion
Que le tirage au sort soit utilisé dans un cadre expérimental pour mesurer
l’effet d’un traitement, en médecine comme en économie, apparaît satisfaisant
d’un point de vue statistique. Théorisée par Fisher dans l’entre-deux guerres
en s’appuyant sur des tentatives antérieures [Fisher 1925, 1935], la méthode de
l’expérimentation aléatoire est depuis utilisée dans de nombreuses disciplines
scientifiques. La médecine est certainement celle qui a contribué à la populari-
ser, à travers les dizaines de milliers d’essais cliniques randomisés lancés depuis
la seconde guerre mondiale [Olkin 1995]. À côté, l’économie fait pâle figure,
même en prenant en compte, en plus de la vague actuelle représentée par
l’économiste Esther Duflo, les expérimentations précoces (et méconnues) de
l’entre-deux guerres [Barbier 2012], comme celles, davantage documentées, des
années 1960-1980 aux États-Unis [Monnier 1992]. La première a emmagasiné
bien plus d’expériences que la seconde, et les discussions théoriques sur la
méthode des essais contrôlés randomisés n’en sont que plus riches. L’hypothèse
de travail de cet article était ainsi que la médecine pouvait faire bénéficier
102 Arthur Jatteau

l’économie de son recul historique supérieur, dont découle une réflexion plus
poussée. Deux éléments en particulier nous semblent devoir être mis en avant.
Le premier invite à nuancer le transfert de hiérarchisation des formes
de preuves qu’ont opéré les randomistes. S’appuyant implicitement sur la
hiérarchie des preuves telle qu’elle est diffusée en médecine, ils arguent de la
supériorité de la randomisation sur toute autre forme de méthode d’évaluation.
Si on retrouve un tel classement dans la littérature médicale, celle-ci comporte
également tout un pan de recherches visant à questionner une telle hiérarchie.
Il apparaît ainsi que même en médecine, le tirage au sort comme outil ultime
pour mesurer l’effet d’un traitement est régulièrement remis en cause. Cela
implique corollairement une (re)valorisation des autres méthodes. Ce relatif
pluralisme méthodologique revendiqué par des chercheurs en médecine, et
plus encore les raisons qui les poussent à le défendre, doivent être considérés
par les randomistes. Il s’agit de sortir d’une posture confortable qui laisserait
entendre que la supériorité d’une méthode aurait été définitivement prouvée,
en se référant à une discipline (la médecine) dont l’aura scientifique, si elle
peut être questionnée, est certainement supérieure à celle de l’économie.
La question de la généralisation se pose différemment, car ce problème
n’est pas nié par les randomistes, mais il demeure néanmoins dévalorisé.
Sur cet aspect également, la littérature médicale permet d’éclairer à quel
point elle est cruciale dans une optique d’application des résultats. Pour
sortir de l’expérimentation et aller vers la généralisation, il faut considérer
la validité externe à sa juste valeur. Cette question est ancienne en médecine,
où les chercheurs se sont depuis longtemps saisis de cette question. Outre
que leurs travaux permettent d’en saisir toute l’importante en économie,
les pistes qu’ils proposent pour le dépasser doivent également être prises en
compte par les randomistes, notamment en ce qu’elles appellent à une diversité
méthodologique accrue.
C’est là l’enseignement principal de cette comparaison entre la médecine
et l’économie à travers le prisme des essais contrôlés randomisés. Quoique
puissant statistiquement, ils apparaissent insuffisants à eux seuls pour remplir
l’objectif qu’on leur assigne : non seulement montrer les effets d’un traitement
dans un cadre expérimental, mais aussi et surtout, montrer quels effets un tel
traitement aurait une fois généralisé.

Bibliographie
Abel, Ulrich & Koch, Armin [1999], The role of randomization in clinical
studies : Myths and beliefs, Journal of Clinical Epidemiology, 52(6), 487–
497, doi : 10.1016/S0895-4356(99)00041-4.
Abraham, John & Reed, Tim [2002], Progress, innovation and regulatory
science in drug development : The politics of international standard-setting,
Social Studies of Science, 32(3), 337–369, doi : 10.2307/3183031.
Les essais randomisés contrôlés 103

Armitage, Peter [2003], Fisher, Bradford Hill, and randomization,


International Journal of Epidemiology, 32(6), 925–928, doi : 10.1093/ije/
dyg286.

Ashraf, Nava, Berry, James et al. [2010], Can higher prices stimulate
product use ? Evidence from a field experiment in Zambia, American
Economic Review, 100(5), 2383–2413, doi : 10.1257/aer.100.5.2383.

Banerjee, Abhijit V. (éd.) [2007], Making Aid Work, Cambridge : The MIT
Press.

Banerjee, Abhijit V. & Duflo, Esther [2009], L’approche expérimentale en


économie du développement, Revue d’Économie politique, 119, 691–726, doi :
10.3917/redp.195.0691.

Barbier, Jean-Claude [2012], évaluations “expérimentales” ? : quelques leçons


de l’histoire, Politiques sociales et familiales, 110, 19–31, doi : 10.3406/caf.
2012.2731.

Barrett, Christopher B. & Carter, Michael R. [2014], Retreat from radical


skepticism : Rebalancing theory, observational data and randomization in
development economics, dans : Fields Experiments and Their Critics, édité
par D. L. Teele, New Haven ; Londres : Yale University Press, 58–77.

Batifoulier, Philippe [2015], Aux origines de la privatisation du financement


du soin : quand la théorie de l’aléa moral rencontre le capitalisme sanitaire,
Revue de la régulation, 17, 2–32, doi : 10.4000/regulation.11196.

Benson, Kjell & Hartz, Arthur J. [2000], A comparison of observational


studies and randomized, controlled trials, New England Journal of Medicine,
342(25), 1878–1886, doi : 10.1056/NEJM200006223422506.

Black, Nick [1996], Why we need observational studies to evaluate the


effectiveness of health care, British Medical Journal, 312(7040), 1215–1218,
doi : 10.1136/bmj.312.7040.1215.

Bold, Tessa, Kimenyi, Mwangi et al. [2013], Scaling up what works :


Experimental evidence on external validity in Kenyan education, Working
Paper, Rap. tech., Center for Global Development.

Boruch, Robert, Snyder, Brooke et al. [2000], The importance of rando-


mized field trials, Crime & Delinquency, 46(2), 156–180, doi : 10.1177/
0011128700046002002.

Bruhn, Miriam & McKenzie, David [2009], In pursuit of balance :


Randomization in practice in development field experiments, American
Economic Journal : Applied Economics, 1(4), 200–232, doi : 10.2307/
25760187.
104 Arthur Jatteau

Bulte, Erwin, Pan, Lei et al. [2012], Pseudo-placebo effects in randomized


controlled trials for development : Evidence from a double-blind field
experiment in Tanzania, Working Paper.

Cartwright, Nancy [2007], Are RCTs the gold standard ?, BioSocieties, 2(1),
11–20, doi : 10.1017/S1745855207005029.

Chamayou, Grégoire [2013], Les Corps vils. Expérimenter sur les êtres
humains aux xviiie et xixe siècles, Paris : La Découverte.

Charlton, B. G. & Miles, A. [1998], The rise and fall of EBM, QJM : An
International Journal of Medicine, 91(5), 371–374, doi : 10.1093/qjmed/91.
5.371.

Cohen, Jessica & Dupas, Pascaline [2010], Free distribution or cost-sharing ?


evidence from a randomized malaria prevention experiment, The Quarterly
Journal of Economics, 125(1), 1–45, doi : 10.1162/qjec.2010.125.1.1.

Concato, John, Shah, Nirav et al. [2000], Randomized, controlled


trials, observational studies, and the hierarchy of research designs,
New England Journal of Medicine, 342(25), 1887–1892, doi : 10.1056/
NEJM200006223422507.

Coriat, Benjamin, Coutrot, Thomas et al. (éds.) [2017], Misère du scien-


tisme en économie. À propos de l’affaire Cahuc et Zylberberg, Vulaines-sur-
Seine : Éditions du Croquant.

Deaton, Angus [2010], Instruments, randomization, and learning about


development, Journal of Economic Literature, 48, 424–455, doi : 10.1056/
NEJM200006223422506.

Dodier, Nicolas & Barbot, Janine [2000], Le temps des tensions épisté-
miques : Le développement des essais thérapeutiques dans le cadre du sida,
Revue française de sociologie, 41(1), 79–118, doi : 10.2307/3322655.

Duflo, Esther [2004], Scaling up and evaluation, dans : Accelerating


Development, édité par F. Bourguignon & B. Pleskovic, Washington, DC ;
Oxford : World Bank ; Oxford University Press, 342– 367.

—— [2010a], La Politique de l’autonomie, Paris : Seuil.

—— [2010b], Le Développement humain, Paris : Seuil.

Duflo, Esther, Dupas, Pascaline et al. [2015], School governance, teacher


incentives, and pupil–teacher ratios : Experimental evidence from Kenyan
primary schools, Journal of Public Economics, 123, 92–110, doi : 10.1016/j.
jpubeco.2014.11.008.
Les essais randomisés contrôlés 105

Duflo, Esther, Glennerster, Rachel et al. [2008], Using randomization in


development economics research : A toolkit, dans : Handbook of Development
Economics, édité par T. P. Schultz & J. A. Strauss, Burlington : Elsevier,
t. 4, 3895–3962, doi : 10.1016/S1573-4471(07)04061-2.

Duflo, Esther, Hanna, Rema et al. [2012], Incentives work : Getting teachers
to come to school, American Economic Review, 102(4), 1241–1278, doi :
10.1257/aer.102.4.1241.

Duflo, Esther & Kremer, Michael [2005], Use of randomization in the


evaluation of development effectiveness, dans : Evaluating Development
Effectiveness, édité par G. K. Pitman, N. F. Osvaldo & G. K. Ingram, New
Brunswick : Transaction Publishers, 93–120.

Duflo, Esther, Kremer, Michael et al. [2008], How high are rates of return to
fertilizer ? Evidence from field experiments in Kenya, American Economic
Review, 98(2), 482–88, doi : 10.1257/aer.98.2.482.

Eber, Nicolas & Willinger, Marc [2012], L’Économie expérimentale, Paris :


La Découverte.

Eble, Alex, Boone, Peter et al. [2014], Risk and evidence of bias in
randomized controlled trials in economics, Rap. tech., Brown University,
Mimeo.

Feinstein, Alvan R. [1984], Current problems and future challenges in


randomized clinical trials, Circulation, 70(5), 767–774, doi : 10.1161/01.
CIR.70.5.767.

Ferracci, Marc & Wasmer, Étienne [2011], État moderne, État efficace.
Evaluer les dépenses publiques pour sauvegarder le modèle français, Paris :
Odile Jacob.

Fisher, Ronald A. [1925], Statistical Methods for Research Workers,


Edinburgh : Oliver & Boyd.

—— [1935], Design of Experiments, Edinburgh : Oliver & Boyd.

Glasgow, Russell E., Green, Lawrence W. et al. [2006], External validity :


We need to do more, Annals of Behavioral Medicine, 31(2), 105–108, doi :
10.1207/s15324796abm3102_1.

Glasgow, Russell E., Lichtenstein, Edward et al. [2003], Why don’t we


see more translation of health promotion research to practice ? Rethinking
the efficacy-to-effectiveness transition, American Journal of Public Health,
93(8), 1261–1267, doi : 10.2105/AJPH.93.8.1261.

Glennerster, Rachel & Takavarasha, Kuzai [2013], Running Randomized


Evaluations : A Practical Guide, Princeton : Princeton University Press.
106 Arthur Jatteau

Glewwe, Paul, Kremer, Michael et al. [2009], Many children left behind ?
Textbooks and test scores in Kenya, American Economic Journal : Applied
Economics, 1(1), 112–135, doi : 10.1257/app.1.1.112.

Gonzalez Alvaredo, Facundo, Chancel, Lucas et al. (éds.) [2018], Rapport


sur les inégalités mondiales, Paris : Seuil.

Gueron, Judith M. [2002], The politics of random assignment : Implementing


studies and affecting policy, dans : Evidence Matters : Randomized Trials in
Education Research, édité par F. Mosteller & R. F. Boruch, Washington :
Brookings Institution Press, 15–49.

Gueron, Judith M. & Rolston, Howard [2013], Fighting for Reliable


Evidence, New York : Russell Sage Foundation Publications.

Henry-Amar, Michel [2005], Études de cohortes, essais cliniques randomisés,


méta-analyse : quelle méthode pour quels résultats ?, dans : 27e journées de
la SFSPM, 40–47.

Holmes, Dave, Murray, Stuart J. et al. [2006], Deconstructing the evidence-


based discourse in health sciences : Truth, power and fascism, International
Journal of Evidence-Based Healthcare, 4(3), 180–186, doi : 10.1111/j.1479-
6988.2006.00041.x.

Horwitz, Ralph I., Singer, Burton H. et al. [1996], Can treatment that is
helpful on average be harmful to some patients ? A study of the conflicting
information needs of clinical inquiry and drug regulation, Journal of Clinical
Epidemiology, 49(4), 395–400, doi : 10.1016/0895-4356(95)00058-5.

Ioannidis, John A., Haidich, Anna-Bettina et al. [2001], Comparison of


evidence of treatment effects in randomized and nonrandomized studies,
Journal of the American Medical Association, 286(7), 821–830, doi :
10.1001/jama.286.7.821.

Isambert, François-André [1987], L’expérimentation sur l’homme comme


pratique et comme représentation, Actes de la recherche en sciences sociales,
68, 15–30.

Jacobson, Lionel D., Edwards, Adrian G. K. et al. [1997], Evidence-based


medicine and general practice, British Journal of General Practice, 47(420),
449–452, https://bjgp.org/content/47/420/449.

Jatteau, Arthur [2011], Les Expérimentations aléatoires en économie du


développement : enjeux critiques, pratique de terrain et portée politique,
Mémoire de master 2, EHESS, Paris.

—— [2013], Expérimenter le développement ? Des économistes et leur terrain,


Genèses, 4(93), 8–28, doi : 10.3917/gen.093.0008.
Les essais randomisés contrôlés 107

—— [2016], Faire preuve par le chiffre ? Le cas des expérimentations aléatoires


en économie, Thèse de doctorat, ENS Paris Saclay.

—— [2018], Comment expliquer le succès de la méthode des expérimentations


aléatoires ? Une sociographie du J-PAL, SociologieS, 13 mars, en ligne,
https://journals.openedition.org/sociologies/6700#quotation.

Kravitz, Richard L., Duan, Naihua et al. [2004], Evidence-based medicine,


heterogeneity of treatment effects, and the trouble with averages, The
Milbank Quarterly, 82(4), 661–687, doi : 10.1111/j.0887-378X.2004.00327.x.

Kunz, Regina & Oxman, Andrew D. [1998], The unpredictability paradox :


Review of empirical comparisons of randomised and non-randomised clinical
trials, British Medical Journal, 317(7167), 1185–1190, doi : 10.1136/bmj.317.
7167.1185.

Labrousse, Agnès [2010], Nouvelle économie du développement et essais


cliniques randomisés : une mise en perspective d’un outil de preuve et de
gouvernement, Revue de la régulation, 7, 2–32, doi : 10.4000/regulation.7818.

—— [2016], Apprendre des expérimentations aléatoires. Promesse de scien-


tificité, complications pratiques, expériences historiques, La Vie des idées,
4 mars, 1–10, https://laviedesidees.fr/IMG/pdf/20160304_labrousse.
pdf.

Laurent, Catherine, Baudry, Jacques et al. [2009], Pourquoi s’intéresser à


la notion d’“evidence-based policy” ?, Tiers Monde, 200(4), 853–873, doi :
10.3917/rtm.200.0853.

Levitt, Steven D. & List, John A. [2009], Field experiments in economics :


The past, the present, and the future, European Economic Review, 53(1),
1–18, doi : 10.1016/j.euroecorev.2008.12.001.

L’Horty, Yannick, Duguet, Emmanuel et al. [2012], Faut-il subventionner le


permis de conduire des jeunes en difficulté d’insertion ?, Rapport d’évalua-
tion quantitative, Fonds d’expérimentation pour la jeunesse, s.l.

L’Horty, Yannick & Petit, Pascale [2011], évaluation aléatoire et expé-


rimentations sociales, Revue française d’économie, 26(4), 13–48, doi :
10.3917/rfe.111.0013.

Lordon, Frédéric [1997], Le désir de “faire science”, dans : Actes de la


recherche en sciences sociales, t. 119, 27–35.

Marks, Harry [1997], The Progress of Experiment : science and therapeutic


reform in the United States (1900–1990), Cambridge : Cambridge University
Press, trad. fr. par F. Bouillot, La Médecine des preuves : histoire et
anthropologie des essais cliniques (1900-1990), Le Plessis-Robinson : Institut
Synthélabo pour le progrès de la connaissance, 1999.
108 Arthur Jatteau

Miguel, Edward & Kremer, Michael [2004], Worms : Identifying impacts


on education and health in the presence of treatment externalities,
Econometrica, 72(1), 159–217, doi : 10.1111/j.1468-0262.2004.00481.x.

Monnier, Éric [1992], Évaluations de l’action des pouvoirs publics, Paris :


Economica.

Moore, D. A. J., Goodall, R. l. et al. [2000], How generalizable are the


results of large randomized controlled trials of antiretroviral therapy ?, HIV
Medicine, 1(3), 149–154, doi : 10.1046/j.1468-1293.2000.00019.x.

Naylor, C.D. [1995], Grey zones of clinical practice : some limits to evidence-
based medicine, The Lancet, 345(8953), 840–842, doi : 10.1016/S0140-
6736(95)92969-X.

Olkin, Ingram [1995], Statistical and theoretical considerations in meta-


analysis, Journal of Clinical Epidemiology, 48(1), 133–146, doi : 10.1016/
0895-4356(94)00136-E.

Picciotto, Robert [2012], Experimentalism and development evaluation :


Will the bubble burst ?, Evaluation, 18(2), 213–229, doi : 10.1177/
1356389012440915.

Quentin, Aurélie & Guérin, Isabelle [2013], La randomisation à l’épreuve du


terrain. L’exemple du projet de microassurance Sky au Cambodge, Revue
Tiers Monde, 213(1), 179–200, doi : 10.3917/rtm.213.0179.

Rodrik, Dani [2008], The New Development Economics : We Shall


Experiment, but How Shall We Learn ?, Working Paper 55, HKS.

Rothwell, Peter M. [2005], External validity of randomised controlled trials :


“to whom do the results of this trial apply”, The Lancet, 365(9453), 82–93,
doi : 10.1016/S0140-6736(04)17670-8.

—— [2006], Factors that can affect the external validity of randomised


controlled trials, PLOS Clinical Trials, 1(1), 1–5, doi : 10.1371/journal.pctr.
0010009.

Schulz, Kenneth F. [1995], Subverting randomization in controlled trials,


JAMA, 274(18), 1456–1458, doi : 10.1001/jama.1995.03530180050029.

Schulz, Kenneth F. & Grimes, David A. [2002], Blinding in randomised


trials : hiding who got what, The Lancet, 359(9307), 696–700, doi :
10.1016/S0140-6736(02)07816-9.

Scriven, Michael [2008], A summative evaluation of rct methodology :


An alternative approach to causal research, Journal of MultiDisciplinary
Evaluation, 5(9), 11–24, http://journals.sfu.ca/jmde/index.php/jmde_
1/article/view/160.
Les essais randomisés contrôlés 109

SIGN 50 [2008], A guideline developer’s handbook, Rap. tech., Scottish


Intercollegiate Guidelines Network, s. l.

Smith, Gordon C. S. & Pell, Jill P. [2003], Parachute use to prevent death
and major trauma related to gravitational challenge : Systematic review of
randomised controlled trials, British Medical Journal, 327, 1459–1461, doi :
10.1136/bmj.327.7429.1459.

Solomon, Phyllis L., Cavanaugh, Mary M. et al. [2009], Randomized


Controlled Trials : Design and Implementation for Community-based
Psychosocial Interventions, New York : Oxford University Press.

Supiot, Alain [2015], La Gouvernance par les nombres. Cours au Collège de


France (2012-2014), Paris : Fayard.

The Lancet [2004], The World Bank is finally embracing science, The Lancet,
364(9436), 731–732, doi : 10.1016/S0140-6736(04)16945-6.

Thomas, James, Harden, Angela et al. [2004], Integrating qualitative research


with trials in systematic reviews, British Medical Journal, 328(7446), 1010–
1012, doi : 10.1136/bmj.328.7446.1010.

Thornton, Rebecca L. [2008], The demand for, and impact of, learning HIV
status, American Economic Review, 98(5), 1829–1863, doi : 10.1257/aer.98.
5.1829.

Worrall, John [2007], Evidence in medicine and evidence-based


medicine, Philosophy Compass, 2(6), 981–1022, doi : 10.1111/j.1747-
9991.2007.00106.x.
Les données en première personne et
l’expérimentation en psychologie

Pascal Ludwig
Sciences, Normes et Démocratie,
Sorbonne Université, CNRS, UMR 8011, Paris (France)

Matthias Michel
Sciences, Normes et Démocratie,
Sorbonne Université, CNRS, UMR 8011, Paris (France)

Résumé : En sciences sociales, les scientifiques utilisent les rapports des sujets
sur leurs propres états mentaux dans leurs démarches expérimentales. Ainsi,
l’introspection, ou la capacité des sujets à former des croyances sur leurs
propres états mentaux, y joue un rôle important. Selon les tenants de l’in-
trospectionnisme, l’introspection est une méthode, certes privée, mais qui per-
met de justifier directement des hypothèses scientifiques. Ainsi, contrairement
aux méthodes utilisées dans les sciences de la nature qui se fondent unique-
ment sur des données publiques, les sciences sociales utiliseraient des données
subjectives pour justifier leurs hypothèses. Contre l’introspectionnisme, nous
défendons que l’introspection n’est pas utilisée pour justifier directement les
hypothèses, mais que sa place est plutôt similaire à celle d’un instrument de
mesure des états et processus mentaux des sujets, susceptible d’être calibré,
à la façon dont les instruments de mesure utilisés dans les sciences de la nature
peuvent l’être.

Abstract: Social scientists often appeal to subjective reports about subjects’


mental states. As such, introspection, which is the subjects’ capacities
to know and report on their own mental states, plays a fundamental role
in the social sciences. According to proponents of “introspectionnism”,
although introspective knowledge is private, it can be used to justify scientific
hypotheses. As such, the use of “subjective data” in the social sciences would
make these disciplines fundamentally different from the natural sciences, where
data is supposed to be publicly accessible. Against introspectionnism, we

Philosophia Scientiæ, 23(2), 2019, 111–130.


112 Pascal Ludwig & Matthias Michel

argue that the role of introspection is similar to that of a scientific apparatus


allowing scientists to detect and measure subjects’ mental states. In our view,
scientists do not justify their hypotheses by using private, subjective data.
Instead, they use publicly available measurement outcomes, obtained by using
subjects’ introspective capacities as measuring instruments.

Le terme « introspection » désigne la capacité à former des croyances jus-


tifiées sur ses propres états ou processus mentaux, sans inférer ces croyances à
partir d’une observation détachée de son propre comportement. L’introspection
est la capacité qui nous permet de connaître nos expériences conscientes. Il
ne s’agit probablement pas d’une unique capacité, qu’on pourrait comparer
à une « observation intérieure », mais plutôt d’un ensemble de capacités,
qui ont ceci de commun qu’elles peuvent fonder des rapports subjectifs,
les « données en première personne ». Les données en première personne
sont utilisées en psychophysique [Chirimuuta 2014], en psychologie cognitive
[Schooler & Schreiber 2004], en psychiatrie [Nelson, Thompson et al. 2012],
dans les neurosciences cognitives [Leopold, Maier et al. 2003], [Pine & LeDoux
2017], dans les études portant sur la conscience [Chalmers 1999], [Overgaard,
Rote et al. 2006]. En économie, elles constituent une large partie de la
base empirique des recherches sur la mesure du bonheur [Alexandrova 2008],
[Kahneman, Diener et al. 1999]. En psychologie sociale, la quantification des
phénomènes sociaux repose sur l’établissement de « constructs 1 » qui sont
souvent opérationnellement associés à des rapports en première personne
[Borsboom 2005]. En effet, ces constructs sont fréquemment liés aux états
mentaux des sujets, que ces états soient des attitudes ou des sentiments, et il
est difficile de les évaluer sans faire appel à des rapports subjectifs.
Faut-il en inférer qu’il existe une différence méthodologique fondamentale
entre les sciences humaines et les sciences de la nature ? Deux positions
s’affrontent dans la littérature. Nous qualifierons la première position « d’in-
trospectionniste ». Il s’agit en effet, pour les philosophes qui l’adoptent
[Goldman 1997], [Hatfield 2005, 2014], [Overgaard 2006], d’expliquer l’im-
portance des données en première personne dans certaines communautés
scientifiques par le fait que ces communautés considèrent l’introspection
comme une méthode, certes privée, mais néanmoins parfaitement acceptable,
de justification des hypothèses. Lorsque l’introspection est utilisée pour justifier
une hypothèse scientifique, le contenu introspecté est lui-même utilisé pour
justifier l’hypothèse. Si c’est le cas, une divergence méthodologique existe entre
ces communautés épistémiques et les communautés des sciences naturelles,
puisque le caractère public d’une méthode d’établissement des données est
considéré comme une caractéristique essentielle d’une bonne justification
1. La notion de « construct » n’est pas facile à traduire, car elle correspond à la
fois à un rôle causal, au mécanisme susceptible de réaliser le rôle causal, et au concept
permettant de décrire le rôle causal. Nous choisissons donc de conserver le terme en
anglais.
Les données en première personne en psychologie 113

dans les sciences de la nature. Cependant, une position plus conservatrice


a également été défendue [Piccinini 2009]. Selon cette seconde position, le
rôle des données subjectives dans les sciences humaines n’est pas un rôle de
justification, mais un rôle expérimental. Lorsque l’introspection est utilisée
dans son rôle expérimental, les rapports et comportements introspectifs
des sujets, et non les contenus directement issus de l’introspection, sont
utilisés comme des données empiriques parmi d’autres. Nous nous proposons
de défendre cette seconde position, en nous concentrant sur le cas de la
psychologie : selon nous, la meilleure explication que l’on peut apporter à
la place singulière des données en première personne en psychologie ne tient
pas au rôle de ces données dans la justification des hypothèses, mais plutôt à
leur rôle dans la démarche expérimentale lorsque cette dernière porte sur des
sujets humains.

1 La fiabilité de l’introspection
Les introspectionnistes insistent sur le fait que les états mentaux produits par
les mécanismes introspectifs sont aussi susceptibles de constituer de bonnes
raisons de croire, du point de vue des sujets, que ceux qui sont produits par
des mécanismes perceptifs. Pour cette raison, une part substantielle du débat
porte sur la fiabilité de ces mécanismes. Depuis les critiques d’Auguste Comte
[Wilson 1991], puis celle de John B. Watson [Watson 1913], les adversaires
de l’utilisation de méthodes en première personne insistent sur leur manque
de fiabilité [Nisbett & Wilson 1977], [Schwitzgebel 2008], et ceux qui sont
favorables à leur utilisation soutiennent qu’un état mental n’a pas besoin
d’appartenir à un système parfaitement fiable d’acquisition d’information pour
pouvoir conférer des raisons [Goldman 1997], [Kriegel 2013]. Il est tellement
notoire en psychologie sociale que les sujets humains ont souvent du mal
à identifier correctement leurs motivations réelles par introspection que la
question est discutée jusque dans la littérature de vulgarisation [Simler &
Hanson 2018]. Aux arguments des sceptiques, on a répondu d’une part que la
fiabilité de l’introspection varie avec son objet – par exemple, l’introspection
des sensations visuelles, contrairement à l’introspection des motivations, est
supposée fiable [Hatfield 2005], [Kriegel 2013] – ; et d’autre part qu’une
méthode de fixation de croyances n’a pas besoin d’être parfaitement fiable
pour être rationnelle [Goldman 1997], [Kriegel 2013].
Il ne suffit cependant pas que des états mentaux soient produits de façon
fiable pour que les objets de ces croyances soient considérés comme des données
scientifiques. À cet égard, il faut souligner qu’une donnée ne renvoie pas,
dans le discours scientifique à un état mental privé, si fiable soit-il, mais à
une proposition justifiée d’une façon spécifique. Soutenir que l’introspection
peut servir de méthode pour établir des données scientifiques, cela implique
donc que l’on peut accepter non seulement que des croyances fiables sont
114 Pascal Ludwig & Matthias Michel

produites par des méthodes introspectives, mais aussi que ces méthodes
peuvent être mentionnées pour justifier des propositions dans un contexte de
controverse. Pour illustrer ce point, considérons le cas du témoignage [Shapin
1994], [Hardwig 1991]. La communication est un moyen fiable d’acquisition
de croyances [Coady & Antony 1992]. Néanmoins, les historiens des sciences
ont aussi souligné que la mention d’un témoignage ne pouvait servir de
justification scientifique pour une donnée qu’à condition que certaines règles
soient respectées. Ainsi, on exige que la source d’un témoignage soit précisée, et
que ce témoignage soit produit par une personne ayant une certaine crédibilité
[Wootton 2015]. La fiabilité d’un témoin doit, dans un contexte de débat
scientifique, pouvoir être vérifiée. Mais surtout, et c’est le point fondamental,
il faut que la méthode ayant permis d’établir les données soit publiquement
identifiable. Or, nous allons soutenir que ce n’est pas le cas de la méthode
dite « introspective » : ce que recouvre cette appellation est trop flou pour
qu’on puisse considérer qu’il existe une méthode publiquement identifiable
d’établissement des données que l’on pourrait décrire comme « introspective ».

2 Y a-t-il une méthode introspective


publiquement identifiable ?
Partons d’une description de la place de l’introspection dans l’école introspec-
tionniste de Wundt et de Titchener. Pour comprendre le sens que ces auteurs
donnent au concept d’introspection, il faut avoir à l’esprit les remarques
d’Auguste Comte et de Franz Brentano sur l’idée d’une observation intérieure2 .
Dans la première leçon du Cours de philosophie positive, Comte nie que
l’observation intérieure soit une source de données scientifiques :
Mais, quant à observer de la même manière les phénomènes intel-
lectuels pendant qu’ils s’exécutent, il y a impossibilité manifeste.
L’individu pensant ne saurait se partager en deux, dont l’un
raisonnerait, tandis que l’autre regarderait raisonner. L’organe
observé et l’organe observateur étant, dans ce cas, identiques,
comment l’observation pourrait-elle avoir lieu ? [Comte 1830].
En raison de l’impact de cette discussion, le concept d’introspection a
donné lieu à des interprétations divergentes. Ainsi Franz Brentano, influencé
par Comte, introduit-il une distinction entre observation intérieure [innere
Beobachtung] et perception intérieure [innere Wahrnehmung]. Selon lui, il est
possible d’observer les objets de la perception externe, mais pas ceux de la
perception intérieure :
2. Sur ce point voir le post de blog d’Eric Schwitzgebel, « Wundt on Self-
Observation and Inner Perception », Juin 2009, http://schwitzsplinters.
blogspot.fr/2009/06/wundt-on-self-observation-and-inner.html. Voir aussi
[Boring 1953] et [Sackur 2009].
Les données en première personne en psychologie 115

ce qui est objet de ce qu’on appelle communément perception


externe – nous pouvons l’observer : pour bien comprendre un
phénomène, on y applique toute son attention. Mais c’est là
chose absolument impossible quand il s’agit d’objets d’une pure
perception interne. Cette remarque s’applique surtout à certains
phénomènes psychiques comme la colère. Il suffirait en effet
d’observer la colère qui bouillonne en nous, pour la voir se
calmer et que disparût en même temps l’objet de l’observation.
[...] Conformément à une loi psychologique constante, nous ne
pouvons appliquer notre attention à l’objet de la perception
interne. [Brentano 2008, 42]

Selon Brentano, l’introspection joue un rôle essentiel dans l’établissement des


données, mais il ne s’agit pas d’une forme d’observation attentive. C’est au
travers d’une perception périphérique, la « perception intérieure », que les
phénomènes psychiques sont perçus « accessoirement » [nebenbei], sans que
l’attention se détourne du monde extérieur. Wundt est en désaccord avec
Brentano sur ce point essentiel. S’il reprend la distinction entre perception
et observation internes – dans son vocabulaire : « Selbstbeobachtung » et
« innere Wahrnehmung », [Wundt 1888] –, c’est bien à l’observation intérieure
et non à la perception intérieure qu’il identifie l’introspection. Contrairement à
Brentano, Wundt considère en effet qu’il est possible d’observer un processus
intérieur au moment où celui-ci a une occurrence, ce qui suppose de prêter
attention à ce processus. C’est une conviction qui est partagée par son élève
Edward Titchener, qui soutient, plus de vingt ans plus tard, que l’introspection
est l’exact analogue en psychologie de l’observation en physique [Titchener
2010, 24]. Cela implique que des propositions peuvent être, dans un contexte
de laboratoire, justifiées directement par introspection, exactement de la
même façon que des propositions peuvent être justifiées directement par
« inspection » dans les sciences de la nature. La pratique de l’introspection
chez Wundt comme chez Titchener était rigoureusement contrôlée. Ainsi, le
simple fait d’introspecter n’est pas chez ces auteurs une condition suffisante
de la justification des hypothèses scientifiques. Plutôt, c’est l’introspection
couplée à son contrôle expérimental qui permet de justifier les hypothèses.
Considérons un exemple de Titchener : l’illusion de Müller-Lyer. Les
lignes horizontales figurant dans le stimulus ont la même longueur, mais
elles ne nous apparaissent subjectivement pas comme ayant la même longueur.
Nous pouvons, par introspection, acquérir la connaissance selon laquelle ces
lignes nous apparaissent comme ayant une longueur différente, et en ce
sens on peut certainement considérer que l’introspection permet de former
des croyances vraies. Mais peut-on pour autant considérer qu’il s’agit d’une
méthode de justification, comparable à cet égard à l’observation visuelle ? Le
problème, c’est qu’il n’est pas facile de déterminer exactement sur quoi porte la
proposition justifiée. Lorsque nous disons que les lignes nous « apparaissent »
plus grandes, est-ce que nous décrivons une propriété des stimuli, la propriété
116 Pascal Ludwig & Matthias Michel

« d’apparaître » de telle ou telle façon ? Une propriété des sensations visuelles


ou des expériences visuelles ? Mais si c’est le cas, quelle est la nature des
sensations ou expériences visuelles, et comment peut-on les identifier ? Faut-il
regarder hors de nous (Brentano), ou bien en nous (Wundt, Titchener), et si
oui, comment exactement ?
Des questions de ce type se sont réellement posées dans l’histoire de la
psychologie introspectionniste. Ainsi, lors de la controverse des « pensées sans
images » [imageless thoughts], un désaccord surgit entre Titchener d’un côté,
et les psychologues de Würzburg Narziss Ach et Karl Bühler de l’autre, qui
s’inspiraient des recherches d’Oswald Külpe [Lindenfeld 1978]. Les seconds
soutenaient qu’on pouvait former des pensées conscientes sans avoir la moindre
expérience sensorielle, une thèse que Titchener rejetait. Selon Titchener,
l’introspection permettait de vérifier que même les concepts abstraits sont
toujours associés à des images visuelles ou sonores [Titchener 1909, 18–19] ;
selon Bühler en revanche, l’introspection permettait de vérifier que l’expérience
de compréhension n’est parfois associée à « aucune qualité sensorielle, et
aucune intensité sensorielle » [Bühler 1907]. Il s’avéra impossible de résoudre
expérimentalement ce désaccord fondamental.
Les historiens de la psychologie considèrent que c’est en raison du
caractère insoluble de la controverse des pensées sans images que la méthode
introspectionniste a été abandonnée en psychologie [Schwitzgebel 2011],
[Schultz & Schultz 1987]. En l’absence d’une méthode de vérification des
hypothèses spécifiant des critères de preuve de manière publique, les désaccords
étaient indépassables. Or, les psychologues introspectionnistes se sont révélés
incapables de se mettre d’accord sur une telle méthode. Titchener conclut sa
revue de la littérature portant sur les pensées sans images de la façon suivante :
Je pense que je suis suffisamment versé dans l’introspection, et
suffisamment objectif dans mes buts, pour savoir ce dont on parle.
J’ai rencontré, encore et encore, des états de conscience comme
le doute, l’hésitation, la croyance, l’assentiment, le souvenir
volontaire, la sensation d’avoir un mot sur le bout de la langue, et
je n’ai jamais été capable de découvrir de processus sans images.
[Titchener 1909, 182, notre traduction]
Mais comment un observateur neutre pourrait-il vérifier que les objets mentaux
observés par Titchener et ceux observés par Bühler étaient les mêmes ?
En l’absence de réponse, il est impossible de trancher rationnellement les
divergences de croyances entre observateurs. Ce problème est proche de
ce qu’Eran Tal a appelé le « problème de l’individuation des quantités »
[Tal 2019] : un désaccord entre des résultats issus de deux procédures de
mesure différentes peut s’expliquer ou bien par le fait que ces procédures ne
mesurent pas le même phénomène, ou bien parce que des erreurs systématiques
n’ont pas été corrigées. On ne peut résoudre ce problème qu’à condition
de corriger les erreurs systématiques. Or les introspectionnistes ne précisent
jamais quelles procédures publiques permettraient de corriger les sujets. On
Les données en première personne en psychologie 117

trouve, certes, chez Titchener, un ensemble d’instructions sur la manière


dont l’introspection devrait être pratiquée, garantissant un partage public de
la méthode introspective, mais ces instructions ne permettent pas d’évaluer
publiquement les introspections particulières. Par conséquent, le problème
de l’individuation des quantités ne peut pas être résolu dans un cadre
introspectionniste. En cas de désaccord, on ne peut donc jamais savoir si les
sujets se trompent ou s’ils ont des expériences différentes.

3 L’interprétation des expériences en


psychophysique
Nous sommes maintenant mieux armés pour discuter l’argument central des
philosophes introspectionnistes :
1. Les données en première personne sont largement utilisées dans les
sciences sociales, en particulier dans toutes les branches de la psycho-
logie ;
2. La meilleure explication du fait que ces données sont largement utilisées,
c’est qu’elles sont mobilisées pour justifier directement des hypothèses
par introspection ;
Conclusion : l’introspection, qui est une méthode privée, est utilisée pour
justifier des hypothèses, au moins en psychologie.
Dans le paragraphe précédent, nous avons développé un contre-argument
contre la prémisse 2. Nous avons suggéré que l’introspection ne pouvait pas
être une méthode de justification, en rappelant qu’il n’y avait jamais eu
d’accord parmi les psychologues introspectionnistes, sur ce qu’était exac-
tement la méthode introspective, ni sur ce qu’elle permettait de vérifier.
Plusieurs philosophes soutiennent cependant le contraire. Ainsi Alvin Goldman
écrit-il :
Peut-on maintenir [...] qu’un événement objet d’introspection est
lui-même considéré comme constituant une donnée [a piece of
evidence] pour les sciences cognitives ? L’introspection est-elle
traitée comme une méthode justifiant des données [evidence-
conferring method] ? Oui, je pense qu’on peut le maintenir. [...]
Dans la mesure où les chercheuses en sciences cognitives font
confiance aux quasi-observations des sujets, qui permettent de
mettre au jour certains faits mentaux, elles considèrent ces faits
comme des données à expliquer, ou comme des preuves [evidence]
susceptibles de confirmer ou d’infirmer des hypothèses. [Goldman
1997, 544, notre traduction]
La fin de ce texte est significative. Goldman emploie en effet une
disjonction, lorsqu’il souligne que les chercheuses « considèrent [les faits
118 Pascal Ludwig & Matthias Michel

obtenus par l’usage de l’introspection] comme des données à expliquer, ou


comme des preuves » (nous soulignons). On peut étudier empiriquement un
mécanisme, utiliser le mécanisme dans un dispositif expérimental, sans avoir
une compréhension théorique de sa nature ni de son fonctionnement. Dans ce
cas, l’observation comme la manipulation du mécanisme produisent bien des
données – mais pas des preuves. Il ne paraît en effet pas acceptable d’utiliser
une méthode de justification dans des preuves sans avoir une compréhension
théorique de la nature de cette méthode, comme nous l’avons souligné
dans la section 2. Il est exact que des mécanismes introspectifs divers sont
utilisés expérimentalement pour « mettre au jour certains faits mentaux ».
Mais cela n’implique pas que ces mécanismes soient mobilisés dans des
justifications d’hypothèses.
Afin d’illustrer ce point, nous nous proposons de partir du cas le plus diffi-
cile pour la thèse que nous souhaitons défendre : l’utilisation de l’introspection
dans l’expérimentation en psychophysique. Gary Hatfield, qui est un défenseur
de la position introspectionniste, tire son principal argument en faveur de
l’introspectionnisme de l’usage de l’introspection en psychophysique :

Si l’on définit l’introspection comme le fait de porter délibérément


et immédiatement attention à certains aspects de l’expérience
phénoménale, nous voyons qu’elle continue à être utilisée comme
une source de preuve [evidence] en psychologie de la perception
et en psychologie cognitive. [...] La clef de l’introspection n’est
pas de “regarder vers l’intérieur”, mais de porter son attention
aux aspects pertinents de l’expérience. Ces aspects incluent les
variations pertinentes dans les apparences visuelles des choses.
[...] De telles réponses sont traitées comme des données probantes
[evidence] scientifiques dans la littérature en psychologie expéri-
mentale. [Hatfield 2005, 279]

Il y a dans ce texte un glissement sémantique entre deux sens du terme


« evidence » : cette expression renvoie d’abord à l’idée d’une méthode de
justification des hypothèses, mais dans sa seconde occurrence, Hatfield fait
référence à l’observation des comportements d’introspection des sujets. Mais
répétons-le : le fait que les sujets utilisent des mécanismes psychologiques sus-
ceptibles d’être décrits comme introspectifs dans certains contextes n’implique
pas que l’introspection soit utilisée pour justifier des hypothèses – pas plus que
le fait d’observer en anthropologue une pratique magique n’implique d’utiliser
la pratique magique en question pour justifier une hypothèse3 .

3. Nous remercions Jérôme Sackur pour avoir souligné une nuance à cette asser-
tion, en mentionnant le cas d’un article de [Julesz 1964] présentant une expérience
de disparité binoculaire dans laquelle les sujets ont une illusion de profondeur. Dans
cet article, Julesz ne donne d’autre justification à l’existence de cette illusion que
le fait que les sujets auxquels il a présenté les stimuli ont eu une impression de
profondeur. Cela pourrait constituer un usage direct de l’introspection des sujets
Les données en première personne en psychologie 119

Dans quelles conditions l’introspection est-elle utilisée aujourd’hui en


psychophysique ? Soulignons que le terme « introspection » n’apparaît plus
dans la littérature psychophysique. Certaines distinctions importantes entre
types d’expériences sont néanmoins liées à l’introspection [Chirimuuta 2014].
Ainsi G. S. Brindley distingue-t-il, dans son manuel classique, entre des
expériences plus « objectives », les expériences de type A, et les expériences
plus « subjectives », les expériences de type B [Brindley 1970]. On peut parler
d’expériences psychophysiques dans les deux cas, car le but est de tester
des hypothèses portant sur les relations entre des stimuli, susceptibles d’être
décrits dans le vocabulaire de la physiologie, et des sensations rapportées par
les sujets. Dans le cas des expériences de type A, le lien entre stimulus et
sensations est assez direct : « chaque fois que deux stimuli causent l’envoi de
signaux indiscernables du point de vue physique, les sensations produites par
ces stimuli, rapportées à l’aide de mots par les sujets, des symboles, ou des
actions, doivent également être indiscernables » [Brindley 1970, 133]. Dans le
cas des expériences de type B, en revanche,

le sujet doit décrire la qualité ou l’intensité de ses sensations,


ou abstraire une dimension de similarité entre deux sensations
distinctes. Les phénomènes impliqués ont une certaine objectivité,
car différents observateurs s’accordent plus ou moins dans leurs
descriptions. [Brindley 1970, 133]

Considérons un exemple de condition expérimentale de type B, faisant


intervenir l’illusion de Müller-Lyer4 . On demande au sujet de compenser
l’illusion en augmentant, à l’aide d’un dispositif expérimental, la taille de la
ligne apparaissant la plus courte, jusqu’à ce qu’à ce qu’on appelle le « point
d’équilibre subjectif », c’est-à-dire jusqu’au moment où les deux lignes lui
semblent avoir la même longueur. Il s’agit bien d’une condition de type B,
puisque même lorsque les lignes semblent avoir la même longueur pour
le sujet, les deux stimuli diffèrent cependant encore par la direction des
pointes. Mais, et c’est le point central pour notre propos, ces protocoles
expérimentaux peuvent être décrits sans faire référence à l’introspection
comprise comme une méthode de justification. Dans les manuels récents de
psychophysique, les expériences de type B ne sont en effet plus présentées en
faisant appel au concept de sensation, mais uniquement dans un vocabulaire
comportemental [Kingdom & Prins 2010]. Dans le cas de l’illusion de Müller-
Lyer, le point d’équilibre subjectif est ainsi aujourd’hui défini comme le seuil
à partir duquel de petites différences dans le stimulus conduisent un sujet

pour justifier l’existence de cette illusion. Néanmoins, nous pensons que, dans ce
type de cas, l’accord universel des individus doit plutôt être vu comme une donnée
publiquement accessible qui justifie l’adoption d’une hypothèse par inférence à la
meilleure explication. Ce n’est donc pas l’introspection de chaque sujet qui justifie
l’hypothèse.
4. Pour plus de détails sur les expériences de type A et de type B, voir [Brindley
1970].
120 Pascal Ludwig & Matthias Michel

à changer son comportement de classification, en classant les deux lignes


comme ayant des tailles différentes. Pour déterminer ce seuil, on utilise un
protocole de choix forcé, où le sujet doit répondre par oui ou par non à la
question de savoir si les lignes semblent avoir des tailles différentes. Ce qui
est mesuré n’est donc pas décrit comme une sensation, mais bien comme
un comportement, en l’occurrence un comportement de classification. Cet
exemple peut être généralisé : contrairement à ce que suggèrent les philosophes
introspectionnistes, et jusqu’à preuve du contraire, les psychophysiciennes
n’utilisent plus l’introspection pour justifier les hypothèses5 . Certes, l’usage de
capacités introspectives est l’une des dimensions des comportements observés,
mais les données utilisées pour justifier les hypothèses théoriques sont bien
comportementales et non subjectives.

4 Quelle place pour l’introspection dans


la pratique expérimentale ?
Nous avons rejeté, dans la section précédente, l’inférence à la meilleure
explication sur l’utilisation de données en première personne dans les sciences
humaines par l’usage de l’introspection comme méthode de justification des
hypothèses : le cas de la psychophysique, qui est pourtant le plus favorable au
partisan de l’introspection, montre que l’introspection ne se substitue pas à
l’observation et à la mesure des comportements. Mais comment peut-on alors
expliquer la présence massive des données en première personne en psychologie,
si ce n’est pas par l’usage d’une forme d’observation intérieure ? Pour répondre
à cette question, il faut examiner de manière plus approfondie la façon dont
fonctionne l’expérimentation en psychologie.
L’attrait de l’introspectionnisme réside dans le fait que cette position
concilie deux exigences : celle associée à la méthode empirique d’une part,
puisque l’introspection est supposée être une méthode de justification compa-
rable à une observation intérieure [Kriegel 2013] ; et d’autre part, celle liée à
l’autonomie des sciences sociales, en particulier de la psychologie, puisque cette
méthode d’observation intérieure peut être également vue comme une voie
d’accès à des entités inobservables, comme les sensations en psychophysique
[Hatfield 2005]. Cet attrait découle cependant d’une conception simplificatrice
de la méthode expérimentale, qui identifie à tort les phénomènes sur lesquels
porte cette méthode à l’ensemble des objets ou des événements directement
observables. Selon cette conception simplificatrice, on a forcément besoin d’une

5. Edwin Boring voit d’ailleurs là une des conséquences du behaviorisme : « Dans


l’introspection classique, le sujet est l’observateur. Il est responsable de la fiabilité
dans ses descriptions des données conscientes [...]. Le behaviorisme change le lieu de
la responsabilité scientifique, qui passe du sujet observant à l’expérimentateur, qui
devient ainsi l’observateur du sujet » [Boring 1953, 184, notre traduction].
Les données en première personne en psychologie 121

forme intérieure d’observation pour accéder aux phénomènes mentaux, ou au


moins à certains d’entre eux, et cette méthode n’est autre que l’introspection.
Dans un article important [Bogen & Woodward 1988], James Bogen &
James Woodward soutiennent, contre cette conception traditionnelle mais
simplificatrice, que les phénomènes expliqués par les théories scientifiques
ne sont en général pas directement observables. Selon eux, les phénomènes
constituant les explananda des théories sont postulés par inférence à partir
de données qui sont obtenues par des méthodes souvent logiquement indépen-
dantes des théories testées6 . Sans vouloir présumer de la validité générale de
l’approche de Bogen & Woodward, elle nous semble trouver une application
particulièrement pertinente en psychologie. Nous avons établi, dans les trois
premières sections de cet article, que l’introspection n’était pas utilisée pour
tester des hypothèses portant sur des objets mentaux « internes ». Il ne faudrait
cependant pas en tirer la conclusion behavioriste selon laquelle la psychologie
ne s’intéresserait qu’à des comportements observables. Les phénomènes que
les hypothèses formulées en psychologie visent à expliquer sont en réalité
rarement directement observables. Ils sont en effet décrits par ce que les
psychologues nomment des « constructs », c’est-à-dire des concepts introduits
dans la théorie par leur rôle causal, sans lien direct avec l’observation ni avec
les mesures [Fodor 1965]. Ces constructs sont considérés comme des variables
dites « latentes », qui sont supposées, d’après la théorie testée, avoir une
influence causale sur des variables observables, dites « manifestes », l’influence
en question découlant du rôle causal associé au construct. Par exemple,
un test de personnalité peut permettre d’inférer la valeur d’une variable
latente, comme l’extraversion d’un sujet, à partir de l’observation de variables
manifestes, comme un ensemble de réponses à un questionnaire. Pour qu’un
construct soit considéré comme valide, il ne suffit pas qu’une manipulation
des variables puisse être effectuée. Selon la théorie dite de la « validité des
constructs » [construct validity] [Campbell 1957], [Cook & Campbell 1979],
un construct est valide si, et seulement si, les données observées ou mesurées
peuvent être interprétées comme réellement causées par le phénomène décrit
par le construct, indépendamment du contexte caractérisant telle étude de
terrain ou tel protocole expérimental [Borsboom, Mellenbergh et al. 2004],
[Borsboom 2005]. Dans le cas des tests de personnalité par exemple, une mesure
d’extraversion n’est valide que si c’est bien l’extraversion du sujet qui est la
cause de ses réponses.
Puisque les phénomènes décrits par les concepts psychologiques ne sont en
général pas directement observables, la manipulation des variables qui leur sont
associées, ainsi que la mesure des valeurs des variables manifestes que cette
manipulation permet de modifier, soulèvent des difficultés, et c’est souvent
ici qu’intervient l’introspection. Non pas, encore une fois, que l’introspection
6. C’est également un thème important chez Ian Hacking. Hacking souligne en
effet que « souvent le travail expérimental [...] réside moins dans l’observation et dans
le rapport que dans le fait de parvenir à exhiber un phénomène à l’aide d’un certain
équipement » [Hacking 1983, 167].
122 Pascal Ludwig & Matthias Michel

se substitue à l’observation7 . L’ensemble des capacités cognitives, en fait


très variées, que ce terme recouvre, joue plutôt un rôle instrumental : elles
permettent à la fois de produire des circonstances dans lesquelles les effets
des variables étudiées peuvent être observés, et parfois aussi de mesurer ces
effets. Nous nous proposons maintenant de discuter quelques cas illustrant les
modalités sous lesquelles ces capacités introspectives interviennent dans les
pratiques empiriques des psychologues.

4.1 L’introspection comme instrument de mesure


Indépendamment du fait que l’introspection renvoie probablement à un
ensemble de capacités [Cassam 2014], chacun peut s’accorder sur le fait qu’une
capacité de fixation de croyance est introspective lorsqu’elle permet de justifier
immédiatement, c’est-à-dire de façon non-inférentielle, des croyances portant
sur ses propres états mentaux, que ces états soient sensoriels ou cognitifs. Un
tel processus de fixation de croyances peut être considéré comme causal, et
pour cette raison, même si le processus n’est pas complètement fiable, comme
un indicateur de l’occurrence des états mentaux en question. Un grand nombre
des constructs utilisés en psychologie sociale ne pourraient tout simplement pas
être mesurés si l’on ne faisait pas appel aux rapports en première personne, et
donc, dans bien des cas, à l’introspection en ce sens général. Considérons ainsi
le champ des recherches portant sur le bien-être subjectif [subjective well-being]
[Alexandrova 2008, 2017]8 . En raison de la définition même de ce concept,
il s’agit d’une variable que l’on ne peut pas mesurer indépendamment des
attitudes des sujets. Or, le moyen le plus simple de mesurer ces attitudes est
d’utiliser des questionnaires demandant de produire des rapports en première
personne. Le concept de bien-être subjectif est considéré comme un concept
complexe, qui regroupe plusieurs sous-concepts : la présence d’affects positifs,
l’absence d’affects négatifs, et la satisfaction globale dans la vie [Diener,
Emmons et al. 1985, 71]. Il s’agit aussi d’un concept essentiellement subjectif,
au sens où il vise à refléter l’évaluation globale par une personne de sa propre
7. Ce point pourrait être discuté en remarquant que l’introspection pourrait être
utilisée en psychologie, non pas pour expliquer les phénomènes psychologiques, mais
pour en établir une taxonomie. L’introspection aurait donc un rôle dans la description
des phénomènes psychologiques. Si nous ne nions pas que l’introspection joue un rôle
dans ce domaine, il est important de remarquer que, du fait que nous n’avons pas
un accès direct aux esprits des autres, l’établissement d’une taxonomie fiable des
phénomènes psychologiques doit nécessairement passer par un ensemble de rapports,
ou comportements publiquement accessibles. L’argument général développé dans cet
article s’applique donc aussi à cet aspect plus « descriptif » de la psychologie.
8. Nous prenons ici des exemples issus de la psychologie sociale et de la
personnalité, mais cette analyse s’applique plus généralement aux sciences cognitives.
En effet, comme nous l’a fait remarquer Jérôme Sackur dans un commentaire à cet
article, le point de départ de la psychologie cognitive est que des processus cognitifs qui
ne sont pas directement observables, et qui sont souvent inaccessibles à l’introspection,
peuvent être utilisés afin d’expliquer les performances des sujets.
Les données en première personne en psychologie 123

qualité de vie, en fonction de ses propres critères [Shin & Johnson 1978, 478].
Pour cette raison, l’échelle de cinq items introduite en 1985 pour mesurer le
bien-être subjectif « est conçue autour de l’idée qu’il faut demander aux sujets
de produire un jugement global sur leur satisfaction dans la vie » [Diener,
Emmons et al. 1985, 71–72]. Certaines des questions dans l’échelle mobilisent
l’introspection. Ainsi, l’item 1 demande de réagir au jugement suivant :
« globalement, ma vie est proche de mon idéal », et l’on ne peut pas juger
de son idéal de vie sans s’interroger sur ses propres croyances et aspirations.
En théorie, la réponse du sujet pourrait reposer sur une observation détachée,
en troisième personne, de son propre comportement et de ses attitudes : on lui
demande avant tout de porter un jugement sur sa vie, pas sur ses états mentaux
à l’instant t du jugement. Les concepteurs de l’échelle du bien-être subjectif ne
s’interrogent d’ailleurs pas sur les mécanismes introspectifs impliqués dans la
mesure. Du point de vue méthodologique, ce n’est pas un problème pertinent
dans un premier temps : ce qui importe, en priorité, est d’une part de
vérifier la fiabilité de l’échelle, c’est-à-dire sa capacité à produire des mesures
cohérentes et reproductibles, et sa validité, c’est-à-dire le fait qu’elle mesure
bien les phénomènes qu’elle est censée mesurer. Or, il est possible de vérifier,
par des moyens statistiques, la fiabilité d’un instrument de mesure même
lorsqu’on ne comprend pas complètement la façon dont fonctionne l’instrument
[John & Benet-Martínez 2014].
Dans un second temps, la question du rôle de l’introspection dans la
procédure de mesure est apparue dans les discussions, en particulier lorsque
des interrogations concernant sa validité ont surgi. Ainsi, Norbert Schwarz &
Fritz Strack ont souligné que les valeurs obtenues lorsqu’on utilise l’échelle du
bien-être subjectif étaient fortement dépendantes du contexte : elles peuvent
être facilement biaisées par l’information accessible au sujet au moment où
il répond, mais également lorsqu’on l’incite à comparer sa propre situation
présente à celles d’autres personnes [Schwarz & Strack 1999]. Schwarz et
Strack en ont déduit que les réponses au questionnaire sont causées par les
émotions et les sentiments que les sujets éprouvent au moment de la réponse,
et non par des attitudes stables dans le temps [Schwarz & Strack 1999, 61].
Autrement dit, il se peut que les sujets répondent en se fondant essentiellement
sur leur évaluation introspective, au moment t, de leurs émotions positives et
négatives relatives à leur vie. En conséquence, ces auteurs, ainsi que d’autres
psychologues et économistes, ont proposé de remplacer l’échelle du bien-être
subjectif par une mesure complètement différente, reposant sur l’agrégation de
mesures introspectives instantanées se rapportant à des expériences subjectives
de bien-être des agents [Kahneman, Krueger et al. 2004].
La question du rôle causal de l’introspection intervient donc de façon cen-
trale dans le débat, mais jamais comme une question épistémologique concer-
nant la fiabilité d’une méthode d’observation interne. Lorsque l’introspection
se trouve discutée, c’est en tant que capacité jouant un rôle instrumental dans
la mesure et non en tant que justification observationnelle plus ou moins fiable
de phénomènes mentaux. Le problème principal qui se pose est au fond un
124 Pascal Ludwig & Matthias Michel

problème de calibration : il s’agit de déterminer si l’instrument de mesure


produit des indications – ici, les rapports des sujets – qui nous permettent
d’inférer correctement la valeur de la propriété mesurée – ici, le bien-être sub-
jectif. Les procédures de mesure sont ainsi calibrées d’une manière semblable
à celle qui est utilisée en physique, par exemple lorsqu’on calibre des thermo-
mètres [Chang 2004], même lorsque l’instrument fait intervenir l’introspection.
De ce point de vue, il n’y a donc pas d’asymétrie entre la psychologie et les
sciences de la nature, contrairement à ce que supposent les introspectionnistes.

4.2 L’introspection comme outil et comme objet


d’expérimentation
Depuis le tournant behavioriste, le psychologue n’est plus un sujet utilisant
l’introspection, c’est plutôt un observateur du sujet utilisant l’introspection
[Boring 1953, 184]. Refuser la position introspectionniste ne revient pas,
comme pouvaient le penser les behavioristes, à éliminer l’introspection de
la psychologie. Comme nous l’avons vu, l’introspection peut être considérée
comme un outil de mesure. Mais elle peut aussi être étudiée comme un
phénomène cognitif parmi d’autres, susceptible d’être observé ou manipulé.
Considérons ainsi le paradigme expérimental de Kosslyn [Kosslyn 1973]. Il est
demandé au sujet de mémoriser des images d’objets de formes et de tailles
diverses, parmi lesquelles figure un avion à hélice. On demande ensuite au
sujet de fixer son attention sur une partie de l’un de ces objets, par exemple
sur la queue de l’avion, puis de répondre à une question portant sur une
autre partie de cet objet, par exemple : « cet avion a-t-il une hélice ? ». Le
temps de réponse est chronométré, et cela permet à Kosslyn d’observer que
le temps de réponse des sujets est corrélé avec la distance spatiale entre les
deux parties de l’avion. Autrement dit, l’expérience confirme l’hypothèse selon
laquelle les sujets manipulent des représentations iconiques en mémoire de
travail, et qu’ils utilisent une procédure de balayage quasi-visuel pour réaliser
la tâche demandée. Ce protocole expérimental présuppose que les sujets sont
capables d’avoir à la fois un contrôle métacognitif de la façon dont leur
attention se focalise lorsque des représentations sont manipulées en mémoire de
travail, et une connaissance introspective de cette focalisation attentionnelle.
L’introspection est donc utilisée non pas pour observer un processus cognitif,
mais bien pour manipuler certaines variables latentes : l’hypothèse sous-jacente
au paradigme expérimental de Kosslyn est que si le sujet focalise son attention
sur une image mentale, une représentation ayant un format iconique sera
activée en mémoire de travail, et l’activation de cette représentation causera
certains comportements mesurables. Le phénomène mesuré n’existerait tout
simplement pas sans cette présupposition.
Est-il possible « d’objectiver » [Questienne, Atas et al. 2018] le concept
d’accès introspectif, c’est-à-dire de l’étudier dans un cadre expérimental ?
Distinguons préalablement entre deux grandes sortes d’introspection : la
Les données en première personne en psychologie 125

connaissance des processus et états occurrents d’une part, comme les émotions
ou en général les expériences conscientes, et l’introspection des états disposi-
tionnels, que l’on ne peut pas identifier à des événements ou à des processus
ayant un début et une fin, comme les préférences ou les croyances [Cassam
2014]. Il est devenu courant en psychologie sociale, depuis la publication de
l’article de Nisbett & Wilson [Nisbett & Wilson 1977], de considérer que
l’introspection des états dispositionnels est un processus inférentiel complexe,
qui peut donner lieu à des formes de confabulation [Ludwig & Michel
2017]. Il en découle qu’utiliser cette forme d’introspection comme instrument
de mesure peut s’avérer méthodologiquement problématique. En revanche,
plusieurs études suggèrent qu’il est possible, dans le cas de l’introspection
des états ou des processus occurrents, d’établir des corrélations entre les
données subjectives et des facteurs causaux objectifs. Les sujets peuvent
évaluer introspectivement la visibilité d’un stimulus [Overgaard, Rote et al.
2006], leur sentiment subjectif d’effort mental lors de la réalisation d’une
tâche cognitive [Naccache, Dehaene et al. 2005], le sentiment d’agir associé au
contrôle moteur [Moore, Wegner et al. 2009], certaines caractéristiques d’une
action mentale, comme le nombre d’objets vers lesquels l’attention visuelle
a été dirigée lors d’une recherche visuelle [Reyes & Sackur 2014], ou encore
certains aspects du déploiement de l’attention visuelle [Reyes & Sackur 2017].
De tels mécanismes introspectifs sont utilisés depuis longtemps pour mesurer
les états ou processus occurrents9 . Mais ce qui est nouveau et significatif, c’est
que certaines équipes étudient ces instruments de mesure introspectifs eux-
mêmes comme des mécanismes, en établissant des corrélations entre mesures
objectives et mesures subjectives, et en essayant d’expliquer ces corrélations
de façon causale à partir des meilleures théories disponibles. Ici encore, la
démarche est semblable à celle que l’on a pu décrire en physique, lorsque la
mise en corrélation des résultats de plusieurs procédures de mesure permet de
valider les instruments10 . Étudier les mécanismes de l’introspection elle-même
sera probablement nécessaire pour pouvoir calibrer les procédures de mesure
subjectives plus efficacement.

5 Conclusion
S’il est incontestable que les données subjectives, acquises par des processus
introspectifs, jouent un rôle important dans les sciences humaines – tout
particulièrement en psychologie –, il ne s’agit pas d’un rôle de justification
directe des hypothèses, du moins pour ce qui concerne la psychologie expéri-
mentale. L’introspection est utilisée dans les contextes d’observation et d’expé-
rimentation essentiellement pour manipuler et mesurer des phénomènes qui,
9. C’est en particulier le cas dans le domaine de la psychologie des émotions et
des affects [Quigley, Lindquist et al. 2014].
10. Voir en particulier l’analyse de cette procédure de validation, à propos du
microscope, dans [Hacking 1981].
126 Pascal Ludwig & Matthias Michel

sinon, seraient difficilement accessibles à l’étude expérimentale. Les chercheurs


qui utilisent ces méthodes introspectives considèrent donc l’introspection
comme un instrument, qui, comme tous les instruments, peut lui-même faire
l’objet d’une investigation empirique. Certaines équipes ont ainsi récemment
commencé à étudier expérimentalement l’introspection comme un mécanisme
susceptible d’être manipulé. Il est probable que ces recherches joueront
dans le futur un rôle crucial dans la validation des paradigmes reposant
sur l’introspection en psychologie, et plus généralement dans l’ensemble des
sciences humaines.

Bibliographie
Alexandrova, Anna [2008], First-person reports and the measurement
of happiness, Philosophical Psychology, 21(5), 571–583, doi : 10.1080/
09515080802412552.

—— [2017], A Philosophy for the Science of Well-Being, Oxford : Oxford


University Press.

Bogen, James & Woodward, James [1988], Saving the phenomena, The
Philosophical Review, 97(3), 303–352, doi : 10.2307/2185445.

Boring, Edwin G. [1953], A history of introspection., Psychological Bulletin,


50(3), 169–189, doi : 10.1037/h0090793.

Borsboom, Denny [2005], Measuring the Mind : Conceptual Issues in Modern


Psychometrics, Cambridge : Cambridge University Press.

Borsboom, Denny, Mellenbergh, Gideon J. et al. [2004], The concept of


validity., Psychological Review, 111(4), 1061–1071, doi : 10.1037/0033-295X.
111.4.1061.

Brentano, Franz [2008], Psychologie du point de vue empirique, Paris : Vrin.

Brindley, Giles Skey [1970], Physiology of the Retina and Visual Pathway,
Londres : Edward Arnold.

Bühler, Karl [1907], Tatsachen und Probleme zu einer Psychologie der


Denkvorgänge, Archiv für die gesamte Psychologie, 9, 197–365, http://hdl.
handle.net/11858/00-001M-0000-002A-F2DE-B.

Campbell, Donald T. [1957], Factors relevant to the validity of experiments


in social settings, Psychological Bulletin, 54(4), 297–312, doi : 10.1037/
h0040950.

Cassam, Quassim [2014], Self-knowledge for Humans, Oxford : Oxford


University Press.
Les données en première personne en psychologie 127

Chalmers, David J. [1999], First-person methods in the science of conscious-


ness, Consciousness Bulletin, Fall, 8–11.

Chang, Hasok [2004], Inventing Temperature : Measurement and Scientific


Progress, Oxford : Oxford University Press.

Chirimuuta, Mazviita [2014], Psychophysical methods and the evasion of


introspection, Philosophy of Science, 81(5), 914–926, doi : 10.1086/677890.

Coady, Cecil & Antony, John [1992], Testimony : A Philosophical Study,


Oxford : Clarendon Press.

Comte, Auguste [1830], Cours de philosophie positive (1), Paris : Rouen


Frères.

Cook, Thomas D. & Campbell, Donald T. [1979], Quasi-experimentation :


Design and Analysis Issues for Field Settings, Chicago : Rand McNally
College.

Diener, Ed, Emmons, Robert A. et al. [1985], The satisfaction with life
scale, Journal of Personality Assessment, 49(1), 71–75, doi : 10.1207/
s15327752jpa4901_13.

Fodor, Jerry [1965], Explanation in psychology, dans : Psychology in America,


édité par M. Black, Londres : Routledge, 161–179.

Goldman, Alvin I. [1997], Science, publicity, and consciousness, Philosophy


of Science, 64(4), 525–545, doi : 10.2307/188559.

Hacking, Ian [1981], Do we see through a microscope ?, Pacific Philosophical


Quarterly, 62(4), 305–322, doi : 10.1111/j.1468-0114.1981.tb00070.x.

—— [1983], Representing and Intervening : Introductory Topics in the


Philosophy of Natural Science, Cambridge : Cambridge University Press.

Hardwig, John [1991], The role of trust in knowledge, The Journal of


Philosophy, 88(12), 693–708, doi : 10.2307/2027007.

Hatfield, Gary [2005], Introspective evidence in psychology, dans : Scientific


Evidence. Philosophical Theories and Applications, édité par P. Achinstein,
Baltimore : The Johns Hopkins University Press, 259–286.

—— [2014], Psychological experiments and phenomenal experience in size


and shape constancy, Philosophy of Science, 81(5), 940–953, doi : 10.1086/
677891.

John, Oliver P. & Benet-Martínez, Veronica [2014], Measurement, dans :


Handbook of Research Methods in Social and Personality Psychology, édité
par H. T. Reis & . M. Judd, New York : Cambridge University Press, 2e
éd., 473–503, doi : 10.1017/CBO9780511996481.023.
128 Pascal Ludwig & Matthias Michel

Julesz, Bela [1964], Binocular depth perception without familiarity cues,


Science, 145(3630), 356–362, doi : 10.2307/1714418.

Kahneman, Daniel, Diener, Edward et al. [1999], Well-Being : The


Foundations of Hedonic Psychology, New York : Russell Sage Foundation.

Kahneman, Daniel, Krueger, Alan B. et al. [2004], Toward national well-


being accounts, American Economic Review, 94(2), 429–434, doi : 10.1257/
0002828041301713.

Kingdom, Frederik A. & Prins, Nicolaas [2010], Psychophysics : a Practical


Introduction, Londres : Academic Press.

Kosslyn, Stephen Michael [1973], Scanning visual images : Some structural


implications, Perception & Psychophysics, 14(1), 90–94, doi : 10.3758/
BF03198621.

Kriegel, Uriah [2013], A hesitant defense of introspection, Philosophical


Studies, 165(3), 1165–1176, doi : 10.1007/s11098-013-0148-0.

Leopold, David, Maier, A. et al. [2003], Measuring subjective visual


perception in the nonhuman primate, Journal of Consciousness Studies,
10(9–10), 115–130.

Lindenfeld, David [1978], Oswald Külpe and the Würzburg school, Journal of
the History of the Behavioral Sciences, 14(2), 132–141, doi : 10.1002/1520-
6696(197804)14:2<132::AID-JHBS2300140206>3.0.CO;2-4.

Ludwig, Pascal & Michel, Matthias [2017], L’introspection, dans :


L’Encylopédie philosophique, édité par M. Kristanek, Encyclo-Philo, http:
//encyclo-philo.fr/introspection-a/.

Moore, James W., Wegner, Daniel M. et al. [2009], Modulating the sense of
agency with external cues, Consciousness and Cognition, 18(4), 1056–1064,
doi : 10.1016/j.concog.2009.05.004.

Naccache, Lionel, Dehaene, Stanislas et al. [2005], Effortless control :


Executive attention and conscious feeling of mental effort are dissociable,
Neuropsychologia, 43(9), 1318–1328, doi : 10.1016/j.neuropsychologia.2004.
11.024.

Nelson, Barnaby, Thompson, Andrew et al. [2012], Basic self-disturbance


predicts psychosis onset in the ultra high risk for psychosis “prodromal”
population, Schizophrenia Bulletin, 38(6), 1277–1287, doi : 10.1093/schbul/
sbs007.

Nisbett, Richard E. & Wilson, Timothy D. [1977], Telling more than we


can know : Verbal reports on mental processes, Psychological Review, 84(3),
231–259, doi : 10.1037/0033-295X.84.3.231.
Les données en première personne en psychologie 129

Overgaard, Morten [2006], Introspection in science, Consciousness and


Cognition, 15(4), 629–633, doi : 10.1016/j.concog.2006.10.004, special Issue
on Introspection.
Overgaard, Morten, Rote, Julian et al. [2006], Is conscious perception
gradual or dichotomous ? A comparison of report methodologies during a
visual task, Consciousness and Cognition, 15(4), 700–708, doi : j.concog.
2006.04.002, special Issue on Introspection.
Piccinini, Gualtiero [2009], First person data, publicity and self-
measurement, Philosophers’Imprint, 9(9), 1–16, http://hdl.handle.net/
2027/spo.3521354.0009.009.
Pine, Daniel S. & LeDoux, Joseph E. [2017], Elevating the role of subjective
experience in the clinic : Response to Fanselow and Pennington, American
Journal of Psychiatry, 174(11), 1121–1122, doi : 10.1176/appi.ajp.2017.
17070818r.
Questienne, Laurence, Atas, Anne et al. [2018], Objectifying the subjective :
Building blocks of metacognitive experiences in conflict tasks, Journal
of Experimental Psychology : General, 147(1), 125–131, doi : 10.1037/
xge0000370.
Quigley, Karen S., Lindquist, Kristen A. et al. [2014], Inducing and
measuring emotion and affect, dans : Handbook of Research Methods in
Social and Personality Psychology, édité par H. T. T. Reis & H. M.
Reis, New York : Cambridge University Press, 2e éd., 220–252, doi :
10.1017/CBO9780511996481.014.
Reyes, Gabriel & Sackur, Jérôme [2014], Introspection during visual search,
Consciousness and Cognition, 29, 212–229, doi : 10.1016/j.concog.2014.08.
009.
—— [2017], Introspective access to implicit shifts of attention, Consciousness
and Cognition, 29, 11–20, doi : 10.1016/j.concog.2016.10.003.
Sackur, Jérôme [2009], L’introspection en psychologie expérimentale, Revue
d’Histoire des Sciences, 62(2), 349–372, doi : 10.3917/rhs.622.0349.
Schooler, Jonathan & Schreiber, Charles A. [2004], Experience, meta-
consciousness, and the paradox of introspection, Journal of Consciousness
Studies, 11(7), 17–39.
Schultz, Duane P. & Schultz, Sidney Ellen [1987], History of Modern
Psychology, San Diego : Harcourt Brace Jovanovich.
Schwarz, Norbert & Strack, Fritz [1999], Reports of subjective well-being :
Judgmental processes and their methodological implications, dans : Well-
Being : The Foundations of Hedonic Psychology, édité par D. Kahneman,
E. Diener & N. Schwarz, New York : Russell Sage Foundation, 61–84.
130 Pascal Ludwig & Matthias Michel

Schwitzgebel, Eric [2008], The unreliability of naive introspection, The


Philosophical Review, 117(2), 245–273, doi : 10.1215/00318108-2007-037.

—— [2011], Perplexities of Consciousness, Cambridge, Mass. : MIT Press.

Shapin, Steven [1994], A Social History of Truth. Civility and Science in


Senventeenth-Century England, Chicago : University of Chicago Press.

Shin, Doh C. & Johnson, D. M. [1978], Avowed happiness as an overall


assessment of the quality of life, Social Indicators Research, 5(1), 475–492,
doi : 10.1007/BF00352944.

Simler, Kevin & Hanson, Robin [2018], The Elephant in the Brain : Hidden
Motives in Everyday Life, New York : Oxford University Press.

Tal, Eran [2019], Individuating quantities, Philosophical Studies, 176(4), 853–


878, doi : 10.1007/s11098-018-1216-2.

Titchener, Edward Bradford [1909], Lectures on the Experimental Psychology


of the Thought-processes, New York : Macmillan.

—— [2010], A Text-Book of Psychology, New York : Macmillan.

Watson, John B. [1913], Psychology as the behaviorist views it, Psychological


Review, 20(2), 158–177, doi : 10.1037/h0074428.

Wilson, Fred [1991], Mill and Comte on the method of introspection, Journal
of the History of the Behavioral Sciences, 27(2), 107–129, doi : 10.1002/1520-
6696(199104)27:2<107::AID-JHBS2300270202>3.0.CO;2-M.

Wootton, David [2015], The Invention of Science : A New History of the


Scientific Revolution, New York : Harper.

Wundt, Wilhelm [1888], Selbstbeobachtung und innere Wahrnehmung,


Philosophische Studien, 4, 292–309.
Situer l’analyse phylogénétique entre les
sciences historiques et expérimentales

Thomas Bonnin
Exeter Centre for the Study of the Life Sciences (Egenis),
University of Exeter (Grande-Bretagne)

Jonathan Lombard
Department of Cell and Molecular Biology, Science for Life
Laboratory, Uppsala University (Suède)

Résumé : Cet article propose une étude conceptuelle d’une pratique scien-
tifique. L’analyse phylogénétique, méthode phare en biologie de l’évolution,
permet d’inférer les relations évolutives entre différentes espèces ou organismes.
De nos jours, elle fait souvent intervenir l’usage de données moléculaires, dont
les résultats sont appelés des phylogénies moléculaires. Comment caractériser
cette pratique ? Nous commençons par une présentation de la méthode, en
la découpant en quatre étapes : (1) l’identification puis (2) l’alignement de
séquences homologues (descendants d’un ancêtre commun) ; (3) la construc-
tion puis (4) l’interprétation d’un arbre phylogénétique. Nous montrons que
l’analyse phylogénétique n’est pas une expérimentation, et donc n’appartient
pas au « style de laboratoire », tel que défini par Hacking. Elle ne correspond
pas non plus à une méthode typique des sciences historiques, telle que décrite
par Cleland. Bien que la correspondance de l’analyse phylogénétique avec ces
catégorisations ne soit que partielle, nous défendons l’utilité de chacune de
ces confrontations pour souligner des aspects distincts de cette pratique. Nous
remettons aussi en cause l’idée d’une séparation méthodologique nette entre
sciences expérimentales et sciences historiques.

Abstract: This article offers a conceptual study of a scientific practice.


Phylogenetic analysis is one of the main methods of evolutionary biology
as it allows us to deduce the evolutionary relationships between different
species or organisms. In current practice, these analyses are often performed
with the help of molecular data, resulting in what are called molecular

Philosophia Scientiæ, 23(2), 2019, 131–147.


132 Thomas Bonnin & Jonathan Lombard

phylogenies. A major question is what is the best way to characterize


this practice? We begin with a presentation of this method articulated
in four stages: (1) identification; (2) alignment of homologous sequences
(stemming from a common ancestor); (3) construction (4) interpretation of
phylogenetic trees. We show that phylogenetic analyses are not experiments,
and therefore do not belong to the “laboratory style”, as defined by Hacking.
This practice does not correspond to a typical practice from the historical
sciences, as described by Cleland. Although there is only a partial corre-
spondence between phylogenetic analysis and these conceptualizations, we
argue that each confrontation sheds light on distinct aspects of this practice.
We also question the idea of a strong methodological separation between
experimental sciences and historical sciences.

1 Introduction
Si ce numéro spécial de la revue Philosophia Scientiæ propose une comparaison
des formes d’expérimentations à l’œuvre dans les sciences de la nature et dans
les sciences humaines et sociales, cet article prend deux tangentes qui, nous
l’espérons, déboucheront quand même sur une contribution pertinente.
La première concerne le type de science analysée. Nous nous intéressons à
une pratique appartenant aux sciences historiques. Plus précisément, l’article
s’intéresse à la description de l’analyse phylogénétique (et plus particulière-
ment, de la phylogénie moléculaire), une méthode principalement employée
en biologie évolutive. Cette pratique constitue l’outil privilégié pour étudier
l’histoire du vivant depuis l’apparition des premières formes de vie sur Terre
jusqu’au suivi des nouvelles résistances aux antibiotiques dans le présent. Cet
outil combine des connaissances fonctionnelles provenant d’autres domaines
biologiques et des données moléculaires au profit d’études évolutives qui sont,
par définition, historiques. Il ne s’agit donc pas d’une pratique « typique » des
sciences naturelles, au sens où elle ne cherche pas à dégager les régularités
et les lois qui régissent le comportement des choses, mais à décrire une suite
temporelle d’événements contingents.
La seconde tangente concerne la manière dont cette pratique est habituel-
lement définie. Contrairement à d’autres contributions de ce numéro spécial,
l’analyse phylogénétique n’est pas, à notre connaissance, considérée comme une
forme d’expérimentation. Tout en se basant sur la comparaison d’organismes
actuels, les études phylogénétiques essayent de fournir un regard sur des
événements passés et contingents sur lesquels il est impossible d’intervenir,
et que l’on ne peut pas reproduire. Cette méthode n’essaye d’ailleurs pas
de déterminer des événements à l’échelle d’organismes spécifiques du passé,
mais plutôt de générer une représentation du phénomène évolutif dans
Situer l’analyse phylogénétique 133

son intégralité. L’analyse phylogénétique ne semble donc pas intuitivement


correspondre à une investigation expérimentale.
Malgré cela, nous proposons avec cet article d’explorer ce qui découle d’une
confrontation entre l’analyse phylogénétique et la notion d’expérimentation,
et par ce biais, d’étudier la relation entre sciences historiques et sciences
expérimentales. Nous commençons, dans la section 2, par une présentation
de l’analyse phylogénétique en tant que méthode. Elle se découpe en quatre
étapes principales : (1) la recherche de séquences issues d’un ancêtre commun,
(2) l’alignement de ces séquences afin de les comparer entre elles, (3) la
production et (4) l’interprétation d’un arbre phylogénétique. Dans la section 3,
nous analysons le type de pratique qu’est l’analyse phylogénétique. Nous
montrons que l’analyse phylogénétique n’est pas une expérimentation, et donc
n’appartient pas au style de laboratoire, tel que défini par Hacking [Hacking
1992a]. Elle ne correspond pas non plus à une méthode typique des sciences
historiques, telle que décrite par Cleland [Cleland 2002].
Bien que la correspondance de l’analyse phylogénétique avec ces catégori-
sations soit partielle, nous défendons l’utilité de chacune de ces confrontations
pour souligner des aspects distincts de cette pratique. L’analyse phylogénétique
partage avec une expérimentation typique le soin apporté dans la définition du
système cible et dans l’amélioration de la reproductibilité des résultats. L’idée
du style de laboratoire, bien qu’utilisée hors de son domaine d’application,
permet de mettre en avant les différentes composantes de cette pratique, et
d’ouvrir la réflexion sur ses dynamiques d’autolégitimation. Enfin, comme une
science historique typique, l’analyse phylogénétique consiste à relier des traces
contemporaines par des causes communes situées dans le passé.
En conclusion, notre analyse met en avant l’insuffisance de nos catégories
actuelles pour caractériser pleinement une pratique comme l’analyse phylogé-
nétique et remet en cause l’idée d’une séparation méthodologique nette entre
sciences expérimentales et sciences historiques.

2 L’analyse phylogénétique
L’analyse phylogénétique constitue un des outils principaux de la biologie
évolutive. Elle s’inspire de l’idée d’arbre généalogique. Une généalogie est
une figure arborescente qui montre les liens génétiques qui connectent les
ancêtres à leurs descendants. Il s’agit d’une nécessité théorique découlant
d’un présupposé fondamental de la biologie, qui postule l’existence d’une
parenté commune plus ou moins éloignée dans le temps pour expliquer les
similarités observées entre les êtres vivants. Afin d’étudier ces relations, la
biologie évolutive utilise les caractéristiques communes entre organismes pour
reconstruire des arbres phylogénétiques (ou « phylogénies ») qui représentent
le lien de parenté existant entre les caractéristiques étudiées. Ces relations sont
souvent employées pour inférer les relations de parenté entre espèces.
134 Thomas Bonnin & Jonathan Lombard

Les premiers caractères à avoir été utilisés pour effectuer ces comparaisons
étaient « morphologiques », c’est-à-dire des caractéristiques « visibles » des
êtres vivants, tels que l’ossature des animaux. Les analyses phylogénétiques
sont maintenant souvent effectuées à partir de caractères « moléculaires »,
correspondant aux séquences d’ADN et de protéines. Ce type d’analyse
a suivi un développement fulgurant depuis les années 1960, notamment
grâce à l’accumulation de données génomiques permise par l’avènement des
technologies de séquençage [Suárez-Díaz & Anaya-Muñoz 2008]1 .
Les caractères moléculaires ont constitué une révolution méthodologique
au sein de l’analyse phylogénétique. Les séquences d’ADN sont toutes
constituées des mêmes bases nucléotidiques. Le code génétique, c’est-à-dire la
correspondance entre un triplet de nucléotides et un acide aminé constituant
des protéines, est le même pour la quasi-totalité des organismes. Cette
constante presque universelle du vivant au niveau moléculaire fournit une base
comparative unique exploitée par les analyses phylogénétiques moléculaires.
L’utilisation de caractères moléculaires possède de nombreux avantages.
D’abord, il y a dans chaque organisme beaucoup plus de gènes et de
protéines que de traits morphologiques. Chaque nucléotide d’un gène ou
acide aminé d’une protéine constitue potentiellement un caractère comparable
entre espèces. Ainsi, les caractères moléculaires permettent de comparer des
organismes tellement différents morphologiquement qu’ils seraient difficiles à
comparer, ou tellement proches qu’ils seraient difficiles à distinguer. Tel est
le cas, par exemple, de l’évolution des microorganismes (protistes, bactéries,
archées), dont la diversité était difficile à mesurer morphologiquement aupa-
ravant [Castelle & Banfield 2018].
Étant donné la profusion de caractères moléculaires, la première étape
de l’analyse phylogénétique consiste en la recherche de séquences issues d’un
dernier ancêtre commun, qui puissent être comparées.

2.1 Sélectionner des homologues


En biologie évolutive, deux caractères sont dits homologues s’ils sont hérités
d’un dernier ancêtre commun. Si la comparaison de caractères homologues
est la seule qui puisse avoir un sens biologique, comment faire pour établir
une relation d’homologie entre deux traits ? En ce qui concerne les caractères
morphologiques, l’homologie est souvent déterminée par les connexions de
chaque caractère avec d’autres structures adjacentes. Par exemple, on peut
établir la relation d’homologie entre chaque os des extrémités antérieures des
vertébrés en étudiant les autres os qui s’y connectent. Dans le cas moléculaire,
1. Notre caractérisation méthodologique de l’analyse phylogénétique s’inspire des
travaux de Suárez-Díaz & Anaya-Muñoz, qui proposent une caractérisation plus
technique et détaillée que la nôtre. Leur angle philosophique, centré sur l’étude des
formes d’objectivité et de subjectivité en jeu dans cette méthode, est complémentaire
à celui que nous proposons ici.
Situer l’analyse phylogénétique 135

l’argument est statistique. Sachant qu’un petit gène est composé d’environ
600 nucléotides, et qu’il existe 4 types de nucléotides, cela veut dire qu’il
existe, pour un gène de cette taille, 4600 , soit ∼ 10260 combinaisons possibles
de nucléotides de cette longueur. Pour une petite protéine de 200 acides aminés
et sachant qu’il existe 20 acides aminés différents, le nombre de combinaisons
aléatoires possibles est de 20200 , soit 10361 combinaisons possibles. À titre de
comparaison, le nombre d’atomes existants dans l’univers est estimé à 1080 . La
détermination d’homologies se base donc sur le présupposé que la ressemblance
entre deux séquences d’ADN ou de protéines ne puisse pas être due au hasard,
surtout si l’on sait par ailleurs que les fonctions des protéines codées par ces
gènes sont les mêmes, ou très similaires, entre les différents organismes qui les
portent. Au contraire, ces ressemblances trahissent une descendance commune.
Cette recherche de séquences similaires ne peut pas se faire manuellement.
La taille des séquences concernées, le nombre possible de leurs variantes et
l’ampleur des bases de données de séquences d’ADN et de protéines rendent
nécessaire l’emploi de méthodes heuristiques. Ces méthodes cherchent à
explorer les « meilleures possibilités » en un temps réduit pour rendre l’analyse
possible. Aujourd’hui, les outils les plus largement utilisés pour effectuer cette
tâche sont le Basic Local Alignment Search Tool (BLAST) [Altschul, Gish
et al. 1990] et ses dérivés. BLAST calcule un « score de similarité » entre deux
séquences potentiellement homologues. Ce score ne se limite pas à compter le
nombre de sites identiques entre les deux séquences, mais pondère la présence
d’éventuelles mutations par l’utilisation d’une « matrice de substitution ».
La matrice de substitution rassemble les différentes fréquences de sub-
stitution d’un acide aminé à un autre. En effet, toutes les mutations n’ont
pas la même fréquence. Cela s’explique d’abord par la redondance du code
génétique (toutes les mutations de l’ADN n’impliquent pas un changement
de l’acide aminé correspondant). Cela vient aussi des propriétés chimiques
spécifiques des acides aminés. La sélection naturelle tend à conserver des acides
aminés avec des comportements chimiques proches, qui auront un impact
moindre sur l’activité de la protéine en question. La matrice en elle-même
est construite en fonction de données empiriques sur les fréquences relatives
de chaque type de mutation.
La pertinence de la similarité entre deux séquences est indiquée par
l’e-value calculée par BLAST, qui mesure les chances de retrouver par hasard
ce même score de similarité pour une séquence de cette taille au sein de la
base de données utilisée. Plus l’e-value est faible, moins le score de similarité a
de chances d’être le résultat du hasard. En pratique, le seuil d’e-value à partir
duquel la similarité de séquences n’est plus considérée comme pertinente est
arbitraire, mais doit être explicitement signalée par l’utilisateur.
136 Thomas Bonnin & Jonathan Lombard

2.2 L’alignement de séquences


Une fois les séquences homologues identifiées, il faut les aligner, c’est-à-dire
déterminer l’homologie entre chacun des nucléotides (ou acides aminés) des
séquences disponibles. En effet, chaque élément qui compose une séquence
constitue un caractère pour lequel on cherche à établir la relation avec les
caractères équivalents des autres séquences homologues. Ainsi, toutes les
séquences homologues identifiées sont comparées entre elles (on parle ainsi
d’alignement multiple). Le résultat est une matrice où chaque ligne correspond
à une séquence et chaque colonne correspond aux sites présumés homologues
(Fig. 1a). Chaque alignement peut ainsi recevoir un score mesuré sur la
base de l’identité, d’une pénalité de substitution pondérée en fonction de
matrices prédéfinies (souvent les mêmes que pour BLAST), ainsi qu’une
pénalité pour les espaces (insertions et délétions) nécessaires pour assurer une
correspondance optimale des autres sites entre eux. L’impossibilité d’évaluer
l’ensemble des alignements possibles rend à nouveau nécessaire l’emploi de
méthodes heuristiques.
Une deuxième phase de l’alignement, le « découpage » [trimming], permet
d’éliminer pour la suite des analyses les sites contenant trop d’espaces
(notamment aux extrémités) ou trop de variabilité. On ne garde ainsi que
les sites dont on pourrait extraire des informations phylogénétiques (Fig. 1b).
Cette sélection est en principe faite à l’aide d’un des nombreux logiciels qui
utilisent des critères plus ou moins sophistiqués pour exclure automatiquement
les sites dont l’homologie paraît incertaine. Certaines méthodes sont plus
adaptées à certains cas, mais toutes les méthodes de découpage peuvent être
soumises à des critiques [Tan, Muffato et al. 2015]. La répétition de cette étape
avec différents paramètres ou logiciels devient alors une manière d’évaluer la
fiabilité des résultats, et le choix de la méthode retenue apparaît explicitement
dans les publications. L’étape d’alignement est cruciale, car elle détermine la
base comparative sur laquelle l’arbre phylogénétique est construit.

2.3 Construction des arbres


Cette étape consiste à représenter sous forme d’un arbre phylogénétique les
relations évolutives entre nos séquences. Une manière de faire cela est d’utiliser
le principe de parcimonie. Celui-ci affirme que le meilleur arbre est celui qui
minimise le nombre d’évènements évolutifs. Dans la pratique, le principe de
parcimonie est souvent invoqué dans les hypothèses et scénarios évolutifs, mais
rarement utilisé pour la reconstruction de phylogénies moléculaires à cause
(a) de la difficulté à distinguer entre plusieurs arbres également parcimonieux
et (b) des artefacts connus induits par ses méthodes [Felsenstein 1978].
Les autres méthodes de reconstruction phylogénétique se basent plutôt
sur la distance évolutive entre les séquences. Ces méthodes commencent par
le calcul d’une matrice de distances entre toutes les paires de séquences.
Situer l’analyse phylogénétique 137

A – – LP–TRR–PY– – – – – – –DSATAP–GYMAVGDAAAHV-N
B – – LP–TRR–PY– – – – – – –DSATAP–GFMAVGDAAGHV-N
a.
C – – LP–TRR–PY– – – – – – –DSAVHP–GYMAIGDAAGHV-N
D – – LP–TRR–PY– – – – – – –DSAVHP–GYVAIGDAAGHV-N

A LPTRRPDSATGYMAVGDAAAHVN
B LPTRRPDSATGFMAVGDAAGHVN
b.
C LPTRRPDSAVGYMAIGDAAGHVN
D LPTRRPDSAVGYVAIGDAAGHVN

Figure 1 – Présentation de 4 séquences homologues alignées (a) avant et (b) après


découpage. Les résidus enlevés lors du découpage sont indiqués en gras sur la figure 1a.
Il s’agit d’un extrait de séquences homologues au sein d’un alignement qui intègre, par
ailleurs, de nombreuses autres séquences. Cela explique le retrait de résidus identiques
entre ces 4 séquences.

Pour cela, on emploie le modèle d’évolution le plus à même de décrire


l’évolution des séquences. Cet article n’a pas pour vocation d’entrer dans le
détail des divers paramètres pris en compte par ces modèles. On peut citer
comme exemples des vitesses variables d’évolution, à la fois entre différentes
séquences et d’un site au sein d’une séquence par rapport à un autre. Le choix
des modèles d’évolution peut lui même faire le sujet d’études comparatives et
est toujours spécifié dans les travaux de phylogénie. Ces méthodes de calcul
diffèrent de celles employées dans les étapes d’identification et d’alignement
des homologues par leur degré de sophistication accru. Le but ici n’est pas
de sélectionner parmi une foule d’alignements possibles, mais d’évaluer plus
finement les relations entre les séquences choisies.
Une fois que la matrice des distances est obtenue, elle peut être soumise
à différentes méthodes possibles. Dans les méthodes de distances, on utilise
la matrice de distances pour regrouper deux des séquences (par exemple, les
deux séquences les plus proches), recalculer les distances en se basant sur ces
dernières, et intégrer ainsi les autres au fur et à mesure. Dans les méthodes
probabilistes (de vraisemblance ou bayésiennes), on calcule la probabilité
d’obtenir chaque arbre possible à partir des données de l’alignement, pour
sélectionner ensuite l’arbre avec la meilleure probabilité. Dans la pratique,
une application exhaustive des méthodes de probabilité impliquerait encore
l’exploration de beaucoup trop de topologies, des méthodes heuristiques sont
donc à nouveau utilisées.
L’arbre phylogénétique obtenu est composé de nœuds et de branches
(Fig. 2). Les nœuds représentent des ancêtres communs qui, dans ce cas, sont
virtuels, comme des portraits-robots que l’on peut reconstruire en recoupant
138 Thomas Bonnin & Jonathan Lombard

Figure 2 – Exemple schématique d’arbre phylogénétique. Les flèches indiquent


les nœuds représentant d’hypothétiques ancêtres communs entre les séquences
comparées.

les informations connues à propos des espèces en amont et en aval du nœud.


La longueur des branches représente la quantité de changements que l’on
estime s’être produits entre deux points. Cette représentation permet donc
de comparer les anciennetés des ancêtres communs de diverses séquences
et, par extrapolation, cela permet de comparer les anciennetés des ancêtres
communs entre les espèces portant ces séquences. Finalement, quelle que soit
la méthode utilisée pour construire l’arbre, le soutien statistique des résultats
obtenus est évalué. Dans une phylogénie, il n’est pas possible d’appliquer les
concepts classiques d’intervalles de confiance ou de tests de significativité. Les
méthodes bayésiennes intègrent par définition une mesure de ce soutien, mais
pour les autres méthodes, on applique généralement des mesures de bootstrap.
Ces dernières évaluent la robustesse de la topologie en « ré-échantillonnant »
les données utilisées. L’objectif de ces mesures est de déterminer le soutien de
chaque nœud de l’arbre, ce qui, dans une certaine mesure, constitue une forme
d’évaluation de la reproductibilité du résultat.

2.4 Interprétation des arbres


L’interprétation des résultats de l’analyse phylogénétique nécessite de nom-
breuses précautions. D’abord, comme dans toute analyse statistique, le fait
qu’un nœud proposé ait un haut degré de soutien n’indique pas nécessairement
Situer l’analyse phylogénétique 139

que le nœud proposé soit validé. Il est en effet tout à fait possible que le
haut degré de soutien obtenu soit le résultat d’un artefact méthodologique,
d’un biais d’échantillonnage ou du choix d’un modèle d’évolution inadapté.
Pareillement, ce n’est pas parce qu’un nœud est faiblement soutenu qu’il
est nécessairement faux. On parle ici plutôt d’un nœud « non résolu ». Les
discussions et validations finales des résultats se font en comparant les arbres
obtenus avec d’autres analyses, où (1) les mêmes données sont soumises à
d’autres méthodes d’alignement, de trimming, de reconstruction d’arbres ou
à d’autres modèles d’évolution ; ou bien (2) d’autres données sont employées,
en comparant, par exemple, la phylogénie du (des) gène(s) d’intérêt à celle
d’autres gènes ou de phylogénies indépendamment obtenues.
Après cette présentation succincte de l’analyse phylogénétique, que peut-on
dire sur le type de pratique que cela constitue ? L’analyse ci-dessous confronte
l’analyse phylogénétique et les arbres phylogénétiques à diverses manières
potentielles de le conceptualiser.

3 Catégoriser l’analyse et les arbres


phylogénétiques

3.1 L’analyse phylogénétique n’est pas


une expérimentation
Dans cette section, nous approfondissons la relation entre l’analyse phylogé-
nétique et la notion d’expérimentation. Comme évoqué dans l’introduction,
l’analyse phylogénétique n’est pas habituellement caractérisée comme une
expérimentation. Selon Dupouy, « l’expérimentation est un procédé d’investi-
gation par lequel on cherche à produire ou modifier un phénomène, en isolant
et manipulant les variables qui sont susceptibles d’agir sur le phénomène en
question » [Dupouy 2011, 215]. De cette définition émergent deux propriétés
explicites : l’isolement de variables d’intérêt sur un système cible et une
intervention sur ce dernier pour produire un phénomène. Deux propriétés
implicites suivent : la définition d’un système cible sur lequel l’intervention a
lieu et la reproductibilité des résultats obtenus lors de l’intervention effectuée.
Nous montrons que les deux premières propriétés, isolement et intervention,
ne sont pas présentes dans l’analyse phylogénétique. Par conséquent, on ne
peut pas considérer cette dernière comme une expérimentation.
Dans un contexte où les bases de données contiennent des millions de
séquences appartenant à toutes sortes d’organismes, les étapes de sélection
et d’alignement ont pour but de ne garder que les portions de séquences
alignées qu’on estime porteuses des signaux phylogénétiques recherchés. Cette
étape est analogue, au sein d’une expérimentation, à la définition d’un système
cible. Cependant, cette définition n’est pas faite dans le but d’isoler certaines
140 Thomas Bonnin & Jonathan Lombard

variables d’intérêt sur le système cible afin d’étudier leurs rôles. Dans l’analyse
phylogénétique, on ne s’intéresse pas à l’évolution spécifique de certains des
homologues isolés, mais plutôt aux relations généalogiques de l’ensemble des
homologues. L’étape qui « transforme » l’ensemble des séquences isolées en
arbre phylogénétique peut être perçue comme une intervention sur le système
cible, effectuée avec l’aide d’un ensemble d’outils computationnels. Cependant,
il ne s’agit pas, comme dans une expérimentation, de modifier de manière
contrôlée le comportement du système cible, mais plutôt de restituer le
déroulement des relations phylogénétiques entre espèces vivantes. Enfin, de
nombreuses méthodes sont employées pour évaluer la qualité des produits
obtenus après chaque étape de l’analyse. On peut citer la vérification de
l’e-value, la comparaison des résultats entre méthodes d’alignement ou re-
construction phylogénétique, entre différents modèles évolutifs ou l’évaluation
de la robustesse des résultats. Cet ensemble de mesures est orienté vers
l’amélioration de la reproductibilité des résultats obtenus.
Pour résumer, si l’analyse phylogénétique en possède certains éléments
caractéristiques, elle ne peut pas, à proprement parler, être définie comme
une expérimentation. Malgré cette inadéquation, nous allons, dans un second
temps, montrer la correspondance, à nouveau partielle, entre cette pratique
scientifique et le « style de laboratoire » défini par Hacking.

3.2 L’analyse phylogénétique et le style de


laboratoire (1) : idées, choses et marques
Le concept de style de laboratoire, inspiré par Crombie [Crombie 1981],
cherche à décrire les pratiques réalisées dans cet espace physique particulier. Le
laboratoire, selon Hacking, est conçu comme un espace où, à l’aide d’appareils,
on interfère avec des phénomènes naturels dans des conditions contrôlables
et isolables. Ces interférences ont pour but de produire un savoir de type
général ou généralisable. Les sciences de laboratoire forment donc un sous-
ensemble des sciences expérimentales. Du point de vue de Hacking, il existe
de nombreuses expérimentations, notamment dans les sciences humaines,
qui n’ont pas lieu dans un laboratoire. À l’inverse, le travail de certaines
sciences historiques (paléontologie, archéologie) et de l’espace (astrophysique,
astronomie, cosmologie) peut se dérouler au sein de laboratoires. Cependant,
puisque ces dernières n’interfèrent pas avec leurs phénomènes d’intérêt,
elles n’appartiennent pas au style de laboratoire [Hacking 1992a, 33–36].
Cette absence d’interférence empêche également à l’analyse phylogénétique
d’appartenir au style de laboratoire.
Le concept de Hacking spécifie une typologie de composantes que l’on
retrouve dans les pratiques de laboratoire. Ces composantes sont regroupées
en trois catégories : les idées, les choses et les marques. Nous montrons dans
cette section que cette typologie est utile pour identifier les composantes de
l’analyse phylogénétique et leurs rôles.
Situer l’analyse phylogénétique 141

Sur le plan des idées, Hacking identifie d’abord les questions, les raisons
pour lesquelles une expérimentation est mise en œuvre. Elles correspondent
ici aux enjeux historiques et classificatoires à propos desquels les analyses
phylogénétiques cherchent à apporter des éléments de réponse.
Ensuite, il identifie la théorie, qu’il divise en trois types d’éléments,
ces distinctions étant plus ou moins graduelles selon la discipline concernée
[Hacking 1992a, 44]. Les savoirs d’arrière-plan et les théories systématiques
sont les présupposés et attentes théoriques, respectivement non-systématisés
et systématisés, qui sont tenus pour acquis dans la formulation d’une expéri-
mentation. Bien qu’elles soient nécessaires à la création d’une expérimentation,
ces théories n’ont pas ou peu de conséquences concrètes immédiates. Ici, ces
savoirs correspondent aux théories concernant l’évolution et le fonctionnement
des organismes (en particulier sous leurs aspects moléculaires).
Ces savoirs sont reliés avec la situation empirique concrète à l’aide
d’hypothèses topiques faisant la connexion entre les théories abstraites
mobilisées et les phénomènes concrets étudiés. Au sein de la phylogénie
moléculaire, ces hypothèses correspondent aux matrices de substitution et
aux modèles d’évolution employés pour identifier et aligner des homologues
puis pour reconstruire les relations phylogénétiques à partir de la similarité
des séquences alignées. Le choix de ces modèles est aussi régi par des
contraintes plus pragmatiques provenant souvent des limites des ressources
computationnelles à disposition.
Le dernier composant de ces idées correspond aux modèles des appareils
employés lors de l’analyse. Ici, il s’agit des différents programmes informatiques
employés tout au long de l’analyse phylogénétique. Ces programmes ne
cherchent pas nécessairement à intégrer des savoirs mis en jeu lors de l’analyse,
mais à rendre cette analyse possible par l’emploi de l’outil informatique. Ils
sont en ce sens similaires aux éléments d’un microscope employés pour étudier
les structures cellulaires.
Sur le plan des choses, Hacking identifie la cible de l’expérimentation. Celle-
ci correspond aux « substances ou populations étudiées » [Hacking 1992a, 46,
notre traduction]. Elle peut être préparée afin que certaines de ses composantes
soient mises en avant pour permettre l’analyse. Ici, les cibles sont les séquences
d’ADN et de protéines, qui constituent des « archives » de l’histoire du vivant,
elles-mêmes archivées et accessibles au sein de bases de données.
Les interventions sur la cible sont effectuées par les sources de modification.
Les résultats de ces modifications sont ensuite perçus par des détecteurs et
enregistrés par des générateurs de données. Ces processus sont facilités par
un ensemble d’outils, objets moins spécifiques d’une situation expérimentale
donnée, mais nécessaires à leur déroulement. Cet ensemble de choses contri-
buant à la génération de données est, dans le cas de l’analyse phylogénétique,
intégralement constitué par les outils informatiques de stockage, de calcul et de
visualisation, distribués au sein d’un vaste réseau de programmes, ordinateurs,
142 Thomas Bonnin & Jonathan Lombard

réseaux et serveurs. C’est par le biais de cet ensemble informatique intégré que
les interventions sur les séquences préparées sont effectuées.
Enfin, les marques sont les résultats de l’interaction des choses avec les
idées. Parmi ces marques se trouvent, d’abord, les données, que Hacking
considère comme le produit « brut » de l’intervention effectuée. Les données
sont, ensuite, traitées afin d’être rendues intelligibles et adaptées aux questions
auxquelles elles sont destinées à répondre. Les arbres phylogénétiques publiés
sont le produit final de ce processus. Ce sont ces derniers qui circuleront
principalement hors de leurs laboratoires d’origine.
Hacking distingue deux composantes de ce processus de traitement de
données. Lorsque ce processus n’est pas dirigé par des considérations théo-
riques, il parle de réduction des données. Cela correspond, par exemple, à
l’amélioration des qualités esthétiques de l’arbre obtenu. Lorsque ce pro-
cessus est dirigé par des considérations théoriques, telles que la question
sous-jacente ou les modèles employés lors du protocole, il parle d’ana-
lyse des données. Ici, cela peut correspondre à la mise en avant de cer-
taines séquences particulièrement pertinentes pour le questionnement initial.
Cela aboutit à l’obtention de données qui, avec l’aide de principes théoriques
et en lien avec la question soulevée, permettent d’effectuer une interprétation
à la lumière de la question initiale.

3.3 L’analyse phylogénétique et le style de


laboratoire (2) : autolégitimation
La notion de Hacking n’est pas uniquement proposée pour rendre possible
des descriptions précises des composantes contemporaines d’une pratique.
Le style de laboratoire cherche aussi à mettre en avant la présence de
dynamiques d’autolégitimation [self-vindication] des pratiques concernées.
Cette autolégitimation s’effectue par un ajustement mutuel des choses, des
idées et des marques mobilisées pour qu’elles puissent produire de manière
stable et pérenne du savoir scientifique fiable. Les composantes d’un style de
laboratoire sont donc reliées par une forme de circularité vertueuse, créant
un « système clos essentiellement irréfutable » [Hacking 1992a, 30, notre
traduction]. Ces processus d’ajustement mutuel sous-tendent l’idée défendue
par Hacking selon laquelle les expérimentations « ont une vie propre » : elles
« se développent, changent, et, pourtant, gardent un certain développement
au long terme » [Hacking 1992b, 307, notre traduction].
L’analyse phylogénétique, bien que ne constituant pas à nos yeux une forme
d’expérimentation, possède aussi ses dynamiques d’autolégitimation. Celles-ci
sont sous-tendues par la sophistication accrue de l’ensemble théorique mobilisé
(que ce soit les théories d’arrière-plan ou les hypothèses topiques) et par une
croissance exponentielle des ressources matérielles disponibles, que ce soit
les séquences disponibles pour l’analyse ou les ressources computationnelles
informatiques. Ces ensembles se sont ajustés mutuellement pour produire
Situer l’analyse phylogénétique 143

des données de plus en plus fiables et précises, et revendiquer au passage


un ensemble de succès notable. La découverte des archées comme troisième
domaine du vivant [Woese & Fox 1977] est un exemple de succès précoce
de cette méthode. De plus, l’actuelle ubiquité des analyses phylogénétiques
moléculaires, à différentes échelles (que ce soit pour retracer l’évolution de
l’ensemble du vivant ou l’émergence présente de résistances bactériennes)
et pour différents buts (qu’ils soient l’établissement de fonctions ou de
classifications), constitue pour nous le marqueur le plus clair de sa légitimité
acquise et de son développement continu.
L’identification de cette dynamique d’autolégitimation est féconde, dans
le sens où elle ouvre des questionnements sur ses modalités. Nous nous
contenterons, dans cet article, d’esquisser quelques pistes. Nous pensons qu’un
parallèle intéressant peut être effectué avec les simulations, une pratique qui
a aussi pour but de produire du savoir sur un système cible sans interférence
avec ce dernier.
La légitimité des résultats de simulations a fait l’objet de controverses au
sein de la philosophie de sciences. Dans le contexte des sciences sociales, Guala
et Morgan justifient l’infériorité épistémique relative des simulations par rap-
port aux expérimentations à cause de l’absence d’interaction matérielle directe
avec le phénomène étudié [Guala 2002], [Morgan 2003]. De son côté, Ruphy
défend une interprétation antiréaliste des simulations du fonctionnement de
galaxies. D’abord, le choix des modèles employés est sous-déterminé. De plus,
les modèles employés doivent être ajustés pour être opérationnalisés au sein
de ces simulations, faisant ainsi de ces dernières des représentations infidèles
des ensembles théoriques sur lesquels elles sont bâties [Ruphy 2017]. Pour
ces raisons, Ruphy considère que ces simulations représentent des processus
possibles plutôt que des processus réels.
Les arbres phylogénétiques ont ceci en commun avec les simulations du
fonctionnement de galaxies qu’ils constituent notre seul accès épistémique au
phénomène étudié. De plus, notre analyse en section 2 montre que le choix des
modèles employés pour les construire est tout aussi sous-déterminé. Ces argu-
ments sceptiques, confrontés à l’autolégitimation des analyses phylogénétiques,
créent une tension qui permet d’ouvrir de nombreuses pistes d’investigation.
Comment les biologistes utilisant ces méthodes échappent-ils (en partie) à
ce scepticisme et arrivent-ils à construire des connaissances fiables sur leurs
phénomènes d’intérêt ?
Cela vaudrait la peine d’étudier plus précisément les dimensions formelles,
informelles, tacites ou explicites qui dirigent la constellation de choix qui
parsèment les étapes de l’analyse phylogénétique. Il est particulièrement
intéressant de souligner ces éléments pour une pratique qui s’est construite en
opposition à des phylogénies morphologiques jugées trop dépendantes envers
des considérations subjectives [Suárez-Díaz & Anaya-Muñoz 2008]. Ensuite, on
pourrait se pencher sur le rôle que joue le savoir théorique dans la construction
des modèles et la validation des résultats obtenus. Les composantes identifiées
144 Thomas Bonnin & Jonathan Lombard

par Hacking mettent en avant la relation indirecte entre des théories de « haut
niveau » et les hypothèses topiques plus concrètes. Comment, plus concrète-
ment, les connaissances sur l’évolution et le fonctionnement des organismes
sont-elles intégrées dans les modèles employés ? Comment permettent-elles de
légitimer les résultats obtenus ? De surcroît, comment les résultats obtenus
par d’autres méthodes (s’il y en a) permettent-ils d’accroître ou de saper la
confiance envers un arbre phylogénétique ?
Pour résumer, nous jugeons que la confrontation de l’analyse phylogé-
nétique avec le style de laboratoire est philosophiquement fructueuse. Elle
permet non seulement de clarifier les différents éléments de cette pratique,
mais aussi de générer de nombreuses investigations concernant les modalités
de légitimation de ses résultats.

3.4 Les analyses phylogénétiques comme méthode


typique des sciences historiques ?
Notre analyse a, jusque-là, mis en avant des parallèles intéressants entre
analyse phylogénétique et pratiques expérimentales. Cela nous a permis
d’effectuer une caractérisation fine des composantes de cette pratique et
d’ouvrir de nombreuses pistes d’investigations sur les modalités de légitimation
de ses résultats. Dans cette dernière section, nous confrontons l’analyse
phylogénétique, une pratique historique, avec la conceptualisation de la
méthodologie des sciences historiques proposée par Cleland.
Par l’application de modèles d’évolution aux données apportées, l’analyse
phylogénétique s’emploie à reconstituer les relations généalogiques entre des
séquences individuelles. De ce point de vue, l’analyse phylogénétique peut être
conçue comme une méthode typique des sciences historiques. Ces dernières,
selon Cleland, possèdent leur méthodologie propre, distincte de celle des
sciences expérimentales. Les sciences historiques sont caractérisées par la
volonté d’expliquer une collection de traces contemporaines à l’aide d’une
cause commune située dans le passé [Cleland 2002]. L’analyse phylogénétique,
de même, permet d’inférer une cause commune (des ancêtres communs plus
ou moins éloignés dans le temps) à la similarité de séquences contemporaines.
Les sciences historiques sont souvent présentées comme confrontées à un
manque de données (que ce soit en quantité ou en qualité). Cet ensemble
limité de traces à disposition aboutit à une sous-détermination ubiquitaire des
théories par les preuves. Dans ce contexte, les confirmations et réfutations de
théories proviennent, selon Cleland, de la découverte de « pistolets fumants »
[smoking guns] : des traces capables de favoriser une hypothèse par rapport
à d’autres, jusque-là empiriquement équivalentes [Cleland 2002, 480–481]. Les
traces du passé dénichées sont présentées comme le fruit de découvertes en
partie fortuites sur les terrains d’investigations. L’emploi de méthodes pour
aider à l’identification et à l’analyse de traces est présenté comme secondaire,
Situer l’analyse phylogénétique 145

comme des « outils utiles empruntés à d’autres disciplines dans des buts
précis » [Cleland 2011, 566, notre traduction].
Au regard de l’analyse développée dans les sections précédentes, cette
conception de la méthodologie des sciences historiques semble incomplète et
inadaptée au cas de la pratique de l’analyse phylogénétique. Le séquençage
d’une diversité toujours plus étendue d’organismes constitue toujours une
tâche essentielle des approches phylogénétiques. En effet, l’obtention de
nouvelles données peut permettre d’éviter des artefacts liés à des biais
d’échantillonnage, d’étoffer la connaissance sur l’évolution d’un groupe connu
ou même la description de nouveaux groupes préalablement inconnus. Cela
peut avoir des effets importants sur la validité des hypothèses évolutives
disponibles. Pour ces raisons, les phylogénéticiens sont, d’une certaine manière,
en manque de données.
D’un point de vue pratique, cependant, la situation actuelle indique
plutôt l’inverse. De fait, les immenses bases de données apportent déjà une
surabondance de données disponibles. Cela fait de la sélection de séquences
pertinentes une préoccupation majeure des pratiques phylogénétiques actuelles
[O’Malley 2016]. La principale limite des démarches phylogénétiques n’est ainsi
plus la capacité à trouver de nouvelles données, mais le développement de
méthodes qui permettent d’en extraire les informations voulues. Cela passe
par le développement d’une panoplie d’outils et de logiciels opérationnalisant
de nombreux modèles et concepts à chaque étape de l’analyse phylogénétique,
comme présenté ci-dessus. Ce développement fait l’objet de ce que Suárez-
Díaz & Anaya-Muñoz [Suárez-Díaz & Anaya-Muñoz 2008] décrivent comme
une « anxiété méthodologique » de la part des biologistes de l’évolution. En
somme, il est désormais difficile de considérer, comme le fait Cleland, ces enjeux
comme « secondaires » à la découverte de nouvelles séquences.

4 Conclusion
Dans le cadre de cet article, nous avons cherché à explorer la fécondité d’une
confrontation de l’analyse phylogénétique avec une série de conceptualisations
potentielles de cette pratique. En mobilisant une pratique « périphérique » à
celles discutées au sein de ce numéro spécial, nous pensons avoir souligné
et exploré de manière fructueuse la limite parfois ténue existant entre
pratiques historiques et expérimentales, ainsi que la difficulté résultante de
placer certaines pratiques scientifiques dans l’éventail des conceptualisations
disponibles.
Notre discussion a montré que l’analyse phylogénétique fait partie de ces
pratiques qu’il est difficile de catégoriser. L’analyse phylogénétique partage
avec les expérimentations le souci d’une définition précise de son système
d’intérêt et d’augmenter la fiabilité et reproductibilité des résultats obtenus.
L’absence d’isolement et d’intervention à proprement parler nous empêche,
146 Thomas Bonnin & Jonathan Lombard

cependant, de caractériser cette pratique comme une expérience. Cette non-


correspondance n’est pas une surprise en soi : cette pratique n’a jamais été dé-
crite comme telle. Cependant, l’exploration de cette possibilité, notamment en
faisant correspondre l’analyse phylogénétique avec le « style de laboratoire »,
a permis d’effectuer une description fine des composantes de cette pratique
et de soulever une série de questionnements sur les modalités de légitimation
de ses résultats. Cela montre la fécondité du concept de Hacking hors de son
domaine d’application initial.
La caractérisation des sciences historiques par Cleland fut effectuée dans
le but de distinguer ces dernières des sciences expérimentales, notamment
en ce qui concerne les manières d’établir la solidité de leurs hypothèses.
Le cas d’étude de cet article est, d’un côté, une méthodologie typique
des sciences historiques. De l’autre, la surabondance de données et l’im-
portance et la complexité des outils méthodologiques employés ne corres-
pondent pas avec la description proposée par Cleland. La proximité entre
cette pratique historique et les pratiques expérimentales, notamment en ce
qui concerne la légitimation des résultats et l’évitement soigneux d’erreurs
et d’artefacts, semble indiquer une distinction plus fine entre ces types de
pratiques qu’il n’y paraît de prime abord.

Bibliographie
Altschul, Stephen F., Gish, Warren et al. [1990], Basic local alignment search
tool, Journal of Molecular Biology, 215(3), 403–410, doi : S0022-2836(05)
80360-2.

Castelle, Cindy J. & Banfield, Jillian F. [2018], Major new microbial


groups expand diversity and alter our understanding of the tree of life,
Cell, 172(6), 1181–1197, doi : 10.1016/j.cell.2018.02.016.

Cleland, Carol E. [2002], Methodological and epistemic differences between


historical science and experimental science, Philosophy of Science, 69(3),
447–451, doi : 10.1086/342455.

—— [2011], Prediction and explanation in historical natural science, The


British Journal for the Philosophy of Science, 62(3), 551–582, doi :
10.1093/bjps/axq024.

Crombie, Alistair C. [1981], Philosophical presuppositions and shifting in-


terpretations of Galileo, dans : Theory Change, Ancient Axiomatics, and
Galileo’s Methodology : Proceedings of the 1978 Pisa Conference on the
History and Philosophy of Science, édité par J. Hintikka, D. Gruender
& E. Agazzi, Dordrecht : Springer Netherlands, t. I, 271–286, doi :
10.1007/978-94-009-9045-6_19.
Situer l’analyse phylogénétique 147

Dupouy, Stéphanie [2011], L’expérimentation, dans : Philosophie des sciences


humaines, édité par Fl. Hulak & Ch. Girard, Paris : Vrin, 213–241.

Felsenstein, Joseph [1978], Cases in which parsimony or compatibility


methods will be positively misleading, Systematic Biology, 27(4), 401–410,
doi : 10.1093/sysbio/27.4.401.

Guala, Francesco [2002], The Methodology of Experimental Economics,


Cambridge : Cambridge University Press.

Hacking, Ian [1992a], The self-vindication of the laboratory sciences, dans :


Science as Practice and Culture, édité par A. Pickering, Chicago : University
of Chicago Press, 29–64.

—— [1992b], Do thought experiments have a life of their own ? Comments


on James Brown, Nancy Nersessian and David Gooding, dans : PSA :
Proceedings of the Biennial Meeting of the Philosophy of Science
Association, 302–308.

Morgan, Mary S. [2003], Experiments without material intervention : Model


experiments, virtual experiments and virtually experiments, dans : The
Philosophy of Scientific Experimentation, édité par H. Radder, Pittsburgh :
University of Pittsburgh Press, 216–235.

O’Malley, Maureen A. [2016], Histories of molecules : Reconciling the past,


Studies in History and Philosophy of Science Part A, 55, 69–83, doi : 10.
1016/j.shpsa.2015.09.002.

Ruphy, Stéphanie [2017], Scientific Pluralism Reconsidered : A New Approach


to the (Dis)unity of Science, Pittsburgh : Pittsburgh University Press.

Suárez-Díaz, Edna & Anaya-Muñoz, Victor H. [2008], History, objectivity,


and the construction of molecular phylogenies, Studies in History and
Philosophy of Science Part C, 39(4), 451–468, doi : 10.1016/j.shpsc.2008.
09.002.

Tan, Ge, Muffato, Matthieu et al. [2015], Current methods for automated
filtering of multiple sequence alignments frequently worsen single-gene
phylogenetic inference, Systematic Biology, 64(5), 778–791, doi : 10.1093/
sysbio/syv033.

Woese, Carl & Fox, George E. [1977], Phylogenetic structure of the proka-
ryotic domain : the primary kingdoms, dans : Proceedings of the National
Academy of Sciences of the United States of America, t. 74, 5088–5090.
La philosophie morale expérimentale
est-elle expérimentale ?

Yves Serra
Sciences, Normes et Démocratie,
Sorbonne Université, CNRS, UMR 8011, Paris (France)

Résumé : La philosophie morale expérimentale telle qu’elle se développe


depuis vingt ans a pour ambition d’apporter des arguments aux débats philoso-
phiques par l’utilisation de méthodes expérimentales issues de la psychologie.
L’article a pour objet premièrement de donner un aperçu de ces développe-
ments, deuxièmement d’analyser différents types de difficultés liées tant au
processus d’expérimentation en philosophie morale qu’à la dimension norma-
tive et, troisièmement, de les inscrire dans la perspective de l’expérimentation
dans les sciences de la nature.

Abstract: Experimental Moral Philosophy aims to bring arguments to


philosophical debate by developing the use of experimental methods derived
from psychology. The purpose of this article is first to give an overview of
these developments, second to analyze different types of difficulties related
to the process of experimentation in moral philosophy and to its normative
dimension, and third to note them down in the perspective of natural science
experimentation.

1 Introduction
Le programme de la Maison Interuniversitaire des Sciences de l’Homme –
Alsace a pour titre : « Épistémologie comparée de l’expérimentation dans les
sciences de la nature et dans les sciences humaines et sociales ». La philosophie
morale n’est pas une science, elle n’entre dans aucune de ces deux catégories et,
de plus, semble plus attachée à la réflexion a priori qu’à l’utilisation des retours
d’expériences. Il est donc légitime de s’interroger sur la pertinence d’une entrée

Philosophia Scientiæ, 23(2), 2019, 149–169.


150 Yves Serra

sur la philosophie morale dans le présent dossier. Plusieurs apports nous


semblent toutefois pouvoir en être attendus. Premier apport, la philosophie
expérimentale a connu un fort regain d’intérêt depuis une vingtaine d’années
et l’épistémologie de l’expérimentation a pris une place importante dans les
controverses au sein de la philosophie analytique ; ce sera un des objectifs
de cet article d’en donner un aperçu. Deuxième apport, s’il apparaît difficile
d’envisager que les réponses aux questions morales soient uniquement fondées
sur l’expérience, il apparaît également difficile d’affirmer que la connaissance
empirique1 du comportement humain sera complètement sans importance
à l’heure d’évaluer les théories morales. Nous tenterons une présentation
sommaire des arguments des promoteurs et détracteurs de l’utilisation de
l’expérimentation en philosophie morale. Enfin, notre troisième objectif sera,
dans l’esprit du présent dossier, de relire les questions d’épistémologie de
l’expérimentation à la lumière des problèmes posés par la philosophie morale
expérimentale2 . Certes ces problèmes sont particuliers, mais ils rejoignent
pour partie ceux des sciences humaines pour au moins deux raisons. La
première est méthodologique : les philosophes expérimentaux empruntent
principalement leurs outils aux psychologues. La seconde est historique : une
partie significative des philosophes expérimentaux acteurs du renouveau de
cette approche a aujourd’hui rejoint les laboratoires de psychologie, à l’exemple
de Joshua Greene, Jerôme Dokic ou Florian Cova.

2 La philosophie morale expérimentale


La philosophie expérimentale que nous évoquerons ici est un mouvement –
dit X-Phi par les anglophones – dont l’origine est habituellement située à
la fin des années 1990 et qui a connu un important développement dans les
années 20003 . Il concerne plusieurs sous-domaines de la philosophie, nous nous
concentrerons ici sur la philosophie morale.
Le philosophe moral, dans une tradition millénaire, construit des théories
morales sur ce qu’il est bien ou mal de faire ; il évalue ces théories en exerçant
son intuition morale sur des situations réelles ou fictionnelles. L’enjeu de la
philosophie expérimentale est de rompre avec cette tradition du « philosophe
en fauteuil » et d’élargir l’approche des questions morales à l’aide des outils
expérimentaux utilisés dans les sciences humaines et, en particulier, par les
psychologues.

1. Nous retiendrons ici le terme « empirique » pour des démarches qui donnent
une place importante à l’observation et à l’expérimentation. Il existe de nombreuses
variantes de l’empirisme, nous n’entrerons pas dans ce débat ici.
2. La présente contribution s’inscrit dans le cadre d’un travail de recherche en vue
d’une thèse de philosophie sous la direction d’Anouk Barberousse.
3. Pour une revue générale voir [Knobe & Nichols 2008] et, en français, le numéro
spécial de la revue Klesis [Cova 2013].
La philosophie morale expérimentale est-elle expérimentale ? 151

Pour décrire les contours de cette approche, prenons l’exemple d’un des
articles les plus connus de Joshua Knobe [Knobe 2006], un des promoteurs
du mouvement X-Phi. Cet article porte sur l’attribution d’intentionnalité
d’une action4 . Il présente le scénario d’un chef d’entreprise lançant un projet
motivé uniquement par sa rentabilité, en ayant marqué son indifférence
aux éventuelles conséquences positives ou négatives sur l’environnement. Le
projet se déroule, est très rentable et a les conséquences prévues, positives
ou négatives, sur l’environnement. L’expérience consiste à demander à des
participants si le chef d’entreprise a intentionnellement amélioré ou nui à
l’environnement. Les réponses montrent alors une nette dissymétrie : les
participants disent que le chef d’entreprise a intentionnellement causé les
dégâts et qu’il faut le blâmer quand les conséquences sont négatives, mais qu’il
n’a pas intentionnellement amélioré l’environnement et qu’il n’est pas à féliciter
quand les conséquences sont positives.
Cette dissymétrie expérimentalement constatée, qui fait dépendre l’attri-
bution d’intentionnalité du jugement moral porté sur le résultat, n’est pas
un phénomène nouveau pour les psychologues, pas plus que la méthode de
questionnaire utilisée. L’apport de Joshua Knobe à la psychologie n’est donc ni
de fond ni de méthode. Son apport à la philosophie se situe à un autre niveau :
l’auteur considère que cette dissymétrie ne peut être prise en compte par les
principales théories morales offertes par les philosophes dont, en particulier, le
conséquentialisme et le déontologisme.
En deux mots, pour le conséquentialisme, une action est morale si la
conséquence en est souhaitable ; pour le déontologisme, l’action est morale
si elle est conforme à des règles morales impératives. Ni dans un cas, ni dans
l’autre, il n’est cohérent que l’intention même de l’action soit attribuée au chef
d’entreprise en fonction du caractère positif ou négatif de notre jugement du
résultat de l’action. Les deux théories seraient donc empiriquement mises en
difficulté par l’expérience de Joshua Knobe et il faudrait écarter, ou a minima
reconsidérer, ces deux théories morales.
En suivant cet exemple, on peut dégager deux caractéristiques de la
philosophie morale expérimentale. D’abord, et trivialement, elle s’appuie sur
les méthodes et analyses développées par les psychologues pour aborder
l’étude du comportement humain. Ensuite, et surtout, la philosophie morale
expérimentale repose sur la thèse selon laquelle il serait possible de concevoir
et mener des expériences en vue de construire des arguments utiles aux débats
proprement philosophiques.
La philosophie expérimentale a donné lieu à de nombreux articles dont
l’ambition est d’apporter de nouveaux arguments empiriques aux philosophes
qui acceptent de sortir de leur fauteuil5 . Mais cette thèse a conduit à

4. Cette expérience, décrite dans [Knobe 2006], a fait également l’objet d’une
présentation vidéo : https://www.youtube.com/watch?v=sHoyMfHudaE.
5. Pour une introduction plus ample, voir le « Manifeste » dans [Knobe & Nichols
2008].
152 Yves Serra

de nombreuses controverses6 , aussi bien sur la pertinence des conclusions


psychologiques tirées, que sur la possibilité d’induire des arguments inté-
ressants sur le plan philosophique. Ainsi, dans l’exemple ci-dessus, il a été
proposé que les participants répondent bien à la question posée, l’attribution
d’intentionnalité, en cas de conséquence positive sur l’environnement mais
que, en cas de conséquence négative, les participants souhaitent punir le chef
d’entreprise et donnent donc la réponse qui va le plus sûrement conduire
à cette condamnation. Les participants déplaceraient ainsi la question de
l’intentionnalité vers celle de la culpabilité et, si c’est le cas, l’interprétation
philosophique de Joshua Knobe perd sa pertinence.
Cet exemple nous conduit à un constat et à une première question. Le
constat est que l’expérience menée par Joshua Knobe est, ou n’est pas,
jugée philosophiquement importante selon que l’on adopte telle ou telle
interprétation psychologique des réponses des participants. La question est
alors celle de la généralisation de ce constat : cette fragilité des conclusions
est-elle un cas isolé dû à la structure particulière de cette expérience ou traduit-
elle une difficulté plus profonde liée aux spécificités de la philosophie morale ?

3 La philosophie morale ne peut être


expérimentale : trois lignes
d’argumentation
Le philosophe moral s’intéresse aux comportements humains, ce qu’ils sont et
ce qu’ils devraient être. À ce titre, il semble trivial d’affirmer qu’il devrait, au
moins pour partie, être à l’écoute des sciences de l’homme, et en particulier de
la psychologie, de façon à bénéficier des approches empiriques sur lesquelles
ces sciences s’appuient. Pourtant, les philosophes ont développé de nombreux
arguments tendant à faire douter de l’intérêt de cet apport empirique à la
philosophie morale ou à en évoquer les limites. Nous proposons de regrouper ces
arguments selon trois lignes qui sont la complexité du comportement humain,
la circularité du cerveau se pensant lui-même et la normativité intrinsèque au
domaine moral.
Les arguments liés à la complexité s’appuient sur les caractéristiques qui
feraient du cerveau humain un organe à part : des centaines de milliards de
neurones, plus de dix milles synapses par neurone qui évoluent dynamiquement
et ceci pour chacun des sept milliards d’individus inscrits dans des milliers de
cultures. Le comportement humain le plus simple mettrait alors en œuvre des
réseaux de myriades d’éléments en interconnexion complexe inaccessible aux
observations.
Du fait de cette complexité, on est en droit d’être perplexe quant à
la possibilité pour une expérimentation menée à un certain instant en un
6. Voir une revue de controverses dans [O’Neill & Machery 2014].
La philosophie morale expérimentale est-elle expérimentale ? 153

certain endroit sur un certain échantillon de personnes de pouvoir être


fortement signifiante pour le comportement humain pris dans sa généralité.
L’expérimentation ne pourra alors pas, ou très peu, contribuer à instruire
les grandes questions de philosophie morale qui portent sur ce que font ou
devraient faire les humains en général.
Face aux doutes liés à la complexité, le philosophe moral expérimental
pourra développer plusieurs contre-arguments. Citons en deux. Tout d’abord,
constatons que ce doute porte sur la possibilité de toute science humaine et
sociale et non sur la seule philosophie morale. Il rejoint ainsi la famille des
doutes sceptiques qui, par leur trop grande généralité, s’autodétruisent7 .
Illustrons le second contre-argument par un exemple : le cas très médiatisé
des expériences de Libet. En 1973, ce chercheur a montré que la prise
de conscience d’un stimulus sensoriel n’avait lieu que plusieurs centaines
de millisecondes après que les neurones moteurs se soient activés. Sur le
plan psychologique, le résultat est d’importance, mais il l’est encore plus
sur le plan philosophique : l’expérience a été analysée comme pouvant
conduire potentiellement à la remise en question du libre arbitre. Cet
exemple illustre le principal contre-argument opposé par les philosophes
expérimentaux à l’attentisme que semble induire l’argument de la complexité :
plutôt que d’attendre que des résultats comme ceux de Libet ne fassent
irruption sur le terrain philosophique de façon impromptue, autant participer
dès aujourd’hui à ces études en proposant et en menant des expériences
utiles aux débats philosophiques8 .
Les arguments liés à la circularité s’appuient sur les paradoxes de
l’autoréférence : comment le cerveau pourrait-il se penser lui-même ? Cet
argument a des racines vénérables dès les origines de la philosophie : dans
le mythe de la caverne de Platon, les hommes enchaînés ne perçoivent du
monde que ce que la lumière venant du dehors projette au fond de la caverne
et il faudrait qu’ils puissent se libérer de leurs chaînes pour pouvoir se rendre
compte de l’étroitesse de leur point de vue. De la même façon, la connaissance
que nous pouvons atteindre grâce à notre cerveau sur le monde en général et
notre cerveau en particulier est limitée par ce que peut connaître ce cerveau.
On peut résumer d’une formule cette limitation : si le cerveau a le défaut de
ne pas voir ses défauts, alors il ne peut voir le défaut de ne pas les voir.
L’argument de la circularité peut être décliné en deux variantes. Une
variante sceptique, illustrée par H. Putnam avec l’image du « cerveau dans
la cuve » [Putnam 1981] et popularisée par le cinéma avec le film Matrix :
imaginons un cerveau dans une cuve dont toutes les relations au monde
extérieur seraient remplacées par des connexions à une machine. Il vivrait alors

7. Dans [Williamson 2007], Thimothy Williamson suggère que le philosophe


s’attarde sur les arguments spécifiques et ne perde pas de temps et d’énergie à
combattre des arguments sceptiques qui mettent en doute trop largement toute
possibilité de connaissance.
8. Je reprends ici pour partie l’argumentation de [Cova, Dutant et al. 2012].
154 Yves Serra

dans un monde virtuel créé par cette machine et serait incapable d’accéder au
monde réel. L’argument est logiquement imparable mais, comme pour celui de
la complexité, il est très affaibli par son caractère extrême.
Une seconde variante est issue du naturalisme9 : tous les systèmes naturels
que nous observons autour de nous sont finis et ont des capacités limitées.
Le cerveau est un système naturel limité (poids, taille, énergie,...) issu de
l’évolution ; il est donc fortement probable qu’il soit également limité dans
ses capacités10 . Si ces limites existent, ce que le naturaliste semble devoir
accepter, nous ne les connaissons pas en totalité11 et peut-être ne pouvons-
nous pas les connaître. C’est cette possibilité d’objets qui nous seraient
inaccessibles que le philosophe se doit de soulever, comme le propose Timothy
Williamson12 . Lorsque la philosophie propose des dilemmes qui semblent
échapper à notre entendement, c’est peut-être l’indice qu’elle se rapproche de
ces zones d’ignorance13 . Cette variante naturaliste de l’argument de circularité,
moins extrême que la variante sceptique, offre l’opportunité d’imaginer des
approches empiriques, observations ou expérimentations, de ce qui pourrait
être inaccessible aux capacités humaines.
Soulignons à nouveau que ces deux premières lignes d’argumentation, la
complexité et la circularité, concernent potentiellement toute activité humaine
visant à connaître le comportement humain. Elles ne sont propres ni à la
philosophie morale expérimentale ni aux SHS et vont, si on les poursuit,
conduire à douter aussi bien de la philosophie morale en fauteuil que de toute
réflexion sur l’humain, a priori et a posteriori.
La troisième ligne d’argumentation repose sur la normativité et nous
semble plus importante car plus spécifique à la philosophie morale expéri-
mentale. Commençons par constater que la définition de la normativité, des
normes et des valeurs qui la sous-tendent, n’est pas tâche facile et qu’elle ne
pourra être qu’esquissée ici. Nous nous contenterons d’une définition naïve : la
morale est l’ensemble des règles générales sur le bien et le mal qui aident
chacun à instruire des jugements dans les cas particuliers auxquels il est
exposé. Cette définition minimale suffit à faire apparaître deux difficultés
pour qui souhaiterait s’appuyer sur l’observation ou l’expérimentation pour
établir ces règles morales. La première est d’ordre logique, et on la dénomme

9. Le naturalisme consiste en deux thèses : d’une part, la nature est tout ce qui
existe et d’autre part, les sciences naturelles nous offrent le meilleur accès possible à
la connaissance de cette nature [Andler 2016].
10. Voir la formulation que donne Noam Chomsky de cette limitation dans
[Chomsky 2016].
11. Les travaux sur les biais des raisonnements humains en donnent une première
approche [Kahneman, Slovic et al. 1982].
12. Dans [Williamson 2007, 17], l’auteur évoque les elusive objects qui seraient
inaccessibles à notre perception comme à notre entendement.
13. Il est significatif à ce propos qu’on ait pu proposer de définir la philosophie
analytique comme l’étude de ces paradoxes [Franceschi 2005].
La philosophie morale expérimentale est-elle expérimentale ? 155

habituellement le problème de Hume14 : « De ce qui est on ne peut déduire ce


qui doit être. » L’observation répétée de l’homicide ne nous dit rien des règles
morales qui l’interdisent.
La seconde difficulté est d’ordre pragmatique : expérimenter, c’est déjà
faire. Les sciences physiques nous ont habitués à percevoir la recherche de
connaissance comme sans effet sur la chose à connaître, le pendule oscille de
la même façon que je l’observe ou non, et même si la physique quantique vient
aujourd’hui mettre cette hypothèse en doute, il n’en reste pas moins que nous
faisons souvent comme si observer un phénomène ne l’altérait pas. Or cette
illusion de neutralité de l’observateur est la source de difficultés pour l’étude
des règles morales. Mener une recherche en psychologie morale est déjà une
action et change le monde qu’on aimerait simplement observer.
Les deux difficultés, logique et pragmatique, se combinent pour faire de la
question normative un tout difficile à aborder. Il semble que nous ayons d’un
côté un monde abstrait fait de règles et de valeurs et d’un autre côté, le monde
concret dans lequel l’acteur moral agit sans qu’il puisse déduire simplement ce
qu’est le bien concret à partir des règles et valeurs qui l’animent. Construire des
ponts au-dessus de ce fossé entre l’idéal des normes et des valeurs, et le monde
actuel des actions et justifications, est l’ambition à relever pour répondre
à la question normative.
Revenons à la notion de norme pour tenter d’affiner les rapports possibles
à l’expérimentation. L’usage de la norme dans le discours moral peut être
descriptif, évaluatif, prescriptif ou impératif. La norme est simplement descrip-
tive quand elle exprime des habitudes, par exemple vestimentaires, largement
répandues ou, au contraire, minoritaires au sein d’une population. Elle devient
évaluative quand, sur la base de certains de ces détails vestimentaires, on
infère des conclusions sur la personnalité de celui ou de celle qui les porte.
La norme est prescriptive quand elle conseille ou déconseille tel détail vesti-
mentaire dans telle circonstance et peut devenir impérative quand elle l’interdit
ou le rend obligatoire. Tout objet de jugement peut ainsi être normal au sens
descriptif d’un phénomène courant, et néanmoins simultanément contraire
aux normes morales, que celles-ci soient comprises comme impératives ou
simplement prescriptives15 .
La science expérimentale peut avoir la tentation de se libérer du problème
de la normativité en se limitant à la connotation descriptive de la norme. Une
telle science « a-normative » permettrait de décrire le monde sans aborder
les aspects évaluatifs. Mais ce choix, bien qu’attrayant par la simplification
qu’il apporte et les succès qui lui sont liés dans les sciences physiques,
est voué à l’échec pour les sciences humaines pour au moins trois types
de raisons. Premièrement, on voit mal comment le comportement humain

14. Pour une remise en perspective de cet argument avec la philosophie de Hume
voir [Nurock 2011].
15. On peut penser à nouveau à l’homicide, événement très courant, mais exclu par
les règles morales.
156 Yves Serra

pourrait être décrit en faisant totalement abstraction des évaluations portées


en permanence par ces humains sur les situations qu’ils vivent. Deuxièmement,
la science est également une activité humaine et, à ce titre, comporte
nécessairement des évaluations de ses propres critères de pertinence. Et enfin,
troisièmement, lancer une étude scientifique sur un sujet donné, c’est déjà
choisir un sujet et en écarter d’autres, ce qui est un choix reflétant, de fait,
évaluations et préférences.
Est-ce à dire que, confrontés aux trois lignes d’argumentation que sont la
complexité, la circularité et la normativité, il nous faille renoncer totalement
aux méthodes des sciences naturelles pour aborder la philosophie morale ?
Certes, le comportement humain est complexe à étudier, mais les connaissances
acquises par les sciences cognitives montrent qu’un chemin, partiel et progres-
sif, est possible en utilisant les meilleures approches dont nous disposons16 .
L’argument de la circularité induit également un doute fort quant à notre
capacité à nous penser nous-mêmes, ce qui nous intime d’être conscients des
risques de biais liés à ces limites et de redoubler de rigueur. Enfin, la difficulté
de passer de ce qui est à ce qui doit être, et la complexité liée au réseau intime
qui lie ontologie, épistémologie et axiologie, nous interdit l’option facile, mais
sans issue, d’une démarche « a-normative ». Prendre au sérieux ce défi de
l’intégration des trois axes de la réflexion philosophique, suppose, a minima,
que le philosophe expérimental et le psychologue, au sein d’une organisation
qui à l’idéal les insère démocratiquement dans la société, débattent en amont
du choix des recherches à mener ainsi que des règles éthiques à appliquer dans
leurs objectifs comme dans leurs moyens, communiquent de façon responsable
sur les développements de leurs travaux, et poursuivent, à l’aval de ces études,
l’analyse des impacts de leurs résultats.
En supposant des dispositions prises en ce sens, nous pourrons mettre très
provisoirement les aspects normatifs au second plan et lancer des recherches
empiriques. Nous devrons alors aborder la difficile question de l’observation et
de l’expérimentation au service de la philosophie morale, ce que nous allons
simplement illustrer ici à l’aide du célèbre scénario du tramway fou.

4 Un exemple de série d’expériences :


le tramway fou
Le philosophe moral, avons-nous dit, construit des théories morales qu’il évalue
en exerçant son intuition morale sur des situations réelles ou fictionnelles. Les
situations les plus appréciées, les dilemmes moraux, sont celles où plusieurs
règles morales se contrecarrent, obligeant le philosophe à approfondir à la fois
sa théorie et ses intuitions.
16. Sur cette dimension du naturalisme, voir [Andler 2016] et [Collins, Andler et al.
2018].
La philosophie morale expérimentale est-elle expérimentale ? 157

Prenons l’exemple très classique du dilemme imaginé par Philippa Foot en


1967 afin de comparer les théories morales conséquentialistes et déontologistes
que nous avons déjà rencontrées. Le scénario est le suivant :
Un tramway fou sans chauffeur dévale une pente et va, si rien ne
l’arrête, écraser cinq personnes qui travaillent sur les rails. Vous
êtes témoin de la scène et vous êtes à proximité d’un aiguillage
qui vous permet d’envoyer le tramway vers une voie de garage.
Malheureusement, une personne est sur cette voie de garage et
sera écrasée si vous basculez cet aiguillage. Que faites-vous ?
(Description adaptée de [Foot 1978])
Le conséquentialiste agira sur l’aiguillage, sauvant ainsi cinq vies au prix d’une.
Mais le déontologiste, appliquant la règle impérative « tu ne tueras point »,
pourrait refuser d’être ainsi à l’origine de la mort d’un innocent.
En 1976, Judith Jarvis Thomson [Thomson 1976] a proposé une variante
de ce dilemme. Le tramway dévale toujours la pente au péril de la vie de cinq
personnes, mais là, plus d’aiguillage ; en revanche, vous êtes sur un pont avec,
à votre côté, un gros homme. Si vous le poussez sur la voie, l’obstacle qu’il
constitue arrêtera le tramway, mais le gros homme périra sous le choc.
Le bilan est le même que précédemment, cinq vies sauvées au prix d’une,
et le conséquentialiste devrait maintenir sa position et pousser le gros homme.
Pour le déontologiste, deux règles impératives sont maintenant violées, la
première « tu ne tueras point » comme dans le cas précédent, et une seconde,
« tu verras toujours en autrui une fin et jamais un moyen ».
Le dilemme ainsi enrichi permet à chacun d’exercer son intuition morale
et de vérifier si cette intuition est en accord ou non avec la théorie morale
qu’il privilégie. À ce stade, nous pouvons considérer ce travail comme
caractéristique de la philosophie « en fauteuil » telle que nous l’avons évoquée
plus haut. La première étape que franchit le philosophe expérimental en
rupture avec cette méthode est de remplacer l’intuition du philosophe par
un sondage sur un échantillon de personnes. Ce changement peut paraître
mineur17 ; il ne s’agit que de poser à plusieurs personnes la question que
le philosophe s’administrait à lui-même. Mais, à l’examen, il constitue un
premier pas important : il transforme l’affirmation du philosophe « je pense
que x » en une affirmation vérifiable par un tiers « n % des humains
pense que x18 ». Rendre ainsi l’observation vérifiable par un tiers est
un préalable à l’approche scientifique.
Dans le cas du tramway fou, le résultat du sondage est le suivant : 80 % des
personnes disent agir sur l’aiguillage, alors que seulement 30 % des personnes
disent pousser le gros homme. Ces expériences ont été reproduites : les résultats
17. Voir par exemple [Baertschi 2017, 95].
18. Pour l’analyse de la validité de l’observation à la première personne, voir
[Piccinini 2009] et l’article de MM. Ludwig & Michel dans le présent recueil, p. 111–
130.
158 Yves Serra

ont pu varier dans le détail, mais sans remise en cause du résultat principal.
Une large majorité des personnes interrogées agit sur l’aiguillage et une petite
minorité passe à l’action quand il s’agit de pousser le gros homme. Le protocole
d’enquête peut être enrichi en demandant aux participants la raison de leur
choix. Pour le cas de l’aiguillage, les raisons exprimées confirment le poids de
l’argument conséquentialiste : il est pertinent de sauver cinq personnes au prix
d’une. En revanche, pour le second cas, les participants ne mentionnent plus le
bilan des conséquences, mais évoquent les émotions négatives que génère chez
eux l’idée de pousser un homme vers une mort certaine.
Avec ce recours au sondage, l’interprétation des résultats se complexifie
par l’irruption des émotions dans l’opposition entre conséquentialisme et
déontologisme. On peut par exemple penser que l’idée de pousser le gros
homme suscite des émotions qui activent des réactions morales profondément
déontologiques. On peut aussi penser, inversement, qu’enfreindre une règle
morale est une source d’émotions qui inhibent l’action, et on peut également
envisager que les réactions émotionnelles et morales ne soient pas causalement
liées, mais combinent leurs effets. Les possibilités sont nombreuses et on voit
ici un apport de l’approche expérimentale : l’irruption des émotions comme
élément important pour les participants oblige le philosophe moral à expliciter
comment elles sont prises en compte dans sa théorie morale. À la différence de
l’expérience de pensée définie par le philosophe et menée sur lui-même à l’aide
de ses propres intuitions, la confrontation à l’expression des participants élargit
le débat ; à charge pour le philosophe d’en tirer profit pour l’approfondir.
Sur cette base expérimentale, le philosophe peut maintenant utiliser le
paradigme du tramway fou pour explorer l’influence de nombreux paramètres.
Il sera impossible de décrire ici toutes ces variantes tant la littérature de
« tramwaylogie » est abondante ; nous en avons extrait deux exemples de
nature à montrer comment les philosophes expérimentaux ont progressivement
utilisé les instruments des psychologues.
Le premier exemple porte sur la comparaison entre un échantillon constitué
de personnes ayant des troubles autistiques et un groupe de contrôle. Les
résultats montrent qu’il n’y a pas de différence entre les deux groupes dans
le cas « aiguillage », mais une différence importante dans le cas « gros
homme » : les autistes le poussent plus souvent. Les auteurs ont fait le lien
avec le déficit émotionnel caractéristique des autistes qui favoriserait la règle
conséquentialiste.
En 2001, le développement de l’IRMf a permis que soit menée une nouvelle
variante de l’expérience analysant les réponses neuronales des participants
lorsqu’on leur soumet les deux scénarios [Greene, Sommerville et al. 2001]. Les
auteurs concluent à l’activation des corrélats neuronaux des émotions dans le
cas « gros homme » et pas dans le cas « aiguillage », confortant ainsi le résultat
des expériences précédentes sur le rôle des émotions.
Les méthodes mises en œuvre dans ces expériences répondent à plusieurs
critères reconnus comme étant de bonne pratique expérimentale dans les
La philosophie morale expérimentale est-elle expérimentale ? 159

sciences de la nature : réplication, méthode des différences, cohérence et


triangulation de l’opérationnalisation19 des concepts. Les expériences ont été
répliquées et ont porté sur des groupes différents dont les réponses ont été
interprétées par plusieurs équipes indépendantes. La méthode des différences
comparant deux sous-populations se distinguant par un seul paramètre, ici
l’autisme, est la marque même de la démarche expérimentale telle qu’elle est
définie par Claude Bernard. Les émotions, par nature difficiles à observer, sont
opérationnalisées de plusieurs façons, par une déclaration de l’intéressé, par la
méthode des différences et par leurs corrélats neuronaux détectés par IRMf, ce
qui permet une triangulation où chaque observation conforte les conclusions
depuis un autre point de vue.
Pourtant, de nombreux philosophes ont critiqué cette démarche expéri-
mentale comme n’apportant pas d’arguments intéressants aux débats sur les
théories morales. Première critique, les scénarios présentés seraient beaucoup
trop éloignés de la réalité quotidienne qui fait le contexte moral quotidien
des acteurs20 . À l’évidence, il est impossible de mener l’expérience avec
un vrai tramway, de vraies victimes, un vrai décideur, ni même d’imaginer
des situations réelles pouvant s’approcher de ces situations extrêmes et peu
vraisemblables. Cette critique ne concerne pas seulement la philosophie morale
expérimentale, mais s’étend à toute la philosophie morale qui utilise des
expériences de pensée extrêmes faites pour donner à voir les différences entre
théories morales sans poids donné à la crédibilité de la situation. Se pose alors
la question de la pertinence de ces cas extrêmes : il serait envisageable que
les théories morales ne se différencient que dans des cas limites mais qu’elles
conduisent en pratique au même comportement dans les cas courants. L’intérêt
des débats entre philosophes moraux s’en trouverait alors fortement relativisé.
Deuxième critique, générique : cette méthode expérimentale s’appuie sur
la participation à des expériences en laboratoire et a de ce fait de nombreuses
limites. Tout d’abord, le fait qu’il ne s’agisse que de déclaration et non de
comportement réel. Or celui-ci suppose le passage à l’acte ce qui est bien
différent d’une déclaration d’intention. Ensuite, la sélection des participants,
souvent des étudiants en psychologie, est peu représentative. Enfin, toutes ces
expériences se concluent par des pourcentages significatifs de cas non expliqués
par les théories (pourquoi 80 % poussent-ils l’aiguillage et 20 % non ?) sans
que soient analysés ces cas : incompréhension du scénario ? Volonté de fausser
l’expérience ? Valeurs morales différentes ?
Enfin, si les expériences du type de celle du tramway fou semblent bien
répondre à certains critères utilisés dans les sciences de la nature, il est d’autres
critères qui, au contraire, semblent inatteignables. Sauf à ne retenir qu’un sens
très lâche de ce terme, il n’y a pas ici de mesure à proprement parler. Ce qui est

19. L’opérationnalisation est la relation entre un trait psychologique non directe-


ment observable, les psychologues disent latent, et un phénomène observable supposé
permettre de donner accès à ce trait.
20. Pour le détail de ces critiques, voir [Kahane 2015].
160 Yves Serra

obtenu est simplement un recueil de résultats assez informels qui ne construit


pas un espace mathématisé des mesures possibles [Stevens 1946]. Ce constat
n’est bien sûr pas propre à l’expérimentation en philosophie morale, mais est
ici frappant : comment simplement décrire quelle pourrait être la grandeur
mesurée dans le cadre d’une expérience du « tramway fou » ? Il semble que le
fossé explicatif entre ces expériences et les théories morales soit beaucoup trop
profond pour qu’il puisse être franchi.
Deux difficultés symétriques illustrent ce fossé : le dispositif expérimental
opérationnalise-t-il bien les relations théoriques visées ? Et, inversement, les
résultats de l’expérience sont-ils clairement exploitables dans les termes des
théories en jeu ? Les méthodes utilisées reprennent celles de la psychologie
expérimentale, l’approche du philosophe expérimental n’a donc aucune raison
particulière d’être ni plus ni moins immunisée que celle-ci envers tous les biais
potentiels que les participants, l’expérimentateur, le statisticien, le psychologue
et le philosophe peuvent introduire21 . Toutes ces difficultés se concrétisent dans
les controverses portant, comme nous l’avons vu plus haut dans l’exemple
de l’effet Knobe, sur la signification exacte des résultats, sur les processus
psychologiques en jeu dans chaque cas22 et, finalement, sur la possibilité d’en
tirer des conclusions utiles aux débats philosophiques.
Pour illustrer cette difficulté à interpréter les résultats expérimentaux,
appuyons-nous de nouveau sur une variante du tramway fou. Dans un article
de 2015, deux chercheurs grenoblois ont soumis au dilemme du tramway des
participants recrutés dans des bars et ayant des taux d’alcoolémie variables
[Duke & Bègue 2015]. L’alcool est connu pour diminuer la rationalité et
augmenter les réactions émotives. En suivant les analyses précédentes qui
semblent lier le refus de pousser le gros homme aux émotions, on devrait
s’attendre à ce que les personnes sous l’emprise de l’alcool tendent vers ce refus.
Or les relevés vont significativement dans l’autre sens : ces personnes alcoolisées
tendent plus souvent que le groupe de contrôle à pousser le gros homme.
Qu’en conclure ? Que l’alcool pousse à un raisonnement conséquentialiste ?
Ou plutôt que le modèle simpliste opposant conséquentialisme et rationalité
d’un côté à déontologisme et émotions de l’autre est inopérant ? Ou qu’il existe
de nombreuses émotions dont les rôles et les inhibitions peuvent varier ?
Sans entrer dans le détail des arguments en faveur de chacune des inter-
prétations possibles, on peut souligner qu’aucune des variantes précédentes
du tramway fou de 1967 à 2015 n’a mentionné le taux d’alcoolémie des
participants. Faut-il en conclure que cette dernière variante compromet les
interprétations ayant négligé cet aspect et que la complexité du comportement
moral humain ne permet pas ce type de simplification ? La jeune histoire
de la philosophie expérimentale est déjà riche de plusieurs exemples de ce

21. La crise de la réplicabilité des expériences en psychologie a porté une lumière


crue sur l’ensemble de ces biais [Collaboration Open Science 2015].
22. Pour des exemples de controverses, voir [O’Neill & Machery 2014].
La philosophie morale expérimentale est-elle expérimentale ? 161

type où une expérience complémentaire remet profondément en cause les


interprétations précédemment proposées.
L’épistémologie des sciences naturelles a une longue tradition d’analyse du
double tranchant de l’apport expérimental, d’un côté améliorer nos théories,
mais d’un autre côté, parfois, en saper les fondements. Ce sera l’objet de la
prochaine section de tenter un parallèle entre l’expérimentation en sciences
naturelles et en philosophie morale expérimentale.

5 Les rôles de l’expérimentation en sciences


de la nature et perspectives pour
la philosophie expérimentale
L’épistémologie de l’expérimentation dans les sciences de la nature a fait l’objet
de développements récents importants avec par exemple les travaux de Ian
Hacking, Peter Galison, Bas Van Fraassen et Allan Franklin23 . Nous pouvons
esquisser sur cette base les multiples rôles que l’expérimentation joue dans
le complexe scientifique fait, pour reprendre la formule de Hacking, d’idées,
d’objets et de traces24 . Nous avons retenu dix axes : les deux premiers sont,
sans surprise, de conforter ou d’infirmer une théorie, les deux suivants affinent
l’apport de l’expérimentation à la théorie. Les trois axes suivants marquent
l’autonomie du domaine expérimental en regard de la théorie et, enfin, les
trois derniers sont centrés sur la contribution méthodologique particulière
de l’expérimentation au sein de la démarche scientifique. La question du
rôle de l’expérimentation dans les sciences ne sera certainement pas épuisée
avec ces dix axes et les formulations que nous en retenons ne sont que trop
grossières en regard des sources citées plus haut. Ces dix axes ne constituent
donc qu’une esquisse utile pour une première approche du point de vue de
l’épistémologie des sciences naturelles, puis du point de vue de la philosophie
morale expérimentale, telle qu’abordée ci-dessus.

5.1 L’expérimentation en appui du développement


des théories
Conforter une théorie. Le premier rôle que l’on peut attendre d’une
expérience est de conforter une théorie. Exemple classique, la relativité
qui prévoyait la déviation de la lumière passant près d’une masse impor-
tante a été confortée par la mesure de la déviation de la lumière des
étoiles proches du disque solaire à l’occasion d’une éclipse en 1919. Une
23. La liste qui suit est en particulier appuyée sur les références suivantes : [Hacking
1983], [Galison 1987], [Van Fraassen 2010], [Franklin & Perovic 2016], [Franklin 1981].
24. Voir [Hacking 1992].
162 Yves Serra

limitation forte de ce rôle a été soulignée par Duhem, puis Quine : les
expériences sous-déterminent les théories. Il est toujours possible de trou-
ver plusieurs théories différentes qui satisfont aux observations disponibles.
Cette difficulté conduit, pour néanmoins choisir entre théories empiriquement
équivalentes, à développer les approches favorisant la théorie la plus simple
(principe du rasoir d’Ockham) ou la plus explicative (principe d’inférence à la
meilleure explication).

Réfuter une théorie. Karl Popper a proposé de définir le rôle de


l’expérience dans la démarche scientifique comme, essentiellement, d’offrir la
possibilité de réfuter une théorie. S’il n’est pas possible qu’une expérience
valide définitivement une théorie, il semble qu’elle puisse en revanche l’invalider
définitivement si l’observation contredit les prévisions théoriques. Comme pour
la validation des théories, la portée de la réfutation a été l’objet de discussions :
une expérience ne peut à elle seule réfuter une théorie car, d’une part, les
scientifiques n’abandonnent pas aisément une théorie qui fonctionne bien dans
un grand nombre de cas et, d’autre part, il est souvent possible de trouver
des modifications mineures de la théorie qui prennent en compte les résultats
d’une expérience discordante. Ce constat, ainsi que celui de la multiplicité
des approches scientifiques [Andler 2013], conduit aujourd’hui à relativiser
la réfutation en tant que critère prépondérant de scientificité. En revanche,
et en prolongement des travaux de Karl Popper, une théorie qui serait par
construction non réfutable ne pourrait que très difficilement être qualifiée de
scientifique.

Confirmer ou infirmer l’existence d’une entité théorique. Les


deux axes précédents envisagent les théories comme des touts qui sont soit
confirmés, soit réfutés grâce à l’approche expérimentale. Ce troisième axe,
plus modeste, vise à tenter de confirmer, ou d’infirmer, l’existence d’une entité
non directement observable stipulée par la théorie. Par exemple, les électrons
ne sont pas directement observables, mais la physique en a proposé l’existence.
Des phénomènes liés à ces entités peuvent être décrits par la théorie et
l’expérimentateur se donnera pour objectif de les observer, de façon à confirmer
ainsi indirectement l’existence des entités prédites. Au-delà de ce premier
niveau, Ian Hacking a défendu la thèse que c’est en manipulant ces entités, en
mettant au point des instruments permettant de créer ces phénomènes, que
les scientifiques acquièrent intimement la certitude opérationnelle25 de leur
existence [Hacking 1983].

Préciser la forme (souvent mathématique) d’une relation. La


théorie peut proposer une relation entre plusieurs entités, mais laisser à
25. C’est cette certitude opérationnelle qui, indépendamment de toute option
métaphysique, leur permet, individuellement et en groupe, de manipuler ces nouveaux
objets comme ils le feraient d’objets du quotidien immédiatement accessibles à la
perception et à l’action.
La philosophie morale expérimentale est-elle expérimentale ? 163

l’expérimentateur la tâche d’en trouver la forme exacte. Ainsi, par exemple, le


psychologue peut proposer que la perception de l’intensité sonore soit fonction
de l’énergie acoustique de l’onde sonore, mais la forme exponentielle de cette
relation, qui conduit à mesurer le niveau sonore par un logarithme, est le
résultat des expériences de psychométrie.
Et la philosophie morale expérimentale ?
Les quatre axes ci-dessus s’appuient sur une démarche en trois temps :
une théorie est présupposée, sa force est suffisante pour que puissent en être
déduits des phénomènes observables, l’expérimentation consiste à mettre en
œuvre des contextes proches des conditions de ces prédictions et de vérifier
si les phénomènes prévus adviennent. Chacun de ces trois temps donne lieu à
des questions particulières que doit affronter le philosophe moral expérimental.
Les théories morales sont-elles assez fortes pour être prédictives ? Assez
précises pour que des contextes opérationnels puissent être élaborés ? Elles sont
certainement plus statistiques que déterministes, mais alors comment fixer les
seuils significatifs pour leur validation ?
Les philosophes moraux qui se préoccupent de la vie bonne, des critères du
bien ou du juste, ou d’autres sujets de ce haut niveau d’abstraction proposent
des théories dont une vérification ou une réfutation globale ne serait guère
envisageable. À l’extrême, certaines théories morales comme le situationnisme
par exemple sont, par leur formulation même, hors d’atteinte de toute approche
empirique. En revanche, l’objectif plus modeste de conforter ou d’infirmer
l’existence d’une entité théorique ou la forme d’une relation est l’objectif même
des approches que nous avons vues avec l’effet Knobe ou avec le tramway fou
et le rôle de l’émotion, entité théorique à explorer. Faire la part, provisoire et
révisable, des dissensus moraux qui relèvent ou non d’une possible approche
empirique est une tâche difficile qui reste à entreprendre.

5.2 Le développement autonome du domaine


expérimental
Les quatre premiers axes que nous avons évoqués ci-dessus, confirmation et
infirmation d’une théorie, confirmation d’une entité et précision de la forme
d’une relation, semblent donner à l’expérience un rôle auxiliaire de la recherche
théorique. Hacking a souligné que pour les sciences naturelles, il n’en est rien :
l’activité expérimentale est, pour une part importante, autonome. Précisons
les trois axes liés à cette autonomie.

Développer un savoir-faire opérationnel. Pour que l’observation ou


l’expérimentation puissent avoir lieu, il est nécessaire de construire des savoir-
faire opérationnels, techniques, matériels, et organisationnels qui évoluent
de façon à pouvoir créer (ou observer) les phénomènes, à pouvoir agir
sur (ou prendre en compte) les paramètres qui peuvent influer sur ces
164 Yves Serra

phénomènes, à améliorer en permanence (précision, spécificité, justesse...) les


instruments de détection, de mesure et d’intervention... Un rôle important de
l’expérimentation est de donner l’occasion du développement de ces savoir-
faire opérationnels qui portent en germe les résultats du futur. Le double sens
du mot expérience, à la fois ce qu’on fait pour la première fois et compétence
acquise par ce qu’on a déjà fait, trouve ici sa pleine expression.

Explorer des domaines de paramètres non couverts par les


théories et expériences existantes. Un deuxième élément de l’au-
tonomie de l’expérimentation est sa capacité à rechercher systématiquement
des phénomènes dans toutes les zones de valeur des paramètres accessibles
à l’intervention et à l’instrumentation. Ainsi, par exemple, la physique des
particules s’est développée en construisant des appareils de plus en plus
importants de façon à explorer des énergies hors des domaines déjà théorisés.

Favoriser la sérendipité. Enfin, lorsque l’expérimentateur sort des


sentiers battus et tend son attention vers ce que de nouvelles approches ou
de nouveaux instruments vont produire d’inconnu, il arrive qu’il découvre
des phénomènes hors de son objectif initial de recherche. C’est ainsi que
la radiographie par rayons X ou le four à micro-ondes ont été découverts,
par hasard dira-t-on trop rapidement, car ce type d’évènement ne peut
advenir qu’après un long travail de préparation construisant le contexte de
la découverte.
Et la philosophie morale expérimentale ?
Nos différents exemples ont illustré que pour ses méthodes et principes
expérimentaux, la philosophie expérimentale repose en pratique sur la psycho-
logie expérimentale. Dans une première analyse, la philosophie expérimentale
n’aurait ainsi aucun apport au développement autonome de l’expérimentation,
qui serait uniquement du ressort de la psychologie. Cela ferait de la philosophie
expérimentale un parasite de la psychologie expérimentale. On peut a contrario
avancer que, d’une part, les questions posées par la philosophie morale étendent
le domaine de la psychologie et, à ce titre, contribuent à son développement
y compris sous l’angle expérimental26 , et, d’autre part, que l’interprétation
philosophique des expériences psychologiques peut permettre des éclairages
différents révélateurs des objectifs des recherches27 .

26. L’exemple de l’expérience de Libet montre comment des questions philoso-


phiques comme celle du libre arbitre sous-tendent de nombreuses expériences de
psychologie.
27. Yves Gingras a ainsi souligné les objectifs religieux de certaines études dans
[Gingras 2016].
La philosophie morale expérimentale est-elle expérimentale ? 165

5.3 La spécificité de l’apport de l’expérimentation


Outre les rôles d’auxiliaire de la théorie et d’acquisition de savoir-faire
opérationnels, l’expérimentation a également un rôle systémique de remise
en doute permanente de son propre protocole. En rupture avec l’optimisme
indispensable au théoricien qui échafaude des hypothèses, l’expérimentateur
a pour objectif d’être plus pessimiste que le plus pessimiste de ses opposants
jusqu’à considérer, comme le propose Peter Galison qu’une expérience ne soit
finie que lorsque toutes les objections imaginables, toutes les interprétations
alternatives, ont été empiriquement écartées [Galison 1987]. Les trois derniers
axes vont dans ce sens.

Détecter et diminuer les sources d’erreur. Une partie importante


du travail de l’expérimentateur est de détecter les multiples sources des erreurs
qui peuvent mettre en cause les résultats de l’expérimentation, que ce soit
par l’irruption de paramètres non souhaités (impuretés, imprécision, influences
externes...), par les erreurs de manipulation, ou par des dysfonctionnements
des instruments de détection et de mesure.

Définir toutes les interprétations possibles et imaginer des


variantes. La thèse Duhem-Quine de la sous-détermination des théories
par les expériences a pour contrepartie opérationnelle que le travail de l’expé-
rimentateur doit comprendre d’envisager toutes les interprétations alternatives
possibles en regard des résultats et d’imaginer les variantes du dispositif
expérimental permettant, au mieux, de donner les arguments empiriques
permettant de les évaluer.

Contribuer aux itérations épistémiques. Pour répondre au dilemme


de la coordination28 entre ce que l’on souhaite mesurer et le dispositif
expérimental qui permet d’obtenir cette mesure, Hasok Chang propose ce qu’il
dénomme l’« itération épistémique ». Cette proposition consiste à accepter que
nous ne disposons pas de fondements absolus, de vérités premières, mais que
nous partons de l’état épistémique existant que nous tentons d’améliorer par
un processus itératif portant sur nos théories, expériences et mesures. Hasok
Chang a suggéré en 2015 que ce processus pourrait également être pertinent
dans le domaine de la psychologie de la perception [Barwich & Chang 2015]. Le
rôle de l’expérimentation est de contribuer à ces itérations épistémiques dans
une interaction avec la théorie du phénomène étudié, ainsi qu’avec toutes les
théories opérationnellement embarquées dans le dispositif expérimental et, en
particulier, dans chacun des instruments utilisés pour la détection et la mesure
des phénomènes.
28. Comment savoir si une mesure est valide si on ne la compare pas à une
mesure déjà faite ? Mais alors, comment cette précédente mesure a-t-elle elle-même
été validée ? [Van Fraassen 2010, 115].
166 Yves Serra

Et la philosophie morale expérimentale ?


Les itérations épistémiques, et le rôle important de l’expérimentation dans
ces itérations, donnent de la science une double image, d’une part celle d’une
démarche itérative sans fin et, d’autre part, celle d’un ensemble formé de
théories, d’objets et de traces des expériences passées, constitutif de la science à
un instant donné. Cet état de la science réalisé à un moment donné est souvent
évoqué avec l’expression « nos meilleures théories scientifiques », mais, en
suivant les propositions de ce qui précède, il serait préférable de compléter par
« nos meilleures théories scientifiques appuyées sur notre meilleur savoir-faire
expérimental et les résultats de nos plus belles expériences ». Les itérations
permettent à chaque discipline scientifique de construire un consensus, au
moins partiel, sur l’état des connaissances ainsi que sur les difficultés soulevées
par cet état qui définissent le périmètre des recherches à poursuivre.
La philosophie n’a évidemment pas la même structure : aucun sujet
n’y fait l’objet de consensus, que ce soit sur l’état de l’art ou même
sur l’inventaire des problèmes ou difficultés. Une question qui peut alors
caractériser l’épistémologie de l’expérimentation en philosophie serait la
suivante : n’est-elle qu’une façon de présenter des arguments dans le débat
philosophique en complément des outils conceptuels habituels du philosophe ?
Ou, comme pour les sciences de la nature au xviie siècle, est-elle le point
de départ d’une nouvelle démarche itérative qui changera la nature de la
connaissance philosophique ? On peut reformuler cette alternative dans le cas
de la philosophie morale expérimentale de la façon suivante : quelle part de la
morale relève d’une science des comportements humains et, à ce titre, s’appuie
sur l’expérimentation pour avancer par itérations épistémiques, et quelle part
relève de questions philosophiques éternelles qu’aucun argument empirique ne
saurait trancher ?

6 Conclusion
Toutes les difficultés de méthode que nous venons d’évoquer et qu’affronte
le philosophe moral expérimental ne doivent pas faire oublier la principale
difficulté spécifique à son domaine normatif : la philosophie morale présente de
façon aiguë l’obligation de répondre au défi de l’intégration entre épistémologie,
ontologie et axiologie pour, en particulier, prendre en compte l’urgence de
l’action.

Bibliographie
Andler, Daniel [2013], Dissensus in science as a fact and as a norm,
dans : New Challenges to Philosophy of Science, édité par H. Andersen,
La philosophie morale expérimentale est-elle expérimentale ? 167

D. Dieks, W. J. Gonzalez, Th. Uebel & Gr. Wheeler, Dordrecht : Springer


Netherlands, 493–506, doi : 10.1007/978-94-007-5845-2_40.

—— [2016], La Silhouette de l’humain : quelle place pour le naturalisme dans


le monde d’aujourd’hui ?, Paris : Gallimard.

Baertschi, Bernard [2017], Jusqu’où la philosophie morale peut-elle être


expérimentale ?, Raison publique, 22(2), 93–101, URL https://www.cairn.
info/revue-raison-publique-2017-2-page-93.htm.

Barwich, Ann-Sophie & Chang, Hasok [2015], Sensory measurements :


Coordination and standardization, Biological Theory, 10(3), 200–211, doi :
10.1007/s13752-015-0222-2.

Chomsky, Noam [2016], Quelle sorte de créatures sommes-nous ? : langage,


connaissance et liberté, Montréal : Lux Éditeur, trad. fr. par N. Cavé.

Collaboration Open Science [2015], Estimating the reproducibility of


psychological science, Science, 349(6251), 4716–1–8, doi : 10.1126/science.
aac4716.

Collins, Thérèse, Andler, Daniel et al. [2018], La Cognition : du neurone à


la société, Paris : Gallimard.

Cova, Florian [2013], La philosophie expérimentale, Klésis, 27, 310.

Cova, Florian, Dutant, Julien et al. [2012], La Philosophie expérimentale,


Paris : Vuibert.

Duke, Aaron A. & Bègue, Laurent [2015], The drunk utilitarian : Blood
alcohol concentration predicts utilitarian responses in moral dilemmas,
Cognition, 134, 121–127, doi : 10.1016/j.cognition.2014.09.006.

Foot, Philippa [1978], Virtues and Vices : and other essays in moral
philosophy, Oxford : Basil Blackwell, chap. The Problem of Abortion and the
Doctrine of the Double Effect, 19–32, doi : 10.1093/0199252866.003.0002,
1re édition dans Oxford Review, 1967, 5, 5–15.

Franceschi, Paul [2005], Introduction à la philosophie analytique : paradoxes,


arguments et problèmes contemporains, Paris : Le Manuscrit.

Franklin, Allan [1981], What makes a “good” experiment ?, The British


Journal for the Philosophy of Science, 32(4), 367–374, doi : 10.1093/bjps/
32.4.367.

Franklin, Allan & Perovic, Slobodan [2016], Experiment in physics, URL


https://stanford.library.sydney.edu.au/archives/win2016/entries/
physics-experiment/.
168 Yves Serra

Galison, Peter [1987], How Experiments End, Chicago : University of Chicago


Press.

Gingras, Yves [2016], L’Impossible Dialogue : sciences et religions, Montréal :


Boréal.

Greene, Joshua D., Sommerville, R. Brian et al. [2001], An fMRI inves-


tigation of emotional engagement in moral judgment, Science, 293(5537),
2105–2108, doi : 10.1126/science.1062872.

Hacking, Ian [1983], Representing and Intervening : Introductory Topics in


the Philosophy of Natural Science, Cambridge : Cambridge University Press.

—— [1992], The self-vindication of the laboratory sciences, dans : Science as


Practice and Culture, édité par A. Pickering, Chicago : University of Chicago
Press, 29–64.

Kahane, Guy [2015], Sidetracked by trolleys : Why sacrificial moral dilemmas


tell us little (or nothing) about utilitarian judgment, Social neuroscience,
10(5), 551–560, doi : 10.1080/17470919.2015.1023400.

Kahneman, Daniel, Slovic, Paul et al. (éds.) [1982], Judgment under


Uncertainty : Heuristics and Biases, Cambridge : Cambridge University
Press.

Knobe, Joshua [2006], The concept of intentional action : A case study in


the uses of folk psychology, Philosophical Studies, 130(2), 203–231, doi :
10.1007/s11098-004-4510-0.

Knobe, Joshua Michael & Nichols, Shaun (éds.) [2008], Experimental


Philosophy, Oxford : Oxford University Press.

Nurock, Vanessa [2011], Sommes-nous naturellement moraux ?, Paris : PUF.

O’Neill, Elizabeth & Machery, Edouard [2014], Current Controversies in


Experimental Philosophy, New York : Routledge.

Piccinini, Gualtiero [2009], First person data, publicity and self-measurement,


Philosophers’Imprint, 9(9), 1–16, URL http://hdl.handle.net/2027/spo.
3521354.0009.009.

Putnam, Hilary [1981], Reason, Truth, and History, Cambridge : Cambridge


University Press.

Stevens, Stanley Smith [1946], On the theory of scales of measurement,


Science, 103(2684), 677–680, doi : 10.1126/science.103.2684.677.

Thomson, Judith Jarvis [1976], Killing, Letting Die, and The Trolley Problem,
The Monist, 59(2), 204–217, doi : 10.5840/monist197659224.
La philosophie morale expérimentale est-elle expérimentale ? 169

Van Fraassen, Bas C. [2010], Scientific Representation : Paradoxes of


Perspective, Oxford : Oxford University Press.

Williamson, Timothy [2007], The Philosophy of Philosophy, Malden :


Blackwell Pub.
Varia
Éternité et développement : la question du
temps logique chez Leśniewski

Valentina Luporini
Scuola Normale Superiore (SNS), Pise (Italie)

Résumé : Le problème du temps tourmente et nourrit la philosophie de-


puis sa naissance. Dans ce cadre, une lecture métaphysique des textes de
S. Leśniewski permet de développer un point de vue original sur certaines
propriétés fondamentales du temps logique. En particulier, après une analyse
minutieuse des œuvres philosophiques de jeunesse, et notamment de l’article
« La vérité est-elle éternelle ou éternelle et sempiternelle ? » (1913), nous
montrons que le temps logique est, chez Leśniewski, inévitablement double : les
propositions, dont la vérité doit pouvoir être éternelle, sont des entités qui se
développent dans un espace et dans un temps déterminés (qui correspondent
à l’espace et au temps de leur construction graphique). De même, cette double
temporalité apparaît dans l’Ontologie (1919), un calcul logique des noms dont
l’axiomatique est établie à partir du foncteur ε, connecteur logique à la fois
inscrit dans un espace et dans un temps et néanmoins sans ancrage temporel.
Ainsi, plusieurs interrogations émergent. Comment pouvons-nous justifier le
statut ontologique de cet « être » ayant une connotation atemporelle – lieu
indiscuté et indiscutable de toute vérité logique – à l’intérieur d’une perspective
évolutive dans laquelle il est inévitablement inscrit ? Quelles sont les conditions
de possibilité de la coexistence de ces deux dimensions temporelles ? Afin de
répondre à ces questionnements, une analyse approfondie qui porte sur la
nature de ce temps logique se révèle nécessaire.

Abstract: The problem of time has both tormented and nourished philosophy
since its beginnings. To address this problem, we propose to engage in a
metaphysical reading of S. Leśniewski’s texts. This reading will allow us
to explain certain main properties of logical time. In particular, after an
accurate analysis of philosophical early works, and especially of the paper “Is
All Truth Only Eternal or Is It Also True without a Beginning?” (1913),
we could demonstrate that logical time in Leśniewski’s works is inevitably
double. Indeed, on the one hand, the truth of the sentences must be eternal
and, on the other hand, these sentences develop in a well-defined time and

Philosophia Scientiæ, 23(2), 2019, 173–189.


174 Valentina Luporini

space element (that is the time and space of their graphic construction).
Similarly, this double temporality emerges in the Ontology (1919), a logical
calculus of names that presents an axiomatization established on the basis of
functor ε, a logical connective inscribed in a specific time and space without
any simultaneous temporal determination. This argument gives rise to a
whole series of questions: How can we justify the ontological status of this
“being” with a timeless connotation, an uncontested and indisputable place of
every logical truth inside a developmental perspective in which it is inevitably
inscribed? Which are the conditions of possibility of the coexistence of these
two temporal determinations? In order to answer these questions we had to
set up a detailed study of the nature of this logical time.

1 Introduction

Le temps, boîte noire de la physique, indéfinissable logique par excellence,


recouvre cependant une place fondamentale à l’intérieur de toute pratique
scientifique. Les exemples qui montrent la présence souterraine de la question
du temps au sein des différentes sciences sont multiples : le concept de
simultanéité utilisé en physique classique est drastiquement remis en doute
par la théorie de la relativité restreinte d’Einstein ; le « en même temps » du
principe de non-contradiction que nous trouvons chez Aristote n’est pas défini
et il est cependant une des conditions nécessaires du fonctionnement correct
de ce principe ; la mathématique est censée faire abstraction du temps, mais
ses modèles restent pourtant applicables à une réalité temporelle.
« Qu’est-ce donc que le temps ? Si personne ne m’interroge, je le sais ; si
je veux répondre à cette demande, je l’ignore », déclare saint Augustin dans
ses Confessions [Augustin 1933, 300]. Ainsi, le problème du temps tourmente
et nourrit la philosophie depuis sa naissance. L’idée cyclique du temps comme
éternel retour, déjà présente dans la philosophie stoïcienne, sera reprise et
réinventée par Hegel et par Nietzsche ; le concept de temps lié au mouvement
qu’Aristote propose dans sa Physique trouve écho dans l’œuvre philosophique
de Thomas d’Aquin et l’idée augustinienne du temps comme mode d’être
propre aux créatures, qui n’est jamais véritablement divisible en passé, présent
et futur, marquera profondément la pensée philosophique contemporaine,
notamment pour ce qui concerne le concept de « durée originelle » chez Bergson
ou de temps de la protension et de la rétention de l’analyse husserlienne.
En outre, la distinction que Descartes opère entre temps et durée, ainsi que
l’idée kantienne du temps comme forme a priori de la sensibilité sont, à l’heure
actuelle, l’objet d’un vif débat philosophique.
Éternité et développement: la question du temps chez Leśniewski 175

De même, la question du temps demeure un implicite de l’histoire


de la logique. À l’exception de certaines constructions néoplatoniciennes1
et du récent développement des systèmes modaux temporels2 , la question
du temps a été souvent négligée en logique. Cependant, nous pouvons
identifier deux approches théoriques fondamentales concernant le temps,
qui ne bénéficient pourtant pas toujours d’une véritable explicitation :
1) l’approche pragmatique, visant à assimiler la genèse du temps logique avec
celle de l’énonciation ou de l’inscription des propositions apophantiques par un
sujet et 2) l’approche propre aux mathématiciens qui, en faisant abstraction
du temps, théorisent un système à l’intérieur duquel toute proposition syntaxi-
quement bien formée est censée être toujours vraie. La première interprétation,
qui donne lieu aux plus récents développements de la phraséologie et de
la pragmatique, rapporte la vérité du jugement à l’acte d’assertion d’un
sujet empirique et risque ainsi la dérive psychologiste3 . La deuxième, en
présupposant un univers atemporel, semble détacher complétement la pratique
logique du sujet spatio-temporel qui l’exerce.
Dans le présent article, nous proposons une analyse du caractère du temps
des propositions logiques chez S. Leśniewski (1886-1939), logicien et philosophe
de l’École de Lvov-Varsovie. Une telle analyse, à la fois métaphysique et
logique, vise trois objectifs principaux : en premier lieu, nous tenterons
de cerner le statut de ses systèmes logiques (§ 2) ; ensuite, nous essayerons
d’élucider l’argument philosophique qui porte sur le temps de la vérité et de
fournir un exposé détaillé de sa démonstration technique (§ 3). Ce dernier
point sera approché à partir de la traduction française de l’article de 1913
« La vérité est-elle éternelle ou éternelle et sempiternelle ? » [Kotarbiński
& Leśniewski 2011]4 , publication encore très peu exploitée. En dernier lieu,
nous tenterons de clarifier le caractère que le temps assume dans l’Ontologie
(système logique élaboré à partir de 1919) et nous avancerons, à l’aide de cet
appareil conceptuel, notre hypothèse métaphysique concernant le caractère

1. Dans le néoplatonisme, le temps est généralement compris comme l’occasion


de déploiement de l’Intelligible et, par conséquent, de l’émergence du raisonnement
et de la logique. En particulier, Plotin conçoit le raisonnement en tant que διάνοια,
c’est-à-dire comme un parcours ayant d’étapes distinctes d’un contenu [νοῦς] qui,
dans l’éternité, est tout entier simultanément [cf. Plotin 1857-1861, Livre 3, Traité 7
(45)].
2. Nous faisons référence à toute logique qui présente un calcul des propositions
augmenté de modalités temporelles. Parmi celles-ci, nous rappelons la Computational
Tree Logic, la Logique Temporelle Linéaire, la Metric Interval Temporal Logic et la
Signal Temporal Logic.
3. En particulier, la phraséologie, en tant qu’étude des expressions lexicalisées,
rapporte la proposition à l’ensemble des constructions et des expressions propres à
un milieu et à une époque spécifiques, limitant a fortiori les conditions de possibilité
d’une vérité logique universelle.
4. Cette traduction s’éloigne parfois de la traduction anglaise « Is All Truth
Only Eternal or Is It Also True without a Beginning ? » [Leśniewski 1992, 86–115],
considérée, par plusieurs spécialistes de Leśniewski, comme imparfaite.
176 Valentina Luporini

spécifique du temps logique chez Leśniewski, dans le but de rétablir la


possibilité et l’importance d’une étude approfondie qui porte sur le rôle que
les déterminations temporelles acquièrent dans la pratique logique (§ 4).

2 Une logique développementale

En accord avec l’idée leśniewskienne selon laquelle les systèmes formels relèvent
d’une activité qui ne sépare jamais la recherche logique de l’élucidation de
doutes de nature sémantique [cf. Leśniewski 1916-1939, 35–36], le corpus de
Leśniewski doit toujours être interrogé à partir d’au moins deux perspectives
herméneutiques complémentaires : d’une part, l’analyse syntaxique et formelle
des systèmes conçus en tant qu’entités logico-mathématiques, et, de l’autre,
l’explicitation du contenu philosophique et conceptuel qui en constitue à la
fois le fondement et la structure méthodologique.
En premier lieu, selon ce que nous pourrions considérer comme une
conception radicalement nominaliste, les systèmes formels de Leśniewski
répondent au statut de collections de signes, dont la possibilité s’enracine
dans leur inscription sur un support matériel (l’encre sur un papier, la craie
sur le tableau, etc.5 ). Pour cette raison, chaque symbole dans un système
leśniewskien doit être considéré – pour employer une terminologie introduite
par Peirce – comme un token, c’est-à-dire comme un objet unique, déterminé
du point de vue temporel en vertu de sa construction graphique, qui se déroule
dans une temporalité bien définie et du point de vue spatial, si nous prenons
en considération l’espace qu’il occupe en tant que marque concrète [cf. Peirce
1906], [cf. aussi Peeters 2006a].
En deuxième lieu, Leśniewski conçoit une logique développementale à
l’intérieur de laquelle les systèmes formels assument le statut d’entités
concrètes en perpétuelle expansion, dont les prémisses – les axiomes donnés –
ne sont jamais en mesure d’expliciter, de façon préalable, toutes les conclusions
auxquelles le système peut mener. En d’autres termes, les systèmes logiques
de Leśniewski sont toujours ouverts. Dans ce cadre, puisque le nombre
de théorèmes démontrés est, en acte, toujours fini6 , il devient nécessaire
d’envisager un mécanisme qui permette aux systèmes d’implémenter une
marge d’évolution potentiellement infinie. Ce rôle est attribué aux définitions

5. À ce propos, Peter Simons qualifie la logique de Leśniewski d’« inscriptionna-


liste » [Simons 2007].
6. Nous remarquons que le fait que les thèses du système soient en acte
toujours en nombre fini est à considérer comme une des conséquences d’une praxis
inscriptionnaliste : les seules entités ayant le statut des thèses sont des entités qui
sont inscrites dans l’espace et dans le temps.
Éternité et développement: la question du temps chez Leśniewski 177

créatives qui permettent d’augmenter in itinere la capacité expressive et


déductive d’un système logique7 .
Afin de rendre possible cette marge d’évolution, Leśniewski réalise aussi un
métalangage qui prévoit une méthode de construction progressive des thèses
du langage de calcul. Ainsi, les directives inférentielles et les explications termi-
nologiques, qui constituent le corpus du métalangage, ne contiennent jamais
un ensemble de termes décidés avant le développement des systèmes. Pour
reprendre une image du célèbre commentateur Eugene C. Luschei, les règles
inférentielles de Leśniewski doivent être considérées comme des « épreuves
d’architecte » et non pas comme des « spécifications de constructeur » [Luschei
1962, 118, ma traduction] : elles contrôlent le développement des systèmes
sans en imposer les détails (l’ordre, le nombre, le caractère typographique
des thèses, etc.), qui n’apparaissent que pendant la construction du langage de
calcul. Le métalangage de Leśniewski présente ainsi un caractère profondément
ambivalent : il fonde le langage de calcul – puisqu’il garantit la pureté
syntaxique de sa construction8 – mais il ne détermine pas son contenu.
Une telle construction requiert en outre une méthode d’exposition qui
soit capable de décrire le développement des systèmes dans l’espace et dans
le temps. Pour cette raison, Leśniewski refuse de réaliser un « compendium
systématique » et exhaustif et privilégie une approche « autobiographique ».
Celle-ci prévoit l’exposition progressive de ses idées au moyen d’une stratégie
éditoriale des textes qui doit pouvoir montrer au lecteur « l’ordre chronologique
et l’interdépendance de certains faits scientifiques » et qui oblige aussi l’auteur
à passer « momentanément sous silence la majeure partie des conséquences »
dérivées de ceux-ci [Leśniewski 1916-1939, 32]. En ce sens, toute l’œuvre de
Leśniewski apparaît comme un parcours personnel qui part de certaines lignes-
directrices méthodologiques – ainsi que de certaines idées embryonnaires – pour
aboutir à des axiomatiques rigoureuses, jamais achevées une fois pour toutes.
Ainsi, le dévoilement progressif des constructions logiques rendu possible par
l’usage de définitions créatives, dont le critère d’intelligibilité est garanti par
la méthode autobiographique, constitue, comme Denis Miéville le souligne,
l’outil le plus adéquat pour représenter « l’activité génétiquement fondatrice
de la logique pure » [Miéville 2008, 173].
À ce stade, nous voyons déjà que, d’une part, la question du temps logique
devient tout à fait incontournable lorsque nous nous interrogeons sur la valeur

7. Pour une analyse théorique et technique des définitions créatives chez


Leśniewski nous renvoyons aux textes suivants [Miéville 2008, 159–175], [Miéville
2006b], [Joray 2006], [Zanasi 2009].
8. La possibilité de cette « pureté syntaxique » réside dans l’explicitation du
caractère extensionnel du système logique. Pour donner un exemple, le métalangage
spécifie le caractère extensionnel des catégories sémantiques qui permettent un sys-
tème coextensif, où il est toujours possible de remplacer des expressions équivalentes
salva veritate d’un contexte propositionnel à un autre. Nous remarquons donc que, en
principe, les règles formelles des directives de construction formalisées par Leśniewski
pourraient être appliquées à un autre système développemental extensionnel.
178 Valentina Luporini

logique et philosophique des systèmes temporalisés de Leśnieswki et que,


d’autre part, le caractère développemental qui nous permet de les concevoir
comme des ensembles concrets et spatio-temporels des tokens semble exclure ce
que nous avons appelé l’« approche propre aux mathématiciens » [cf. supra, 1] :
nous ne pouvons pas faire comme s’il n’y avait pas de temps, puisque les
systèmes possèdent toujours une détermination temporelle spécifique. Quelle
est donc la nature de ce temps ? Devons-nous rapprocher l’œuvre de Leśniewski
de l’interprétation pragmatique ?

3 La vérité éternelle et sempiternelle :


conséquences d’une hypothèse
métaphysique et logique
Afin de conquérir un regard exhaustif sur la question du temps logique
chez Leśniewski, il est nécessaire de mobiliser un autre élément théorique
fondamental. Il s’agit de la conception – déjà évoquée à plusieurs reprises
– conception de la vérité, dégagée dans l’article « La vérité est-elle éternelle ou
éternelle et sempiternelle9 ? » (1913), qui constitue une réponse au texte « La
question de l’existence du futur » (1913) de Kotarbiński. Ces deux articles
reprennent et développent le problème très connu des futurs contingents,
introduit pour la première fois par Aristote dans le De interpretatione [Aristote
2008, 106] et s’inscrivent, chacun d’une manière particulière, dans la tradition
twardowskienne de l’École de Lvov-Varsovie10 .
En particulier, Kotarbiński établit les frontières entre liberté humaine et
prédétermination par la formulation d’une hypothèse métaphysique et logique :
la vérité ne cesse pas, mais elle n’a pas toujours été là. Autrement dit, d’une
part « ce qui est passé n’a pas cessé d’exister : il est seulement devenu absent »
[Kotarbiński & Leśniewski 2011, 73], et, par conséquent, si nous formulons un
jugement qui constate ce qui est passé, nous obtenons un jugement vrai sur

9. Dans ce cadre, il est important de dégager une petite analyse sémantique


des deux termes-clés, à savoir « wieczny » et « odwieczny ». Le terme « wieczny »
exclut toute temporalité ; il comprend la signification du terme « éternel » au sens
du latin ex-tempore (sans temps) par lequel il est traduit. Le terme « odwieczny »
est plus difficile à traduire. En particulier, « odwieczny » indique quelque chose qui
existe depuis tellement de temps que personne ne se souvient de son commencement
et il supposerait ainsi un ancrage dans le temps. Dans l’édition que nous allons
utiliser, ce terme est traduit par l’expression « sempiternel ». En particulier, les
occurrences du terme « éternel », utilisé pour caractériser la vérité, signifient « infini
avec commencement », tandis que l’expression « sempiternel » signifie « infini sans
commencement » [cf. Kotarbiński & Leśniewski 2011, 11–41].
10. Pour une analyse approfondie des héritages historiques et théoriques du concept
de vérité propre aux auteurs de l’École de Lvov-Varsovie, nous renvoyons aux textes
suivants [Betti 2006], [Mulligan & Cometti 2011].
Éternité et développement: la question du temps chez Leśniewski 179

une chose qui existe 11 et, d’autre part, « tout ce qui sera vérité à un moment
donné n’a pas toujours été vérité auparavant ; chaque jugement, qui est vrai
aujourd’hui, n’était pas tel hier » [Kotarbiński & Leśniewski 2011, 81]. En ce
sens, la condition de possibilité de l’émergence de la vérité – et d’une marge de
liberté dans la constitution celle-ci – relève précisément du fait qu’un jugement
n’est pas vrai avant que ce qu’il constate ne commence à exister.
Or, cette position implique l’invalidation du principe logique du tiers-
exclu puisque le jugement n’est – avant l’émergence de cette vérité – pas
vrai, mais il ne peut en même temps pas être faux non plus, puisque,
symétriquement, un jugement qui a été faux, sera faux pour toujours. Il
devient ainsi nécessaire de faire l’hypothèse d’un jugement ni vrai ni faux en
tant que « troisième opportunité12 », qui représente la condition de possibilité
de l’émergence de la vérité. En d’autres termes, la sphère de la possibilité
apophantique est, d’après Kotarbiński, une sphère d’activité, de création,
d’acte et de liberté ; celle de la réalité est une sphère de détermination.
Ainsi, une causalité universelle est définitivement exclue. L’homme est, dans
une certaine mesure, capable de créer la vérité, dont la condition logique réside
dans un rapport réciproque : « la création a la liberté comme condition », à
savoir, le fait qu’un jugement constatant un objet commence à exister implique
le fait que celui-ci ne soit pas prédéterminé avant d’exister et, inversement,
« la liberté à son tour a la création comme condition », puisque la non-
détermination n’est possible que si la vérité commence à un moment déterminé
[Kotarbiński & Leśniewski 2011, 87].
Dans ce cadre, la critique que Leśniewski développe part du questionne-
ment sur les termes employés par Kotarbiński et, en particulier, sur l’expression
« cesser d’exister13 ». Si « exister » signifie « être un objet à propos duquel un
jugement affirmatif, le constatant, est vrai » et si un jugement constatant un
objet, constate toujours la possession de certaines propriétés par un certain

11. La condition nécessaire et suffisante de la vérité est à chercher dans l’adéquation


des objets aux jugements et vice versa. Chaque objet à propos duquel un jugement
affirmatif le constatant est vrai, existe et vice versa : un jugement constatant un
objet est vrai étant donné que cet objet existe. De la même manière, dire qu’un objet
existe, a existé, ou existera, renvoie, d’après Kotarbiński, au caractère véridique du
jugement sur cet objet. En d’autres termes, selon le modèle des relations d’inhérence,
la possession de certaines caractéristiques par un certain objet est l’objet en question
[cf. Kotarbiński & Leśniewski 2011, 76–79].
12. Afin de clarifier cette idée, Kotarbiński propose l’exemple suivant : les pro-
positions « Socrate est un homme mortel » et « Socrate est un homme immortel »
n’explicitent pas le cadre complet des possibilités, puisque, en dehors de celles-ci, il
y a des choses qui ne sont pas des hommes [cf. Kotarbiński & Leśniewski 2011, 95].
13. Le texte de Leśniewski est une réponse (et une critique) directe à celui de
Kotarbiński. Pour cette raison, l’interaction textuelle est évidente. En particulier,
Leśniewski reprend les arguments de Kotarbiński et il remplace parfois certaines
expressions par d’autres expressions synonymes, ayant des nuances différentes. Pour
une analyse détaillée de ces jeux linguistiques, nous renvoyons à l’Introduction à la
traduction de Katia Vandenborre [Kotarbiński & Leśniewski 2011, 11–41].
180 Valentina Luporini

objet, alors il n’existe que des relations d’inhérences, en tant qu’objets à propos
desquels des jugements affirmatifs qui les constatent sont vrais [Kotarbiński &
Leśniewski 2011, 74–75]. En ce sens, les objets qui ne sont pas des relations
d’inhérence n’existent pas, au sens de la possibilité des jugements affirmatifs
vrais les constatant. Il s’ensuit que la thèse principale concernant l’existence,
sur laquelle Kotarbiński fonde son article, est problématique. Nous aboutissons
en effet à des conclusions tout à fait paradoxales :

[Si l’on suit le raisonnement de Kotarbiński] il existe à vrai dire


un rapport d’inhérence entre la dissertation de Kotarbiński et
la caractéristique de brièveté, autrement dit la possession de la
caractéristique de brièveté par la dissertation de Kotarbiński, mais
ni sa dissertation même existe, ni non plus l’auteur de la disser-
tation Tadeusz Kotarbiński n’existe. [Kotarbiński & Leśniewski
2011, 109]

Concernant le passé, nous avons exactement le même problème :

la possession par César d’avoir traversé le Rubicon, autrement dit


le rapport d’inhérence entre César et cette caractéristique d’avoir
traversé le Rubicon, existait ; par contre, César n’existait pas,
le Rubicon n’existait pas, puisqu’aucun de ces objets n’était un
rapport d’inhérence. [Kotarbiński & Leśniewski 2011, 113]

Par conséquent, les objets qui n’existaient pas n’ont pas cessé d’exister,
parce que « afin de cesser d’exister, il faut d’abord exister14 ». Pour pouvoir
résoudre cette « tragédie logique », une enquête plus approfondie portant sur
la correspondance jugement vrai – objet existant se révèle nécessaire. In primis,
Leśniewski s’interroge sur la nature temporelle de la relation d’inhérence en
se demandant si un objet existe en même temps que le jugement affirmatif
le constatant est vrai. Il en tire deux conclusions : 1) « en ce qui concerne
le temps, un objet n’existe pas seulement quand un jugement affirmatif vrai,
constatant cet objet, est » ; 2) « un jugement affirmatif, constatant un objet,
est souvent vrai, mais, en ce qui concerne le temps, pas seulement quand cet
objet existe » [Kotarbiński & Leśniewski 2011, 117]. Nous voyons ainsi que ces
deux hypothèses que Leśniewski dégage impliquent une scission, ainsi qu’une
proclamation d’autonomie, des trois pôles responsables de la vérité logique :
1) le jugement, 2) l’objet et 3) la relation d’inhérence. D’après nous, cette
nouvelle conception mène Leśniewski à soutenir la thèse de Kotarbiński selon

14. Leśniewski, en reformulant la question de Kotarbiński de savoir si ce qui


est passé a cessé d’exister, utilise l’adjectif « przeszły » (passé), qui souligne
l’accomplissement de l’action, au lieu d’utiliser l’adjectif « miniony » (utilisé par
Kotarbiński) qui souligne le déroulement de l’action (qui est passée). Leśniewski utilise
donc la forme perfective parce que pour comprendre si une relation d’inhérence passée
est encore vraie, il fallait, selon le raisonnement de Kotarbiński, se demander si elle
correspond à un acte de jugement accompli.
Éternité et développement: la question du temps chez Leśniewski 181

laquelle la vérité n’a pas de fin, en changeant pourtant tous les présupposés
qui la justifient. En particulier, l’exercice philosophique permet de distinguer
la relation d’adéquation objet-jugement du caractère sans fin de la vérité de
ce même jugement. En ce sens, même si la relation d’adéquation est passée,
puisque l’objet n’est plus présent, la vérité persiste15 : nous constatons donc
une autonomie de la vérité du jugement par rapport au moment où la relation
d’inhérence est posée.
Or, une question capitale s’impose ici : cette idée d’une vérité autonome
s’intègre-t-elle avec le nominalisme radical de Leśniewski ? Comme nous l’avons
affirmé ci-dessus, chaque signe logique est, pour Leśniewski, un objet concret
[token], qui possède une détermination spatiale et temporelle [cf. supra, 3]. Il
semblerait ainsi naturel d’asserter qu’une proposition-token n’est vraie que
quand elle désigne, par la relation d’inhérence, un tel objet-token concret
spatio-temporel. Comment pouvons-nous renoncer à cette présence de l’objet-
token, tout en gardant la vérité logique de la proposition-token qui le désigne ?
Pour répondre à cette question, nous renvoyons à la lecture que Arianna
Betti propose dans son article « Sempiternal Truth : the Bolzano-Leśniewski-
Twardowski Axis ». Celle-ci pousse jusqu’au bout l’idée nominaliste et attribue
à l’éternité de la vérité un caractère purement « métaphorique » [Betti 2006,
387]. En effet, si nous suivons à la lettre le présupposé inscriptionnaliste
leśniewskien, il est impossible de concevoir deux objets logiques équiformes
comme deux entités identiques s’ils possèdent deux coordonnées spatio-
temporelles différentes. Ainsi, deux jugements (propositions) ayant la même
forme, énoncés dans deux moments temporels différents, ne sont le même
jugement qu’au sens métaphorique 16 . En d’autres termes, l’éternité de la vérité
correspond à la vérité de tout jugement équiforme au jugement (vrai) énoncé
au moment spécifique où la relation d’adéquation a lieu.

15. En ce sens, un objet passé, qui a existé, ne peut pas posséder dans le présent
une caractéristique quelconque. S’il existait dans le passé, il a cessé d’exister. Par
contre, le jugement constatant – par la relation d’inhérence – une chose passée reste
vrai même si la chose en question a cessé d’exister. À ce propos, Leśniewski affirme
qu’il n’y a pas une réponse générale à la question de savoir si ce qui est passé a cessé
d’exister. Autrement dit, certains objets passés ont cessé d’exister, d’autres pas : « ce
qui existait et est passé a cessé d’exister. Ni l’un ni l’autre, en tant que non présents
dans le présent, ne possède aucune caractéristique dans ce présent, et donc pas non
plus la caractéristique d’exister. Ce qui est passé et existait n’existe pas non plus à
présent, tout comme ce qui existait et est passé. De manière générale : tout ce qui est
passé, à présent n’existe pas » [Kotarbiński & Leśniewski 2011, 115].
16. En ce sens, Leśniewski parle de jugements « phonétiquement identiques », mais
« sémantiquement différents » [cf. Kotarbiński & Leśniewski 2011, 122]. « Dans la
science est répandue une certaine imprécision – d’ailleurs inoffensive dans la plupart
des cas – qui repose sur le fait qu’on appelle communément deux ou plus de jugements
identiques (“les mêmes”) un (“le même”) jugement. Si par exemple diverses personnes
énoncent à des moments différents dans un sens similaire une quantité indéfinie de
jugements “l’homme est mortel”, alors on considère communément tous ces jugements
comme “un et le même” jugement “l’homme est mortel” » [Kotarbiński & Leśniewski
2011, 118].
182 Valentina Luporini

Nous arrivons maintenant au cœur de la problématique. Leśniewski affirme


que non seulement la vérité n’a pas de fin, mais qu’elle n’a également pas de
commencement :
Y a-t-il eu n’importe quand un moment où un certain jugement,
qui est vrai à présent, n’aurait pas été vrai [...] ? Toute vérité est
sempiternelle [sans commencement ni fin]. Il n’y a jamais eu de tel
moment où un certain jugement, qui est vrai à présent, n’aurait
pas été vrai. [Kotarbiński & Leśniewski 2011, 127]
Si nous suivons de nouveau Betti, « pour toute propositions s, si s est
vraie au moment t, alors toute proposition équiforme à s dite, écrite, etc. à
un moment aléatoire t1 , passé ou futur par rapport à t, doit être également
vraie » [Betti 2006, 387, notre traduction]17 . Ainsi, la vérité est chez Leśniewski
« omnitemporelle » : elle renvoie à l’infinité en puissance des jugements
équiformes au jugement vrai au moment t. En ce sens, la sempiternalité est –
elle aussi – métaphorique et n’a à faire qu’avec les jugements qui présentent une
valeur rétroactive. Nous remarquons donc que la scission entre jugement (dont
la vérité est éternelle et sempiternelle) et objet (qui habite un espace et un
temps particulier) est définitivement accomplie. Deux dimensions temporelles
hétérogènes, éternité et développement, coexistent et se manifestent sous
deux égards différents : les propositions logiques sont, chez Leśniewski, des
objets temporels dont la vérité n’est pas, de manière semblable aux modèles
mathématiques, soumise au temps.
À ce stade, notre question de départ est à formuler à nouveau : si l’éternité
(et la sempiternalité) de la vérité est liée aux jugements dits, écrits, etc.,
devons-nous l’interpréter à l’aide de l’hypothèse pragmatique du temps logique
comme acte d’assertion ? Leśniewski exclut explicitement cette possibilité en
affirmant que
Si nous appelons objet « éternel » l’objet qui ne cesse jamais
de durer, alors aucun jugement ne doit être éternel dans ce
sens : il cesse de durer avec le moment où on l’exprime la
dernière fois ; la fin de la durée des êtres énonçant les jugements
est alors en tous cas la derrière limite du jugement. Aucun
jugement vrai, autrement dit aucune vérité, n’est éternelle dans
ce sens, si l’humanité énonçant des jugements n’est pas éternelle.
[Kotarbiński & Leśniewski 2011, 118]18
17. « For any sentence s, if s is true at a time t, then is also true any sentence
equiform to s uttered, written, etc., at an arbitrary time t0 past or future with respect
to t. »
18. À ce sujet, les avis sont partagés. En faveur de l’interprétation de la logique
de Leśniewski en tant que logique sans import pragmatique, semblerait aller la
suppression de la barre d’assertion des Principia Mathematica que Leśniewski théorise
dans les Fondements [cf. Leśniewski 1916-1939, 37–39]. Pour donner un exemple du
débat qui a lieu sur ce sujet à l’heure actuelle, nous renvoyons aux textes suivants
[Peeters 2008], [Vernant 1997].
Éternité et développement: la question du temps chez Leśniewski 183

Ainsi, ce qui est porteur de vérité semble être le contenu du jugement et


non l’acte par lequel ce contenu se manifeste19 . En d’autres termes, le temps
logique ne s’identifie pas avec le sujet qui pose la proposition puisque si celle-
ci est vraie au moment t, elle sera toujours (et était depuis toujours) vraie,
indépendamment du moment temporel ou du contexte phraséologique dans
lesquels elle est assertée. Nous pouvons donc affirmer que ces deux temporalités
qui caractérisent la pratique logique de Leśniewski – éternité et développement
– ne se réduisent ni à un pur pragmatisme, ni à une complète absence de temps.
Reprenons maintenant notre question fondamentale : quelle est la nature
du temps logique chez Leśniewski ? Cette notion d’éternité métaphorique
comme possibilité d’« évoquer » des jugements équiformes aux jugements
vrais construits à un moment déterminé est-elle la seule envisageable ? Afin
de répondre à ces questionnements, il convient de mener une enquête plus
approfondie portant sur l’Ontologie (calcul logique des noms) et, en particulier,
sur le rôle du foncteur ε, connecteur logique à la fois inscrit dans un espace et
dans un temps et néanmoins sans ancrage temporel.

4 Le temps comme création continue


des temporalités
Éclairons quelques autres détails du fonctionnement des systèmes logiques de
Leśniewski. L’Ontologie20 (1919) – calcul logique des noms – présente une
axiomatisation établie en fonction du développement logique de l’unique terme
primitif du système, l’opérateur dyadique ε qui signifie « est21 ». À l’inverse
de ce que nous pourrions croire, l’Ontologie de Leśniewski n’est pas chargée
d’un import ontologique fort. Ce réquisit de neutralité ontologique permet de
remplacer la notion d’objet en tant qu’entité réelle par celle de nom en tant
que symbole qui peut être capable de dénoter, dans un second temps, un
objet. Ainsi, l’Ontologie, comme « étude des principes généraux de l’être »
[Leśniewski 1916-1939, 109, nous soulignons], ne parle pas du monde physique
mais des « manières d’en parler » [cf. Kearns 1967] et la relation d’inhérence,
qui jouait un rôle principal dans l’article de 1913, laisse sa place à un calcul
des noms ontologiquement neutres. À l’intérieur de ce dernier, le foncteur ε ne
couvre pas la totalité du spectre sémantique du verbe « être » à la troisième

19. Nous proposons ici de comprendre l’idée de Leśniewski à l’aide de la différence,


introduite par Twardowski, entre jugements comme actions [czynności] et jugements
comme propositions [powiedzenia]. Dès lors, cette différence est considérée comme
condition de possibilité de la différence entre psychologie et logique [cf. Twardowski
1903, 418].
20. L’Ontologie est le deuxième système logique (en suivant l’ordre chronologique)
après la Méréologie, théorie logique qui étudie les relations touts-parties.
21. La symbolisation de ce foncteur est issue de la première lettre de la troisième
personne au singulier du verbe εἶναι (ἐστί).
184 Valentina Luporini

personne du singulier en français, puisque sa signification existentielle est


exclue : il ne présuppose aucune détermination phénoménale des objets dans
l’univers physique22 . L’Ontologie bénéfice donc du primat de la syntaxe sur la
sémantique, dont la possibilité réside dans la construction d’expressions bien
formées (EBF23 ).
Nous voyons que le problème du temps logique assume ici une autre
connotation. Quel est le temps du foncteur ε qui met en relation deux noms
ontologiquement neutres ? Cette fois-ci, Leśniewski adhère à l’interprétation
que Kotarbiński propose de l’Ontologie. Cette interprétation est précieuse
dans la mesure où elle nous permet d’avancer dans notre problématique.
Kotarbiński distingue deux usages temporels de la copule ε : d’un côté, nous
avons un « usage dérivé », qui ajoute à la sémantique du foncteur ε « le
mot “présentement” » ; de l’autre côté, « l’usage fondamental » [Leśniewski
1916-1939, 110], où l’éternité inscriptionnelle est établie par le mot « est »
qui « remplit le rôle de copule atemporelle placée entre deux noms, l’un à
gauche, l’autre à droite » [Leśniewski 1916-1939, 110, nous soulignons]. Malgré
la possibilité d’employer le foncteur ε selon l’usage dérivé, sa temporalité
originaire demeure donc le sans temps.
Nous remarquons ainsi que ce qui est atemporel n’est plus la vérité de la
proposition (quand il y a adéquation avec l’objet auquel elle réfère), mais le
foncteur ε en tant que token. Dans l’Ontologie, le temps ne semble donc plus
posséder le statut d’une propriété comme une autre ; au contraire, il renvoie à
un toujours-là, symbolisé par le foncteur ε qui ramène la proposition singulière
ontologique de type « A ε b » au schéma prédicatif, représenté dans un univers
logique comme s’il n’y avait pas ce temps24 . Autrement dit, le foncteur ε exerce
un rôle principal dans la temporalisation de l’Ontologie puisqu’il bloque le
temps sur un seul et même instant25 ; il représente la condition de possibilité

22. Pour une explication approfondie de l’Ontologie de Leśniewski, nous renvoyons


à [Miéville 2006b].
23. Nous remarquons que les règles de construction des expressions bien formées se
trouvent dans le métalangage.
24. Dans ce cadre, nous remarquons que la proposition « A ε b » est vraie si 1) A
(nom singulier) dénote un objet ; si 2) b (nom partagé) dénote une propriété et 3)
si l’objet dénoté par A possède la propriété connoté par b [cf. Miéville 2006b]. Pour
une étude approfondie de la suspension temporelle introduite par le foncteur ε nous
renvoyons à [Peeters 2014, Livre 3].
25. Afin de comprendre cette idée, nous proposons de l’aborder sous le prisme d’un
présupposé métaphysique ultérieur, qui prévoit la distinction entre, d’une part, le
temps abstrait, qui représente la temporalité propre aux substances créées et qui
s’explicite dans la division illusoire entre passé, présent et futur et, d’autre part,
le temps concret, qui désigne une durée infinie, un présent permanent. En ce sens,
le temps de la vérité devra être conçu à l’aide de l’image du temps concret. Nous
empruntons l’idée de présent permanent à Boèce [cf. Boethius 2000]. Une ébauche de
la distinction entre temps concret et temps abstrait apparaît en outre chez Descartes
[cf. Descartes 1641].
Éternité et développement: la question du temps chez Leśniewski 185

de la cristallisation temporelle des systèmes, qui assument le statut d’entités


concrètes sans commencement ni fin (éternelle et sempiternelle).
Reprenons maintenant un exemple de Leśniewski. Nous avons tendance à
croire que les propositions « Varsovie de 1830 » et « Varsovie de 1930 » dénotent
deux objets logiques différents, qui possèdent des propriétés différentes (par
exemple, l’un représente une ville soumise à la domination de l’empire russe,
l’autre la capitale de la Pologne indépendante). Cependant, nous pouvons
facilement identifier certaines caractéristiques qui restent constantes (par
exemple, la présence de la place Krasiński, de la Voie Royale ou de la Place
Piłsudski). Il y a donc une ambiguïté dans le fait que les « deux » Varsovie(s),
appartenant à deux temps distincts, sont une seule et même ville ayant des
caractéristiques différentes. Dans ce contexte, le lecteur est mis devant le
choix entre les deux interprétations suivantes : la première selon laquelle
« on n’appelle Varsovie qu’un seul objet dont les dimensions temporelles
sont déterminées mais encore inconnues de nous, à savoir “Varsovie depuis le
commencement jusqu’à la fin de son existence” » ; la deuxième qui consiste à
envisager « un nombre infini d’objets qui sont des Varsovies ». Leśniewski opte
pour la première hypothèse. Dans ce cas, Varsovie de 1830 et Varsovie de 1930
sont deux « coupures temporelles » d’un seul et unique objet, à savoir Varsovie
depuis le début jusqu’à la fin de son existence. Cette solution – dont les
origines pourraient être ramenées à une tradition métaphysique préexistante26
– transfère « l’empreinte temporelle » de la copule au sujet ou au prédicat
et implique une détemporalisation du verbe « être » [Leśniewski 1916-1939,
110]. Ainsi, nous voyons que la difficulté soulevée au niveau de l’usage dérivé
du foncteur ε requiert une analyse sémantique approfondie qui détermine les
rapports temporels des objets logiques et qui permet, en particulier, de bien
distinguer objet et coupures temporelles.
À ce stade, nous envisageons au moins deux façons d’interpréter l’éternité
que le foncteur ε introduit : soit en tant que, en suivant la définition latine du
terme ex-tempore (hors du temps), le foncteur qui supprime toute forme de
temporalité (définition négative), soit en tant que le foncteur sans temps qui
possède pourtant l’entièreté des flexions temporelles (définition positive). Or,
si nous adoptons la première hypothèse, une réconciliation du temps en tant
que développement et de l’éternité demeure impossible. Au contraire, si nous
choisissons la deuxième hypothèse, leur coprésence, cette fois-ci sous un seul
et même rapport, pourra à nouveau être prise en considération.
Explorons donc la définition positive de l’éternité. En accord avec celle-ci,
le foncteur ε comprendrait – en lui – la combinatoire de tous les attributs
temporels possibles et l’éternité serait alors le produit de la temporalité
passée, présente et future, saisies dans un seul et même instant. Autrement

26. Dans cette direction, nous remarquons que la position de Leśniewski ne s’éloigne
pas de l’hypothèse métaphysique aristotélicienne qui prévoit un concept de substance
en tant que substrat dont l’essence ne dépend pas des attributs, en l’occurrence des
déterminations temporelles.
186 Valentina Luporini

dit, l’éternité ne serait pas considérée comme pure absence du temps, mais
comme une création continue de celui-ci. De cette façon, l’ensemble infini
de ces temporalités sera, au niveau du calcul des noms, incarné par la
prédication de type « A ε b » de l’Ontologie qui correspond, à son tour, au
déploiement de l’éternité dans l’espace et dans le temps. Dès lors, il est toujours
possible d’assimiler le toujours-là dont nous avons parlé ci-dessus, au temps de
l’ε comme création continue du temps. En ce sens, le foncteur ε bloque le
temps sur un seul et même instant, qui englobe l’entièreté des déterminations
temporelles possibles.
En dernier lieu, nous voyons que cette hypothèse d’une éternité comme
création continue du temps que nous avons introduite à partir de la significa-
tion du foncteur ε de l’Ontologie n’exclut ni celle d’éternité comme dimension
hors du temps, ni celle d’éternité métaphorique de la vérité qui apparaît dans
l’article de 1913. Dans le premier cas, l’éternité en tant que dimension ex-
tempore (définition négative) et l’éternité en tant qu’ensemble infini de toute
détermination temporelle possible (définition positive) ne sont pas tout à fait
contradictoires puisque la deuxième rejoint la première : en effet, la définition
de l’éternité comme création continue et simultanée de la combinatoire de
toute détermination temporelle possible a comme résultat le sans temps. De
même, dans le deuxième cas, la vérité est éternelle et sempiternelle selon deux
égards différents : d’une part, le temps propre au système logique correspond
à cette création continue du temps, et, de l’autre, il est toujours possible de
construire des propositions logiques équiformes à une proposition logique vraie,
en gardant ainsi la vérité de cette dernière27 .

5 Conclusion
Qu’est-ce donc que le temps logique ? Comment l’œuvre de Leśniewski
pourrait-elle nous aider à réfléchir à une détermination temporelle de la
pratique logique ? Nous l’avons vu, les constructions leśniewskiennes présentent
une tension fondamentale qui s’explicite dans la coprésence de deux tempora-
lités opposées : l’éternité et le développement spatio-temporel. En particulier,
notre hypothèse de travail – qui a englobé la totalité de cette recherche – laisse
apparaître l’exigence propre du questionnement philosophique sur les qualités
du temps de la vérité dans l’article de 1913 et du temps du foncteur ε dans
l’Ontologie. Ces temps sont hétérogènes puisqu’ils représentent à la fois une
propriété comme une autre (que nous pouvons prendre en considération ou
pas), le développement des tokens logiques et l’éternité inscriptionnelle.

27. Dans la section 3, nous avons exploré cette possibilité à partir de l’article
de 1913. De même, ce concept pourrait être appliqué à l’Ontologie : la vérité du
foncteur ε, introduite par l’axiome de l’Ontologie, permet la formation d’autres
propositions vraies à travers la construction des ε équiformes au premier. Ainsi, nous
pourrions affirmer que l’ε du métalangage est construit à partir de l’ε de l’Ontologie.
Éternité et développement: la question du temps chez Leśniewski 187

Ainsi, cette hétérogénéité que nous trouvons chez Leśniewski permet


de se rapprocher de la problématique du temps dans la pratique logique
à partir d’au moins deux perspectives complémentaires : du point de vue
développemental, le temps logique correspond au temps humain dans la
mesure où ses constructions, spatialisées et temporalisées, suivent un parcours
spécifique qui est celui de leur inventeur ; ensuite, le temps logique a également
un caractère éternel qui réside, d’une part, dans la vérité des jugements et, de
l’autre, dans la possibilité de réfléchir une suspension temporelle comme temps
propre aux systèmes logiques. En particulier, une fois nuancées les perspectives
« mathématiques » et « pragmatiques », l’hypothèse de l’éternité comme
création continue du temps permet de concilier les deux pôles temporels –
éternité et développement – dans un seul et même instant, qui est le temps
propre à la pratique logique.
De manière générale, une démarche visant à établir une analyse du temps
comme mécanisme métaphorique et comme création continue et éternelle au
sein des logiques développementales pourrait représenter une lecture féconde
posant des instruments conceptuels utiles à la mise en relief de plusieurs
problématiques essentielles. En effet, la question du temps et de l’éternité
permet d’analyser les fondements de tout système formel sous une perspective
à la fois philosophique et logique. Dans cette direction, il serait particulière-
ment intéressant de reprendre l’analyse du temps chez Leśniewski que nous
avons tentée dans le présent article à la lumière des débats philosophiques
contemporains qui portent notamment sur l’import pragmatique de la logique
et sur la théorie de la vérité28 . Bref, le temps éternel du questionnement
philosophique rejaillit sur toute pratique logique...

Bibliographie
Aristote [2008], Catégories, De l’interprétation, Paris : Vrin, trad. fr. par
J. Tricot.
Augustin, saint [1933], Les Confessions, t. Livre XI, Chapitre XIA, Paris :
Flammarion, trad. fr. par L. Moreau.
Austin, John Langshaw [2013], Truth, Truth (Virtual issue – Featuring classic
papers from the archive and commentaries by contemporary philosophers),
1, 27–41, the Aristotelian Society.
Betti, Arianna [2006], Sempiternal Truth : The Bolzano-Leśniewski-
Twardowski axis, dans : The Lvov-Warsaw School, édité par J. Jadacki &
28. Nous pensons par exemple à la collection suivante : Truth (Virtual issue –
Featuring classic papers from the archive and commentaries by contemporary
philosophers), et notamment aux articles [Austin 2013, Sullivan 2013, Travis 2013,
Sher 2013]. Pour une analyse de la pratique twardoskienne qui mène à un nouveau
concept de vérité logique, nous renvoyons en outre à [Simons 2008].
188 Valentina Luporini

J. Paśniczek, Leiden : Brill, Poznań Studies in the Philosophy of the Sciences


and the Humanities Online, t. 89, 369–399, doi : 10.1163/9789401203371_
019.

Boethius, Ancio Marzio Severino [2000], De Consolatione Philosophiae,


Opuscola Theologica, Munich ; Leipzig : Moreschini.

Descartes, René [1641], Méditations métaphysiques, Paris : Flammarion,


2011.

Joray, Pierre [2006], La définition dans les systèmes logiques de Łukasiewicz,


Leśniewski et Tarski, dans : La Philosophie en Pologne, édité par R. Pouivet
& M. Rebuschi, Paris : Vrin, 203–216.

Kearns, John T. [1967], The contribution of Leśniewski, Notre Dame Journal


of Formal Logic, 8(1–2), 61–93, doi : 10.1305/ndjfl/1093956246.

Kotarbiński, Tadeusz & Leśniewski, Stanisław [2011], La Question de


l’existence du futur, La vérité est-elle éternelle ou éternelle et sempiter-
nelle ?, Bruxelles : E.M.E. & InterCommunications s.p.r.l., trad. fr. par
K. Vandenborre.

Leśniewski, Stanisław [1916-1939], Sur les fondements de la mathématique,


Hermès.

—— [1992], Is all truth only eternal or is it also true without a beginning ?,


dans : Stanisław Leśniewski Collected Works, édité par S. J. Surma,
J. T. J. Srzednicki, D. I. Barnett & V. F. Rickey, Varsovie : Polish Scientific
Publishers, 86–115.

Luschei, Eugene [1962], The Logical Systems of Leśniewski, Amsterdam :


North-Holland Publishing Company.

Miéville, Denis [2006b], Introduction à l’œuvre de S. Leśniewski. L’ontologie.


Fascicule I, Neuchâtel : CdRs.

—— [2008], D’une définition à l’autre, dans : Définition, Rôles et fonctions


en logique et en mathématiques, Actes du colloque, Neuchâtel, 19-20 octobre
2007, Neuchâtel : CdRS, 159–175.

Mulligan, Kevin & Cometti, Jean-Pierre (éds.) [2011], La Philosophie


autrichienne de Bolzano à Musil. Histoire et actualité, Paris : Vrin.

Peeters, Marc [2006a], Introduction à l’œuvre de S. Leśniewski. L’œuvre de


jeunesse. Fascicule IV, Neuchâtel : CdRs.

—— [2008], Stratification hénologique et repli pragmatique, dans : Mais


raconte-moi en détail... (Mélange de philosophie et de philologie of-
fert à Lambros Couloubaritsis), édité par M. Broze, B. Decharneux &
S. Delcomminette, Paris ; Bruxelles : Vrin-Ousia, 715.
Éternité et développement : la question du temps chez Leśniewski 189

—— [2014], Discrépance et simulacre. Kant, Leśniewski et l’ontologie, Amay :


Lamiroy.

Peirce, Charles Sanders [1906], Prolegomena to an apology for pragmaticism,


The Monist, 16(4), 492–546, doi : 10.5840/monist190616436.

Plotin [1857-1861], Les Ennéades de Plotin, Paris : Hachette, trad. fr. par
M.-N. Bouillet, Livre 3, Traité 7 [45].

Sher, Gila [2013], Introduction to and commentary on Jennifer Hornsby’s


“Truth : The Identity Theory”, Truth (Virtual issue – Featuring classic
papers from the archive and commentaries by contemporary philosophers),
1, 205–213, the Aristotelian Society.

Simons, Peter [2007], Stanisław Leśniewski, dans : The Stanford Encyclopedia


of Philosophy, édité par E. N. Zalta, Metaphysics Research Lab, Stanford
University, Winter 2015 éd., en ligne, URL https://plato.stanford.edu/
cgi-bin/encyclopedia/archinfo.cgi?entry=lesniewski.

—— [2008], Twardowski on truth, The Baltic International Yearbook of


Cognition, Logic and Communication, 4, 1–14, doi : 10.4148/biyclc.v4i0.131.

Sullivan, Peter [2013], An introduction to facts and propositions, Truth


(Virtual issue – Featuring classic papers from the archive and commentaries
by contemporary philosophers), the Aristotelian Society.

Travis, Charles [2013], As a matter of fact, Truth (Virtual issue – Featuring


classic papers from the archive and commentaries by contemporary philoso-
phers), the Aristotelian Society.

Twardowski, Kazimierz [1903], Über sogenannte relative Wahrheiten, Archiv


für systematische Philosophie, 8, 415–447.

Vernant, Denis [1997], Du discours à l’action, Paris : PUF.

Zanasi, Fabio (éd.) [2009], La definizione nell’Ontologia di S. Leśniewski. Uno


studio sulle definizioni creative, Annali della Facoltà di Lettere e Filosofia
dell’Università di Siena.
Adresses des auteurs

Catherine Allamel-Raffin Pascal Ludwig


AHP–PReST, UMR 7117 Sciences, Normes et Démocratie,
Université de Strasbourg, Sorbonne Université, CNRS
Université de Lorraine, CNRS UMR 8011
7, rue de l’Université Maison de la Recherche
67000 Strasbourg – France 28, rue Serpente
[email protected] 75006 Paris – France
[email protected]
Stéphanie Dupouy
AHP–PReST, UMR 7117 Valentina Luporini
Université de Strasbourg, Scuola Normale Superiore
Université de Lorraine, CNRS Piazza dei Cavalieri 7
7, rue de l’Université Pisa, 56126 – Italia
67000 Strasbourg – France [email protected]
[email protected]
Mathias Michel
Jean-Luc Gangloff Sciences, Normes et Démocratie,
AHP–PReST, UMR 7117 Sorbonne Université, CNRS
Université de Strasbourg, UMR 8011
Université de Lorraine, CNRS Maison de la Recherche
7, rue de l’Université 28, rue Serpente
67000 Strasbourg – France 75006 Paris – France
[email protected] @paris-sorbonne.fr

Vincent Israel-Jost Dominique Raynaud


Paris – France Université Grenoble Alpes
[email protected] UFR SHS
CS 40700
Arthur Jatteau 38058 Grenoble Cedex 9 – France
CLERSE, UMR 8019 [email protected]
Université de Lille, CNRS
59655 Villeneuve d’Ascq – France Yves Serra
[email protected] Sciences, Normes et Démocratie,
Sorbonne Université, CNRS
Michel Le Du UMR 8011
Université d’Aix-Marseille (AMU) Maison de la Recherche
Centre Gilles-Gaston Granger, 28, rue Serpente
UMR 7304 75006 Paris – France
Maison de la Recherche [email protected]
29, avenue Robert Schuman
13621 Aix-en-Provence – France
[email protected]
ABONNEMENT
Philosophia Scientiæ
Travaux d’histoire des sciences et de philosophie
Revue périodique publiée par les
Archives Henri-Poincaré
Philosophie et Recherches sur les Sciences et les Technologies
UMR 7117 CNRS – Université de Lorraine – Université de Strasbourg

Je m’abonne à Philosophia Scientiæ


à partir du volume : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Nom : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Prénom : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Institut ou bibliothèque : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Adresse : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Code postal : . . . . . . . . . . . . . . . . . . . . . . . Ville : . . . . . . . . . . . . . . . . . . . . . . .

Règlement joint à la commande à l’ordre des Éditions Kimé.


Date : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Signature : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Prix du numéro 24 e

L’abonnement annuel couvre 3 numéros

Tarif France 65 e
Tarif étranger 70 e

Pour vous abonner remplissez ce bulletin et


renvoyez-le à l’adresse suivante :
ÉDITIONS KIMÉ
2, Impasse des Peintres
75002 Paris

Vous aimerez peut-être aussi