Le Distributionnalisme
Le Distributionnalisme
Le Distributionnalisme
Dans les années 1920, à une époque où l’œuvre de Saussure commence à peine à être
connue en Europe, l’américain L. Bloomfield (spécialiste à l’origine des langues indo-
européennes) propose, de façon indépendante, une théorie générale du langage qui,
développée et systématisée par ses élèves sous le nom de distributionnalisme, a dominé la
linguistique américaine jusqu’à 1950.
On voit donc l’installation d’une école descriptive au sein de laquelle des linguistes tels que
Sapir, Bloomfield, Harris et Pike, le français Gross, élaboreront leurs théories.
La notion de distribution
Pour Harris le but de la linguistique distributionnelle est de montrer à partir de l’observation
d’un corpus fini d’énoncés naturels que le système de la langue fonctionne selon des
régularités démontrables. Harris systématise la mise à l’écart, à l’intérieur de l’analyse
linguistique des notions de fonction et de signification. La seule relation pertinente est la
distribution présentée comme la recherche la plus importante de la linguistique descriptive.
La notion de distribution repose sur celle d’environnement. Soit un élément A dans un
énoncé, il est environné d’éléments à sa droite et à sa gauche, ceux-ci constituent
l’environnement de A dans l’énoncéen question, l’ensemble des environnements observés
dans les énoncés recueillis dans un corpus constitue la distribution de A. Harris donne du
concept de distribution la définition suivante :
« La distribution d’un élément est la somme de tous les environnements dans
lesquels il apparait, c’est-à-dire la somme de toutes les positions d’un élément
relatives à l’occurrence d’un autre élément. »
Soit le corpus suivant :
1. Pierre travaille.
2. Le travail de Pierre est sérieux.
3. Tu as vu Pierre?
4. Tu liras le travail de Pierre.
La distribution du nom Pierre est :
1. Ø – travaille.
2. GN. Prép. – V. adj.
3. Pron. V. – Ø.
4. Pron. V. GN. Pré. – Ø
Mais on peut également définir la distribution au moyen d’une autre opération, la
substitution, si un élément A peut se substituer dans les mêmes environnements, on dit que
A et B ont la même distribution : distribution et substitution sont donc étroitement liées.
Exemples :
a. Pierre travaille.
b. Jean travaille. Jean et Pierre peuvent se substituer,
c. J’ai vu Pierre. Ils ont la même distribution.
d. J’ai vu jean.
Donc pour décomposer les énoncés du corpus, le sens ne pouvant intervenir, on procède
comme suit : un énoncé s’apparente à une construction hiérarchisée, il est décomposable en
segments, qui eux-mêmes sont décomposables en sous-segments, ces sous-segments sont
des constituants immédiats et sont isolés dans un premier temps par la possibilité de
marquer une pause ou d’insérer des éléments entre eux. Le constituant immédiat apparait
donc comme un constituant de rang immédiatement inférieur, en partant d’une phrase, on
la décompose en propositions puis en syntagme, pour s’arrêter au mot.
On peut éclairer la finalité du distributionnalisme à travers les exemples suivants :
a. Alice travaille beaucoup.
b. L’homme aime son pays.
c. Alice aime son pays.
d. L’homme travaille beaucoup.
Par entrecroisement des énoncés du corpus, il est possible d’isoler en d. deux constituants :
l’homme/ travaille beaucoup. A son tour l’entrecroisement des constituants immédiats de
d. avec d’autres énoncés d’un autre corpus permettra d’isoler chacun des constituants de d.
a. L’homme travaille beaucoup.
b. L’ouvrier travaille beaucoup.
c. Cet homme travaille fort.
d. Cet homme voyage beaucoup.
Les constituants de d. sont : « l’ », « homme », « travaille », « beaucoup ».
Les constituants immédiats ainsi isolés, il s’agira toujours par des mises en rapports et des
comparaisons avec d’autres énoncés du corpus de les distribuer en classes distinctes. On
aboutit ainsi (ou l’on devrait abroutir) à une séries d’observation donnant naissance à des
déductions logiques à la constitution de classes de plus en plus homogènes et de plus en plus
précises. On pourrait tirer comme conclusion l’existence d’une structure distributionnaliste
de la langue qui ne nécessiterait aucune référence au sens ou à la fonction, référence qui
selon Harris pèse sur la linguistique.
Le transformationalisme
La notion de transformation a été introduite par Harris dans le cadre même du
distributionnalisme.
Dans l’article de 1952, intitulé « Discourse Analisis », on trouve un exposé de la méthode qui
conduisit Harris des procédures strictement distributionnelles aux transformations. L’analyse
du discours proposée consiste tout d’abord à établir, à l’intérieur du texte considéré, des
classes d’équivalence constituées par des éléments apparaissant dans un environnement
(contexte immédiat) identique ou équivalent ; puis à diviser les phrases du texte en
segments, qui sont des successions de classes d’équivalence, de façon à pouvoir ensuite
comparer ces segments du point de vue de la distribution des classes. Ainsi, imaginons que
d’un même texte on puisse extraire les trois phrases suivantes : P1 : Les français sont
gastronomes, P2 : Les habitants de la France sont gastronomes, et P3 : Les habitants de la
France aiment la bonne cuisine. Par comparaison des trois phrases, on obtient les deux
classes d’équivalence suivantes :
X = Les français
Les habitants de la France
Et Y = sont gastronomes
Aiment la bonne cuisine
Les trois phrases sont ensuite chacune caractérisées comme la succession des deux classes X
Y.
Ce n’est qu’à titre de « technique auxiliaire » que Harris recourt à la transformation d’une
phrase originelle en une autre phrase reconnue équivalente à la première. L’équivalence
peut être interne au texte ; ainsi, si l’on trouve dans un même texte les deux phrases P1 = La
mer est bleu et P2 = La mer, qui est bleu, est belle, on peut poser l’équivalence entre P2 = La
mer, qui est bleue, est belle et une phrase P X constituée de la juxtaposition de deux
propositions : La mer est bleue (=P1) ; La mer est belle. L’équivalence peut être externe au
texte : il s’agit alors de l’équivalence grammaticale entre phrases, établie au niveau du
système même de la langue et qui exige que dans la phrase transformée l’on retrouve les
mêmes « rapports grammaticaux » que dans la phrase originelle, ainsi Jean chante la
chanson et La chanson est chantée par Jean sont reconnues grammaticalement
équivalentes, mais pas j’écris à Paul et Paul m’écrit.
Harris donne douze cas d’équivalences (transformations grammaticales), parmi lesquels : le
passage de l’actif au passif, l’anaphorisation d’un terme, d’une relative à une indépendante
etc. De façon générale, les transformations proposées permettent de décomposer une
phrase complexe en plusieurs phrases simples ; exemples : j’ai téléphoné que nous arrivons
= j’ai téléphoné : nous arrivons. Ils fuient, lassant tout = ils fuient ; ils laissent tout. Pierre et
Paul se battent = Pierre bat Paul ; Paul bat Pierre. Les transformations comme les classes
d’équivalence, sont établies « sans aucun recours au sens ».
TD : Analyse distributionnelle
1. Soit le corpus suivant :
• e-f
• e-g
• e-f-h
• e-g-h
quels sont les environnements de chaque élément?
Quels sont ceux qui ont la même distribution?