Le Distributionnalisme

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 10

Le distributionnalisme

Dans les années 1920, à une époque où l’œuvre de Saussure commence à peine à être
connue en Europe, l’américain L. Bloomfield (spécialiste à l’origine des langues indo-
européennes) propose, de façon indépendante, une théorie générale du langage qui,
développée et systématisée par ses élèves sous le nom de distributionnalisme, a dominé la
linguistique américaine jusqu’à 1950.

On désigne, donc sous le nom de Distributionnalisme, un courant linguistique apparu aux


États-Unis au moment où en Europe se constitue la phonologie liée à la diffusion de la
pensée de Saussure. Les similitudes entre le distributionnalisme et les courants européens
contemporains autorisent à les regrouper comme étant autant de variantes du
structuralisme. Les différences entre les deux courants peuvent être mises en rapport avec
les conditions de développement différentes. Alors qu’en Europe la linguistique nouvelle
prend la forme d’une réflexion théorique à partir de langues bien connues, anciennes ou
modernes, la linguistique américaine se constitue moins par rapport au latin et au grec
qu’aux langues amérindiennes encore inconnues et peu décrites : la linguistique américaine
ne prend pas appui sur la longue tradition européenne, cette caractéristique permet le
développement de méthodes originales qui aboutissent également à une conception
structuraliste du langage. Elle est en grande partie conditionnée par des langues
amérindiennes. La tradition américaine est dominée par la méthode descriptive et les
préoccupations théoriques sont réduites au strict minimum indispensable au travail
descriptif. La linguistique descriptive est une linguistique synchronique qui favorise
l’émergence et la domination du paradigme structuraliste, d’autant plus qu’on a affaire à des
langues sans écriture dont le passé est inconnu.

On voit donc l’installation d’une école descriptive au sein de laquelle des linguistes tels que
Sapir, Bloomfield, Harris et Pike, le français Gross, élaboreront leurs théories.

Les postulats théoriques

Les postulats théoriques explicites ou implicites du distributionnalisme sont très


comparables à ceux que Saussure a formulés :
• l’objet d’étude est la langue, par opposition à la parole. La langue est souvent
appelée « code ».
• cette étude doit être synchronique d’autant plus naturellement qu’on a surtout
affaire à des langues sans écriture dont le passé est inconnu.
• La langue est composée d’unités discrètes, que la segmentation permet de dégager.
• Chaque langue constitue un système spécifique, les éléments se définissent par leurs
relations à l’intérieur d’un système, c’est-à-dire par leurs rapports avec les autres
éléments. L’insistance est mise surtout sur les relations syntagmatiques (la
distribution, d’où le nom de l’école).

Une conception mécaniste du langage (l’anti-mentalisme)

L’influence de Bloomfield sur la linguistique américaine se marque surtout à travers la


rédaction de son œuvre majeur intitulée language (Le Langage), publiée en 1933 et qui
constitue une théorie générale du langage qui sera développée et systématisée par ses
élèves sous le nom de distributionnalisme, courant qui dominera la linguistique américaine
jusqu’à 1950.

La linguistique de Bloomfield prend son départ dans la psychologie behavioriste qui


triomphait aux États-Unis depuis 1920. Pour cette théorie le comportement humain dans
tous les domaines peut être décrit à partir de la relation fondamentale stimulus-réponse
c’est-à-dire que le comportement humain est explicable à partir de données externes sans
recours à des données internes (le comportement humain est totalement explicable et
prévisible à partir des situations dans lesquelles il apparait indépendamment de tout facteur
"interne"). Bloomfield conclut de là que la parole, elle aussi, doit être expliquée par ses
conditions externes d’apparition : il appelle cette attitude le mécanisme et l’oppose au
mentalisme. Le langage est donc accessible de l’extérieur en tant que comportement et non
de l’intérieur comme expression de réalités psychologiques, le mentalisme, selon lequel le
langage doit s’expliquer comme un effet des pensées, intentions, croyances et sentiments du
sujet parlant, est impraticable.

De ce fait, il applique au langage le célèbre schéma : stimulus-réponse en le formulant de la


manière suivante : S-r-s-R. Un schéma qui servira à l’explication des faits linguistiques : un
stimulus externe S provoque une réponse r de caractère linguistique, cette réponse agit
comme un stimulus linguistique s incitant le destinataire à agir, c’est-à-dire à donner une
réponse concrète R. Bloomfield illustre cela à travers un charmant scénario : Jill voit une
pomme qui stimule son appétit S, elle demande à Jack d’aller la lui cueillir r voilà un stimulus
linguistique s pour Jack qui ira cueillir le fruit R. Vu de cette façon, l’itinéraire
comportemental de S à R se compose de trois parties par ordre chronologique :

1. actions pratiques précédant l’acte de parole


2. l’acte de parler : le discours
3. Actions pratiques suivant l’acte de parler.

Il s’agit pour Bloomfield d’évacuer de la linguistique les explications mentalistes et d’y


substituer une causalité mécaniste. Cela l’incitera à tracer autour de la linguistique des
frontières qui interdisent au linguiste toute activité de type philosophique, historique ou
autre. On aboutit ainsi à un descriptivisme minutieux qui écarte le recours à des explications
sémantiques.

L’analyse en constituants immédiats


Étudier une langue selon la méthode distributionnelle commence par réunir un corpus aussi
varié que possible qui sera envisagé comme un échantillon, c’est-à-dire un ensemble
d’énoncés effectivement émis, puis sans s’interroger sur la signification des énoncés, on
essaie de faire apparaitre les régularités formelles dans le corpus afin de donner à la
description un caractère ordonné et systématique, et d’éviter qu’elle ne soit un simple
inventaire. Bloomfield met en place la notion de constituant qui est à la base de la procédure
d’analyse en constituants immédiats. Un constituant immédiat est un élément qui est
commun à des formes complexes :
« Nous voyons que certaines formes linguistiques ont des ressemblances
phonétiques et sémantiques avec d’autres formes, par exemple : John courait,
John tombait, Bill courait, Bill tombait, Johny, Billy, dansant, jouant […] la partie
commune de toutes formes complexes est une forme linguistique, c’est un
constituant immédiat. »(Bloomfield, le langage, p. 153).
Le corpus, une fois recueilli, on le segmente en cherchant à rapprocher des morceaux
d’énoncés comparables : dans les exemples ci-dessus, on peut dire que : John et Bill
sont des constituants immédiats, il est de même pour courait et dansait, le diminutif y
et le morphème –ant. La notion d’inclusion de constituants simples dans des formes
complexes est à la base de la conception hiérarchique de la phrase en constituants
immédiats. Le recours à la fonction et à la signification étant exclu, la seule notion qui
serve de base à cette recherche d’irrégularités, est celles de contexte linéaire ou
d’environnement. Cette analyse attribue à la phrase une construction hiérarchique, en
ce sens qu’elle décompose d’abord l’énoncé en segments, qui sont appelés ses
constituants immédiats, puis subdivise chacun de ceux-ci en sous segments, qui sont
les constituants immédiats de ce constituant immédiat, et ainsi de suite jusqu’à arriver
aux unités minimales.
Analysons l’énoncé E : « Le président de la république a ouvert la séance ».
a) On note qu’il y a aussi dans le corpus un énoncé “ Georges bavarde”, fait de
deux unités, et dont l’analyse est évidente. On cherche alors quels segment de
E sont expansions de “Georges” et de “bavarde”. Ce sont respectivement “le
président de la république” et “a ouvert la séance” puisqu’on a aussi dans le
corpus “Georges a ouvert la séance” et “Le président de la république
bavarde”. D’où une première segmentation en deux constituants immédiats :
“le président de la république/ a ouvert la séance”.
b) On décompose ensuite le premier constituent immédiat en le comparant avec
le segment “mon voisin” dont l’analyse est évidente.

La notion de distribution
Pour Harris le but de la linguistique distributionnelle est de montrer à partir de l’observation
d’un corpus fini d’énoncés naturels que le système de la langue fonctionne selon des
régularités démontrables. Harris systématise la mise à l’écart, à l’intérieur de l’analyse
linguistique des notions de fonction et de signification. La seule relation pertinente est la
distribution présentée comme la recherche la plus importante de la linguistique descriptive.
La notion de distribution repose sur celle d’environnement. Soit un élément A dans un
énoncé, il est environné d’éléments à sa droite et à sa gauche, ceux-ci constituent
l’environnement de A dans l’énoncéen question, l’ensemble des environnements observés
dans les énoncés recueillis dans un corpus constitue la distribution de A. Harris donne du
concept de distribution la définition suivante :
« La distribution d’un élément est la somme de tous les environnements dans
lesquels il apparait, c’est-à-dire la somme de toutes les positions d’un élément
relatives à l’occurrence d’un autre élément. »
Soit le corpus suivant :
1. Pierre travaille.
2. Le travail de Pierre est sérieux.
3. Tu as vu Pierre?
4. Tu liras le travail de Pierre.
La distribution du nom Pierre est :
1. Ø – travaille.
2. GN. Prép. – V. adj.
3. Pron. V. – Ø.
4. Pron. V. GN. Pré. – Ø
Mais on peut également définir la distribution au moyen d’une autre opération, la
substitution, si un élément A peut se substituer dans les mêmes environnements, on dit que
A et B ont la même distribution : distribution et substitution sont donc étroitement liées.
Exemples :

a. Pierre travaille.
b. Jean travaille. Jean et Pierre peuvent se substituer,
c. J’ai vu Pierre. Ils ont la même distribution.
d. J’ai vu jean.

a. Le garçon chante. a. Le gamin chante. Garçon et gamin peuvent se


b. Un garçon joue. b. Un gamin joue. substituer, ils ont la même
c. Le méchant garçon est Le méchant gamin est partie distribution.
partie

Donc pour décomposer les énoncés du corpus, le sens ne pouvant intervenir, on procède
comme suit : un énoncé s’apparente à une construction hiérarchisée, il est décomposable en
segments, qui eux-mêmes sont décomposables en sous-segments, ces sous-segments sont
des constituants immédiats et sont isolés dans un premier temps par la possibilité de
marquer une pause ou d’insérer des éléments entre eux. Le constituant immédiat apparait
donc comme un constituant de rang immédiatement inférieur, en partant d’une phrase, on
la décompose en propositions puis en syntagme, pour s’arrêter au mot.
On peut éclairer la finalité du distributionnalisme à travers les exemples suivants :
a. Alice travaille beaucoup.
b. L’homme aime son pays.
c. Alice aime son pays.
d. L’homme travaille beaucoup.
Par entrecroisement des énoncés du corpus, il est possible d’isoler en d. deux constituants :
l’homme/ travaille beaucoup. A son tour l’entrecroisement des constituants immédiats de
d. avec d’autres énoncés d’un autre corpus permettra d’isoler chacun des constituants de d.
a. L’homme travaille beaucoup.
b. L’ouvrier travaille beaucoup.
c. Cet homme travaille fort.
d. Cet homme voyage beaucoup.
Les constituants de d. sont : « l’ », « homme », « travaille », « beaucoup ».
Les constituants immédiats ainsi isolés, il s’agira toujours par des mises en rapports et des
comparaisons avec d’autres énoncés du corpus de les distribuer en classes distinctes. On
aboutit ainsi (ou l’on devrait abroutir) à une séries d’observation donnant naissance à des
déductions logiques à la constitution de classes de plus en plus homogènes et de plus en plus
précises. On pourrait tirer comme conclusion l’existence d’une structure distributionnaliste
de la langue qui ne nécessiterait aucune référence au sens ou à la fonction, référence qui
selon Harris pèse sur la linguistique.

Les procédures distributionnelles


La méthode distributionnaliste commence par réunir un corpus, c’est à partir de l’analyse de
ce corpus selon des techniques d’analyse et de description particulières que l’on aboutit à un
listage de classes distributionnelles, autrement dit, il s’agit d’observer pour dégager les
fonctionnements, c'est-à-dire de procéder à des expériences comme dans les sciences
expérimentales, en l’occurrence à des manipulations, des opérations qui appliquées au
corpus consiste en :
 La commutation (remplacement, substitution) : c’est une technique selon laquelle on fait
commuter sur un axe paradigmatique des sons ou des suites de sons. On aboutit alors à
une nouvelle définition des parties du discours : tous les mots qui commutent entre eux
sur un même axe c'est-à-dire qui peuvent apparaitre dans la même position,
appartiennent à la même classe.
 La combinaison : c’est une technique selon laquelle on combine des sons ou des suites
de sons sur un axe syntagmatique, cette technique permet de voir si des éléments sont
compatibles. Ainsi si un déterminant est compatible avec un adjectif : un joli chapeau,
deux déterminants sont mutuellement exclusifs : *le un chapeau ; cependant, il arrive
qu’on trouve : les quelques chapeaux.
 Permutation (déplacement)/ effacement (suppression) : ces opérations vont permettre
de mettre en lumière la structure phrastique et d’en distinguer les constituants
immédiats (obligatoires, essentiels) des constituants facultatifs dont l’absence ne rend
pas la phrase agrammaticale. La structure dégagée, sous-jacente aux énoncés réalisés est
organisée hiérarchiquement selon la relation d’ordre spécifique de la langue étudiée.

Limites et prolongements du distributionnalisme :


Quelle que soit la complexité de certaines de ses procédures, qui peut être très grande, la
linguistique distributionnelle repose fondamentalement sur quelques idées simples, et il est
difficile de ne pas se comporter en distributionnaliste face à une langue inconnue. Mais ses
limites appariassent vite : il n’est que d’essayer de découper un texte en français en
morphèmes pour s’apercevoir à la première ligne que ce n’est pas chose facile. Si les langues
amérindiennes comme le swahili sont tant citées, c’est bien pour leur exceptionnelle clarté
de structure.
De plus, une fois mises en œuvre les techniques de description et d’analyse, la linguistique
risque de se retrouver sans objet : quand on aura tout décrit, quand on aura énuméré la liste
de toutes les classes distributionnelles, il n’y aura plus rien à faire puisque le sens
n’intervient pas. De plus, le distributionnalisme suppose de suspendre la référence au sens,
cependant cette référence gouverne l’analyse qui est conduite. Enfin, il semble qu’il ait
quelques failles dans la méthodologie distributionnelle et qu’elle ne parvienne pas toujours à
rendre compte de la syntaxe ou de la constitution de certains énoncés, ainsi pour des
phrases telles que :
 Je connais quelles terreurs épouvantes les hommes.
 Je connais quelles terreurs affrontent les hommes.
Dans lesquelles, il y a sous l’apparente identité dans la distribution des éléments, des
constructions syntaxiques différentes.

Le transformationalisme
La notion de transformation a été introduite par Harris dans le cadre même du
distributionnalisme.
Dans l’article de 1952, intitulé « Discourse Analisis », on trouve un exposé de la méthode qui
conduisit Harris des procédures strictement distributionnelles aux transformations. L’analyse
du discours proposée consiste tout d’abord à établir, à l’intérieur du texte considéré, des
classes d’équivalence constituées par des éléments apparaissant dans un environnement
(contexte immédiat) identique ou équivalent ; puis à diviser les phrases du texte en
segments, qui sont des successions de classes d’équivalence, de façon à pouvoir ensuite
comparer ces segments du point de vue de la distribution des classes. Ainsi, imaginons que
d’un même texte on puisse extraire les trois phrases suivantes : P1 : Les français sont
gastronomes, P2 : Les habitants de la France sont gastronomes, et P3 : Les habitants de la
France aiment la bonne cuisine. Par comparaison des trois phrases, on obtient les deux
classes d’équivalence suivantes :
X = Les français
Les habitants de la France
Et Y = sont gastronomes
Aiment la bonne cuisine
Les trois phrases sont ensuite chacune caractérisées comme la succession des deux classes X
Y.
Ce n’est qu’à titre de « technique auxiliaire » que Harris recourt à la transformation d’une
phrase originelle en une autre phrase reconnue équivalente à la première. L’équivalence
peut être interne au texte ; ainsi, si l’on trouve dans un même texte les deux phrases P1 = La
mer est bleu et P2 = La mer, qui est bleu, est belle, on peut poser l’équivalence entre P2 = La
mer, qui est bleue, est belle et une phrase P X constituée de la juxtaposition de deux
propositions : La mer est bleue (=P1) ; La mer est belle. L’équivalence peut être externe au
texte : il s’agit alors de l’équivalence grammaticale entre phrases, établie au niveau du
système même de la langue et qui exige que dans la phrase transformée l’on retrouve les
mêmes « rapports grammaticaux » que dans la phrase originelle, ainsi Jean chante la
chanson et La chanson est chantée par Jean sont reconnues grammaticalement
équivalentes, mais pas j’écris à Paul et Paul m’écrit.
Harris donne douze cas d’équivalences (transformations grammaticales), parmi lesquels : le
passage de l’actif au passif, l’anaphorisation d’un terme, d’une relative à une indépendante
etc. De façon générale, les transformations proposées permettent de décomposer une
phrase complexe en plusieurs phrases simples ; exemples : j’ai téléphoné que nous arrivons
= j’ai téléphoné : nous arrivons. Ils fuient, lassant tout = ils fuient ; ils laissent tout. Pierre et
Paul se battent = Pierre bat Paul ; Paul bat Pierre. Les transformations comme les classes
d’équivalence, sont établies « sans aucun recours au sens ».
TD : Analyse distributionnelle
1. Soit le corpus suivant :
• e-f
• e-g
• e-f-h
• e-g-h
 quels sont les environnements de chaque élément?
 Quels sont ceux qui ont la même distribution?

2. Soit le corpus suivant :


• a-b-c
• c-d-e
• a-f-c
• c-g-e
 quels sont les environnements de chaque élément?
 Quels sont ceux qui ont la même distribution?
3. Pour chaque corpus, trouvez la distribution des mots en gras :
• Les enfants jouent au ballon.
• Ces enfants sont turbulents.
• Il a offert un cadeau à ses enfants.
• Le maire a réuni tous les enfants du village.

• Le vernis donne du lustre au parquet.


• Le festival a redonné du lustre à la petite ville.
• Le lustre de cristal est suspendu au plafond du salon.
• Il y a des lustres que je ne suis pas allé au théâtre.

• Ils travaillent tôt le matin.


• Les ouvriers travaillent assidûment.
• Les élèves qui travaillent sont récompensés.
• Aujourd’hui les fonctionnaires de l’entreprise travaillent gratuitement.

Vous aimerez peut-être aussi