L'Apport de L'Informatique Dans L'Analyse Conjointe Des Données Numériques Et Textuelles
L'Apport de L'Informatique Dans L'Analyse Conjointe Des Données Numériques Et Textuelles
L'Apport de L'Informatique Dans L'Analyse Conjointe Des Données Numériques Et Textuelles
L'APPORT DE L'INFORMATIQUE
DANS
L'ANALYSE CONJOINTE DES DONNÉES
NUMÉRIQUES ET TEXTUELLES
INTRODUCTION
1 Sanchez, J. (1993) : Qu'est-ce que l'analyse relationnelle informatique des textes ? Revue
Informatique et Statistique dans les Sciences Humaines, Université de Liège, 29, 135-165.
Sanchez, J. (1994) : De la désambiguïsation assistée par ordinateur à l'élaboration des
grammaires textuelles. Revue Literary and Linguistic Computing, Oxford University
Press, vol.9, n°3, 195-202.
2 Centre International de Statistique et d'Informatique Appliquée (C.I.S.I.A.), 1, Avenue
Herbillon, 94160 Saint-Mandé (France).
3 SPAD-N (Système Portable d'Analyse des Données - Numériques).
4 SPAD-T (Système Portable d'Analyse des Données - Textuelles).
LA REVUE DE L'EPI N° 78 ANALYSE DE DONNÉES
208
disposait pas des outils nécessaires pour effectuer à la fois une analyse
qualitative et une analyse quantitative à partir d'un nombre important
de questionnaires et d'entretiens.
Nous présenterons brièvement ici, ces possibilités de traitement et
de couplage statistique des enquêtes et des entretiens qui constituent
désormais pour les étudiants et les chercheurs psychologues, grâce au
progrès informatique, une nouvelle voie de formation et de recherche
dont il faudra tenir compte dans nos filières universitaires. D'autant que,
depuis 1986, les étudiants en sciences humaines sont, grâce au plan
d'initiation à l'informatique (I.P.T.), formés précocement à l'utilisation de
l'ordinateur, ce qui rend possible la pratique, à partir de logiciels
spécialisés, des différentes méthodes statistiques enseignées et utilisées
en psychologie. Nous illustrerons notre propos à partir de nos derniers
travaux 5 - 6, où nous avons étudié et appliqué les possibilités de
traitement et de couplage des données numériques et textuelles.
(choix et ordre des mots) et ne développe pas les mêmes thèmes (sens des
mots et thèmes traités) notre principale préoccupation, en tant que
psychologue, est de pouvoir définir à partir du discours de chaque sujet
les différents thèmes que chaque individu a développés, pour ensuite
construire un fichier qui permet, grâce à un codage spécifique, de
l'utiliser comme un tableau de contingence.
Néanmoins, afin de pallier certains problèmes d'analyse contex-
tuelle, nous avons mis en place d'autres procédures complémentaires à
celles proposées par SPAD-T pour étudier les différents mots présents
dans les discours retranscrits. Mais ce choix personnel n'est pas
obligatoire pour pouvoir effectuer l'analyse textuelle avec SPAD-T. Nous
insisterons seulement sur le fait que nous avons opté pour des procédures
lexicométriques contextuelles afin de préserver les informations
nécessaires pour déterminer le sens des mots. En effet, nous n'avons pas
voulu nous contenter de l'examen des données textuelles hors contexte
(liste de mots isolés) car ces listes ne permettent pas une interprétation
correcte du point de vue sémantique. Donnons l'exemple du mot "bruit" :
il peut faire référence à un bruit positif ("j'aime le bruit de l'eau de la
fontaine") ou à un bruit négatif ("je n'aime pas le bruit des voitures"). Si
nous réalisons l'analyse thématique hors contexte les deux sens de la
forme bruit seront représentés par un même point dans le plan factoriel,
ce qui induit une erreur d'interprétation. Par contre si cette analyse est
réalisée en contexte, le sens de "bruit" est bien défini et nous pouvons
ainsi créer deux "items" différents de bruit, l'un positif et l'autre négatif,
qui seront traités et représentés à part sur les plans factoriels.
Les procédures du traitement statistico-lexicométrique sont
fondamentales pour bien comprendre les principes des analyses
textuelles. Les analyses sont surtout basées sur l'utilisation de logiciels et
la mise au point de principes lexicométriques (mesure et description
informatique du lexique) qui supposent la maîtrise d'un certain nombre
de définitions dont nous présenterons les plus importantes :
1) Les unités de traitement : forme, occurrence,
2) Les listes des formes : index et concordances.
La forme graphique est l'unité de base que l'ordinateur est capable
de traiter, c'est-à-dire, une chaîne de caractères séparée par deux blancs
(avant et après) et accompagnée ou non d'une ponctuation. Autrement
dit, il s'agit d'une chaîne de caractères alphanumériques non-délimiteurs
(lettres et chiffres) qui est entourée par d'autres caractères différents
appelés délimiteurs (blancs, points, virgules, deux points, etc.). A partir
I. MARAMOTTI, J. SANCHEZ LA REVUE DE L'EPI
213
----0029
mon village, blotti le long de la forêt, qui lui fait une couleur verte ou ocre, suivant les
saisons, est ce que j’aime dans mon environnement. cette coulée de verdure, avec un soleil
couchant qu’on ne trouve que dans notre village. la forêt, pleine d’oiseaux qu’on voit
évoluer avec les saisons (...).
++++
je déteste ces maisons prétentieuses qu’on érige sans ordre et sans génie, ces décharges
sauvages, ces dépôts d’herbe tondue que d’abominables citadins, qui se croient devenus des
ruraux, essaiment dans la forêt. je déteste ces voitures, sans parler des cyclomoteurs, des
tondeuses, des camions et tous ces cancres qui tolèrent le boucan des moteurs mais
gueulent si un coq chante, ces avions, ces télés, tous ces objets de consommation qui nous
rendent cons et nous empêchent de rêver (...).
++++
oui, je suis préoccupé par les promoteurs immobiliers qui ne peuvent pas voir un espace
vierge sans vouloir le violer. j’ai peur de tous ces citadins avides qui prétendent aimer la
campagne mais voudraient avoir le métro à leur porte. j’ai peur d’un avenir où la
mégalopole nous rejoindra (...).
++++
fermer Roissy. interdire tout nouveau permis de construire dans la commune. interdire les
camions et surtout réprimer le peu de cas qu’ils font des interdictions de circuler, qui
existent dans le village. mettre fin à l’exploitation du gypse. obliger les agriculteurs à
respecter la nature en luttant contre les pesticides, les nitrates, etc. éduquer les gens,
depuis nos voisins jusqu’aux directeurs de l’aéroport de paris, pour que chacun respecte la
liberté des autres et la propriété collective, places, routes, etc. (...)
⇓
Classifications hiérarchiques.
⇓
Méthode de classification automatique.
4. EN CONCLUSION
Isabelle MARAMOTTI,
Département de Psychologie
Université de Paris X-Nanterre
Javier SANCHEZ
Université de Limoges