Lenguaje Infantil
Lenguaje Infantil
Lenguaje Infantil
ISSN: 0214-9915
[email protected]
Universidad de Oviedo
España
LA METODOLOGÍA RETAMHE Y EL
PROYECTO CHILDES: BREVIARIO PARA LA
CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE
INFANTIL
Eliseo Diez-Itza, Catherine E. Snow* y Brian MacWhinney**
Universidad de Oviedo, * Universidad de Harvard y ** Universidad Carnegie
RETAMHE methodology and the CHILDES project with a focus on minimal stan-
dards to codify and analyze child language. This paper investigates some methodologi-
cal issues concerning research in the field of child language and introduces a set of ins-
truments and software developed in the context of the CHILDES (Child Language Data
Exchange System) Project. The RETAHME system provides powerful tools for recor-
ding, transcribing, and analyzing spontaneous speech samples. Information about the use
of the coding system (CHAT) for making distinctions in the transcription process is pro-
vided together with the minimum set of standards (minCHAT) to create CHAT files. The
CLAN computer programs are used to analyze files containing transcriptions of speech
samples for frequency counts, word searches, interactional analyses, etc. The core set of
CLAN commands and options constitute the minCLAN system. The first steps in lear-
ning to use the CHILDES tools are also explained.
desgracia muchas de ellas no han dejado estos nuevos recursos tecnológicos creando
huellas importantes en forma de nuevo co- un sistema de intercambio de transcripciones
nocimiento. El desarrollo del lenguaje es de muestras de habla entre los investigado-
hoy un campo de investigación prometedor res de todo el mundo, se gestó desde 1981
y activo. Mi más profundo deseo es que nos hasta 1984, en que se puso en marcha, el
deje un claro incremento del conocimiento Proyecto CHILDES (CHIld Language Data
psicológico» (Brown, 1973, p. 20). Exchange System), coordinado por Brian
Si la metodología RETAMHE ha contri- MacWhinney y Catherine Snow (MacWhin-
buido decisivamente al estudio y conoci- ney y Snow, 1985, 1990), cuyos objetivos
miento de la adquisición y desarrollo del enuncia MacWhinney (1995, p. X) así:
lenguaje, no se debe sólo al trabajo pionero
de Brown, sino también a su generosidad. 1. Proporcionar más datos de más niños
Antes que sus resultados, compartió sus da- hablantes de más lenguas.
tos con todo aquel que se lo pidió y de ellos 2. Obtener mejores datos mediante un
surgieron infinidad de estudios y todavía sistema de transcripción consistente y docu-
hoy día el «corpus» de Brown sigue siendo mentado.
objeto de investigación, como más adelante 3. Automatizar el proceso de análisis de
se pondrá de manifiesto. La ingente tarea los datos.
que supone la recogida de datos de acuerdo
con esta metodología alcanza una rentabili- Herramientas del sistema CHILDES
dad científica inusitada cuando los datos ob-
tenidos se comparten. Si el «giro comunica- El proyecto encaró dichos objetivos de-
tivo» se caracterizó por entender el lengua- sarrollando tres herramientas distintas e in-
je como una actividad compartida, su acti- tegradas en su función, «como las patas de
tud metodológica no le fue a la zaga convir- un taburete», tal y como lo expresa MacW-
tiendo la investigación en una tarea compar- hinney (1995) en el libro que constituye el
tida por la comunidad científica interna- Manual del sistema CHILDES:
cional en sentido estricto. Al complejo tra-
bajo de transcripción, Brown añadió el tras- 1. DATABASE. El objetivo fundamental
lado de las extensísimas transcripciones de del proyecto era crear una base de datos in-
Adán, Eva y Sara a un cliché que permitió formatizada con el conjunto de todas las
tirar un número limitado de copias que se transcripciones que los investigadores
distribuyeron por todo el mundo, hasta el miembros del sistema fueran aportando, es-
punto de que Brown al final sólo conserva- ta es pues la primera herramienta, la de los
ba la copia original archivada ya como un datos. Una vez informatizadas las muestras
documento histórico. fundacionales de Brown (Adán, Eva y Sa-
El progreso tecnológico había permitido ra), constantemente se ha ido actualizando
desde los años 60 grabar conversaciones in- DATABASE con nuevas transcripciones en
fantiles y reproducir, aunque fuera de un cada uno de sus apartados: inglesas, no-in-
modo restringido, sus transcripciones, pero glesas, bilingües, narrativas y con altera-
la idea de compartir tales datos del lenguaje ciones del lenguaje, hasta alcanzar unas di-
infantil, no encontró su vía ilimitada en po- mensiones considerables tanto cuantitati-
sibilidades hasta el desarrollo de la informá- vas, como cualitativas, es decir, en número
tica y sus ventajas de copia instantánea e in- de lenguas representadas. Sin embargo, to-
cluso, como luego ha ocurrido, de envío a davía son mayoritarias las transcripciones
distancia. Con el propósito de aprovechar en inglés y llama la atención la escasez de
datos en español, que se reducen a seis cor- el CD-ROM «The CHILDES Database»
pora, en relación con la importancia y difu- (MacWhinney, 1997) que incluye las tres
sión de esta lengua, por lo que uno de los herramientas citadas, además del manual y
objetivos del presente artículo es promover de una cuarta herramienta la BIB/DATABA-
el enriquecimiento de DATABASE con SE, compendio bibliográfico actualizado so-
nuevos datos en español. bre el lenguaje infantil con cerca de 13.000
2. CHAT (Codes for the Human Analysis entradas (Higginson y MacWhinney, 1990).
of Transcripts). El primer problema al que
se enfrentaba el proyecto de intercambio era Codificación básica de transcripciones
la ausencia de sistematización en la forma (MinCHAT)
tradicional de las transcripciones (Ochs,
1979). Un requisito básico era pues estable- Las transcripciones en CHAT no presen-
cer una herramienta de transcripción, un sis- tan inicialmente el formato tradicional en
tema estandarizado, un formato, el formato columnas, sino en líneas y se escriben con el
CHAT, que han de tener las transcripciones procesador de textos de CHILDES (CED)
para entrar a formar parte de DATABASE. (véase un ejemplo en la Tabla 1). Existen
Existen unos mínimos requerimientos for- tres tipos de líneas, indicado cada uno de
males que se incluyen dentro de lo que se ellos por un símbolo de codificación que
considera la codificación más elemental, aparece como primer carácter de la línea:
MinCHAT, que luego expondremos, y la po-
sibilidad de codificaciones más complejas 1. Líneas de encabezamiento @ Ej. @Begin
con finalidades investigadoras específicas. 2. Líneas principales * Ej. *CHI:
3.CLAN (Computerized Language Analy- 3. Líneas dependientes % Ej. %err:
sis). La informatización de las transcripcio-
nes facilitó enormemente lo que al fin y al Líneas de encabezamiento (@)
cabo constituye el objetivo último de la me-
todología RETAMHE, el análisis de los re- Como su nombre indica, son en su ma-
sultados obtenidos en el proceso de registro yoría las líneas que encabezan la transcrip-
y codificación, tarea de recuento que antaño ción, marcan el inicio y el final de la misma
se hacía «a mano» en sesiones agotadoras y o pasajes determinados y contienen datos
con fiabilidad excesivamente dependiente fundamentales tales como quiénes son los
de los errores del investigador. La automati- participantes en la conversación, la edad del
zación de dicha tarea se concretó en la terce- niño objeto de estudio, la fecha de la graba-
ra herramienta, CLAN, un paquete de pro- ción o la situación en que se realizó la mis-
gramas informáticos específicos para el aná- ma. Se clasifican en tres categorías: obliga-
lisis de transcripciones en CHAT. Al igual torias, constantes y variables.
que el sistema de codificación, los progra-
mas tienen un uso básico, minCLAN, que in- 1. Obligatorias
troduciremos en este artículo, y unos usos
avanzados que se explican pormenoriza- @Begin: Primera línea de una transcrip-
damente en el Manual (MacWhinney, 1995). ción
El sistema incluye versiones tanto para @End: Última línea de una transcripción
Macintosh, como para MS-DOS y reciente- @Participants: Segunda línea de una
mente se ha incorporado una nueva para transcripción donde se listan todos los parti-
Windows 95. Las actualizaciones de todos cipantes con las tres letras que identificarán
los componentes se publican anualmente en sus intervenciones (CHI, INV, MOT, etc.),
siendo necesario utilizar una nueva línea & palabra incompleta o no palabra
por cada nuevo enunciado, aunque el parti- *CHI: &ee no # dame # el &co coche #
cipante sea el mismo y no cambie el turno. &secí [?].
Por ejemplo, cuando el niño narra un cuen-
to, probablemente será necesario incluir lo Acciones paralingüísticas
que dice en varias líneas principales:
[=!] acciones que acompañan o sustitu-
*CHI: la mamá le dijo que llevase la ces- yen al habla y tienen un valor comunicati-
tita. vo
*CHI: y entonces Caperucita se metió en
el bosque. *CHI: <me quitó el camión> [=! grita].
*CHI: 0 [=! ríe].
1. Códigos en líneas principales *INV: 0 [=! asiente].
*CHI: no # dame el coche # es mío. Van seguidas de una pausa que sustituye
*CHI: no # dame # el coche es mío. al signo exclamativo, salvo cuando van al
*CHI: no # dame # el coche # es mío. final de la línea principal.
Tabla 1
Fragmento de transcripción en formato CHAT de una muestra de habla espontánea recogida en la
conversación entre un niño de tres años y su madre
@Begin
@Participants: CHI Target_Child, MOT Mother
@Age of CHI: 3;6.0
@Coder: Eliseo Diez-Itza
@SES of CHI: middle
@Sex of CHI: male
@Filename: angelpep.cha
@Situation: la madre y el niño juegan sobre la alfombra del salón sentados frente a frente. Tienen un papel y una caja con pinturas
y sellos de caucho.
@Comment: fragmento de una transcripción con finalidad didáctica
@Language: Spanish
@Location: Gijón, Asturias, Spain
rectamente en la pantalla del ordenador sim- iniciarse en MinCLAN a través de sus dis-
plemente escribiendo el nombre del progra- tintos usos. FREQ efectúa sobre las trans-
ma y pulsando «enter», veamos algunos de cripciones recuentos de las frecuencias de
ellos. todas las palabras ofreciendo un listado de
las mismas, al tiempo que calcula otro de
MLU y MLT los índices tradicionalmente más utilizados
para estudiar el vocabulario la type/token
La longitud media de los enunciados ha ratio (TTR), índice de diversidad léxica que
sido la medida más universalmente emplea- viene dado por el cociente entre los voca-
da para cuantificar el desarrollo gramatical blos diferentes que aparecen en la muestra
de los niños. Naturalmente CLAN propor- y el total de palabras de la misma. La eje-
ciona un programa llamado MLU para efec- cución de FREQ se realiza del mismo mo-
tuar dicho cálculo sobre una transcripción o do señalado para MLT y MLU, sin embar-
un conjunto de ellas. Sin embargo, y parti- go el output que se obtiene no separa las
cularmente para el español, resulta difícil frecuencias de cada uno de los participan-
establecer dicha medición en términos de tes, es decir, nos da el recuento de todas las
morfemas, por lo que concedemos mayor palabras que aparecen en la transcripción.
fiabilidad al cálculo del MLU en función Puesto que normalmente nos interesará rea-
del número de palabras por enunciado lizar el recuento de un participante, es ne-
(Diez-Itza, 1992). Dicha medición es uno de cesario introducir una opción en el coman-
los resultados de otro programa que mide la do de modo que el análisis se reduzca a un
longitud media de los turnos: MLT. Dicho tipo de línea, dicha opción es +t seguido
programa, como se puede ver en el ejemplo del nombre de la línea que deseamos anali-
de la Tabla 2, donde se aplica al fragmento
de transcripción reproducido arriba, mide
Tabla 2
para cada uno de los participantes el núme- Análisis con MLT de la longitud media de los
ro de enunciados, el número de turnos y el turnos y enunciados del niño y de la madre en
número de palabras y sobre ellos calcula la la transcripción de la Tabla 1
media de palabras por turno, la media de
producciones por turno y la media de pala- MLT.EXE angelpep.cha +f
Sat Apr 11 21:03:01 1998
bras por enunciado, es decir, el MLU, la
MLT.EXE (18-JUL-95) is conducting analyses on:
longitud media de los enunciados. Para eje- ALL speaker tiers
cutar los programas de CLAN basta con te- ****************************************
clear su nombre seguido del nombre del ar- From file <angelpep.cha> to file <angelpep.mt>
MLT for Speaker: *MOT:
chivo que contiene la transcripción que de- MLT (xxx and yyy are INCLUDED in the utterance and morphe-
seamos analizar. Por ejemplo, para obtener me counts):
en pantalla el análisis que aparece en la Ta- Number of: utterances = 19, turns = 8, words = 110
bla 2 el comando es: Ratio of words over turns = 13.750
Ratio of utterances over turns = 2.375
Ratio of words over utterances = 5.789
>mlt angelpep.cha
MLT for Speaker: *CHI:
FREQ MLT (xxx and yyy are INCLUDED in the utterance and morp-
heme counts):
Number of: utterances = 10, turns = 8, words = 45
Este es uno de los más poderosos pro- Ratio of words over turns = 5.625
gramas de CLAN y a la vez uno de los más Ratio of utterances over turns = 1.250
fáciles de usar, por lo que se recomienda Ratio of words over utterances = 4.500
Referencias
Arnau, J. y Boada, H. (1985). Aspectos de la Bruner, J. (1986). El habla del niño. Barcelo-
evolución del instrumento lingüístico en bilin- na: Paidós. (Orig. 1983).
gües y monolingües. III Congreso Nacional de Diez-Itza, E. (1992). Adquisición del lengua-
AESLA. Valencia. je. Oviedo: Pentalfa.
Brown, R. (1973). A first language. The early Higginson, R. y MacWhinney, B. (1990). CHIL-
stages. Cambridge, Mass.: Harvard University DES/BIB: An anotated bibliography of child langua-
Press. ge and language disorders. Hillsdale, NJ: Erlbaum.
MacWhinney, B. (1995) The CHILDES Pro- Siguán, M. (1983). Metodología para el estu-
yect. Tools for analyzing talk. Hillsdale, N.J.: dio del lenguaje en la infancia. Barcelona: Pu-
Erlbaum. blicacions i Edicions de la Universitat.
MacWhinney, B. y Snow, C. (1985). The Siguán, M., Colomina, R. y Vila, I. (1990).
Child Language Data Exchange System. Journal Metodología para el estudio del lenguaje Infan-
of Child Language, 12, 271-296. til. Vic: Abril.
MacWhinney, B. y Snow, C. (1990). The Sokolov, J.L. y Snow, C. (1994). Handbook of
Child Language Data Exchange System: an up- research in language development using CHIL-
date. Journal of Child Language, 17, 457-472. DES. Hillsdale, N.J.: Erlbaum.
Ninio, A., Snow, C., Pan, B. y Rollins, P. Solé, M.R. (1988). La comunicació verbal en
(1994). Classifying communicative acts in chil- el marc escolar. Vic: Eumo.
dren’s interactions. Journal of Communicative Triadó, C. y Forns, M. (1989) La evaluación
Disorders, 27, 157-188. del lenguaje: Una aproximación evolutiva. Bar-
Ochs, E. (1979). Transcription as theory. En E. celona: Anthropos.
Ochs y B. Schieffelin (eds.) Developmental Prag-
matics (pp. 43-72). Nueva York: Academic Press.
Serra, M. (1976). Métodos e índices para el
estudio psicológico y patológico del lenguaje.
Anuario de Psicología, 15: 171-196. Aceptado el 23 de diciembre de 1998