Denes - Pinson - Cadeia - Fala

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 7

A cadeia da fala∗

Peter B. Denes e Elliot N. Pinson

Normalmente achamos nossa habilidade de produzir e entender a fala algo


bastante natural e dedicamos pouca atenção à sua natureza e seu funciona-
mente, da mesma forma como não estamos especialmente conscientes da ação
de nosso coração, cérebro e outros órgãos essenciais. Não causa surpresa, por-
tanto, que muita gente subestime a influência da fala no desenvolvimento e
funcionamento da sociedade humana.
Os seres humanos desenvolvem sistemas pelos quais falam uns com os ou-
tros onde quer que vivam juntos; mesmo pessoas nas sociedades mais isoladas
usam a fala. A fala, de fato, é uma das poucas coisas, além da habilidade de
produzir ferramentas, que nos distingue de outros animais e está intimamente
conectada com nossa habilidade de pensar abstratamente.
Por que a fala é tão importante? Uma das razões é que o desenvolvimento
da cultura humana se torna possı́vel, em boa medida, por nossa habilidade de
compartilhar experiências, intercambiar ideias e transmitir conhecimento de
uma geração a outra; em outras palavras, a habilidade de comunicarmo-nos
com outros. Podemos nos comunicar uns com os outros de muitas manei-
ras. Os sinais de fumaça dos Apache, o tiro de pistola que dá inı́cio a uma
prova de corrida, as lı́nguas de sinais usadas pelos surdos, o código Morse
e vários sistemas de escrita são apenas alguns exemplos de muitos sistemas
de comunicação diferentes que evoluı́ram para atender a necessidades especi-
ais. A fala, no entanto, é, inquestionavelmente, o sistema que as sociedades
humanas consideraram ser, na maioria das circunstâncias, mais eficiente e
conveniente do que qualquer outro.
O leitor pode pensar que a escrita é um meio de comunicação mais im-
portante do que a fala. Afinal de contas, a palavra escrita e as páginas
produzidas pelas prensas gráficas parecem ser meios mais eficientes e durá-
veis para a transmissão de informação. No entanto, não importa quantos
livros e jornais sejam impressos, a quantidade de informação intercambiada

Capı́tulo 1, “The Speech Chain”, do livro DENES, P. B.; PINSON, E. N. The Speech
Chain: The Physics and Biology of Spoken Language. New York: Worth Publishers, 1993.
Traduzido por Pablo Arantes (DL/UFSCar) para uso educacional. Não distribuir sem o
consentimento do tradutor.

1
por meio da fala ainda é maior. O uso de livros e material impresso expandiu
imensamente em nossa sociedade, mas isso também aconteceu com o uso do
telefone, do rádio e da televisão.
Em resumo, a sociedade humana depende de maneira crucial do fluxo
livre e desimpedido de ideias entre seus membros e, por muitas razões, a fala
mostrou-se ser a mais conveniente forma de comunicação entre nós.
Por meio de seu uso constante como ferramenta essencial para a vida
diária, a fala transformou-se em um sistema altamente eficiente para o in-
tercâmbio até mesmo de nossas ideias mais complexas. É um sistema parti-
cularmente adequado para uso nas condições variadas e sempre mutáveis da
vida. A fala é adequada porque suas funcionalidades não são afetadas pelas
diferentes vozes, hábitos de fala, dialetos e sotaques dos milhões de pessoas
que usam uma mesma lı́ngua. E a fala pode ser usada de forma tão ampla por
que ela é surpreendentemente resistente a ruı́dos, distorções e interferências.
O estudo sistemático da fala é plenamente justificável. Seu estudo vale o
esforço porque revela pistas úteis sobre a natureza e a história da civilização
humana. Para os tecnólogos, porque o entendimento dos mecanismos da fala
ajuda no desenvolvimento de sistemas de comunicação melhores e mais efici-
entes. É importante para todos nós, porque dependemos da fala de maneira
crucial para nos comunicarmos com os outros.
O estudo da fala também é importante para o desenvolvimento da co-
municação entre humanos e máquinas. Todos nós usamos dispositivos que
recebem de nós instruções ou que nos informam sobre sua operação. Fre-
quentemente eles fazem ambas as coisas, como os computadores que usamos
tão amplamente em nossa sociedade; sua operação cada vez mais se baseia
em trocas de informação frequentes, rápidas e convenientes com os usuários.
O entendimento sólido da fala, esse sistema de comunicação interpessoal cujo
desenvolvimento baseou-se na experiência de muitas gerações, deverá provar-
se importante na concepção de sistemas de comunicação ou “lı́nguas” que
conectem usuários e máquinas.
Quando as pessoas pensam sobre a fala, a maioria delas pensa apenas a
respeito do movimento dos lábios e da lı́ngua. Aqueles que têm conhecimento
sobre ondas sonoras, adquirido talvez na montagem ou no uso de sistemas de
som, associarão à fala certos tipos de ondas sonoras. A fala é, na verdade,
um sistema bastante mais complexo, que envolve muitos outros nı́veis de de
atividade humana do que essa abordagem simplista poderia sugerir.
Uma maneira ilustrativa de investigar o que acontece quando falamos é
considerar a situação em que duas pessoas conversam entre si. Por exemplo,
você, como o falante, quer transmitir informação a outra pessoa, o ouvinte.
A primeira coisa que você tem que fazer é por seu pensamento em ordem,
decidir o que quer dizer e, então, colocar o que quer dizer em uma forma

2
linguı́stica. A mensagem é vertida em forma linguı́stica por meio da seleção
das palavras e construções apropriadas para expressar seu significado e da
colocação dessas palavras na ordem requerida pelas regras gramaticais da
lı́ngua. Esse processo está associado a atividades que acontecem no cérebro
do falante e é do cérebro que instruções apropriadas, na forma de de impul-
sos que correm através dos nervos motores, são enviados aos músculos que
ativam os órgãos vocais, os pulmões, as pregas vocais, a lı́ngua e os lábios.
Os impulsos nervosos colocam em movimento os músculos vocais que, por
sua vez, produzem mudanças de pressão bastante sutis no ar circundante.
Chamamos essas mudanças de pressão de ondas sonoras. Ondas sonoras
são chamadas muitas vezes de ondas acústicas, porque a acústica é o ramo
da fı́sica que estuda o som.
Os movimentos dos órgãos vocais geram uma onda sonora que viaja pelo
ar entre o falante o ouvinte. Mudanças de pressão no ouvido ativam o meca-
nismo auditivo do ouvinte e produzem impulsos nervosos que viajam através
do nervo acústico até seu cérebro. Ali, uma quantidade bastante grande de
atividade nervosa já está acontecendo e será modificada pelos impulsos que
chegam do ouvido. Essa modificação da atividade cerebral faz acontecer, de
maneiras que ainda não compreendemos inteiramente, o reconhecimento da
mensagem do falante. Vemos, assim, que a comunicação por meio da fala
consiste de uma cadeia de eventos que ligam o cérebro do falante ao cérebro
do ouvinte. Chamaremos esta cadeia de eventos de cadeia da fala (veja a
figura 1).
Vale a pena mencionar nesse ponto que a cadeia da fala tem um impor-
tante canal lateral. No modelo simplificado falante–ouvinte que acabamos
de descrever, há, de fato, dois ouvintes, não um, uma vez que falantes não
apenas falam, mas ouvem sua própria voz também. Quando se escutam, os
falantes comparam a qualidade dos sons que produzem com as qualidades
sonoras que prentendiam produzir e fazem os ajustes necessários para fazer
coincidir os resultados com suas intenções.
Há muitas maneiras de mostrar que falantes são ouvintes de sua própria
fala. Talvez a mais curiosa seja o efeito da retroalimentação auditiva
com atraso. Esse efeito pode ser demonstrado gravando a voz do falante
e reproduzindo essa gravação para ele via fones de ouvido com um atraso
de frações de segundo. Nessas circunstâncias, o atraso inesperado do som
que é apresentado ao falante induzem-no a gaguejar e arrastar a fala. Outro
exemplo da importância da retroalimentação auditiva são as alterações da
fala de pessoas que sofrem de surdez prolongada. A surdez, obviamente,
impede o acesso das pessoas ao canal de retroalimentação da cadeia da fala.
É possı́vel, até certo ponto, identificar os diferentes tipos de surdez a partir
das alterações de fala que produzem.

3
Figura 1: A cadeia da fala – as formas diferentes da mensagem falada em seu
caminho do cérebro do falante até o cérebro do ouvinte.

Voltemos agora à cadeia da fala principal, aquela que conecta falante e


ouvinte. Vimos que a transmissão de uma mensagem começa com a seleção e
ordenação de palavras e frases. Esse pode ser chamado de nı́vel linguı́stico
da cadeia da fala.
O evento da fala continua no nı́vel fisiológico, com atividades neurais
e musculares, e acaba, no lado do falante, com a geração e a transmissão de
uma onda sonora, o nı́vel fı́sico (acústico) da cadeia da fala.
Na ponta da cadeia onde está o ouvinte, o processo é revertido. Os eventos
começam no nı́vel fı́sico, quando a onda sonora que chega ativa o mecanismo
auditivo. Eles continuam no nı́vel fisiológico por meio de atividade neural
nos mecanismos auditivos e perceptuais. A cadeia da fala é completada no
nı́vel linguı́stico quando o ouvinte reconhece as palavras e frases transmitidas
pelo falante. A cadeia da fala, portanto, envolvem atividade em pelo menos
três nı́veis — linguı́stico, fisiológico e fı́sico — primeiro no lado do falante e
depois no lado do ouvinte.
Podemos pensar na cadeia da fala também como um sistema de comuni-
cação no qual ideias a serem transmitidas são representadas por um código
que sofre transformações à medida que os eventos da fala passam de um nı́-
vel ao outro. Podemos fazer uma analogia entre a fala e o código Morse.
No código Morse, certos padrões de pontos e traços representam diferentes

4
letras do alfabeto; os pontos e traços são códigos para as letras. Esse código
pode ser transformado de uma forma para outra. Uma série de pontos e
traços em um pedaço de papel, por exemplo, pode ser convertida em uma
sequência acústica de sons curtos e longos. Da mesma forma, as palavras
da nossa lı́ngua funcionam como códigos para conceitos e objetos materiais.
A palavra “cachorro”, por exemplo, é um código para um animal que late e
balança a cauda, assim como “traço, traço, traço” representa a letra “o” no
código Morse. Aprendemos as palavras-código de uma lı́ngua – e as regras
para combiná-las em frases – quando aprendemos a falar.
Durante a transmissão da fala, o código de palavras e frases do falante
é transformado em códigos fisiológicos e fı́sicos – em outras palavras, nos
correspondentes conjuntos de movimentos musculares e vibrações no ar –
antes de serem reconvertidos em códigos linguı́sticos no lado do ouvinte. Isso
é análogo a traduzir a forma escrita “traço, traço, traço” do código Morse em
“bip, bip, bip” sonoros.
Muito embora seja possı́vel entender a transmissão da fala como uma ca-
deia de eventos na qual um código para certas ideia é transformada de um
nı́vel a outro, seria um grande erro pensar que os eventos correspondentes
em cada nı́vel diferente são os mesmos. Há algumas relações, claro, mas os
eventos estão longe de ser idênticos. Não há garantia, por exemplo, que as
pessoas produzirão as mesmas ondas sonoras quando pronunciam a mesma
palavra. Na verdade, é bastante provável que produzam ondas sonoras di-
ferentes quando pronuciam a mesma palavra. Do mesmo modo, eles podem
muito bem gerar ondas sonoras similares ao pronunciarem palavras diferen-
tes.
Essas afirmações podem ser demonstradas experimentalmente. Um grupo
de pessoas ouviram a mesma onda sonora correspondente a uma palavra em
três ocasiões, quando a palavra estava inserida em três diferentes frases. Os
ouvintes interpretaram que a mesma onda sonora correspondia a três palavras
inglesas diferentes, “bit”, “bet” ou “bat”, dependendo da frase em que a onda
sonora era inserida.
O experimento mostra claramente que o contexto no qual ouvimos a fala
afeta profundamente as palavras especı́ficas que associamos a ondas sonoras
particulares. Dizendo de maneira diferente, a relação entre uma palavra e
uma onda sonora particular ou entre uma palavra e um movimento muscular
ou impulso nervoso em particular não é unı́voca. Não há uma etiqueta em
uma onda sonora que associe essa onda a uma determinada palavra. Re-
conhecemos uma onda sonora como uma ou outra palavra dependendo do
contexto. Um bom exemplo disso é relatado por pessoas que falam diver-
sas lı́nguas fluentemente. Elas às vezes reconhecem frases que escutaram de
maneira indistinta como tendo sido pronunciadas em uma das lı́nguas que

5
dominam, mas se dão conta depois que a conversa estava acontecendo em
uma lı́ngua diferente daquela.
Conhecimento a respeito do contexto em que a comunicação se dá pode ser
essencial para o entendimento de uma sequência de ondas sonoras particular.
É possı́vel que você tenha ouvido anúncios feitos por meio de alto-falantes
em ambientes não familiares, como uma estação de ônibus ou metrô. É pos-
sı́vel que muitas das palavras sejam incompreensı́veis para você devindo ao
ruı́do e à distorção. No entanto, essa mesma fala seria claramente inteligı́-
vel para usuários frequentes da estação, simplesmente porque eles têm mais
conhecimento do contexto do que você. Neste caso, o contexto é dado pela
experiência deles em escutar a fala em condições ruidosas e por seu maior
capacidade de antecipar o conteúdo das mensagens veiculadas.
A influência forte das circunstâncias sobre o que você reconhece não se
limita à fala. Quando vê televisão ou assiste a filmes, você provavelmente
considera as cenas que vê bastante realistas. No entanto, as imagens na tele-
visão são muito menores do que na vida real e as do cinema, muito maiores.
O contexto fará as imagens pequenas da televisão e as imagens grandes da
tela de cinema parecerem do mesmo tamanho. A falta de cor das imagens
da televisão e cinema em branco e preto não tiram seu realismo. O contexto,
mais uma vez, faz as imagens originais multicoloridas e monocromáticas pa-
recerem similares. Na fala, como nesses exemplos, normalmente não estamos
conscientes de nossa dependência forte em relação ao contexto.
Podemos dizer, portanto, que os falantes não produzem ondas sonoras
idênticas quando produzem a mesma palavra em ocasiões diferentes. Os
ouvintes, quando reconhecem a fala, não contam apenas com informação
extraı́da das ondas sonoras que recebem. Eles também contam com conhe-
cimento de um sistema de comunicação intrincado, sujeito às regras da lin-
guagem e da fala, e com pistas fornecidas pelo assunto da conversa e da
identidade do falante.
Na comunicação falada, portanto, não nos apoiamos realmente no conhe-
cimento preciso de pistas especı́ficas. Ao invés disso, integramos uma grande
variedade de pistas ambı́guas no contexto de uma sistema complexo que cha-
mamos de nossa lı́ngua compartilhada. Se pensarmos bem, não haveria outra
maneira da fala funcionar de maneira eficiente. Seria muito improvável que
milhões de falantes, com suas diferentes qualidades de voz, hábitos de fala
e sotaques, produzissem sons idênticos quando quando quisessem dizer as
mesmas palavras. Quem pesquisa a fala sabe muito bem disso. Muito em-
bora nossos intrumentos para medir as caracterı́sticas de ondas sonoras sejam
mais precisos e flexı́veis do que o ouvido humano, ainda somo incapazes de
construir uma máquina que seja capaz de reconhecer a fala de maneira tão
eficiente quanto um ser humano. Podemos medir caracterı́sticas de ondas

6
sonoras com grande acuidade, mas não sabemos a natureza e as regras do
sistema contextual em relação ao qual os resultados de nossas medidas de-
vem ser considerados, tarefa que é feita de maneira tão bem sucedida pelos
cérebros dos falantes.

Você também pode gostar