Psicometria Life
Psicometria Life
Psicometria Life
A TEORIA DA MEDIDA
Luiz Pasquali
Instituto de Psicologia
Universidade de Brasilia
A
medida em ciências do comportamento, notadamente na Psicolo-
gia, deveria ser chamada puramente de psicometria, similarmente
ao que ocorre em ciências afins a ela, onde se fala de sociometria,
econometria, politicometria, etc. Psicometria, contudo, tem sido abusiva-
mente utilizada dentro de um contexto muito restrito, referindo-se atestes
psicológicos e escalas psicométricas. De qualquer forma, a psicometria
ou medida em Psicologia se insere dentro da teoria da medida em geral
que, por sua vez, desenvolve uma discussão epistemológica em torno da
utilização do símbolo matemático (o número) no estudo científico dos
fenômenos naturais. Trata-se, portanto, de uma sobreposição, ou melhor,
de uma interface entre sistemas teóricos de saber diferentes, tendo a
teoria da medida a função de justificar e explicar o sentido que tal
interface possui.
CIÊNCIA E MATEMÁTICA
A NATUREZA DA MEDIDA
O problema do erro
A observação dos fenômenos empíricos é sempre sujeita a erros
devidos tanto ao instrumental de observação (os sentidos e suas
extensões através de instrumentos tecnológicos) quanto a diferenças
individuais do observador, além de erros aleatórios, sem causas
identificáveis. Assim, tipicamente toda e qualquer medida vem acompa-
nhada de erros e, por conseqüência, o número que descreve um
fenômeno empírico deve vir acompanhado de algum indicador do erro
provável, o qual será analisado dentro de teorias estatísticas para
determinar se o valor encontrado e que descreve o atributo empírico está
dentro dos limites de aceitabilidade de medida.
Axiomas da medida
Como a medida consiste na atribuição de números às propriedades
das coisas segundo certas regras, ela deve garantir que as operações
empíricas salvem os axiomas dos números. A medida que salva todos
esses axiomas é a mais sofisticada possível e, por isso, rara (escala de
razão). A maioria das medidas, ao menos em ciências do comportamento,
se dão por satisfeitas se puderem salvar, pelo menos, os axiomas de
ordem. Se somente os axiomas de identidade forem salvos (escala
nominal), a operação propriamente não chega a ser medida, mas trata-se
apenas de classificação, pois a única característica do número salva é a
sua identidade; isto é, o número utilizado para uma operação empírica
deve ser diferente do de uma outra operação. Para tanto, aliás, o número
é utilizado tão-sòmente como numeral, a saber, um rabisco diferente de
outro, que poderia ser substituído por qualquer outro sinal ou rabisco
(desde que diferentes entre si) sem a menor conseqüência para a medida.
O número, neste caso, serve apenas de etiqueta de uma classe de coisas.
A medida realmente acontece quando se salvam, pelo menos, os axiomas
de ordem dos números. Então, fica a pergunta: É possível se demonstrar
a existência de ordem de magnitude nos atributos das coisas? Isto é, as
coisas têm dimensões, entendidas estas como atributos mensuráveis,
propriedades empíricas possuidoras de magnitude? Como resposta a esta
questão poder-se-ia simplesmente assumir que sim: os atributos
empíricos têm magnitude, como o senso comum nos parece dizer quoti-
dianamente quando fala de 'mais do que', 'maior que' e expressões
similares. Contudo, esta não parece ser uma base muito segura para
fundamentar uma teoria da medida. É preciso, então, demonstrar empi-
ricamente que tal ocorrência existe na realidade das coisas. Nas ciências
físicas esta questão parece resolvida, mas nas ciências sociais e do com-
portamento ela ainda suscita acirradas controvérsias. Segue uma tentativa
de demonstração experimental de axiomas da medida.
Formas de medida
Hã diferentes maneiras (formas) de se atribuir números às proprie-
dades dos objetos. Uma das taxonomías mais úteis consiste em distinguir
três formas diferentes de mensuração: medida fundamental, medida
derivada e medida por teoria (esta chamada de medida by fiat por
Campbell, 1928, 1938). Pode-se igualmente falar em medida direta e
medida indireta; e há outras ainda. A primeira, contudo, parece mais
esclarecedora.
Medida fundamental
É a medida de atributos para os quais, além de se poder estabelecer
uma unidade-base natural específica, existe uma representação extensiva.
São dimensões (atributos mensuráveis) que permitem a concatenação, isto
é, dois objetos podem ser associados, concatenados, formando um terceiro
objeto de mesma natureza. Tal situação ocorre com os atributos de massa,
comprimento e duração temporal. Estes atributos permitem uma medida
direta e fundamental, dado que o instrumento utilizado para medi-los
possui a mesma qualidade que se quer medir neles. Assim, ao se medir o
comprimento de um objeto, utiliza-se um instrumento composto de
unidades de comprimento. A medida dele será dada pela coincidência de pontos
entre o comprimento do objeto e a unidade de comprimento marcada no
instrumento, por exemplo o metro.
Mesmo podendo ser possível conceitualmente se proceder a uma
medida fundamental nos casos mencionados, nem sempre isto é empiricamente
factível. Por exemplo, como se faria uma medida fundamental de distâncias
astronômicas ou subatômicas? Ou como se poderia medir fundamentalmente a
massa de uma galáxia? Nestes casos e semelhantes é preciso recorrer a outras
estratégias de medida, como a medida derivada.
Medida derivada
Unidades de medida
Normalmente existe interdependência entre os fenômenos, de sorte
que, ao se variar um deles, o outro covaria com ele. Esta covariancia pode
ser expressa por alguma constante. Estas constantes podem ser univer-
sais, como o caso da gravitação universal que covaria com as gravitações
locais de um sistema menor, por exemplo, a da massa, chamada inclusive
de constante universal de gravitação. Outras constantes pertencem a
algum sistema específico (constantes do sistema ou locais), como a
constante entre massa e volume em Física ou as constantes da lei do
reforço em Psicologia. Evidentemente, a descrição de tais constantes pode
constituir uma medida indireta.
Além de constantes que relacionam dois ou mais atributos, os
próprios atributos variam por conta própria, assumindo diferentes
magnitudes, isto é, eles são dimensões, entendendo por isso que eles
podem variar de magnitude e, portanto, podem ser mensuráveis. Neste
caso, seria extremamente útil se houvesse, para cada atributo diferente,
uma unidade básica com a qual se pudesse determinar a magnitude do
mesmo. De fato, qualquer unidade que se queira definir serve aos pro-
pósitos da medida, bastando haver consenso sobre a mesma. Mas é fácil
ver as vantagens de se estabelecerem unidades-base aceitáveis para
todos. Nas ciências físicas, este esforço tem sido constante. O critério que
tem guiado os físicos na procura destas unidades-base foi a busca de um
fenômeno natural de estabilidade máxima que pudesse servir como padrão
físico da unidade-base para o sistema. A história da procura destas uni-
dades tem lances de Babel, pois cada região do mundo tinha seus sis-
temas de medida, incomensuráveis com os de outras regiões. Há cerca de
200 anos, contudo, uma procura mais sistemática e mais entrosada em
nível mundial tem sido desenvolvida até que culminasse no Système
International des Unités (abreviado SI), definido na 11th General Conferen-
ce on Weights and Measures (Paris, 1960), onde foram estabelecidas seis
unidades-base ou primárias para os fenômenos físicos, sendo todas as
restantes medidas derivadas destas seis primárias (Klein, 1974; Luce,
Suppes, 1986). A Tabela 1-2, na página seguinte, sintetiza estas unidades-
base consensuais, inclusive o mol, unidade posteriormente acrescida.
A grande maioria das outras unidades em Física são unidades
derivadas destas seis unidades-base. Por exemplo, densidade é igual a
peso por volume (kg/m3), velocidade a metros por segundos (m/s), lumi-
nância a intensidade da luz por área que é expressa em termos de
distância (cd/m2), volt é watts por ampère (V=W/A), watt é joule por
segundo (W=J/s), joule é newton vezes comprimento (J = N.m), newton é
peso vezes distância por tempo (N=kg'm/s2), etc.
A procura de unidades similares em ciências sociais e do comporta-
mento é algo ainda precário, exceto onde medidas fundamentais forem
possíveis, como talvez em psicofisica (medida dos estímulos) e na análise
experimental do comportamento (medidas de estímulos e freqüência de
respostas).
Em que consiste uma medida por lei? Mede-se por lei quando se
quer demonstrar empiricamente que dois ou mais atributos estruturalmente
diferentes mantêm entre si relações sistemáticas. Duas condições são
expressas nesta concepção: 1) os atributos sao de natureza diferente, um
não é redutível ao outro — por exemplo, a cor e a distância são dois
atributos distintos dos fenômenos físicos no caso do desvio para o
vermelho das linhas espectrais dos objetos na medida de distâncias, do
mesmo modo que a resposta e o estímulo são dois atributos diferentes no
caso da medida psicofisica e da análise experimental do comportamento;
2) uma relação sistemática foi demonstrada cientificamente (empiricamen-
te) existir entre estes atributos. Assim, as manipulações efetuadas num
atributo repercutem sistematicamente no outro, donde é possível estabele-
cer uma função de covariancia entre os dois, uma lei.
Medida por teoria
Uma teoria não é uma lei, dado que ela é composta de axiomas ou
postulados e nao de fatos empíricos. Ademais, ela é científica se de seus
axiomas é possível deduzir hipóteses empiricamente testáveis. O caso da
medida por teoria ocorre também em Física, como ficou dito acima. No
caso das ciências sociais e do comportamento, ela é mais facilmente dis-
cernível quando se trabalha com variáveis hipotéticas, isto é, nas teorias
da estrutura latente ou da modelagem latente (latent modeling).
Nesta concepção, a teoria versa sobre processos mentais (estrutu-
ras psicológicas hipotéticas), conceitualizando sua estrutura e sua dinâ-
mica, e define o conjunto de comportamentos que os expressa. Assim,
uma teoria da inteligência trata dos processos cognitivos, sua estrutura,
sua gênese, seu desenvolvimento, seus processos operativos, etc, bem
como dos comportamentos típicos em que ela se expressa, tais como
resolver problemas numéricos, problemas espaciais, problemas com
palavras, etc. E é no nível dos comportamentos que se faz a medida. De
sorte que, ao se medir por teoria neste caso, consiste em dizer que ao se
proceder a medida de um atributo empírico (o comportamento) está-se de
fato medindo a estrutura psicológica latente, isto é, um outro atributo e de
outra natureza (um atributo hipotético). A função da teoria é fundamental-
mente garantir a legitimidade de tal operação; trata-se, portanto, de um
problema de representação: a operação empírica de medir o comporta-
mento representa a medida da estrutura latente. Legitimar tal represen-
tação é a função da teoria psicométrica (a questão da validade psicométri-
ca da medida).
Na verdade, pode-se ver três grandes linhas da teoria da medida
por teoria: a teoria da detecção do sinal em psicofisica, a teoria dos jogos
em Psicologia Social e a teoria das escalas e testes (a psicometria, num
sentido mais restrito). O fato de trabalharem com construios hipotéticos
(processos cognitivos, preferências, utilidade, etc.) seria o elo entre estes
tipos de teorias, bem como a procura de formas de medida desses mes-
mos construios.
A teoria da detecção do sinal trabalha com dois parâmetros: relação
sinal-ruído ('d') e a disposição do sujeito ('beta'). O primeiro parâmetro
define o grau de detectabilidade do sinal contra um fundo de ruído, e o
'beta' define o nível de vontade ou disposição que o sujeito tem de ver o
sinal quando ele está presente.
A teoria dos jogos trabalha com o conceito de utilidade, introduzido
pela ciência econômica. Esta variável representa a preferência do sujeito
na escolha de uma alternativa de ação dentre duas ou várias. A teoria dos
jogos determina as probabilidades de ganhos e perdas associadas com a
escolha de cada alternativa, bem corno permite verificar o nível de prefe-
rência do sujeito com relação a cada alternativa, possibilitando, assim, uma
ordenação destas alternativas em termos de preferência.
NAO-NATURAL NATURAL
NAO-IGUAL ORDINAL ORDINAL
Conceito de erro
Tipos de erro
Erros de observação
Erros de amostragem
Como a pesquisa empírica normalmente não pode ser feita sobre
todos os membros de uma população de eventos ou objetos, tipicamente
se seleciona uma amostra destes eventos ou objetos. Esta escolha de
indivíduos no meio de uma população é sujeita a desvios, vieses, isto é,
erros. O problema não são os erros em si, se o interesse fosse tirar con-
clusões sobre a amostra selecionada. Acontece, porém, que o interesse do
pesquisador é tirar conclusões ou fazer inferências sobre toda a população
da qual a amostra foi retirada. Neste caso, o erro de amostragem é desas-
troso, uma vez que poderia ocasionar inferências errôneas, dada a
presença de vieses da amostra com respeito a esta população (falta de
representatividade). Para solucionaros problemas advindos da seleção da
amostra, foi desenvolvida a teoria estatística da amostragem.
A teoria do erro
Dado que o erro está sempre presente em qualquer medida e que
sua presença constitui uma ameaça séria à tomada de decisões científicas,
é de capital importância que haja meios de neutralizar ou diminuir os seus
efeitos ou, pelo menos, de conhecer sua grandeza, o mais aproximado
possível, para saber o tamanho do risco em que se está incorrendo ao
tomar decisões baseadas na medida. Todos os esforços para controlar o
erro através de procedimentos experimentais são necessários, mas nem por
isso o erro vai desaparecer, visto que a sua ocorrência é imprevisível, isto
é, não é nunca possível se determinar as causas de todos os erros pos-
síveis numa medida. Para enfrentar esta situação foi desenvolvida a teoria
do erro, baseada na teoria da probabilidade e dos eventos casualóides.
Um evento casualóide ou aleatório é definido por Popper (1974,
p. 190): "Uma seqüência-evento ou seqüência-propriedade, especialmente
uma alternativa, se diz 'casualóide' ou 'aleatória' se e somente se os
limites das freqüências de suas propriedades primárias forem 'absoluta-
mente livres', isto é, indiferentes a qualquer seleção que se apoie nas
propriedades de qualquer ênupla de predecessores". Em palavras mais
simples, um evento empírico é aleatório se sua ocorrência não pode ser
predita a partir dos eventos que ocorreram antes dele, isto é, ele é
totalmente independente (livre) com relação ao que aconteceu antes.
Imagine o jogo de lançar uma moeda para obter cara ou coroa ou o de um
dado: qualquer que tenha sido o resultado nos lançamentos anteriores do
dado, o resultado (um entre os seis possíveis) do próximo lançamento é
totalmente imprevisível — isto é liberdade absoluta.
O erro na medida é considerado um evento aleatório, pela teoria do
erro. Feita esta suposição, então é possível tratar o erro dentro da teoria
da probabilidade, do teorema de Bernoulli, que baseia a lei dos grandes
números e da curva normal, que determina a probabilidade de ocorrência
dos vários elementos da série, no nosso caso, da série aleatória composta
dos vários tamanhos de erros cometidos na medida.
A curva normal define que uma seqüência aleatória de eventos
empíricos se distribui normalmente em tomo de um ponto modal (média)
igual a 0 e uma variância igual a 1. Este valor modal, no caso de uma
distribuição de erros, significa que estes se cancelam no final, dado que
este valor (0) é o que possui a maior probabilidade na distribuição.
Contudo, isto é absolutamente verdadeiro somente na distribuição de uma
série aleatória de um número infinito de eventos, segundo o teorema de
Bernoulli. Este teorema, na verdade, afirma que um segmento 'x' de
elementos de uma série aleatória infinita 'A' (isto é, com liberdade
absoluta) que se aproxima da série total (x->A) possui os mesmos
parâmetros desta série. Isto significa que, quanto maior o segmento, mais
próximo está dos parâmetros da série ou, em outras palavras, quanto
maior o segmento, menor o desvio dos parâmetros dele dos da série. Diz
Popper (1974, p.198): "Assim, o teorema de Bernoulli assevera que os
segmentos mais curtos de seqüências casualóides mostram, muitas vezes,
grandes flutuações, enquanto que os segmentos longos sempre se
comportam de modo que sugerem constância ou convergência; diz o
teorema, em suma, que encontramos desordem e aleatoriedade no
pequeno, ordem e constância no grande. É a este comportamento que se
refere a expressão 'lei dos grandes números".
Na prática da pesquisa, contudo, o erro da medida é expresso pelo
erro padrão da medida, que é o valor médio da variância, isto é,
IMPORTÂNCIA DA MEDIDA
Precisão
CONCLUSÃO
REFERÊNCIAS BIBLIOGRÁFICAS
STEVENS, S.S. Mathematics, measurement and psychophysics. In: STEVENS, S.S. (Ed.).
Handbook of experimental psychology. New York: Wiley, 1951. p.1-49.
SUPPES, P., ZINNES, J.L. Basic measurement theory. In: LUCE, R.D., BUSH, R.R.,GALANTER,
E.G. (Eds.). Handbook of mathematical psychology. New York: Wiley, 1963. v.l, p.1-76.
CAPÍTULO 2
I
nformalmente, a psicofisica nasceu em aproximadamente 130 A.C., na
Astronomia, nas mãos de Hiparco, com o desenvolvimento de uma
escala para quantificação de magnitude estelar; formalmente, com a
publicação do Elemente der Psychophysik, por Gustav Theodor Fechner,
em 1860, como uma proposta metodológica para o estudo experimental
da alma. Este evento foi precedido por alguns outros eventos relevantes
que merecem menção. Daniel Bernoulli propôs, em 1738, que as pessoas
não agem com base no valor real do dinheiro, mas em uma transformação
psicológica do seu valor real. Bernoulli propôs que a utilidade do dinheiro
aumenta como uma função logarítmica da quantidade do dinheiro. Em
1824, o matemático Herbart propôs o conceito de limiar, ao afirmar que
eventos mentais precisam ter uma certa força para serem conscientemente
experimentados. Herbart propôs ainda o uso de pressupostos e conceitos
matemáticos para lidar com conceitos psicológicos. Weber (1834-1846),
pesquisando sobre somatossentidos, observou que pesos grandes levan-
tados precisam diferir mais do que pesos pequenos para serem percebidos
como diferentes, levando à formulação de que a diferença apenas per-
ceptível (DAP) é uma razão do peso levantado, criando as condições para
que Fechner enunciasse a lei que mais tarde veio a ter o nome de Weber.
Em torno de 1850, os astrônomos J. Herschel, W.R. Dawes e N.R. Pogson
formularam, independentemente de Fechner, a lei psicofisica básica de
Fechner, no contexto de desenvolver a escala de magnitude estelar
originalmente concebida por Hiparco. Na década de 1850, o físico J.A.F.
Plateau inventou o método de bissecção, no qual o observador, dados dois
valores de estímulo, tinha que produzir um terceiro que parecesse ocupar
a metade do intervalo entre os estímulos padrão. Especificamente, Plateau
* A preparação deste capitulo foi parcialmente financiada pelo CNPq, através do Auxílio
Integrado 50.0493/91-0. A autora agradece a Luiz Pasquali, Miosotis Lúcio e Rosana Maria
Tristão Taveira, pela leitura crítica de versão preliminar e pelas várias sugestões
oferecidas. Miosotis Lúcio também colaborou no levantamento da bibliografia.
solicitou a artistas que, a partir de tintas branca e preta, produzissem um
cinza que parecesse estar equidistante do branco e do preto.
A publicação do Elemente der Psychophysik teve impacto na
comunidade científica européia e foi decisiva para o estabelecimento da
própria Psicologia como disciplina científica. O estabelecimento e o pro-
gresso da psicofisica não foi, entretanto, ausente de percalços. A Univer-
sidade de Cambridge, na Inglaterra, recusou permissão para o estabe-
lecimento de um laboratório de psicofisica porque isto "seria insultar a
religião por colocar a alma humana em um par de escalas", uma reação
que lembra a que sofreu Charles Darwin com o enunciado da teoria da
evolução das espécies. Nos Estados Unidos, William James deixou publi-
camente claro seu desprezo pelo trabalho de Fechner, o que contribuiu
para a pouca participação dos laboratórios americanos de Psicologia
Experimental na consolidação da psicofisica (Adler, 1980; Boring, 1957).
A psicofisica criada por Fechner e os desdobramentos sob sua
influência teórica e metodológica são referidos na literatura como psico-
fisica fechneriana ou clássica. Fechner tinha um interesse especial pela
questão mente-corpo, e sua proposta psicofisica básica, R=f(S), tem
embutidos o pressuposto de identidade psicofisica e o de que as pessoas
não têm acesso direto às sensações, as quais deveriam ser medidas indi-
retamente através de sucessivos limiares diferenciais. Mais especifica-
mente, ele pressupunha que a diferença apenas perceptível (DAP) é a
unidade de sensação, que diferentes DAPs correspondem a uma mesma
sensação e que as DAPs podem se somar para constituir uma escala. O
investimento de Fechner no estudo das sensações não deve ser interpre-
tado como refletindo sua posição sobre o objeto principal do desenvolvi-
mento da psicofisica, mas como refletindo o fato de que Fechner viveu em
uma época em que eram influentes filósofos associacionistas empiricistas
que defendiam que todo o conhecimento e as idéias se devem, em última
instância, a experiências sensoriais com o mundo externo. Não surpreende,
portanto, que tendo Fechner um profundo interesse pela Filosofia, esco-
lhesse as sensações como o ponto de partida de seu extenso "programa"
psicofisico, o qual incluía o estudo da memória e do pensamento.
Lei de Stevens
Stevens, em contraposição direta a Fechner, propôs na década de
50 que a razões iguais de estímulo correspondem razões iguais de sen-
sações. Descrita matematicamente, esta relação pode ser reproduzida por:
Fig. 2-2 — Representação estilizada dos mesmos dados da Fig. 2-1, loga-
ritmicamente transformados. Observe-se que as três funções são retas,
que a curva de aceleração positiva se transformou em uma reta de inclina-
ção maior que 1 e que a curva de aceleração negativa se transformou em
uma reta de inclinação menor que 1. (Adaptado de Stevens, 1975, p.17)
PSICOFISICA CLASSICA
PSICOFÌSICA MODERNA
DETECÇÃO DE SINAL
Procedimento sim-não
O experimento é organizado em tentativas de dois tipos. Em algu-
mas tentativas o sinal é apresentado (mais rigorosamente, tentativas
contendo sinal e ruído) e em outras tentativas o sinal não é apresentado
(mais rigorosamente, tentativas contendo apenas ruído). O observador é
informado da matriz de pagamento (ou, em linguagem coloquial, do que tem
a ganhar e perder com acertos e erros, respectivamente). Sua tarefa é sim-
plesmente julgar, através de uma resposta simples do tipo sim/não, se um
sinal está ou não presente na tentativa Em cada sessão experimental vigora
uma condição de matriz de pagamento e de probabilidade sinal/ruído.
Poder traçar uma curva de isossensibilidade exige que o experimento
inclua várias condições de probabilidade sinal/ruído, o que muitas vezes
não é feito, pois isto exige várias sessões experimentais e um número
muito grande de tentativas. Nestas circunstâncias não existem condições
de se testar os pressupostos de distribuição normal e variâncias iguais,
tendo-se que usar um tratamento estatístico que dispense a verificação
destes pressupostos.
PSICOFÌSICA ANIMAL
Aspectos motivacionais
A impossibilidade de usar instruções verbais, muito ao gosto dos
estudiosos da psicofisica humana, leva ao uso de regras de contingência.
O estabelecimento destas regras não é trivial. Tomemos, por exemplo, o
caso de especificação de limiar absoluto. Se é razoável que uma resposta
de detecção na ausência de estímulo seja considerada uma resposta
errada e, portanto, deva não ser reforçada ou até mesmo punida, não é
razoável planejar que a ausência de resposta na presença de um estímulo
fraco seja considerada erro, pois é uma incógnita a magnitude de estímulo
necessária para que ele seja estímulo efetivo. O uso de reforçamento
positivo, ao mesmo tempo que é eficaz em manter o animal engajado na
tarefa, impõe limites ao número de tentativas contidas em uma sessão
experimental, em virtude de saciação do reforçador, o que leva ao cuidado
de que o procedimento otimize a razão tentativas úteis/tentativas totais.
Resposta de observação
A baixa variância dos dados psicofísicos depende de que o animal
esteja atento ao estímulo sensorial e adequadamente posicionado, de
modo que o estímulo entre em contato com o órgão receptor de forma
especificável e constante. Tipicamente uma tentativa é iniciada com a
apresentação de um estímulo que sinaliza a ocasião para a emissão de
uma resposta de observação. Isto significa, por exemplo, no caso de
estímulos visuais, que o procedimento seja tal que o estímulo sensorial só
será apresentado se o animal estiver com a cabeça posicionada de uma
maneira determinada, para assegurar que os olhos estejam a uma
distância e orientação especificadas em relação ao estímulo. Em um
procedimento típico, a emissão de uma resposta de orientação é condição
para que se inicie o intervalo que pode ou não conter o estímulo sensorial.
A correta emissão da resposta de observação é reforçada com um
estímulo arbitrário que também exerce a função de sinalizar o início de um
intervalo de apresentação de estímulo. A topografia desta resposta
depende de variáveis próprias do experimento, como a espécie animal, a
modalidade e a dimensão de estímulo em estudo.
Controle de estímulo da resposta de detecção
O procedimento precisa incluir salvaguardas para que não existam
outras variáveis, além do próprio estímulo sensorial em estudo, exercendo
o papel de sinalizadores para a ocorrência da resposta de detecção. A
própria existência de uma sinalização para a ocorrência do estímulo sen-
sorial pode propiciar a ocorrência de respostas indevidas de detecção. Um
animal pode estimar o intervalo de tempo entre eventos relevantes e con-
venientemente espaçar suas respostas de forma a maximizar a obtenção
de reforços. Embora esta afirmação costume soar como um exagero para
aqueles não familiarizados com o estudo de aprendizagem animal, ela está
fartamente documentada na literatura especializada. Salvaguardas típicas
para impedir esta possível estratégia de resposta são: tornar variáveis o
tempo entre a emissão da resposta de observação e a apresentação do
estímulo sensorial e o tempo entre a resposta de detecção e o início da
tentativa seguinte; punir respostas de observação e respostas de detecção
na ausência de seus respectivos estímulos sinalizadores com um timeout,
punir respostas de detecção com tempo de reação inferior ao mínimo
necessário, considerando o que se conhece sobre tempo mínimo de
resposta.
Os controles acima são necessários, mas ainda não suficientes. Por
exemplo, um switch que aciona um tom pode conter transientes audíveis,
fazendo com que a ocorrência do estímulo seja detectável independente-
mente de sua intensidade e, em conseqüência, o animal seja reforçado
pela detecção desses transientes, o que pode levar o pesquisador a
concluir pela sua supersensibilidade. Uma forma de controlar isto é
introduzir pseudotentativas nas quais tudo ocorre como em uma tentativa
regular, exceto que o estímulo é apresentado em uma magnitude aberran-
temente distanciada da faixa de sensibilidade conhecida para a espécie.
O uso de pseudotentativas propicia uma forma de monitorar a qualidade
do desempenho do animal. A porcentagem de respostas a estas tentativas
pode ser usada para decidir sobre a confiabilidade dos dados. As res-
postas a pseudotentativas, dentro de um referencial de teoria de detecção
de sinal, podem ser um indicador de critério de resposta. Assim, um animal
conservador terá uma baixa proporção de respostas a estas tentativas e
um limiar mais alto; um animal menos conservador terá uma proporção
mais alta de respostas a estas tentativas e um limiar mais baixo. Um
controle sobre este critério de resposta pode ser tentado via manipulação
da especificação do timeout.
PSICOFÌSICA DA CRIANÇA
Psicofisica do feto
A pesquisa sobre a ontogenèse das sensações tem, obviamente, um
interesse especial na descrição de quando se inicia o responder a estí-
mulos nas diferentes modalidades sensoriais. Há várias evidências bem
estabelecidas de que as crianças já nascem com competência para detec-
tar uma série de estímulos ambientais. Vide, por exemplo, revisão de
Cowart (1981), na área de sentidos químicos, e de Reisman (1987), na área
de somatossentidos. Assim sendo, o surgimento dessa competência
precisa ser buscado no feto, um empreendimento problemático pela
inacessibilidade relativa do observador psicofisico.
Observação extra-uterina do feto
Uma abordagem encontrada na literatura mais antiga é o estudo de
fetos não-viáveis e com poucas horas de vida após o aborto. Estes
estudos, necessariamente muito primitivos, se concentraram na obser-
vação da presença ou não de reflexos (vide revisão de Reisman, 1987) e
mostraram respostas bastante precoces a estímulos táteis aplicados à
face. Dadas as circunstâncias de coleta de dados, a disponibilidade e
interpretação de dados são muito problemáticas.
Observação intra-uterina do feto
Birnholtz e Bernacerraf (1983) mostraram que a ultra-sonografiafetal
permite a observação de atividade muscular fetal em resposta a sons
apresentados extra-uterinamente. Esta técnica contém uma série de
limitações relacionadas a especificação de estímulo sensorial e a repertório
comportamental disponível. No presente momento permite informações
apenas de natureza qualitativa, embora o caráter não-invasivo e a disso-
ciação de condições patológicas imprimam, em princípio, maior garantia de
validade dos dados obtidos. A técnica é promissora especialmente para o
estudo da modalidade auditiva, mas ainda não se transformou em uma
rotina de pesquisa. Na área dos sentidos químicos, uma possibilidade
sugerida em Cowart (1981) é a observação de movimentos de deglutição
em resposta a alteração na composição do líquido amniotico, produzida
pela introdução de substâncias químicas na cavidade intra-uterina, através
de sonda.
Psicofisica do Infante
Procedimentos baseados em atividade geral fisiológica e comportamental
Alterações em medidas como padrão do ciclo de sono, taxa de bati-
mento cardíaco, padrão de respiração, nível de várias substâncias na cor-
rente sangüínea têm sido usados para o estudo das sensações, embora
sejam mais encontrados em estudos mais antigos. Schneider, Trehub e
Bull (1979) fizeram uma análise comparando os resultados de experimen-
tos sobre limiar auditivo em recém-nascidos usando uma variedade de
respostas e encontraram grandes discrepâncias nos dados, argumentando
pela sua baixa confiabilidade. Reisman (1987), fazendo uma revisão de
pesquisas sobre dor em bebês circuncidados, também encontrou dificul-
dades na interpretação dos dados com essa categoria de medida. Estudos
sensoriais baseados em atividade fisiológica e comportamental gerais,
rigorosamente falando, nem se classificam como estudos psicofísicos; sua
inclusão aqui é, muito mais, uma chamada de atenção para a precariedade
metodológica no estudo da ontogenèse das sensações.
Procedimentos baseados em respostas específicas de orientação
A criança recém-nascida e até aproximadamente de quatro meses
de idade tem sido pesquisada com procedimentos principalmente basea-
dos em seu repertório de reflexos incondicionados. A observação da
ocorrência de respostas incondicionadas à apresentação de estímulos
específicos permite afirmar que a criança detecta o estímulo, mas não tem
permitido fazer afirmações confiáveis a respeito de valores mínimos de
estímulo necessários para que ocorra uma sensação. Estes reflexos
também estão sujeitos a habituação, ou seja, sua apresentação repetida
leva ao enfraquecimento e eventual desaparecimento da resposta, fazendo
com que um experimento tenha que se limitar a um pequeno número de
observações. Esta limitação não é facilmente contornada pela repetição do
experimento a intervalos consideráveis na mesma criança, não só porque
o repertório de respostas vai se alterando como porque os próprios
sistemas sensoriais estão em desenvolvimento. O experimentador costuma
então recorrer à análise de dados de grupo, o que é contrário à tradição
psicofisica de privilegiar delineamentos intra-sujeito e análise de dados
individuais. Algumas destas respostas específicas vêm sendo estudadas
sistematicamente, razão pela qual são identificadas a seguir.
Método do olhar preferencial
Este método, creditado a Fantz e Berlyne, que o desenvolveram
simultânea e independentemente, é baseado na tendência observada em
crianças pequenas de fixar o olhar em um estímulo visual com padrão e de
não fixar o olhar em um estímulo liso, em uma situação de escolha. Tipica-
mente, são registrados dados referentes à direção da primeira fixação,
número de fixações e tempo de fixação em cada estímulo. Interpreta-se
que a criança detecta um padrão visual se a ele corresponder maior
freqüência e duração de fixação do olhar. Do método do olhar preferencial
surgiu uma variante, o método do olhar preferencial de escolha forçada,
atribuído a Teller. Neste segundo método, um observador adulto é colo-
cado em uma posição na qual pode observar os olhos da criança, mas não
os estímulos sendo apresentados. A tarefa do observador é julgar a loca-
lização do padrão com base na observação do olhar da criança, sendo-lhe
permitido escolher o(s) aspecto(s) do olhar da criança que julgar mais
¡nformativo(s). Se o julgamento de localização do observador for estatisti-
camente diferente de desempenho aleatório, interpreta-se que a criança
detecta o padrão (Banks, Dannemiller, 1987).
Habituação
Habituação é mais do que um método; é um paradigma a partir do
qual uma série de métodos específicos emergiram, adaptados para moda-
lidades diferentes de estímulo. Baseia-se no fato de que, quando um
estímulo novo é apresentado, o organismo emite uma resposta de orien-
tação. Com a manutenção do estímulo ou sua apresentação repetida a
curtos intervalos de tempo há um decréscimo e eventual desaparecimento
da resposta. Sendo o estímulo alterado (novo estímulo apresentado), a
resposta de orientação reaparece. Assim, por exemplo, estímulos visuais
novos geram uma exploração visual que tende a desaparecer com a
manutenção do estímulo, mas reaparece com a troca do estímulo por um
novo; estímulos auditivos geram uma resposta de virada de cabeça em
direção ao som, a qual tende a desaparecer com manutenção do estímulo.
Este paradigma inclui também fenômenos em que a resposta de orienta-
ção envolve a inibição de uma atividade em andamento. Por exemplo, a
resposta de sucção é interrompida com a apresentação de um som; a ini-
bicão da sucção habitua-se reinstalando-se a sucção com a manutenção
do estímulo auditivo, mas a apresentação de estímulo auditivo diferente
reinstala a inibição. A interpretação costumeira dos dados é que se ocorrer
desabituação, então os estímulos envolvidos são discrimináveis. O leitor
pode consultar Dodwell, Humphrey e Muir (1987) para exemplos detalha-
dos do uso do paradigma ao estudo da percepção visual de padrões.
Varredura visual
O método é baseado no fato de que, quando as pessoas exploram
visualmente imagens, a varredura da imagem segue padrões característi-
cos (Dodwell, Humphrey e Muir, 1987), e a análise destes padrões de
varredura deveriam informar sobre aspectos do estímulo visual aos quais
a pessoa responde. Dodwell e colaboradores alertam que a implementação
deste método em crianças é bastante complexa, do ponto de vista técnico.
Bergamasco (1992) observa que, devido à imaturidade de fotorreceptores
em uma faixa precoce de idade, a melhor imagem visual pode não corres-
ponder à visão foveal, o que dificulta a interpretação do dado tipicamente
analisado com o uso deste método. Feitas estas ressalvas, o método é útil
para o estudo de percepção de forma e de padrão.
Expressões faciais
Uma abordagem adicional tem sido a de caracterizar a relação entre
tipos de estímulo e tipos de topografia de resposta. Nesta abordagem,
quando aplicada ao estudo da gustação, o experimentador pretende carac-
terizar a relação entre topografias específicas de movimentos da face,
incluindo lábios e língua, a concentrações e qualidades de substâncias
químicas aplicadas à boca. Uma análise num nível ainda mais molecular
na área de gustação envolve dissecar as características do comportamento
de ingestão de líquidos, identificando separadamente aspectos como
número de jorros de ingestão, duração dos jorros de ingestão, pausas
entre jorros, volume ingerido, etc. Uma preocupação central nestas
microanálises é a viabilidade de dissociar aspectos estritamente sensoriais
de aspectos hedônicos da resposta ao estímulo químico (Crook, 1987).
Sugar de alta amplitude
Diferencia-se o uso de um procedimento baseado na resposta de
sugar, originalmente proposto para o estudo da visão e posteriormente
adaptado por Eimas e colaboradores (1971) para o estudo da audição. O
que se segue é uma descrição baseada em Patricia Kuhl (1987) represen-
tativa do uso contemporâneo deste procedimento, chamado de sugar de
alta amplitude. Dá-se à criança uma chupeta que contém, internamente,
um transdutor de pressão. Desta forma monitora-se a ocorrência e a
magnitude da resposta de sugar. Respostas de sugar de magnitude acima
de um critério são reforçadas com a apresentação de um som. O som é
mantido até que ocorra habituação da resposta, de acordo com um certo
critério de redução. Ocorrida a habituação, o som é mudado. A mudança
no som gera desabituação da resposta. A desabituação é interpretada
como indicador da discriminabilidade dos dois sons.
Kuhl aponta algumas limitações deste método: a) não separa
convincentemente variáveis sensoriais de variáveis de atenção e moti-
vação pelo estímulo; b) exige tratamento grupai de dados; c) crianças
acima de 4 meses não demonstram interesse pela tarefa, o que limita seu
uso para estudos longitudinais. Não obstante, parece ser o método
disponível mais confiável e com resultados mais consistentes para o
estudo da audição de crianças até os 4 meses.
CONCLUSÕES
MEDIDA PSICOMETRIA
Luiz Pasquali
H
á cerca de 20 anos, Guttman (1971) ainda se interrogava o que
exatamente significava "medida" em ciências sociais e do com-
portamento. Embora, nestas ciências, aparecessem correntes os
termos sociometría, antropometria, biometria, psicometria, econometria e
outras 'metrias', continuavam dúvidas sobre sua significação no campo
da epistemologia e da metodologia. Os vários prefixos das "...metrias"
evidentemente revelavam a área de conteúdo em que a medida era
aplicada. Assim, psicometria seria o uso da medida em Psicologia.
Traço latente
O conceito de traço latente não é isento de ambigüidades e
controvérsias entre os autores que trabalham com tal construto. A
variedade de expressões utilizadas para representá-lo já indica tal
dificuldade. Traço latente vem referido sob denominações como: variável
hipotética, variável fonte, fator, construto, conceito, estrutura psíquica, traço
cognitivo, processo cognitivo, processo mental, estrutura mental, habilida-
de, aptidão, traço de personalidade, processo elementar de informação,
componente cognitivo, tendência e outros. A própria natureza ontológica
de traço latente deixa dúvidas se ele é concebido como um rótulo,
representando uma síntese hipotética de um conjunto de comportamentos
reais, ou como uma realidade mental. Para este autor, o conceito faz mais
sentido quando entendido como realidade na concepção popperiana de
que é real aquilo que age sobre coisas consideradas reais, como as coisas
físicas materiais: "Deve-se então admitir que as entidades reais podem ser
concretas ou abstratas em vários graus. Em Física, aceitamos forças e
campos de força como reais, pois agem sobre coisas materiais. Mas essas
entidades são mais abstratas e, talvez, também mais conjeturáis ou
hipotéticas do que são as coisas materiais comuns. Forças e campos de
força são ligados a coisas materiais, a átomos e a partículas. Têm um
caráter dispositivo: são tendências para interagir. Podem assim ser
descritas como entidades teóricas altamente abstratas, nós as aceitamos
como reais, quer elas ajam de forma direta ou indireta sobre as coisas
materiais." (Popper, Eccles, 1977, p.27-28).
Além desta controvérsia, existem diferentes maneiras de conceber
traço latente quando se trata de definir sua estrutura elementar. Na
verdade, há aqui duas tendências distintas e em vários níveis: concepção
elementarista (reducionista) e concepção estrutural, conforme detalhado
na Figura 3-1.
Fig. 3-1 — Visões elementarista e estrutural de traço latente.
Sistema
O sistema representa o objeto de interesse, chamado também de
objeto psicológico. A psicometria enfoca como seu objeto específico as
estruturas latentes, os traços psicológicos; ela teoriza a partir destas
estruturas hipotéticas. Deste enfoque, evidentemente, surgem dificuldades,
dado que a ciência empírica, dentro da qual a Psicologia se define, tem
como objeto de conhecimento os fenômenos naturais abordados através
da observação, que, no caso da Psicologia, é o comportamento. Este
problema será abordado na seção da representação comportamental da
estrutura latente. Aqui é relevante salientar que a psicometria trabalha com
a teoria dos traços latentes, sendo, portanto, as estruturas psicológicas
latentes o seu objeto ou sistema direto de interesse. O sistema pode ser
considerado de vários níveis, dependendo do interesse do pesquisador.
Poder-se-ia falar de um sistema universal e de sistemas locais. O
universal sendo a estrutura psicológica total do ser humano, e os sistemas
locais, os vários subsistemas de interesse. Assim, a inteligência pode ser
considerada um subsistema dos processos cognitivos, e estes, da estrutura
latente geral; ou mesmo, a inteligência, digamos, verbal, pode ser conside-
rada um sistema quando ela for o interesse imediato e na qual vários
aspectos podem ser considerados, como a compreensão verbal e a
fluencia verbal. Sistema, portanto, constitui-se como tal quando representa
o objeto imediato de interesse dentro de um delineamento de estudo e não
é uma entidade ontológica, monolítica e unívoca.
Propriedade
Um sistema apresenta atributos que são os vários aspectos ou as
propriedades que o caracterizam. Por exemplo, o sistema físico se
apresenta com os atributos de massa, comprimento, etc. Similarmente, a
psicometria concebe os seus sistemas como possuidores de proprieda-
des/atributos que definem os mesmos, sendo estes atributos o foco
imediato de observação/medida. Assim, a estrutura psicológica apresenta
atributos do tipo processos cognitivos, processos emotivos, processos
motores, etc. A inteligência, como subsistema, pode apresentar atributos
de tipo raciocínio verbal, raciocínio numérico, etc. O sistema se constitui
como objeto hipotético que é abordado (conhecido) através da pesquisa
de seus atributos.
Magnitude
A psicometria assume, ainda, que estes atributos psicológicos
apresentam magnitude: os atributos são dimensões, isto é, são mensurá-
veis. Trata-se do conceito de quantidade: os atributos ocorrem com quan-
tidades definidas e diferentes de indivíduo para indivíduo. Quantidade é um
conceito matemático que se define em função dos axiomas de ordem e de
aditividade dos números: os números não somente são diferentes, mas
uns são maiores que outros, de sorte que eles podem ser ordenados numa
série monotônica crescente de magnitude. Ao se falar de magnitude dos
atributos empíricos, quer se referir, pelo menos, a esta propriedade numé-
rica de ordem crescente. Digo pelo menos, porque nem sempre é possível
salvar na medida o axioma da aditividade que implica a possibilidade de
concatenação, resultando em medida de nível intervalar ou de razão. Aliás,
é esta suposição de magnitude das propriedades psicológicas que torna
interessante a utilização do modelo matemático no estudo dos fenômenos
de que trata a Psicologia.
80 a 100 V 10%
60 a 80 IV 20%
40 a 60 III 40%
20 a 40 II 20%
0 a 20 I 10%
O índice D tem que ser positivo, e quanto maior for, mais discrimi-
nativo será o item. Obviamente, um D nulo ou negativo demonstra ser o
item não-discriminativo.
• O teste "t"
Um índice de discriminação mais exato, embora mais laborioso de
se conseguir, consiste na análise da diferença entre as médias obtidas
pelos grupos superior e inferior. Neste caso, é necessário o cálculo das
respectivas médias e de suas variâncias. O nível de significancia do teste
't' pode ser verificado com exatidão em tabelas estatísticas próprias.
• Coeficientes de correlação
O coeficiente phi trabalha com dados dicotômicos, numa tabela de
quatro cáselas, e produz um valor que vai de -1 a +1, como qualquer
coeficiente de correlação. O cálculo deste coeficiente pode ser conseguido
através das tabelas de Jurgensen (1947), para o caso em que o número de
sujeitos for o mesmo nos dois grupos de sujeitos, ou das tabelas de
Edgerton (I960), para o caso deste número ser diferente.
O coeficiente bisserial de correlação (rb) utiliza as médias dos
escores dos sujeitos que passaram ou que não passaram o item. Os livros
de estatística apresentam várias formas de cálculo deste coeficiente
(Guilford, Fruchter, 1973).
O cálculo do índice de discriminação com base no escore total do
teste apresenta um problema teórico. Na verdade, procura-se analisar a
adequação do item (em termos de discriminação) baseada nas infor-
mações obtidas de todo o elenco de ¡tens (escore total). Tal procedimento
parece incongruente, dado que a adequação dos demais itens também está por
ser demonstrada, inclusive a esta altura das análises do teste ainda não se sabe
se os itens do teste são homogêneos, isto é, se o teste é unidimensional,
suposição necessária para se poder obter um escore total. Tenta-se resolver
este problema procedendo-se a uma análise fatorial dos itens antes da própria
análise individual dos mesmos.
3) Item Response Theory (IRT ou ICC)
Esta teoria de análise dos itens possui uma longa história (desde os anos
50), mas só bem recentemente está sendo utilizada praticamente, dadas as
dificuldades das análises estatísticas envolvidas que exigem o poder de
avançados softwares e micros de certo porte. AIRT é uma teoria estatística, mas
de utilização direta na psicometria, inclusive com grandes vantagens sobre
outros métodos tradicionais de análise de itens.
Os modelos matemáticos envolvidos nesta teoria são bastante
complexos e, embora seu conhecimento constitua uma grande vantagem, não
parece ser indispensável seu domínio para uso inteligente por parte do usuário.
A compreensão da sua lógica, entretanto, é indispensável.
Primeiramente, há vários modelos matemáticos envolvidos na IRT. Na
verdade, há três deles principais, dependendo do número de parâmetros que
pretendem avaliar dos itens. Os parâmetros em questão são a dificuldade, a
discriminação e a resposta aleatória (ou melhor, a resposta correta dada ao
acaso). Assim, temos o modelo logístico de 1, 2 ou 3 parâmetros.
Todos os modelos trabalham com traços latentes, isto é, teorizam sobre
as estruturas latentes, como faz a teoria psicométrica. Entendem os sistemas
psicológicos latentes como possuindo dimensões, isto é, propriedades de
diferentes magnitudes ou mensuráveis. Por isso, esta teoria também é
conhecida como a teoria do traço latente ou a teoria da curva característica do
item {¡tem characteristic curve - ICC). A teoria supõe que o sujeito possui um
certo nível de magnitude do traço latente, designado por theta (0), o qual é
determinado através da análise das respostas dos sujeitos por meio de diversas
funções matemáticas. A função do modelo completo de três parâmetros é:
mas corta, por exemplo, o eixo dos X, indicando que o teste como um todo
é mais difícil para a amostra indicada neste eixo (vide Figura 3-5). Os itens
mais difíceis para uma ou outra amostra aparecem indentados em direção
ao eixo da amostra para a qual tais itens são particularmente difíceis.
Assim, por exemplo, o item # 1 é mais difícil para a amostra A, sendo o item
#2 mais difícil para a amostra B.
Uma grande vantagem do enfoque da IRT neste particular consiste
em possibilitar a descoberta das causas de desvio de certos ¡tens (o fato
de serem mais difíceis para uma amostra do que para outra) e, assim, se
poder corrigir esta causa e tentar recuperar o item para o teste (Ellis, 1991).
b) A resposta ao acaso
Os fatores que determinam a resposta ao acaso não são determiná-
veis, pois são, por definição, aleatórios. Tal ocorrência pode ser devido a
Fig. 3-5 — Distribuição dos b de duas amostras.
Validade
Costuma-se definir a validade de um teste dizendo que ele é válido se de
fato mede o que supostamente deve medir. Embora esta definição pareça uma
tautologia, na verdade ela não é, considerada a teoria psicométrica exposta
acima. O que se quer dizer com esta definição é que, ao se medirem os
comportamentos (itens), que são a representação do traço latente, está-se
medindo o próprio traço latente. Tal suposição é justificada se a representação
comportamental for legítima. Esta legitimação somente é possível se existir uma
teoria prévia do traço que fundamente que a tal representação comportamental
constitui uma hipótese dedutível desta teoria. A validade do teste (este
constituindo a hipótese), então, será estabelecida pela testagem empírica da
verificação da hipótese — pelo menos, esta é a metodologia científica. Assim,
fica muito estranha a prática corrente na psicometria de se agrupar intuitiva-
mente uma série de itens e, a posteriori, verificar estatisticamente o que eles
estão medindo. A ênfase na formulação da teoria sobre os traços tem sido muito
fraca no passado; com a influência da Psicologia Cognitiva, esta ênfase
felizmente está voltando ou deverá voltar ao seu devido lugar na psicometria.
A validação da representação comportamental do traço, isto é, do teste,
embora constitua o ponto nevrálgico da psicometria, apresenta dificuldades
importantes que se situam em três níveis ou momentos do processo de
elaboração do instrumento: o nível da teoria, a coleta empírica da informação e
a própria análise estatística da informação.
No nível da teoria se concentram talvez as maiores dificuldades. Na
verdade, a teoria psicológica se encontra ainda em estado embrionário,
destituída quase que totalmente de qualquer nível de axiomatização, resultando
disto uma pletora de teorias, muitas vezes até contraditórias. Basta lembrar de
teorias como behaviorismo, psicanálise, psicologia existencialista, psicologia
dialética e outras, que postulam princípios irredutíveis entre as várias teorias e
pouco concatenados dentro de uma mesma teoria ou, então, em número
insuficiente para se poder deduzir hipóteses úteis para o conhecimento
psicológico. Havendo esta confusão no campo teórico dos construtos, torna-se
extremamente difícil para o psicometrista operacionalizar estes mesmos
construtos, isto é, formular
hipóteses claras e precisas para testar ou, então, formular hipóteses
psicologicamente úteis. Ainda quando a operacionalização for um sucesso, a
coleta da informação empírica não é ¡senta de dificuldades, como, por exemplo,
a definição inequívoca de grupos critérios onde estes construios possam ser
idealmente estudados. Mesmo no nível das análises estatísticas encontramos
problemas. Pela lógica da elaboração do instrumento, a verificação da hipótese
da legitimidade da representação dos construtos se faz pela análise fatorial
(confirmatoria), que procura identificar, nos dados empíricos, os construtos
previamente operacionalizados no instrumento. Acontece que a análise fatorial
faz algumas postulações fortes que nem sempre se coadunam com a realidade
dos fatos. Por exemplo, a análise fatorial assume que as respostas dos sujeitos
aos itens do instrumento são determinadas por uma relação linear destes com
os traços latentes. Todos os métodos atuais de análise fatorial postulam esta
relação linear. Há, ainda, o grave problema da rotação dos eixos, a qual permite
a demonstração de um número sem fim de fatores para o mesmo instrumento.
Diante destas dificuldades, os psicometristas recorrem a uma série de
técnicas para viabilizar a demonstração da validade dos seus instrumentos.
Fundamentalmente, estas técnicas podem ser reduzidas a três grandes classes:
técnicas que visam à validade de construto, validade de conteúdo e validade de
critério (APA, I954).
Validade de construto
A validade de construto ou de conceito é considerada a forma mais
fundamental de validade dos instrumentos psicológicos — e com toda a razão,
dado que ela constitui a maneira direta de verificar a hipótese da legitimidade da
representação comportamental dos traços latentes e, portanto, se coaduna
exatamente com a teoria psicométrica. Historicamente, o conceito de construto
entrou na psicometria através da APA Committee on Psychological Tests, que
trabalhou de 1950 a 1954 e cujos resultados se tornaram as recomendações
técnicas para os testes psicológicos (APA, 1954).
O conceito de validade de construto foi elaborado com o já clássico
artigo de Cronbach e Meehl (1955) "Construct validity in psychological tests",
embora o conceito já tivesse uma história sob outros nomes, tais como validade
intrínseca, validade fatorial e até validade aparente (face validity). Estas várias
terminologias demonstram a confusa noção que construto possuía. Embora
tenham tentado clarear o conceito de validade de construto, Cronbach e Meehl
ainda o definem como a característica de um teste enquanto mensuração de um
atributo ou qualidade, o qual não tenha sido "definido operacionalmente".
Reconhecem, entretanto, que a validade de construto reclama por um novo
enfoque científico. De fato, definir esta validade do modo que eles definiram
parece um pouco estranho em ciência, dado que conceitos não definidos
operacionalmente
não são suscetíveis de conhecimento científico. Conceitos ou construios são
cientificamente pesquisáveis somente se forem, pelo menos, passíveis de
representação comportamental adequada; do contrário, serão conceitos
metafísicos e não científicos. O problema é que os autores, sintetizando, aliás, a
atitude geral dos psicometristas da época, para definir validade de construto,
partiram do teste, isto é, da representação comportamental, em vez de partir da
teoria psicométrica que se fundamenta na elaboração da teoria do construto
(dos traços latentes). O problema não é descobrir o construto a partir de uma
representação existente (teste), mas sim descobrir se a representação (teste)
constitui uma representação legítima, adequada do construto. Este enfoque
exige uma colaboração, bem mais estreita do que existe, entre psicometristas e
Psicologia Cognitiva.
A validade de construto de um teste pode ser trabalhada sob dois
ângulos: a análise da representação comportamental do construto e a análise
por hipótese.
1) A análise da representação
São utilizadas duas técnicas como demonstração da conformidade da
representação do construto: a análise fatorial e a análise da consistência
interna.
A análise da consistência interna consiste essencialmente em verificar a
homogeneidade dos itens que compõem o teste. Assim, o escore total no teste
se torna o critério de decisão, e a correlação entre cada item e este escore total
decide a qualidade do item: sendo alta a correlação, o item é retido. O índice
alpha (a) de Cronbach é tipicamente utilizado como indicador sumário da
consistência interna do teste e, conseqüentemente, dos itens que o compõem.
Há alguns problemas com esta técnica como demonstração da
conformidade da representação do construto. Primeiramente, o escore total
constitui uma dificuldade, dado que ele somente faz sentido se o teste já é, a
priori, homogêneo. Assim, a correlação de cada item com o escore total já
pressupõe que os itens são somáveis, isto é, homogêneos; em outras palavras,
se pressupõe que todos os itens sejam uma representação do mesmo traço
(unidimensionalidade). Por outro lado, a intercorre-lação entre os itens não é
uma demonstração de que estes estejam medindo um e mesmo construto.
Suponha a situação de três itens saturados em três fatores, como segue:
Validade de critério
Concebe-se como validade de critério de um teste o grau de eficácia
que ele tem em predizer um desempenho específico de um sujeito. O
desempenho do sujeito torna-se, assim, o critério contra o qual a medida
obtida pelo teste é avaliada. Evidentemente, o desempenho do sujeito
deve ser medido/avaliado através de técnicas que são independentes do
próprio teste que se quer validar.
Costuma-se distinguir dois tipos de validade de critério: 1 ) validade
preditiva e 2) validade concorrente. A diferença fundamental entre os dois
tipos é basicamente uma questão do tempo que ocorre entre a coleta da
informação pelo teste a ser validado e a coleta da informação sobre o
critério. Se estas coletas forem simultâneas (mais ou menos), a validação
será de tipo concorrente; caso os dados sobre o critério sejam coletados
após a coleta da informação sobre o teste, fala-se em validade preditiva.
O fato de a informação ser obtida simultaneamente ou posteriormente à do
próprio teste não é um fator tecnicamente relevante à validade do teste;
relevante, sim, é a determinação de um critério válido. Aqui se situa
precisamente a natureza central deste tipo de validação dos testes: 1)
definir um critério adequado e 2) medir, válida e independentemente do
próprio teste, este critério.
Quanto à adequação dos critérios, pode-se afirmar que há uma
série destes que são normalmente utilizados, quais sejam:
1) Desempenho acadêmico
Talvez seja o critério mais utilizado na validação de testes de
inteligência. Consiste na obtenção do nível de desempenho escolar dos
alunos, seja através das notas dadas pelos professores, seja pela média
acadêmica geral do aluno, seja pelas honrarías acadêmicas que o aluno
recebeu, ou seja mesmo pela avaliação puramente subjetiva dos alunos
em termos de "inteligente" por parte dos professores ou colegas. Embora
seja amplamente utilizado, este critério tem igualmente sido amplamente
criticado, não em si mesmo, mas pela deficiência que ocorre na sua
avaliação. É sobejamente sabida a tendenciosidade por parte dos profes-
sores em atribuir as notas aos alunos, tendenciosidade nem sempre
consciente, mas decorrente de suas atitudes e simpatias em relação a este
ou aquele aluno. Esta dificuldade poderia ser sanada até com certa
facilidade, se os professores tivessem o costume de aplicar testes de ren-
dimento que possuíssem validade de conteúdo, por exemplo. Como esta
tarefa é dispendiosa, o professor tipicamente não se dá ao trabalho de
validar (validade de conteúdo) suas provas acadêmicas.
Neste contexto, é também utilizado como critério de desempenho
acadêmico o nível escolar do sujeito: sujeitos mais avançados, repetentes
e evadidos — a suposição sendo de que quem continua regularmente ou
está avançado em termos de sua idade possui mais habilidade. Evidente-
mente, nesta história não entra somente a questão da habilidade, mas
muitos outros fatores sociais, de personalidade, etc, tornando este critério
bastante ambíguo e espúrio.
2) Desempenho em treinamento especializado
Trata-se do desempenho obtido em cursos de treinamento em
situações específicas, como no caso de músicos, pilotos, atividades
mecânicas ou eletrônicas especializadas, etc. No final deste treinamento
há tipicamente uma avaliação, a qual produz dados úteis para servirem de
critério de desempenho do aluno.
3) Desempenho profissional
Trata-se, neste caso, de comparar os resultados do teste com o
sucesso/fracasso ou o nível de qualidade do sucesso dos sujeitos na
própria situação de trabalho. Assim, um teste de habilidade mecânica pode
ser testado contra a qualidade de desempenho mecânico dos sujeitos na
oficina de trabalho. Evidentemente continua a dificuldade de levantar ade-
quadamente a qualidade deste desempenho em serviço dos sujeitos.
4) Diagnóstico psiquiátrico
Muito utilizado para validar testes de personalidade/psiquiátricos. Os
grupos-critério são aqui formados em termos da avaliação psiquiátrica:
normais vs. neuróticos, psicópatas vs. depressivos, etc. Novamente, a difi-
culdade continua sendo a adequação das avaliações psiquiátricas feitas
pelos psiquiatras.
5) Diagnóstico subjetivo
Avaliações feitas por colegas e amigos podem servir de base para
estabelecer grupos-critério. É utilizada esta técnica sobretudo em testes
de personalidade, onde é difícil encontrar avaliações mais objetivas. Assim,
os sujeitos avaliam seus colegas em categorias ou dão escores em traços
de personalidade (agressividade, cooperação, etc), baseados na convi-
vência que eles têm com os colegas. Nem precisa mencionar as dificulda-
des enormes que tais avaliações apresentam em termos de objetividade;
contudo, a utilização de um grande número de juizes poderá diminuir os
vieses subjetivos nestas avaliações.
6) Outros testes disponíveis
Os resultados obtidos através de outro teste válido que meça o
mesmo construto que o teste a ser validado servem de critério para deter-
minar a validade do novo teste. Aqui fica a pergunta óbvia: para que criar
outro teste, se já existe um que mede validamente o que se quer medir? A
resposta se baseia numa questão de economia: utilizar um teste que
demanda muito tempo para ser respondido ou apurado como critério para
validar um teste que gaste menos tempo.
Todos estes critérios podem ser considerados bons e úteis para fins
de validação de critério. A grande dificuldade em quase todos eles se situa
na demonstração da adequação da medida deles: em geral, a medida dos
mesmos é precária, deixando, por isso, muita dúvida quanto ao processo
de validação do teste. Entretanto, há exemplos famosos de testes vali-
dados através deste método, como é o caso do MMPI.
Validade de conteúdo
Um teste tem validade de conteúdo se ele constitui uma amostra
representativa de um universo finito de comportamentos (domínio); é
aplicável quando se pode delimitar a priorie claramente um universo de
comportamentos, como é o caso em testes de desempenho, que preten-
dem cobrir um conteúdo delimitado por um curso específico.
Para viabilizar um teste com validade de conteúdo, é preciso que se
façam as especificações do teste antes da construção dos itens. Estas
especificações comportam a definição de três grandes temas: 1) definição do
conteúdo, 2) explicitação dos processos psicológicos (os objetivos) a serem
avaliados e 3) determinação da proporção relativa de representação no teste de
cada tópico do conteúdo.
Quanto ao conteúdo, trata-se de detalhá-lo em termos de tópicos e
subtópicos e de explicitar a importância relativa de cada tópico dentro do teste.
Tais procedimentos evitam a super-representação indevida de alguns tópicos e
sub-representação de outros por vieses e pendores pessoais do avaliador. Claro
que será sempre o avaliador ou equipe de avaliadores quem vai definir este
conteúdo e a relativa importância de suas partes, mas esta definição deve ser
tomada antes da construção dos itens, garantindo certa objetividade, pelo
menos, nas decisões.
Quanto aos objetivos, um teste não deve ser elaborado para avaliar
exclusivamente um processo. Como na aprendizagem entram em ação vários
processos psicológicos, há interesse que todos eles sejam avaliados por um
teste de conteúdo. Por exemplo, o teste deverá conter itens que avaliam a
memória (reproduzir), a compreensão (conceituar, definir), a capacidade de
comparação (relacionar) e de aplicação dos princípios aprendidos (solucionar
problemas, transferência da aprendizagem).
Para facilitar a especificação do teste, pode-se utilizar uma tabela de
dupla entrada, com o detalhamento dos objetivos (processos) no topo e o
detalhamento dos tópicos à esquerda, explicitando, no corpo da tabela, o
número de itens, conforme Tabela 3-4.
Total 8 6 10 24
Precisão (fidedignidade)
O problema que se enquadra sob o conceito de fidedignidade vem
relatado sob uma série de outras denominações, como precisão, fidedignidade,
constância, consistência interna, confiabilidade, estabilidade, confiança,
homogeneidade. As mais genéricas e, por isso, as mais utilizadas são precisão
e fidedignidade.
Estas diferentes designações mostram a variabilidade de conceitos que
precisão assume, dependendo do aspecto que este parâmetro quer salientar do
teste. Na verdade, fidedignidade cobre aspectos diferentes de um teste, mas
todos eles se referem a quanto os escores de um sujeito se mantêm idênticos
em ocasiões diferentes; por exemplo, os escores obtidos num tempo 1 e num
tempo 2 para os mesmos sujeitos. Esta ocorrência (identidade dos escores)
evidentemente supõe que o traço que o teste mede se mantenha constante sob
estas diferentes ocasiões, como é suposto ser o caso, por exemplo, na maioria
dos traços de personalidade e de aptidão. Não seria o caso num teste de humor,
porque este traço por natureza varia de momento para outro, e um teste válido
de humor produziria escores necessariamente diferentes. Assim, o conceito de
fidedignidade, na verdade, se refere ao quanto o escore obtido no teste se
aproxima do escore verdadeiro do sujeito num traço qualquer; isto é, a
fidedignidade de um teste está intimamente ligada ao conceito da variância erro,
sendo este definido como a variabilidade nos escores produzida por fatores
estranhos ao construto. Aparece, assim, claro que a fidedignidade de um teste
depende da questão do erro da medida, especificamente do erro produzido pelo
próprio instrumento: quanto o escore produzido pelo teste se distancia do escore
verdadeiro do sujeito no traço em questão, isto é, a valor theta individual na IRT.
Para melhor conceber esta problemática, é preciso se referir à variância
verdadeira e variância erro. Um procedimento de medida qualquer, por exemplo,
os escores em um teste, produz uma variabilidade nos resultados que, em parte,
é provocada pelas diferenças no próprio traço medido entre diferentes sujeitos,
parte pela imprecisão do próprio instrumento e parte, ainda, por uma série de
outros fatores aleatórios. A fidedignidade da medida depende do tamanho da
variância erro, que é precisamente a variabilidade nos resultados provocada por
estes fatores aleatórios e pela imprecisão do instrumento. Expressa mais
positivamente, a fidedignidade de um instrumento diz respeito ao montante de
variância verdadeira que ele produz vis-à-vis a variância erro, isto é, quanto
maior a variância verdadeira e menor a variância erro, mais fidedigno o instru-
mento: um escore preciso é um escore que se aproxima do valor verdadeiro,
expresso estatisticamente pelo erro padrão da medida (tratado mais adiante).
A definição estatística da fidedignidade é feita através da correlação entre
escores de duas situações produzidos pelo mesmo teste. Se o teste é preciso,
esta correlação deve não somente ser significativa, mas se aproximar da
unidade (cerca de 0,90). De fato, uma correlação de 0,70, por exemplo,
expressaria uma comunalidade de apenas 49% entre as duas situações
provocadas pelo mesmo teste nos mesmos sujeitos. Neste caso, a variância
comum, digamos a variância verdadeira, seria menor que a variância erro,
demonstrando que o teste não produz resultados fidedignos,
isto é, o teste não possui precisão. Esta correlação, no caso do parametro de
fidedignidade ou precisão, é referida como o coeficiente de precisão ou de
fidedignidade.
Dependendo da técnica utilizada para demonstração da precisão de um
teste, surgem vários tipos de precisão: teste-reteste, formas paralelas,
consistência interna.
Precisão teste-reteste
Este tipo de precisão consiste em calcular a correlação entre as dis-
tribuições de escores obtidos num mesmo teste pelos mesmos sujeitos em duas
ocasiões diferentes de tempo. A correlação de 1,00 seria obtida se não
houvesse variância erro provocada pelo teste ou outros fatores aleatórios, como
fatores não controlados nos sujeitos ou na situação de testagem. Quanto mais
longo o período de tempo entre a primeira e a segunda testagem, mais chances
haverá de fatores aleatórios ocorrerem, diminuindo o coeficiente de precisão.
Este intervalo de tempo permite a ação dos fatores mencionados por Campbell e
Stanley ( 1%3) sob o tema de fontes de erro devido à história, maturação,
retestagem e às interações entre estes fatores, bem como ao próprio
instrumento. Por isso, vêem-se as graves dificuldades que apresenta este tipo
de análise da fidedignidade de um teste; particularmente grave aparece aqui a
questão da maturação, isto é, se o próprio traço matura (se desenvolve,
modifica), esta análise da precisão torna-se errônea, dada sobretudo a
eventualidade de que a maturação do traço se processe diferencial mente para
os diversos sujeitos testados. Além disso, e particularmente em testes de
aptidão, a testagem constitui um treinamento, e provavelmente diferencial, para
os sujeitos, o que provocará diferenças na retestagem entre os mesmos,
reduzindo novamente o coeficiente de precisão do teste. Para contornar estas
dificuldades, outros tipos de análises foram elaboradas, como a das formas
alternativas ou análise da consistência interna.
Precisão de formas alternativas
Neste caso, os sujeitos respondem a duas formas paralelas do mesmo
teste, e a correlação entre as duas distribuições de escores constitui o
coeficiente de precisão do teste. A condição necessária para que esta análise
seja válida se situa na demonstração de que as amostras de conteúdo (de itens)
em ambas as formas sejam equivalentes, isto é, que os itens possuam níveis
equivalentes de dificuldade e de discriminação em ambas. Estes parâmetros
podem ser facilmente verificados através da IRT; há, contudo, algumas
dificuldades neste tipo de análise: as duas formas são aplicadas em sucessão
imediata, não eliminando assim totalmente o efeito do intervalo de tempo,
resultando na possível introdução de efeitos da história e do treinamento
(prática) obtido ao responder à primeira das formas alternativas; aparece
facilmente um efeito repetitório, dado que os
itens de ambas as formas são similares, produzindo efeitos motivacionais
negativos no responderte. Além disso, não é tarefa fácil construir formas
alternativas, quando a construção de um só teste já é uma tarefa dispendiosa,
razão pela qual poucos testes aparecem no mercado com formas alternativas.
Precisão da consistência interna
As várias técnicas de estabelecer este tipo de precisão visam
verificar a homogeneidade da amostra de itens do teste, ou seja, a
consistência interna do teste. As técnicas mais utilizadas são: duas
metades, Kuder-Richardson e alfa de Cronbach. Todas elas exigem
aplicação do teste em apenas uma única ocasião, evitando totalmente a
questão da constância temporal.
1) Precisão das duas metades
Os sujeitos respondem a um único teste numa única ocasião. O
teste é dividido em duas partes equivalentes, e a correlação é calculada
entre os escores obtidos nas duas metades. Nao é importante como o
teste é dividido em duas metades, conquanto que estas sejam equivalen-
tes. Na prática, contudo, as duas formas mais normalmente utilizadas são
a divisão do teste em primeira metade e segunda metade ou em itens
pares e itens ímpares. Para efetuar esta análise, de fato o teste não
precisa ser homogêneo, isto é, no qual todos os itens medem o mesmo
traço (por exemplo, itens somente verbais ou numéricos); o que é
fundamental é que as duas metades emparelhem itens homogêneos:
verbal com verbal, numérico com numérico, etc.
Neste tipo de precisão, é preciso notar que o cálculo da correlação
se baseia somente na metade do teste. Assim, num teste de 100 itens, a
correlação se basearia somente em 50 itens. Como o número de itens
afeta o tamanho do coeficiente de correlação, é preciso corrigir este
coeficiente para que leve em consideração a extensão total do teste e,
assim, produzir um coeficiente de precisão mais justo para o teste. Esta
correção é feita através da fórmula de Spearman-Brown:
Padronização (normas)
Padronização, em seu sentido mais geral, se refere à necessidade de
existir uniformidade em todos os procedimentos no uso de um teste válido e
preciso: desde as precauções a serem tomadas na aplicação do teste
(uniformidade das condições de testagem, controle do grupo, instruções
padronizadas e motivar os examinandos pela redução da ansiedade) até o
desenvolvimento de parâmetros ou critérios para a interpretação dos resultados
obtidos. Em seu sentido mais técnico de parâmetro psicométrico, a
padronização se refere a este último aspecto, isto é, como interpretar os
resultados.
Um escore bruto produzido por um teste necessita ser contextualizado
para poder ser interpretado. Obter, por exemplo, 50 pontos num teste de
raciocínio verbal e 40 num de personalidade não oferece nenhuma informação.
Mesmo se dissermos que o sujeito acertou 80% das questões
não diz muito, visto que o teste pode ser fácil (80% então seria pouco) ou difícil
(80% então seria muito). Na verdade, qualquer escore deve ser referido a algum
padrão ou norma para adquirir sentido. Uma tal norma permite situar o escore de
um sujeito, permitindo 1) determinar a posição que o sujeito ocupa no traço
medido pelo teste que produziu o tal escore e 2) comparar o escore deste sujeito
com o escore de qualquer outro sujeito. O critério de referência ou a norma de
interpretação é constituído tipicamente por dois padrões: 1) o nível de
desenvolvimento do indivíduo humano (normas de desenvolvimento) e 2) um
grupo padrão constituído pela população típica para a qual o teste é construído
(normas intragrupo).
Normas de desenvolvimento
As normas de interpretação dos escores de um teste baseadas no
desenvolvimento se fundamentam no fato do desenvolvimento progressivo (nos
vários aspectos de maturação psicomotora, psíquica, etc.) pelo qual o indivíduo
humano passa ao longo de sua vida. Neste sentido, são utilizados, como critério
de norma, três fatores: idade mental, série escolar e estágio de
desenvolvimento.
1) A idade mental
Este critério foi criado por Binet e Simon (1905). Estes autores falavam
de nível mental, depois popularizado como idade mental. Binet e Simon
separaram empiricamente uma série de 54 questões/tarefas em 11 níveis de
idade cronológica: 3 a 10 anos (oito níveis), 12, 15 anos e idade adulta. As
questões que eram respondidas corretamente pela média de crianças/sujeitos
de uma idade cronológica X definiam o nível/idade mental correspondente a esta
idade cronológica. Assim, a um sujeito que respondia a todas as questões que
as crianças de 10 anos eram capazes de responder era atribuída a idade mental
de 10 anos.
Na adaptação norte-americana da escala de Binet-Simon, a Stanford-
Binet (Terman, Merrill, 1960), a idade mental (IM ) foi expressa em termos da
idade cronológica (IC), resultando no quociente intelectual, o Ql, através da
fórmula:
Assim, quem responde a todas as questões correspondentes à sua idade
cronológica possui um Ql de 100 (por exemplo, para uma criança de 10 anos: Ql
= 100 x (10/10) = 100). A interpretação dos resultados em termos de Ql se faz
através da Tabela 3-5.
2) Série escolar
Este critério é utilizado para testes de desempenho acadêmico e so-
mente faz sentido quando se trata de disciplinas que são oferecidas numa
Tabela 3-5 — Interpretação dos escores de Ql
Ql Interpretação
CONCLUSÃO GERAL
REFERÊNCIAS BIBLIOGRÁFICAS
CRONBACH, L. J., MEEHL, P.E. Construct validity in psychological tests. Psychological Bulletin,
Washington, D.C., v.52, p.281-302, 1955.
DUNNETTE, M.D. (Ed.). Handbook of industrial and organizational psychology. New York: Wiley, 1983.
EDGERTON, H.A. A table for computing the phi coefficient. Journal of Applied Psychology,
Washington, D.C., v.44, p.141-145, 1960.
EDWAR DS, A. L. The social desirability variable in personality assessment and research. New York:
Dryden, 1957.
--------------- . Social desirability and personality test construction. In: BASS. B.M., BERG, I .A.
(Eds.). Objective approaches to personality assessment. New York: Van Nostrand, 1959.
EDWARDS, AL, WALKER, J.N. Social desirability and agreement response set. Journal of Abnormal
and Social Psychology, n.62, p.180-183, 1961.
EDWARDS. AL, DIERS.C.J., WALKER, J.N. Response sets and factor loadings on 61 personality
scales. Journal of Applied Psychology. Washington, D.C., n.46, p.220-225. 1962.
EDWARDS. A.L., WALSH, J.A. The relationship between the intensity of the social desirability keying of
a scale and the correlation of the scale with Edwards' SD scale and the first factor loading of the
scale. Journal of Clinical Psychology. Brandon (VT), n. 19, p. 200-203, 1963.
ELLIS, B.B. Item response theory: a tool for assessing the equivalence of translated tests. Bulletin of
the International Test Commission, v.18, n.1-2, p.33-51, 1991.
GESELL. A., AMATRUDA, C.S. Developmental diagnosis. 2ed. New York: Hoeber-Harper. 1947.
GILLINSKY. A.S. The influence of the procedure of judging on the halo effect. American Psychologist.
Washington, D.C., v.2. p.309-310, 1947.
GUILFORD. J.P. FRUCHTER. B. Fundamental statistics in Psychology and Education. 5,ed. New York:
McGraw-Hill, 1973.
HALVERSON. H.M. The acquisition of skill in infancy. Journal of Genetic Psychology. Province-town
(MA), v.43, p.3-48, 1933.
HAMBLETON. R.K. Adapting tests for use in different cultures: technical issues and methods. Bulletin
of the International Test Commission, v.18, n.1-2, p.3-32.1991.
HEINEMAN. CE. A forced-choice form of the Taylor Anxiety Scale. Unpublished doctoral dissertation.
State University of Iowa. 1952.
HULIN. C.L.. DRASGOW. F.. PARSONS, C.K. Item response theory, applications to psychological
measurement. Homewood (IL): Dow Jones-Irwin, 1983.
IRONSON, G.H. Use of chi-square and latent trait approaches for detecting item bias. In: BERK, R.A.
(Ed.). Handbook of methods for detecting test bias. Baltimore (MD): Johns Hopkins University
Press. 1982. p.117-160.
JACKSON, D.N. Problems in preparing personality tests and interest inventories for use in multiple
cultures. Bulletin of the International Test Commissions.IH. n. 1-2. p.94-93, 1991.
JUNG. C.G. Psychologische Typen. Zurich: Rascher. 1921,
JURGENSEN, CE. Table for determining phi coefficients. Psychometrika, v. 12. p. 17-29, 1947.
KELLEY. T.L. The selection of upper and lower groups for the validation of test items Journal of
Educational Psychology. Washington, D.C., v.30, p.17-24. 1939.
KNOBLOCK. H., PASAMANICK. B. (Eds.). Gesell and Amatruda's developmental diagnosis. 3.ed. New
York: Harper and Row. 1974.
KRETSCHMER. E. Physique and character. New York: Hartcourt. 1925.
KUDER. G.F.. RICHARDSON. M.W. The theory of estimation of test reliability. Psychometrika. n.2. p.
151-160. 1937.
LAURENDEAU. M.. PINARD. A. Causal thinking in the child: a genetic and experimental approach.
New York: International Universities Press, 1962.
--------------- . The development of the concept of space in the child. New York: International
Universities Press, 1970.
LORD, F.M. Applications of item response theory to practical testing problems. Hillsdale (NJ): Erlbaum.
1980.
MESSICK. S., JACKSON. D.N. Acquiescence and the factorial interpretation of the MMPI.
Psychological Bulletin. Washington. D.C. v.58. p.299-304. 1961.
MULHOLLAND. T.M.. PELLEGRINO. J.W., GLASER, R. Components of geometric analogy solution.
Cognitive Psychology, v. 12..p.252-284. 1980.
MURRAY. H.A., et al. Explorations in personality. New York: Oxford University Press. 1938.
NEWELL. A.. SIMON. H.A. Human problem solving. Englewood Cliffs (NJ): Prentice-Hall. 1972.
NOVICK. M.R.. LEWIS. C. Coefficient alpha and the reliability of composite measurements.
Psychometrika. v.12. p. 1-13, 1967.
OOSTERHOF, A.O Similarity of various item discrimination indices. Journal of Educational
Measurement. Washington. D.C. v.13. p.145-150, 1976.
PELLEGRINO. J.W.. MUMAW. R.J.. SHUTE. V.J. Analysis of spatial aptitude and expertise. In:
EMBRETSON, SE. (Ed.). Test design: developments in psychology and psycho-metrics. 1985.
p.45-76.
PIAGET. J. The origins of intelligence in children. New York: International Universities Press. 1952.
PINARD. A.. LAURENDEAU, M. A scale of mental development based on the theory of Piaget:
description of a project. Journal of Research in Science Teaching. New York, v.2. p.253-260, 1964.
POPPER. K.R., ECCLES, J.C. O eu e seu cérebro. Brasília: Ed. UnB, 1977.
RASCH. G. An individualistic approach to item analysis. In: LAZARSFELD, P.F., HENRY, N.W. (Eds).
Readings in mathematical social sciences. Cambridge (MA): MIT Press, p.89-107.
RULON. P.J. A simplified procedure for determining the reliability of a test of split-halves. Harvard
Educational Review. Cambridge (MA), v.9, p.99-103, 1939.
SHARON, A.T.. BARTLETT. C.J. Effect of instructional conditions in producing leniency on two types of
rating scales. Personnel Psychology. Durham (NC), v.22, p.251-263, 1969.
SHELDON. W.H. The varieties of human physique: an introduction to constitutional psychology. New
York: Harper, 1940.
STERNBERG, R.J. Intelligence, information processing, and analogical reasoning: the com-ponential
analysis of human abilities. Hillsdale (NJ): Erlbaum, 1977.
----------------. The nature of mental abilities. American Psychologist, Washington. D.C.. v.U.
p.214-230. 1979.
MEDIDAS ESCALARES
Luiz Pasquali
Instituto de Psicologia
Universidade de Brasília
ESCALAS PSICOFÍSICAS
O ENFOQUE DE THURSTONE
Esta matriz Fij pode ser transformada na matriz P,, onde pij = fij/N,
que pode ser transformada na matriz Zij através da tabela da curva normal,
a qual dá as posições escalares dos itens no contínuo do construto,
conforme exemplificado nas Tabelas 4-2 e 4-3.
i
ITENS 1 2 3 4 5 6
j 1 .00 - .25 -.12 - .52 .25 .84 1.65
2 .25 .00 .52 .00 .52 .00 .00 .84
3 .13 .52 -.52 - -.39 - .84 1.28
4 -.52 -.25 .84 - 1.04 .39 1.04
5 -.84 .00 1.28 .00 - .25
6 -1.65 -.84 .25 .00
que foi utilizado nos cálculos das tabelas acima para a obtenção dos
valores escalares (processos discriminantes modais) dos estímulos. Vale
ressaltar que Thurstone oferece testes estatísticos para a verificação da
consistência interna da escala resultante, bem como a verificação da ade-
quação das suposições feitas em cada caso utilizado.
Tendo-se obtido os valores escalares, em termos de desvios padrões, de
uma grande série de estímulos, pode-se construir uma escala intervalar,
selecionando aqueles (cerca de 20) que se situam a distâncias iguais entre si.
Estes estímulos assim escalonados constituem a escala para a medida
das atitudes. Os procedimentos experimentais para aferir as atitudes do
sujeito consistem em pedir ao mesmo que escolha o item (estímulo) com o qual
ele mais concorda, sendo o valor escalar deste item a medida da atitude do
sujeito. Ou pede-se para o sujeito escolher os três ¡tens com os quais mais
concorda, e a medida da sua atitude será a média dos valores escalares destes
três itens.
A construção de escalas a partir desta lei de Thurstone é extremamente
laboriosa. Na verdade, ela se torna quase impossível com um número elevado
de itens, dado que a comparação dos mesmos 2 a 2 aumenta geometricamente
o número de comparações a serem feitas. Para 10 estímulos temos (10 x 9)/2 =
45 comparações, e para 100 itens temos (100 x 99)/2 = 4.950. Por isso,
Thurstone desenvolveu outras técnicas de construção de escalas de atitude.
Uma delas é o método dos intervalos aparentemente iguais (Thurstone, Chave,
1929).
No caso deste método, as afirmações (cerca de 100) sobre um objeto de
interesse são impressas em cartões que os sujeitos devem distribuir em 11
pilhas segundo o grau de favorabilidade que, na sua opinião, a afirmação
apresenta em relação ao objeto psicológico. As 11 pilhas são erigidas sobre um
contínuo de cartões etiquetados de A a K, onde A está ancorado com a
expressão 'desfavorável', o K com 'favorável' e o F (o cartão a meio caminho de
A e K) com 'neutro'.
O valor escalar dos itens se faz através do cálculo da mediana, tendo
como coeficiente de variabilidade o intervalo semi-interquartílico, como na
Tabela 4-4.
O ENFOQUE DE LIKERT
OENFOQUEDEGUTTMAN
1 1 11 01 11 3 1
23 00 00 11 1 3 00
45 00 0 0 01 21 1
1 0
Esta tabela é montada de tal forma que nas colunas estão dispostos
os itens em ordem decrescente, do mais extremado ao mais brando, em
termos de atitude em relação ao construto, e nas linhas estão dispostos os
sujeitos, também em ordem decrescente do escore total obtido nos itens
(para cada item com o qual está de acordo, o sujeito recebe um ponto). Um
item que recebeu o acordo pelo sujeito obtém valor 1 e obtém 0 se o sujeito
não o marcou. Assim se forma uma tabela triangular, de tal sorte que
acima da diagonal deveriam aparecer somente 1 e abaixo somente 0. No
caso em pauta, como o item #1 é o que expressa a atitude mais extrema
em relação ao construto, o sujeito que está de acordo com este item
deveria necessariamente marcar todos os outros itens, fato que não
ocorreu com o sujeito 1, que marcou o item #1 mas não marcou o item #3.
Situações desta natureza provocam a ocorrência de 0 acima da diagonal,
o que é contado como um erro. Para o cálculo do índice de reprodutibilida-
de contam-se todos os erros, isto é, os 0 acima da diagonal, que, no caso,
são dois. Assim, o número de valores apropriados na tabela é 20 - 2 = 18.
O coeficiente de reprodutibilidade será 18/20 = 0,90. Guttman afirma que o
coeficiente deve ser pelo menos de 0,90 para que a escala possa ser
considerada adequada.
Escalas tipo escalograma têm a vantagem de avaliar a unidimensio-
nalidade, bem como de apresentar uma garantia de que a amplitude do
contínuo do construto está sendo coberta, particularmente se o número de
itens for grande (pelo menos 10, sugere Guttman). Contudo, é relativamente
raro de se encontrar na literatura esta forma de escalas. Por quê?
Primeiramente, nem todos os construtos psicológicos permitem escalabíli-
dade. Por exemplo, em atitude política, o sujeito pode estar de acordo com
uma posição do candidato e não com outra, o que poderia inclusive estar
indicando falta de unidimensionalidade da escala. Além disso, Guttman
não oferece dicas de como elaborar os itens, isto é, o escalograma tem
pouco poder heurístico; ele parece ser mais útil para a análise de uma
escala do que para guiar a construção dela.
PAI
forte __ :__ : __ :__ : __ :__ :_ fraco
bom _ :__ : __ :__ : __ : __ :_ mau
ativo _ :__ : __ :__ : __ :__ :_ passivo
-3.-2.-1. 0 . +1 . +2 . +3
ESCALA MULTIDIMENSIONAL
Pólo teórico
As escalas até aqui apresentadas são ditas unidimensionais, porque
elas visam avaliar os sujeitos em apenas um traço psicológico. Falando-se
de uma escala multifatorial, neste caso, entender-se-ia um conjunto de
várias escalas, cada uma medindo um fator ou traço independentemente.
Entretanto, um objeto psicológico pode ser avaliado sob vários aspectos ou
traços simultaneamente. Por exemplo: um candidato à presidência pode ser
avaliado em termos de sua filiação partidária (liberal vs. conservador),
recebendo uma pontuação nesta escala; ao mesmo tempo e independen-
temente, ele pode ser avaliado em termos de sua juventude (jovem vs. velho),
recebendo nesta escala uma outra avaliação, independente da que recebeu na
primeira escala. Teríamos aqui, então, duas escalas unidimen-sionais,
produzindo dois escores independentes. Contudo, pode-se pedir uma avaliação
simultânea do candidato em termos de ambos os atributos, a saber, filiação
partidária e juventude. No primeiro caso, o candidato teria dois escores: um em
filiação partidária e outro em juventude. No segundo caso, entretanto, o
candidato receberia apenas um escore, mas definido em termos de duas
dimensões, que seria ilustrado num espaço bidimensional, onde um ponto é
expresso por duas coordenadas. Assim, o escore dele, neste caso, seria
expresso como Xij , e não por X¡ e Xj. Continuando nesta ilustração, o mesmo
candidato poderia ser avaliado numa série de n traços simultaneamente, de
sorte que o escore dele poderia ser expresso num espaço n-dimensional, com
tantos subscritos quantos os traços sob os quais ele foi avaliado. Estas são as
escalas multidimensionais. No caso de uma avaliação em termos de duas
dimensões, o escore do candidato poderia cair em qualquer um dos quatro
quadrantes que resultam do espaço bidimensional, como na Figura 4-2, onde o
candidato Xise situa em (-1,2).
Pólo experimental
A técnica para levantar os dados de escalas multidimensionais
consiste em pedir ao(s) sujeito(s) para avaliar(em) um objeto psicológico
(candidato), não em um traço de cada vez, mas em comparar vários
objetos psicológicos em vários traços. Por exemplo: Dados os candi-
datos A B C D, avaliar se os candidatos A e B são mais semelhantes
(próximos, iguais, etc.) entre si que os candidatos C e D. Assim, a
técnica para a coleta da informação usa termos que se referem a
"distância psicológica" ou "proximidade psicológica". Esta proximidade
vem designada sob vários termos, tais como parentesco, dependência,
associação, complementaridade, substitutividade, proximidade,
distância, interação, etc.
Um exemplo poderá ilustrar os procedimentos da técnica das
escalas multidimensionais. Suponha quatro candidatos à presidência (A,
B, C ,D). Os respondentes reagem à instrução de emparelhar 2 a 2 os
candidatos e dizer qual é o candidato preferido entre os dois (i > j). Deste
procedimento podem surgir os seguintes dados:
i
CANDIDATOS A B C D
j A 7
B 5 8-
C 3 6 9
D
CONCLUSÃO
REFERÊNCIAS BIBLIOGRÁFICAS
ALBANESE. MA., FORSYTH, R.A. The one-, two- and modified two-parameter latent trait
models: an empirical study of relative fit. Educational and Psychological Measurement.
Durham (NC), v.44 n.2, p.229-246, 1984.
BALLIN. M.. FARNSWORTH, P.R. A graphic rating method for determining the scale values
of statements in measuring social attitudes. Journal of Social Psychology. Provincetown
(MA), v.13, p.323-327.1941.
BENDIG. AW. Reliability and the number of rating scale categories. Journal of Applied
Psychology. Washington, D.C., v.38, p.38-40. 1954.
BIRD, C. Social psychology. New York: Appleton-Century-Crofts. 1940.
BIRNBAUN, A. Some latent trait models and their use of inferring an examinee's ability. In:
LORD, F.M., NOVICK, M.R. (Eds.). Statistical theories of mental test scores. Reading
(MA): Addison-Wesley, 1968.
CAMPBELL, N.R. An account of the principles of measurement and calculations. London:
Longmans Green, 1928.
-------------- . Symposium: Measurement and its importance for philosophy. Proceedings Aristot.
Society Suppl.. London, v.17, p.121-142. 1938.
COOMBS, C.H. A theory of data. New York: Wiley. 1964.
DE BRUYNE, P., HERMAN, J„ DE SCHOUTHEETE, M. Dinâmica da pesquisa em ciências
sociais. .Ved. Rio de Janeiro: Francisco Alves. s.d.
DEBETS. P.. BROUWER. E.. SIJTSMA, K., MOLENAAR, I.W. MSP: a computer program for
item analysis according to a nonparametric IRT approach. Educational and Psychological
Measurement. Durham (NC), v.49. n.3. p.609-613, 1989.
DEBETS. P., BROUWER, E. MSP: a program for Mokken Scale analysis for polychotomous
items. Groningen: IEC ProGAMMA, 1989.
DELBEKE, L. Construction of preference spaces. Louvain: Publications of the University of
Louvain, 1968.
EDWARDS, AL. Techniques of attitude scale construction. New York: Appleton-Century-
Crofts. 1957.
EDWARDS. AL., KENNY, K.C. A comparison of the Thurstone and Likert techniques of
attitude scale construction. Journal of Applied Psychology, Washington, D.C., v.53, p. 72-
83, 1946.
EDWARDS, A.L, KILPATRICK, F.P. A technique for the construction of attitude scales. Journal of
Applied Psychology, Washington, D.C., v.32, p.374-384, 1948.
EKMAN. P. (s.n.t.) 1963.
FISHBEIN, M. AJZEN, I. Beliefs, attitude and intention: an introduction to theory and research. Reading
(MA): Wesley, 1975.
GOLDSAMT, M.R. Effects of scoring method and rating scale length in extreme response style
measurement. College Park (MD): University of Maryland, 1971. (Unpublished doctoral
dissertation)
GUILFORD, J.P. Psychometric methods. 2ed. New York: McGraw-Hill, 1954.
GUTTMAN, L. A basis for scaling qualitative data. American Sociological Review, Washington,
D.C..V.9, p.139-150. 1944.
---------------- . The basis for scalogram analysis. In: STOUFFER, SA. et al. Measurement and
prediction. Princeton (NJ): Princeton University Press, 1950. p.60-69.
. The Cornell technique for scale and intensity analysis. Educational and Psycholog
ical Measurement. Durham (NC), v.7, p.247-280, 1947.
---------------- . The problem of attitude and opinion measurement. In: STOUFFER, S.A. et al.
Measurement and prediction. Princeton (NJ): Princeton University Press. 1950. p.46-59.
--------------- . On Festinger's evaluation of scale analysis. Psychological Bulletin. Washington,
D.C., V.44, p.451-465, 1947.
---------------- . Questions and answers about scale analysis. Research Branch, Information and
Education Division, Army Service Forces. Report D-2. 1945.
JENKINS. J.J., RUSSELL, W.A., SUCI. G.J. An atlas of semantic profiles for 360 words. In: Studies on
the role of language in behavior. Tech. Rep. No. 15. Minneapolis: University of Minnesota, 1957.
JONES, R.R. Differences in response consistency and subject's preferences for three personality
inventory response formats. Proceedings of the 67th Annual Convention of the American
Psychological Association, v.3, p.247-248, 1968.
KOMORITA. S.S. Attitude content, intensity, and the neutral point on a Likert scale. Journal of Social
Psychology. Provincetown (MA), v.61, p.327-334, 1963.
KRUSKAL, J.B., WISH, M. Multidimensional scaling. Newbury Park (CA): Sage Publications, 1991.
LIKERT, R. A technique for the measurement of attitudes. Archives of Psychology . v. 140, 1932.
LORD, F.M. A theory of test scores. Psychometric Monograph, Chicago (IL), n.l, 1952.
---------------- .Applications of item-response theory to practical testing problems. Hillsdale (NJ):
Lawrence Erlbaum, 1980.
MAGER, R.F. Medindo os objetivos de ensino ou "conseguiu um par adequado". Porto Alegre: Globo,
1981.
MATELL, M.S., JACOBY, J. Is there an optimal number of alternatives for Likert-scale items? Journal of
Applied Psychology. Washington, D.C., v.56, n.6, p.506-509, 1972.
---------------- . Is there an optimal number of Likert scale items? Study I: Reliability and validity.
Educational and Psychological Measurement, Durhan (NC), v.31, p.657-674, 1971.
MOLENAAR, I.W., SIJTSMA, K Mokken's approach to reliability estimation extended to multicategory
items. Kwant'rtatieve Methoden. Rotterdam, v.9 n.28, p.l 15-126,1988.
NEVO, B. Face validity revisited. Journal of Educational Measurement, Washington. DC, v.22, p.287-
293, 1985.
NEVO, B., SFEZ, J. Examinees' feedback questionnaires. Assessment and Evaluation in Higher
Education, Bath, v. 10, p.236-249, 1985.
OSGOOD, C.E., SUCI, G.J., TANNENBAUM, PH. The measurement of meaning. Urbana (IL):
University of Illinois Press, 1957.
----------------. A measure of relation determined by both mean difference and profile information.
Psychological Bulletin, Washington, D.C., v.49, p.251-262.
PEREIRA, CA. Alves. O diferencial semântico: uma técnica de medida nas ciencias humanas e sociais.
São Paulo: Ática, 1986.
POPPER, K.R. A lógica da pesquisa cientifica. São Paulo: Cultrix, 1972.
RASCH, G. Probabilistic models for some intelligence and attainment tests. Copenhagen: Danish
Institute for Educational Research, 1960.
SAFFIR, M.A. A comparative study of scales constructed by three psycho-physical methods.
Psychometrika, v.2, p. 179-198, 1937.
SEASHORE, R.H., HEVNER, K. A time-saving device for the construction of attitude scales. Journal of
Social Psychology, Provincetown (MA), v.4, p.366-372, 1933.
SIEGEL, S. Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill, 1956.
SIJTSMA, K., DEBETS, P., MOLENAAR, I.W. Mokken scale analysis for polychotomous items: theory,
a computer program and an empirical application. Quality & Quantity, apud DEBETS, P..
BROUWER, E., SIJTSMA, K., MOLENAAR, I.W. MSP: a computer program for item analysis
according to a nonparametric IRT approach. Educational and Psychological Measurement, Durham
(NC), v.49 n.3, p.609-613, 1989.
STEVENS, S.S. Mathematics, measurement, and psychophysics. In: STEVENS, S.S. (Ed.). Handbook
of experimental psychology. New York: Wiley, 1951. p.1-49.
THURSTONE, L.L. A law of comparative judgment. Psychological Review, Washington, D.C., V.34,
p.273-286, 1927.
----------------. Psychophysical analysis. American Journal of Psychology, Champaign (IL), v.38,
p.368-389, 1927.
--------------- . The method of paired comparisons for social values. Journal of Abnormal and Social
Psychology, v.21, p.384-400, 1927.
--------------- . Equally often noticed differences. Journal ot Educational Psychology. Washington,
D.C.,v.l8,p.289-293, 1927.
THURSTONE. L.L, CHAVE, E.J. The measurement of attitude. Chicago (IL): University of Chicago
Press, 1929.
TORGERSON, W.S. Theory and methods of scaling. New York: Wiley, 1958.
TUCKER, L.R., MESSICK, S. An individual differences model for multidimensional scaling.
Psychometrika, v.28, p.333-367, 1963.
VAN DÉR VEER, F., HOWARD, K.I., AUSTRIA, A.M. Stability and equivalence scores based on three
different response formats. Proceedings of the 78th Annual Convention of the American
Psychological Association, v.5, p.99-100, 1970.
WEBB, S.C. A generalized scale for measuring interest in science subjects. Educational and
Psychological Measurement, Durham (NC), v.ll, p.456-469, 1951.
CAPITULO 5
Jorge de Souza
Departamento de Economía Universidade
Federal de Pernambuco
D
esde os primeiros estudos da psicofisica alemã, na segunda
metade do século XIX, os psicometristas lidam com o problema de
ordenação de um conjunto de estímulos ou objetos psicológicos
relativamente a uma de suas propriedades. Dá-se o caso, por exemplo,
quando os sujeitos do experimento, juizes ou examinandos, são instados
a manifestarem-se sobre qual o sinal sonoro, entre dois sinais a eles
submetidos, é o mais intenso. Postos, assim, diante de um conjunto de
sinais sonoros expostos dois a dois, os juizes dão as suas respostas, e
o objetivo do experimento é obter uma ordenação ascendente dos
estímulos quanto às suas intensidades. Essa mesma ordenação é
comparada com a correspondente ordem natural sob controle do
pesquisador. Quanto mais elevada for a compatibilidade entre as duas
seqüências, maior é a acuidade perceptiva do examinando.
Sob esse enfoque, os diversos sentidos da percepção humana,
como a visão, a audição, a sensação de peso, etc, foram investigados na
psicofisica e, a partir deles, estabeleceram-se as chamadas leis da
psicofisica.
Retomando essas idéias no século XX, Louis Thurstone, o grande
psicossociometrista norte-americano, concebeu uma situação mais geral
e pôde estender as idéias da psicofisica a uma classe mais ampla de
problemas que envolviam o conceito de traço psicológico. O traço
psicológico é uma propriedade ou uma variável de caráter latente — e,
portanto, não diretamente observável — ligada a algum sujeito ou objeto
de investigação. Enquadra-se nessa ordem, por exemplo, a variável
latente que leva os consumidores a manifestarem suas preferências entre
diversas marcas de um produto ou os cidadãos a escolherem seus
políticos preferidos num elenco de homens públicos.
Algumas das teorias psicométricas sobre o tratamento deste tema
são o objeto deste capítulo.
O MODELO DOS JULGAMENTOS COMPARATIVOS
(5.1)
(5.2)
(5.3)
Fig. 5-1
(5.6)
Ao modelo por esse modo caracterizado dá-se o nome de modelo
de julgamentos comparativos de Thurstone.
(5.7)
(5.8)
Ele pode ser resolvido, por exemplo, através do método dos mínimos
quadrados, onde deve ser minimizada a função
Derivando-se relativamente aos valores de escala, encontra-se que
e assim sucessivamente.
(i=1, 2
................................................................ m-1)
(5.9) ( / = 1 , 2 ......................m).
(5.10)
(5.11)
ou seja:
, ou
ainda
Fig. 5-2
ou ainda, equivocantemente,
(5.12) (j = 1, 2...................... k)
, ou seja,
( / = 1.2........ m).
(5.13)
O MODELO DE LUCE
se e somente se se e
(5.14)
somente se
em que o símbolo « denota o empate entre os
estímulos O¡ e Oj e o parâmetro "e" positivo é uma espécie de limiar que,
se não ultrapassado, impede a discriminação entre os estímulos Oi e Oj
desde o ponto de vista da manifestação de uma preferência. Pela mesma
ordem de idéias usadas anteriormente, transformam-se essas regras
para a correspondente versão probabilistica, ou seja, impõem-se, agora,
os seguintes critérios decisorios de caráter estatístico:
(5.15)
(5.16)
(5.17)
(5.19)
onde zi[j é a abcissa da curva normal (0,1) cuja área à esquerda desse
valor é igual a nji; deve-se notar que, desse modo, para o modelo Luce,
encontram-se duas abcissas, de acordo com a figura 5-3.
Fig. 5-3
(5.20)
(5.21)
Supondo, também, simplificadamente, que as variâncias i
sejam independentes dos estímulos, concebe-se
que será constante e, desse modo, pode-se fazê-la
unitária porque esta hipótese corresponde apenas a uma mudança de
escala nos valores de escala, sempre interpretados na escala ordinal.
Desse modo, somando e subtraindo as duas equações anteriores,
obtêm-se as expressões
(5.22)
(5.23)
(5.24)
(5.25)
(5.26)
(5.27)
(5.28)
(5.29)
onde Nj é nova matriz que resulta de N pela substituição antes enunciada.
Nesse caso, a solução do problema de escalagem é igual a
(5.30)
(5.31)
(5.32)
(5.33)
(5.34)
A implantação do algoritmo anterior requer, para sua implementação
mais eficaz, as seguintes providências:
155
I) uma boa aproximação inicial para a sua rápida convergência;
II) uma normalização das aproximações obtidas
em cada etapa.
A aproximação inicial, aqui sugerida, consiste simplesmente em
fazer (¡ = 1,2,..., m), isto é, supõe-se inicialmente uma preferên-
cia manifestada imparcialmente sob a hipótese de absoluta ignorância no
concernente à natureza dos estímulos.
A condição de normalização é naturalmente imposta em cada etapa
e consiste em substituir cada por
(5.34)
(5.35)
(5.36)
(5.37)
REFERENCIAS BIBLIOGRÁFICAS
BRADLEY, R.A.. TERRY. M.E. The rank analysis of incomplete block designs I: the method of paired
comparisons. Biometria, v.39, p.324-345, 1952.
FORD JR., L.R. Solution of a ranking problem from binary comparisons. American Mathematical
Monthly. Washington. D.C.. v.64. p.28-33, 1957.
GREENBERG, MG. A modification of Thurstone's law of comparative judgment category of equal or no
difference. Psychological Bulletin. Washington. D.C.. v.64. 108-112, 1965.
GUTTMAN, L. An approach for quantiting paired comparisons and rank order. Annals of Mathematical
Statistics. Hayward (CA), v.17, p.144-163. 1946.
HOTELLING, N. Analysis of a complex of statistical variables into principal components. Journal of
Educational Psychology. Washington. D.C.. v.24, p.417-441; 498-520,1933.
LUCE, R.D. Discrimination. In: LUCE, R.D., BUSH, R.R., GALANTER, E. Psychology. New York: Wley.
1963. v.1.
MICHAUD. P. Opinions aggregations. In: JANSE, J.. MARCOTORCHINO, J.F., PROTH, J. M. (Eds.).
New trends in data analysis and applications. Amsterdam: North Holland, 1983.
NISHISATO, S. Analysis of categorical data: dual scaling and its applications. Toronto: University of
Toronto Press, 1980.
--------------- . Optimal scaling of paired comparison and rank order data: an alternative to Gut-
tman's formulation. Psychometrika, v.43, p.263-271, 1978.
SIJBERG, L. Successive intervals scaling of paired comparisons. Psychometrika, v.32, p.297-308,1967.
SOUZA, J. de. Métodos de escalagem psicossocial. Brasília: Thesaurus, 1987.
THURSTONE, L.L. A law of comparative judgment Psychological Review. Washington, D.C., v.34,
p.273-286, 1927.
CAPITULO 6
* Note-se que. neste trabalho, concebem-se de modo inovador as bases históricas da Psi-
cometria como o resultado da confluência entre os esforços de psicólogos e estatísticos.
Para um mais amplo entendimento de uma formulação da história da Psicometria, pode-se
consultar, deste mesmo autor. História das Idéias Estatísticas. Recife: UFPE. 1995. Notas
internas.
efeito, no caso em tela, a inadaptabilidade do método fatorial manifesta-se,
em primeiro lugar, pela justificável rejeição que se deve esperar relativa-
mente a uma das hipóteses nele implícitas, configurada como a incorrela-
ção dos fatores ou variáveis latentes. Nesse sentido, o leitor já deve
beneficiar-se da dúvida natural que se lhe acomete — sub-repticiamente,
é bem verdade — quanto à adequação da Análise Fatorial. Mas essa
mesma rejeição aos fatores ortogonais pode ser também justificada pela
ignorância de quem os manuseia no referente à hipótese de ortogonalida-
de ou incorrelação entre os fatores.
Infere-se daqui, na realidade, uma dupla manifestação da ignorância
científica. Em primeiro lugar, no concernente às hipóteses fundamentais
dessa fértil técnica psicométrica e, em segundo lugar, pelo desconheci-
mento de alternativas metodológicas que superam satisfatoriamente a
restrição interposta. Assim, no caso, poder-se-ia optar pelo método
sucedâneo da Análise Fatorial Oblíqua como um meio propício à supe-
ração da séria restrição de ortogonalidade. Esta, sabe-se bem, não
encontra respaldo nem nos dados observacionais e nem, tampouco, nas
formulações teóricas subjacentes de todas as ciências psicossociais —
pode-se dizer sem medo de errar.
Não se há de inferir, desse exemplo — e essa formulação consubs-
tanciaria, também, um erro inaceitável —, que a Análise Fatorial clássica
com fatores ortogonais deva ser abandonada enquanto conhecimento
metodológico — não. O leitor mais versado nas literaturas estatística e
psicométrica iria logo nelas reconhecer a sua imprescindibilidade como
base ou etapa intermediária para alcançar a formulação mais pertinente ao
embasamento teórico da sucedânea — e mais pertinente — Análise
Fatorial Oblíqua.
Toda essa teia de considerações apoiada no paradigma da Análise
Fatorial auxilia-nos a concluir que, no geral, é ignorância quanto às bases
ou hipóteses que sustentam os métodos ou as técnicas psicométricas e
estatísticas o fator primordial de sua inadequação na abordagem dos
dados observacionais. Na realidade, essa última afirmação é por demais
abusiva, porque a inadaptabilidade constatada não reside nos métodos em
si mesmos, mas nas suas condições de aplicação. É que eles se compor-
tam com neutralidade, esperando, ingenuamente, que seus usuários
saibam manejá-los com respeito às suas idiossincrasias. Seria fácil e
cientificamente desonesto, convenhamos, assacar contra a Psicometria ou
a Estatística, rés inocentes que padecem da mesma injustiça com que as
uvas maduras, na fábula de La Fontaine, passaram por verdes pela
frustração da raposa incapacitada para alcançá-las.
Uma outra ordem de idéias sobre a insuficiência dos conhecimentos
psicométrico e estatístico resulta da consideração dos fins a que eles se
destinam. Para ilustração, ponha-se, ainda, o exemplo com que se vem
tratando o tema. E muito comum encontrarem-se dezenas de complexos
artigos que versam sobre a inferência estatística em Análise Fatorial. A tão
conhecida e importante revista pioneira Psychometrika é detentora de
recordes nesse sentido. Muito bem — digo com ênfase —, esses artigos
laureiam seus autores pela originalidade de suas concepções, pela
sofisticação estatística e matemática que nos deixam complexados e com
sentimentos mesmo que ora são os da inferioridade, vezes outras os da
frustração e — esse é o mais justo, reconheçamos — o do temor! Todas
essas dolorosas sensações, infelizmente, não são manifestadas de modo
explícito; não as revelamos para não nos desnudarmos diante dos colegas
que, eles mesmos, ironicamente, também as padecem no altar sofrido de
limitações iguais às que nos acicatam. E, se algo revelamos sobre isso em
algum momento, é uma espécie de rancor que gera, a meu juízo, esse
sentimento difuso de aversão à Psicometria e, também, à Estatística de um
modo geral. Como bom psicanalista inquieto, eu veria como normais esses
sentimentos e, até mesmo, considerá-los-ia mais que pertinentes ou
saudáveis. É que há algo de errado ou talvez inadequado por trás dessas
formulações estéreis, e é exatamente essa sensação que quero analisar
friamente. Onde sustentar-se, então, para considerá-la em suas di-
mensões corretas? Em que se podem apoiar os mortais psicólogo e
sociólogo, condenados ambos, juntamente com politicólogos e pedagogos,
ao sacrifício irremediável nesse altar de formalismos lógico-matemáticos?
Há um caminho fácil, leitor, quero dizer, perfeitamente trilhável, porque
possui para o intento apenas a difícil e delicada capacidade de observar;
mas deve-se fazê-lo, é claro, judiciosamente e sem idéias preconcebidas
— isso é essencial. Com efeito, todos esses conhecimentos — que se
diriam de cunho estatístico-inferenciais relativamente à Análise Fatorial —
sustentam-se, entre várias outras, na hipótese simples de que os erros dos
testes ou instrumentos de medição que geram os escores ou notas têm
distribuição normal de Gauss-Laplace. Essa é a questão que deve ser
considerada quando nos propomos a dissecar a plausibilidade de
Psicometria no contexto psicossocial a que ela se destina. Interroguemo-
nos, assim, se a destacada hipótese estatística sobre a normalidade dos
erros decorre da observação, do exame dos fatos, ou se, contrariamente,
ela é fruto da gratuidade ou da conveniência com que, Procustos neuróti-
cos da novidade científica, limitamos a realidade ao leito de ferro de
nossas conveniências acadêmicas, para brilharmos nesse mundo falso de
publicações e bibliografias!
Não há aqui como fugir-se, também, à sempre presente historicida-
de da ciência, à sua realidade de época, às marcantes influências
importadas e, sobretudo, engolidas sem a imprescindível digestão
presidida pelo amparo da crítica epistemológica! Com efeito, a Análise
Fatorial, desde os seus primórdios londrinos de 1904, sob a inteligência de
Spearman e, sobremodo, sob a tutela posterior de estatísticos como
Hotelling, Thurstone, Wishart, Roy, Fisher e outros que, nos anos 30 e 40
deste século, consolidaram-na como uma teoria normal da Analise Estatística
Multivariada, estava marcadamente influenciada pela mais que centenária teoria
dos erros normais, essa fecunda fonte de toda ciência observacional que
sustentou, também, a Estatística Inferencial da linha desenvolvida de Ronald
Fisher, Egon Pearson e Jerzy Neyman. No entanto, é preciso que se ressalte,
essa hipótese de normalidade, descoberta dos astrônomos e físicos, era
adequada aos dados das ciências experimentais, era ditada pelas observações
das ciências cujos experimentos eram controlados pelo pesquisador. Diante
disso, a conclusão que nos compete enunciar é a de que, infelizmente, o
conceito de erro distribuído normalmente não é respaldado pela natureza das
observações das variáveis psicossociais obtidas, desde logo, mediante
instrumentos de mensuração mais precários de que os das ciências
experimentais. Adotá-la, assim, seria amarrar a realidade ao mesmo leito de
ferro das conveniências que nos servem ao papel de Procustos da ciência e não
a de verdadeiros cientistas ou, pelo menos, a de profissionais honestos e
capacitados. Que fazer? Essa é a interrogação que, estarrecidos
justificadamente, nos fazemos agora. Não há como precipitar-se diante disso.
Longe, muito longe mesmo, a idéia de atirar tudo a esse lixo da ciência, tão
impressionantemente rico de teorias, métodos e técnicas exibidos
pretensiosamente como os mais puros produtos da inteligência e da cultura
humanas. Contenhamos a indignação natural diante da descoberta de que
tínhamos razão, de que não éramos tão tolos quanto as complicações
estatísticas nos faziam crer! Já não nos devemos vexar, mas ver a tudo com
reservas deve ser a primeira atitude, o que sugere a prudência, boa guia dos
nossos propósitos. E mais: antes de quaisquer outras considerações, havemos
de concluir que a posição mais correta é a de que, no estágio em que se situa a
inferência da Análise Fatorial — e é sobre ela que se sustenta o nosso
paradigma —, é que não convém adotá-la a não ser em situações muito
específicas. Isto porque, antes de mais nada, é imprescindível ver a Análise
Fatorial Clássica como um método eminentemente exploratório, sem nenhum
cunho inferencial ou de confirmação de hipóteses, que, este sim, é o cerne da
Inferência Estatística. Aliás, quase todo o aparato psicométrico até hoje
conhecido convém que seja visto muito mais pela ótica exploratória ou descritiva
e, menos do que desejam os seus teóricos desavisados e usuários incautos,
pela visão ideal da indução estatística.
A conclusão a que chegamos sobre tudo o que se disse é a de que, no
geral, o insucesso e a suspeição com que são vistos os métodos psicométricos
e estatísticos são fruto de várias causas que se somam nessa empreitada de
desprezo pelo bom-senso: a falta de conhecimento das hipóteses estatísticas
que lhes dão respaldo, o seu uso abusivo, extrapolando-se os limites sem que
para isso haja autorização científica e técnica e, last but not least, o
desconhecimento de alternativas metodológicas mais consentâneas.
O ENSINO DA PSICOMETRIA E DA ESTATÍSTICA
IRT (Item Response Theory) já tem uma longa história. Ela iniciou
com os trabalhos de Lord (1952, 1953) nos Estados Unidos e
Rasch (1960) na Holanda, que a utilizaram para testes de
desempenho e de aptidão. Contudo, apenas ultimamente, a partir
de meados dos anos 80, a IRT vem se tornando a técnica predominante
no campo dos testes. A razão da demora desta teoria em ser
amplamente utilizada em psicometria consiste na enorme complexidade
de manipulação de seus modelos matemáticos, inviáveis sem os
requintados programas de computador, e estes só começaram
efetivamente a entrar no mercado nos anos 80.
Atualmente, a IRT parece que veio para ficar e substituir grande
parte da teoria clássica da psicometria — isto é um fato que já ocorre no
Primeiro Mundo (USA, Canadá, Europa, Japão, Israel, Austrália); no res-
tante do mundo ela é raramente utilizada, e no Brasil (América Latina em
geral) ela sequer é conhecida. Este capítulo visa precisamente iniciar no
País o conhecimento e, esperamos, o uso desta técnica no campo da
psicometria.
As publicações em IRT vêm crescendo e tomando conta das revis-
tas especializadas, como a Psychometrika. Há centros importantes de
pesquisa nesta área nos USA (University of Massachusetts at Amherst),
Holanda e Espanha (Universidade de Oviedo). Existe, inclusive, uma
sociedade internacional, a International Test Commission (ITC), que filia
seguidores da IRT. De fato, no Congresso Internacional da ITC, em
Oxford (Inglaterra), de julho de 1993, havia mais de 120 participantes de
cerca de 46 países. Da América Latina só estavam representados o Brasil
e a Argentina, com dois participantes cada.
O enorme impacto que a IRT vem tendo em psicometria se deve
ao fato de ela superar certas limitações teóricas graves que a psicometria
tradicional contém. Hambleton, Swaminathan e Rogers (1991) salientam
especialmente quatro dessas limitações:
1) Os parâmetros clássicos dos ¡tens (dificuldade e discriminação)
dependem diretamente da amostra de sujeitos utilizada para estabelecê-
los (group-dependenf). Daí, se a amostra não for rigorosamente repre-
sentativa da população, aqueles parâmetros dos itens não podem ser
considerados válidos para esta população. Como conseguir amostras
representativas é um problema prático grave para os construtores de
testes; a dependência dos parâmetros dos itens na amostra obtida se
torna um empecilho de grandes proporções para a elaboração de ins-
trumentos psicométricos não enviesados.
2) A avaliação das aptidões dos testandos também depende do
teste utilizado (test-dependent). Assim, testes diferentes que medem a
mesma aptidão irão produzir escores diferentes da mesma aptidão para
sujeitos idênticos. Testes com índices de dificuldade diferentes evidente-
mente produzirão escores diferentes. Mesmo no caso das formas
paralelas, há sempre a dificuldade de que o montante de erros nas duas
formas dificilmente seja o mesmo, o que produzirá novamente escores
diferentes.
3) A definição do conceito de fidedignidade ou precisão na teoria
clássica dos testes constitui também uma fonte de dificuldades. Ela é
concebida como a correlação entre escores obtidos de formas paralelas
de um teste ou, mais genericamente, como o oposto do erro de medida.
Ambos os conceitos apresentam dificuldades. Primeiramente, é pratica-
mente impossível satisfazer as condições de definição de formas
paralelas e, no caso do erro de medida, é postulado que este seja
idêntico em todos os examinandos — postulado improvável (Lord, 1984).
4) Outro problema da teoria clássica dos testes consiste em que
ela é orientada para o teste total e não para o item individual. Toda a
informação do item deriva de considerações do teste geral, não se
podendo assim determinar como o examinando se comportaria diante de
cada item individual.
Estas e outras dificuldades dos modelos e técnicas clássicos de
medida incitaram os psicometristas à procura de teorias alternativas que
pudessem permitir estabelecer (Hambleton et ai., 1991):
a) características do item sem ser dependente da amostra de sujeitos
utilizados;
b) escores dos examinandos independentes do teste utilizado;
c) um modelo em nível do item em vez do teste;
d) um modelo que não exija formas rigorosamente paralelas para
avaliar a fidedignidade;
e) um modelo que ofereça uma medida de precisão para cada escore
de aptidão.
Essas características são precisamente oferecidas pela Teoria da
Resposta ao Item (Hambleton, 1983; Hambleton, Swaminathan, 1985; Lord,
1980; Wright, Stone, 1979; Hambleton, Swaminathan, Rogers, 1991; Muñiz,
1990).
CARACTERÍSTICAS DA IRT
Teoria da IRT
Contrariamente à teoria clássica de psicometria, a IRT trabalha com
traços latentes e coloca dois axiomas fundamentais: 1) o desempenho do sujeito
numa tarefa (item do teste) se explica em função de um conjunto de fatores ou
traços latentes (aptidões, habilidades, etc.) — o desempenho é o efeito, e a
causa são os traços latentes; 2) A relação entre o desempenho na tarefa e o
conjunto dos traços latentes pode ser descrita por uma equação monotônica
crescente, chamada de ICC (Item Characteristic Function ou Item Characteristic
Curve — a curva característica do item) e exemplificada na Figura 7-1, onde se
observa que sujeitos com aptidão maior terão maior probabilidade de responder
corretamente ao item e vice-versa (Ө¡ é a aptidão e P¡(Ө) a probabilidade de
resposta correta).
Hã um número ilimitado de modelos para expressar esta relação,
dependendo do tipo de função matemática utilizada e/ou do número de
parâmetros que se quer descobrir para o item.
Propriedades da IRT
Entre as características da IRT, duas são de especial relevância:
unidimensionalidade e independência local.
Unidimensionalidade
A IRT postula que há apenas uma aptidão responsável pela realização de
um conjunto de tarefas (itens). Parece pacífico que qualquer desempenho
humano é sempre multideterminado ou multimotivado, dado que mais de um
traço latente entra na execução de qualquer tarefa. Contudo, para satisfazer o
postulado da unidimensionalidade, é suficiente admitir que haja uma aptidão
dominante (um fator dominante) responsável pelo conjunto de itens. Este fator é
o que se supõe estar sendo medido pelo teste. O postulado da
unidimensionalidade ainda continua importante, dado que a IRT, embora
estudos estejam sendo feitos nesta área, ainda não possui soluções adequadas
para modelos multidimensional.
Independência local
Este postulado afirma que, mantidas constantes as aptidões que afetam
o teste, as respostas dos sujeitos a quaisquer dois itens são estatisticamente
independentes. Seja 0 o conjunto de aptidões que afetam um conjunto de itens,
Uj a resposta de um sujeito ao item i (i = 1, 2, ..., n) e a probabilidade de
resposta do sujeito i com
aptidão significa a probabilidade de uma resposta correta e
a probabilidade de uma resposta errada. A independência local
pode ser matematicamente afirmada como
MODELOS DA IRT
( l = 1. 2........n),
No nosso caso,
Ө ny Pe(Өy) P(Өy)
1.000
x2 =
A fórmula da função é
2) erro máximo =
Eficiência relativa
A l(0) permite comparar a relativa eficiência de um teste com relação
a outro em sua capacidade de estimar a aptidão 0:
TRANSFORMAÇÕES DO 0
onde
191
APLICAÇÕES DA IRT
Banco de itens
CONCLUSÃO
AIRT não veio somente para ficar, mas constitui a teoria psicométrica
predominante no dito Primeiro Mundo de hoje. Embora ela seja teorica-
mente complexa e praticamente exigente em seus procedimentos analí-
ticos, parece imprescindível que todos os que trabalham com testes
psicológicos tenham conhecimento da mesma e dela façam uso na elabo-
ração de seus instrumentos. A literatura é abundante na área, e a disponi-
bilidade de softwares apropriados o é igualmente. O desconhecimento da
IRT no Brasil vem complicar ainda mais o lastimável estado atual dos
instrumentos psicológicos aqui utilizados, dado que nem a psicometria
clássica é ensinada adequadamente na grandíssima maioria das universi-
dades brasileiras.
REFERÊNCIAS BIBLIOGRÁFICAS
ANGOFF, W.H. Scales, norms, and equivalent scores. In: THORNDIKE. R.L. (Ed.). Educational
measurement. 2.ed. Washington, D.C.: American Council on Education, 1971. p.508-GC)0.
------------------ . Use of difficulty and discrimination indices for detecting test bias. Baltimore (MD):
The Johns Hopkins University Press. 1982.
ANGOFF, W.H., FORD, S.F. Item-race interaction on a test of scholastic aptitude. Journal of
Educational Measurement. Washington, D.C.. v.10, p.95-105, 1973.
BAKER. F. B. Methodology review: item parameter estimation under the one-, two-, and three-
parameter logistic models. Applied Psychological Measurement. St. Paul (MN). v.ll, p. 111-142,
1087.
BIRNBAUM, A. Some latent trait models and their use in inferring and examinee's ability. In: LORD,
F.M.. NOVICK, M.R. Statistical theories of mental test scores. Reading (MA): Addison-Wesley,
1968. p. 17-20.
ELLIS, B.B. Item Response Theory: a tool for assessing the equivalence of translated tests. Bulletin of
the International Test Commission, v.19 n.1/2, p.33-51, 1991.
HAMBLETON, R.K. Principles and selected applications of Item Response Theory. In: LINN, R.L. (Ed.).
Educational measurement 3.ed. New York: McMillan. 1989. p.147-200.
HAMBLETON, R.K. (Ed.). Applications of Item Response Theory. Vancouver (BC): Educational
Research Institute of British Columbia. 1983.
HAMBLETON. R.K.. SWAMINATHAN, H. Item Response Theory, principles and applications. Boston
(MA): Kluwer, 1985.
HAMBLETON, R.K., SWAMINATHAN. H., ROGERS. H.J. Fundamentals of Item Response Theory.
London: Sage, 1991.
JENSEN, A.R. Bias in mental testing. New York: Free Press, 1980.
------------------. How much can be boost IQ and scholastic achievement? Harvard Educational
Review, Cambridge (MA), v.39, p.1-123, 1969.
LORD, F.M. An application of confidence intervals of maximum likelihood to the estimation of an
examinee's ability. Psychometrika. v. 18, p.57-75.1953.
----------------- .Applications of Item Response Theory to practical testing problems. Hillsdale (NJ):
Lawrence Erlbaum, 1980.
LORD, F.M., NOVICK, M.R. Statistical theories of mental test scores. Reading (MA): Addison-Wesley.
1968.
MISLEWY. R.J., BOCK, R.D. BILOG: maximum likelihood item analysis and test scoring logistic models.
Mooresville (IN): Scientific Software, 1984.
MUÑIZ FERNANDEZ. J. Teoría de respuesta a los ítems: un nuevo enfoque en la evolución psicológica
y educativa. Madrid: Piramide, 1990.
RASCH, G. Probabilistic models for some intelligence and attainment tests. Copenhagen: Danish
Institute for Educational Research, 1960.
SCHEUNMAN, J. A method of assessing bias in the test items. Journal of Educational Measure-ment.
Washington, D.C., v.16, n.3, p.143-152. 1979.
------------------. Solving measurement problems with the Rasch model. Journal of Educational
Measurement. Washington, D.C., v.14, p.97-116. 1977b.
WRIGHT. B.D., STONE, M.H. Best test design. Chicago (IL): MESA Press. 1979.
WRIGHT. B.D.. MEAD, R.J., BELL, S.R. BICAL: calibrating items with the Rasch model. Chicago (IL):
University of Chicago. School of Education. 1979. (Statistical Laboratory Research Memorandum,
23B).
WRIGHT, B.D., PANCHAPAKESAN, N. A procedure for samplefree item analysis. Educational and
Psychological Measurement, Durham (NC), v.29, p.23-48, 1969.
2ª PARTE
CONCLUSÃO
REFERÊNCIAS BIBLIOGRÁFICAS
REES, A.H., PALMER, F.H. Factors related to change in mental test performance. Developmental
Psychology Monographs, v.3, n.2, 1970.
RESCHLY, D.J. Aptitude tests in educational classification and placement. In: GOLDSTEIN, G.,
HERSEN, M. (Eds.). Handbook of psychological assessment. New York: Pergamon, 1990.
------------------ . Evaluation of the effects of SOMPA Measures on classification of students as
mildly retarded. American Journal on Mental Deficiency, v.86, p.16-20, 1981.
RESNICK, LB. The future of IQ testing in education. In: STERNBERG. R.J., DETTERMAN. D.K.
(Eds.). Human intelligence. Norwood (NJ): Ablex, 1979.
ROAZZI, A., SPINILLO. A.G., ALMEIDA, L.S. Definição e avaliação da inteligência: limites e
perspectivas. In: ALMEIDA, L.S. (Ed.). Cognição e aprendizagem escolar. Porto:
Associação dos Psicólogos Portugueses, 1991.
ROSENTHAL. R.. JACOBSON. L. Pygmalion in the classroom. New York: Holt, Rinehart and
Wiston, 1968.
SATTLER, J.M. Age effects on Wechsler adult intelligence scale-revised tests. Journal of
Consulting and Clinical Psychology. Washington. D.C.. v.SO, p.785-786. 1982.
------------------ . Assessment of children. San Diego (CA): Jerome M. Sattler. 1988.
SPEARMAN, C. The abilities of man. New York: Macmillan, 1927.
STERNBERG, R.J. Beyond IO: a triarchic theory of human intelligence. Cambridge: Cambridge
University Press, 1985.
------------------ . Death, taxes, and bad intelligence tests. Intelligence, Norwood (NJ), v. 15, p.257-
269. 1991.
THORNDIKE, R.L, HAGEN, E.P., SATTLER, J.M. Stanford-Binet intelligence scale. 4.ed. Chigago
(IL): Riverside, 1986.
THURSTONE, L.L Primary mental abilities. Chicago (IL): Univ. Chicago Press, 1938.
TYLER, L.E. Individuality, human possibilities and personal choice in the psychological de-
velopment of men and women. San Francisco (CA): Jossey-Bass, 1981.
VANE. J.R.. MOTTA. R.W. Group intelligence tests. In: GOLDSTEIN, G., HERSEN, M. (Eds.).
Handbook of psychological assessment. New York: Pergamon, 1990.
VERNON, P.E. The structure of human abilities. London: Methuen, 1965.
VYGOTSKY. L.S. Mind in society, the development of higher psychological process. Cambridge
(MA): Harvard University Press, 1978.
------------------ . The measurement and appraisal of adult intelligence. Baltimore (MD): Williams
and Wilkins, 1958.
------------------ . The measurement of adult intelligence scale. Baltimore (MD): Williams and
Wilkins, 1939 e 1944.
WEISS, D.J.. DAVIDSON, M.L Test theory and methods. Annual Review ofPsychology.*.32, p.629-
658, 1981.
WESMAN, AG. Intelligenttesting. American Psychologist, Washington, D.C., v.36. p. 112-113, 1968.
WIGDOR, A.K.. GARNER, W.R. Ability testing: uses, consequences, and controversies.
Washington, D.C.: National Academy Press, 1982.
WILLIAMS, R.L The BITCH test. St. Louis (MO): Black Studies Program. Washington University,
1972.
------------------ . Danger: testing and dehumanizing the black child. Clinical Child Psychology
Newsletter, v.9, p.5-6, 1970.
------------------ . The problem of match and mismatch in testing black children. In: MILLER, L.
(Ed.). The testing of black students: a symposium. Englewood Cliffs (NJ): Prentice-Hall, 1974.
ZAZZO. R., GILLY M.. VERBA-RAD. M. Nouvelle échelle métrique de l'intelligence. Paris: Armand
Colin, 1966.
------------------ . Nova escala métrica da inteligencia. Lisboa: Livros Horizonte, 1978. v.1.
CAPITULO 9
METODO
Forma II a
(continua)
Fig. 9-1 (cont.)
Primera premisa
relacionai
(A1B) (AOB) (APB)
Id. =identidad, Sb. =subconjunto, Sp. = superconjunlo, Ov. =Iraslapamiento (overlap), Ex. =exclusión entre conjuntos. Las rela-
ciones Sp. entre paréntesis pueden dar lugar a controversia con respecto a Ex.; ellas respuenden al criterio del autor que se ha
basado en (B1 A). Esta ambigüedad surge del conjunto vacio cuando se lo emplea como término consecuente de las relaciones R.
PREMISAS EXTENSIONALES
Diagrama Rectangular
( + ) A ( + ) U
A-B-C-D -A-B-C-
(+) (-) B D
AB-C-D -AB-C-D
(-) (-) (-) (+) c
A-BC-D ABC-D -ABC-D -A-BC-D
(-) (-) (-) ( + ) D
A-BCD ABCD -ABCD -A-BCD
(-) (-) (-) -A-B-CD
A-B-CD AB-CD -AB-CD
En el caso en que A = 0
En el caso en que A ≠Ǿ
CONCLUSIONES
ABELSON, R.P. ARONSON, E., MCGUIRE, W.J.. NEWCOMB, T.M., ROSENBERG, M.J..
TANNEMBAUM, P.H. (Eds.)- Theories of cognitive consistency, a source-book. Chicago (IL): Rand-
McNally, 1968.
BENTHAM, J. Outline on a new system of logic. [S.I.: s.n.], 1827.
BOOLE, G. An investigation of the laws of thought. London: Macmillan, 1854.
--------------- .The mathematical analysis of logic. Cambridge (MA): MacMillan, Barclay and
MacMillan, 1847.
--------------- . The mathematical analysis of logic. Oxford: Basil Blackwell, 1948,1951.
BROUWER, L.E.J. Intuitionism and formalism. Bulletin of the American Mathematical Society, V.20,
p.81-96, 1913.
CERASO, J., PROVITERA. A. Sources of error in syllogistic reasoning. Cognitive Psychology. V.2,
p.400-410. 1971.
CHAPMAN. L.J., CHAPMAN, J.P. Atmosphery effect re-examined. Journal of Experimental Psychology
Washington, D.C.. v.58, p.220-226,1959.
CRONBACH. L.J., GLESER, G.C., RAJARATNAM, N.. NANDA. H. The dependability of behavioral
measure, theory of generalizability for scores and profiles. New York: Wiley, 1972.
DEL VAL, J.A. (Comp.). Investigaciones sobre lógica y psicología. Madrid: Alianza Universidad, 1977.
DICKSTEIN, L.S. Differential difficulty of categorical syllogisms. Bulletin of the Psychonomic Society.
V.8, p.330-332. 1976.
ERICKSON. J.R. Research on syllogistic reasoning. In: REVLIN, R., MAYER, RE. (Eds.). Human
reasoning. Washington, DC: Winston, 1978.
--------------- . A set analysis theory of behavior in formal syllogistic reasoning tasks. In: SOLSO,
R.L. (Ed.). Theory of cognitive psychology, the Loyola Symposium. Potomac: Erlbaum. 1974.
EVANS, J.S.B.T. Selective processes in reasoning. In: EVANS, J.S.B.T. (Ed.). Thinking and reasoning,
psychological approaches. London: Routledge and Kegan. 1983.
FEATHER, NT. Acceptance and rejection of arguments in relation to attitude strength, critical ability,
and intolerance of incosistency. Journal of Abnormal and Social Psychology, v.69, p. 127-136,1965.
FELDMAN, S. (Ed.). Cognitive consistency, motivational antecedents and behavioral consequents. New
York: Academic Press, 1966.
FESTINGER, L A theory of cognitive dissonance. Stanford (CA): Stanford University Press, 1957.
FRANDSEN, A.N., HOLDER. J.R. Spatial visualization in solving complex verbal problems. Journal of
Psychology. Provincetown (MA), v.73, p.229-233, 1969.
FRASE, L.T. Belief, incongruity, and syllogistic reasoning. Psychology Reports, v. 18, p.982, 1966.
GOTTESMAN, L. CHAPMAN, L.J. Syllogistic reasoning errors in schizophrenia. Journal of Consulting
Psychology, v.24, p.250-255, 1960.
GUILFORD. J.P. Three faces of intellect. American Psychologist. Washington. D.C., v.14,
p.469-479, 1959.
HALPERN. J. Reasoning. In: EYSENCK. M.W. (Ed.). The Blackwell dictionary of cognitive
psychology. Oxford: Basil Blackwell. 1990.
HAMILTON, W. Lectures on metaphysics and logic. [S.I.: s.n.J, 1859.
HARRELL. W.A. The effects of alcohol use and offender remorsefulness on sentency decisions.
Journal of Applied Social Psychology. Silver Spring (MD). v. 11, p.83-91, 1981.
HEIDER, F. The psychology of interpersonal relations. New York: Wiley. 1958.
HENLE. M. Foreword. In: REVLIN, R., MAYER. R.E. (Eds.). Human reasoning. Washington,
D.C.: Winston. 1978.
. ------------ . On the relation between logic and thinking. Psychological Review. Washington.
D.C.. V.69, p.366-378, 1962.
HERBART, J.F. Hauptpunkte derlogik. [S.I.: s.n). 1808.
— ---------- . Lehrbuch zur einleitung in die philosophie. [S.I.: s.n.]. 1813.
JOHNSON-LAIRD, P.N. Mental models. Cambridge (MA): Harvard University Press. 1983.
------------- . El ordenador y la mente: introducción a la ciencia cognitiva. Barcelona: Paidós,
1990.
KAHNEMAN, D.. SLOVIC, P.. TVERSKY, A. (Eds.). Judgment under uncertainty: heuristics
and biases. Cambridge: Cambrigde University Press, 1983.
KANT, I. Logik. [S.I.: s.n.|. 1800. (Redactado por Jàsche sobre apuntes de clase de Kant).
KASSIN, S.M. Base rates and prediction: the role of sample size. Personality and Social
Psychology Bulletin. Beverly Hills (CA). v.5, p.210-213, 1979.
LEFFORD, A. The influence of emotional subject matter on logical reasoning. Journal of
General Psychology. Provincetown (MA), v.34. p. 127-151, 1946.
LINDZEY. G„ ARONSON, E. (Eds.). The handbook of social psychology. 2.ed. Reading
(MA): Addison Wesley, 1969. v.3: The individual in the social context.
LIPPS, T. Grundzuge derlogik. [S.I.: s.n|. 1893.
LOPEZ ALONSO. A.O. Test de coherencia. Publicación CIIPME. Buenos Aires, v.65. 1981.
------------- . Razonamiento humano: un test para su consistencia interna. Revista Signos
Universitarios. Buenos Aires, v.7, n.13 (Especial: Psicología), 1988.
------------- . Razonamiento humano: distintos niveles de insight estructura y organización lógica
subyacente (versión ampliada). Cuadernos Pinero, Buenos Aires, n.16, 1990.
------------- . Razonamiento humano: distintos niveles de insight, estructura y organización lógica
subyacente. Revista de Psicología General y Aplicada. Madrid, v. 44, n.2, p.221-230,199 la.
------------- . Hacía una teoría sistémico-cibernética de la organización cognitiva de la mente y
del origen de la conciencia. Revista Signos Universitarios. Buenos Aires, v.10, n.19
(Especial: Miscelánea I), 1991b.
--------------. Incidencia de la codificación de las premisas en el logro de un razonamiento
coherente. Revista Interdisciplinata, Buenos Aires, v.10 n.2, p. 137-167, 1991c.
--------------. Relational structures of premisses as determinant of reasoning coherence and
thought logical organization. Brussels, 1992. Trabajo presentado en el 25th. International
Congress of Psychology, Bélgica, julio 1992.
LOPEZ ALONSO, A.O., RICARDI, N.C. La organización lògica del razonamiento en relación con
categorías de diagnòstico psiquiátrico. Revista IRICE, Rosario, 1993.
LORD, C.R., ROSS, L, LEPPER, M.R. Biased assimilation and attitude polarization: effects of
prior theories on subsequently considered evidence. Journal of Personality and Social
Psychology, Washington, D.C., v.37, p.2098-2109, 1979.
McGUIRE, W.J. Cognitive consistency and attitude change. Journal of Abnormal and Social
Psychology, v.60, p.345-353,1960.
REVLIN, R. Two models of syllogistic reasoning: feature selection and conversion. Journal of
Verbal Behavior,w.l4, p.180-195, 1975.
RICARDI, N.C. Estudio evolutivo del pensamiento y su covariación con la consistencia interna
del razonamiento en niños sordos y oyentes. Revista del Instituto de Investigaciones
Educativas. Buenos Aires, v.15, n.67/68, oct. 1989.
RIMOLDI, H.J.A. Problems of thinking about thinking: language, and logical structure in problem
processing. In: FROELICH, W., SMITH, G., DRAGUNS, J., HENTSCHEL, U. (Eds.).
Psychological processes in cognition and personality. Washington, D.C.: Hemisphere, 1984.
. A technique for the study of problem solving. Educational and Psychological Measure
ment, Durham (NC), v.15, n.4, p.450-461, 1955.
VON DOMARUS, E. The specific laws of logic in schizophrenia. In: KASAMIN, J.S. (Ed.). Language
and thought in schizophrenia. Berkeley: University of California Press, 1944.
VON WRIGHT, G.H. Ensayo de lógica modal. Buenos Aires: S. Rueda, 1970.
WASON, P.C. Problem solving and reasoning. British Medical Bulletin. Cognitive Psychology,
Edinburgh, v.3, p.206-210,1971.
--------------- . Realismo y racionalidad en la tarea de selección. In: CARRETERO, M., GARCIA
MADRUGA, J.A. (Comps.). Lecturas en psicología del pensamiento. [S.l.]: Alianza Psicología,
1984.
----------------. Reasoning. In: FOSS. B. (Ed.). New horizons in psychology. London: Penguin, 1966.
--------------- . Self contradictions. In: JOHNSON-LAIRD, P.N., WASON, P.C. (Eds.). Thinking:
readings in cognitive science. Cambrigde: Cambridge University Press, 1977.
WHITEHEAD, A.N., RUSSELL, B. Principia mathematica. Cambrigde: Cambridge University Press,
1910.
WOODWORTH, R.S., SELLS, S.B. An atmosphere effect in normal syllogistic reasoning. Journal of
Experimental Psychology, v.18, p.451-460, 1935.
OBSERVAÇÃO DO COMPORTAMENTO
Diretrizes metodológicas
Como decorrência das proposições teóricas da etologia e da análise
do comportamento aplicada, foi desenvolvida uma série de diretrizes
metodológicas para a realização de estudos observacionais, que serão
descritas a seguir. Antes, porém, é importante lembrar a questão da
seletividade. Segundo Hinde (1966), a seleção na observação é inevitável:
a descrição e a classificação envolvem rejeição de dados e seleção de
critérios. Sempre se corre o perigo de rejeitar os dados essenciais e utilizar
unidades de análise irrelevantes. No entanto, a rejeição insuficiente de
dados pode levar a um conjunto de detalhes confusos e desviar a atenção
dos aspectos essenciais do problema. Para Hinde (1973), o grau de
seleção depende do problema estudado e do fato de que a precisão do
registro diminui à medida que aumenta o número de respostas a registrar.
Avaliação da fidedignidade
O conceito de fidedignidade, de acordo com a teoria clássica dos
testes, é apresentado por Johnson e Bolstad (1973, p.26) como "a
consistência com que um teste mede um dado atributo ou fornece um
escore consistente em uma dada dimensão", sendo que "a exigência
clássica de fidedignidade envolve a consistência no instrumento de medida
ao longo do tempo (fidedignidade no teste-reteste) ou ao longo de
conjuntos de itens respondidos na mesma ocasião (fidedignidade split-
half)" (id. ibid., p.10). O autor discute a aplicação do conceito aos estudos
observacionais em análise do comportamento aplicada e argumenta que
o cálculo do acordo entre observadores não deve se constituir a única
forma de aferir a fidedignidade desses estudos.
Weick (1968) cita Medley e Mitzel, que sugerem três tipos de
fidedignidade, calculados através de diferentes índices: acordo entre
observadores (diferentes observadores observando ao mesmo tempo),
estabilidade (o mesmo observador observando em ocasiões diferentes) e
fidedignidade (observadores diferentes observando em ocasiões diferen-
tes). A medida de acordo entre observadores, mais comumente utilizada,
privilegia a intersubjetividade, enquanto as demais privilegiam a replicabili
dade. O autor também cita Dunnette, que argumenta que há várias fontes
de erros quando se faz observação, e que o tipo de fidedignidade
necessária para avaliar ou compensar cada um desses erros é diferente.
Os tipos de erros mencionados são: a) amostragem inadequada de con-
teúdo, quando observadores diferentes colhem amostras de apenas alguns
elementos de um comportamento complexo e essas amostras consistem de
elementos diferentes; b) tendências de respostas ao acaso, que provêm
de definições imprecisas de categorias ou de compreensão inadequada da
categoria por parte do observador, que o levam freqüentemente ao uso de
definições intuitivas informais, mais variáveis que as formalmente definidas;
c) mudanças no ambiente e d) mudanças na pessoa que está sendo
observada, duas alterações que podem ocorrer ao longo do período de
observação. Dadas essas várias fontes de erro, Weick (1968) sugere que a
fidedignidade seja medida de vários modos. Num estudo ideal de obser-
vação, seriam feitas quatro comparações: 1) as classificações de duas
pessoas observando o mesmo evento seriam correlacionadas, prevenindo
erros de mudanças na pessoa e no ambiente; 2) as classificações de um
mesmo observador observando um evento semelhante em duas ocasiões
diferentes seriam comparadas, evitando-se erro de amostragem de
conteúdo; 3) depois seria correlacionado o acordo de dois observadores
observando um evento em duas ocasiões diferentes, medida vulnerável às
quatro fontes de erro, da qual se pode esperar a fidedignidade mais baixa
dentre as quatro comparações; 4) finalmente, as observações de um único
observador observando um único evento seriam comparadas às outras
correlações, em uma verificação da consistência interna do observador. O
autor considera que é possível apenas aproximar-se deste ideal de
avaliação da fidedignidade, priorizando-se o acordo entre observadores em
relação a um único evento. Tendo em vista as atuais possibilidades de
gravação em vídeo, considera-se que seria bastante viável adaptar essas
propostas para avaliação da fidedignidade tanto durante o treino de
observadores como no teste de categorias de comportamento.
Uma revisão das variáveis que podem afetar o índice de concor-
dância foi realizada por Batista (1977). No que se refere ao acordo entre
observadores quando é utilizada a técnica de registro cursivo, Batista e
Matos (1984) discutem a questão e sugerem definições e medidas aplicá-
veis a essa técnica de registro.
Batista (1985) analisa as diferenças de abordagem à questão da
fidedignidade por autores ligados à etologia e à análise do comportamento
e conclui que o pesquisador deve adequar a avaliação de fidedignidade às
características específicas de seu projeto de trabalho. A autora faz
algumas sugestões específicas:
a) Estudos preliminares que visem à caracterização de um fenô-
meno podem se beneficiar mais de discussões informais entre pesqui-
sadores do que de testes formais de fidedignidade.
b) Estudos em que um único observador efetua todos os registros
de comportamento podem ter avaliações de fidedignidade de várias
formas, entre as quais 1) a aferição da estabilidade do observador
através de verificação de seu desempenho no registro de um mesmo
vídeo em duas situações diferentes e 2) a comparação de seu desem-
penho com o de um pesquisador experiente que tenha tido contato
prévio com as definições das categorias apenas por escrito.
c) Estudos em que diferentes observadores participem da coleta de
dados terão que contar necessariamente com um sistema de aferição
da precisão de cada um desses observadores. Um alto índice de
acordo, no entanto, não indicará necessariamente a adequação do
sistema de categorias utilizado, uma vez que estes poderão estar
reagindo a uma definição implícita da categoria.
d) O teste das definições de categorias poderá ser realizado, em
parte, através da análise dos desacordos constatados para categorias
específicas.
No que se refere à fidedignidade, o importante é reter o significado
mais amplo do termo e estabelecer formas de aferi-la que sejam compatí-
veis com os objetivos de cada estudo.
A perspectiva sociointeracionlsta-construtivista
de estudo do desenvolvimento
Trata-se de uma perspectiva que aborda a situação de interação
social como constitutiva dos sujeitos. Enfoca o diálogo como troca nego-
ciada constitutiva dos sujeitos e da própria troca (Lyra, 1988). Baseia-se,
em parte, em formulações referentes à aquisição da linguagem (Lemos,
1981), em que a autora considera que as situações de interação são um
espaço para a construção de relações semânticas, morfológicas e
sintáticas pela criança. Ela propõe uma continuidade entre o período pré-
verbal e o verbal na aquisição da linguagem e sugere que a criança deve
passar pelo processo de inserir-se numa estrutura diàdica com um
interlocutor para construir uma representação de si mesma e do outro
como interlocutores. Considera que sua proposição é semelhante à de
Vygotsky, citado por ela, de que as atividades da criança adquirem
significado em um sistema de relacionamento social, na medida em que o
caminho que vai do objeto para a criança e da criança para o objeto passa
pela relação com outra pessoa.
Dentro desse enfoque, Lyra e colaboradores (Lyra, 1988,1991; Lyra,
Galindo, Cipriano, 1990; Lyra, Cabral, Pantoja, 1991) têm desenvolvido um
programa de pesquisa das interações entre mãe e bebê, realizando
registros longitudinais em vídeo em situação natural. Têm sido analisadas
como atividades partilhadas as interações "face a face" e as interações
"mãe-objeto-bebê". Nas interações "face a face", têm sido estudadas a
produção vocal e o sorriso. Ao discutir aspectos referentes à transcrição e
análise de dados em vídeo, Lyra (1991) afirma a necessidade de uma
"filiação profunda" entre a posição teórico-epistemológica do pesquisador
e a metodologia de transcrição e análise de dados a ser adotada.
Esclarece alguns pontos acerca de sua concepção de estudo, destacando-
se: a) a necessidade de exploração de registros longitudinais; b) uma
concepção de causalidade como transformações e construções bidirecio-
nais e interdependentes; c) o enfoque em ambos os sujeitos bem como na
interação entre eles; d) a visão da diade como unidade de análise
indissociável. Nesse sentido, propõe como solução metodológica para uma
primeira fase do programa de pesquisa a descrição e análise de momentos
identificados como qualitativamente diferentes dos anteriores e posteriores,
"procurando relacionar as transformações e construções identificadas à
compreensão do dinamismo existente na história da diade, ou seja, aos
processos de troca negociada entre os parceiros, chamados de processos
dialógicos" (Lyra, 1991, p.294). Decorre daí a necessidade do registro
longitudinal em vídeo, cuja transcrição e análise são efetuadas a partir de
critérios derivados dessas concepções.
A partir dessa análise, de cunho qualitativo, a autora relata o
destaque de um elemento presente nas organizações face a face: as
trocas vocais, que ensejaram uma segunda fase de seu programa de
pesquisa, incluindo uma verificação quantitativa das modificações
identificadas na produção vocal do bebê. Reafirma, entretanto, que sua
posição teórica vê a quantidade como filiada à qualidade, sendo que a
compreensão do processo de transformação e construção continuam a
depender de uma análise qualitativa.
Outro exemplo de trabalho nessa perspectiva é o de Oliveira (1988a),
que realizou um estudo longitudinal em uma creche pública, usando a
noção de "jogo de papéis" como foco da análise dos dados, registrados em
vídeo. A análise das transcrições foi realizada com base na seleção de
trechos em que se evidenciava a construção de enredos de diferentes
papéis construídos pelas crianças no grupo e no faz-de-conta. A análise
mostrou a construção coletiva da brincadeira e uma crescente diferen-
ciação de papéis. A autora tem analisado também situações de interação
adulto-criança em creches e pré-escolas. Ela discute o conceito de papel
na análise do processo interacional, retomando postulados da Psicologia
sociointeracionista de base dialética do início do século, e propõe um
enfoque processual que concebe a interação "como constituindo os
sujeitos e não como influências, mesmo que recíprocas, entre sujeitos já
constituídos" (Oliveira, 1992).
Ainda um outro exemplo de pesquisa abordando a interação entre
crianças como um processo de construção mútua é o trabalho de Pedrosa
(1989), que fez gravações em vídeo na creche, em situação de recreação
livre. A autora apresenta seus dados na forma de descrição de onze
episódios, indicando para cada um: a) o nome do episódio; b) dados sobre
a data, horário, duração, crianças envolvidas; c) descrição da situação
(presente e imediatamente anterior); d) resumo do episódio e descrição
detalhada do mesmo. A análise dos dados evidencia: a) a ocorrência de
brincadeira compartilhada em grupo, sem a sugestão do adulto, em
crianças desde menos de dois anos de idade; b) o levantamento de
hipóteses sobre processos de regulação, tais como o "arranjo" da
brincadeira, ajustamentos rítmicos e posturais, regras, etc. Discutindo
questões referentes à transcrição e análise de registro em vídeo, Pedrosa
e Carvalho (1991, p.285) definem episódio interativo como "um segmento
de registro onde aparecem seqüências interativas claras e conspicuas ou
trechos do registro em que se pode circunscrever um grupo de crianças a
partir do arranjo que formam e/ou da atividade que realizam" e consideram
que o recorte em episódios corresponde a uma primeira forma de seleção
dos dados que parece útil para perseguir a estrutura interacional do grupo.
Afirmam que o início de um episódio pode ser delimitado por um fato a
partir do qual se articula uma seqüência interativa (por exemplo: uma
criança pega um apito e começa a soprá-lo) ou o episódio pode emergir
de uma situação em que vários elementos se combinam e se constituem
em uma seqüência, às vezes só reconhecida a posteriori, e cujo início é
algumas vezes arbitrado, o mesmo ocorrendo para a delimitação do
término de um episódio.
Os episódios são a seguir divididos em momentos, com critérios
bastante flexíveis. Em alguns casos, segue-se a composição social do
grupo; em outros, a configuração da seqüência em curso, seguindo pistas
como o conteúdo da brincadeira, a distribuição espacial, etc. As autoras
ressaltam que essa proposta de recorte decorre de sua concepção de
interação, concebida como "um processo de influências recíprocas entre
os parceiros" (id. ibid., p.286), admitindo que a estruturação desses arranjos
envolve processos de regulação entre as crianças.
As autoras destacam dois tipos de transcrição do episódio: um que
privilegia uma seqüência de interação identificada e descreve o comporta-
mento das outras crianças que também estão em cena, apenas se estiver
diretamente relacionado àquela seqüência — nesse caso, o interesse é
seguir a trama interacional específica; já o outro tipo de transcrição procura
incluir tanto as seqüências interacionais quanto informar sobre todos os
comportamentos das crianças que aparecem em cena, com um foco de
atenção mais abrangente, usado quando se deseja comentar as regu-
lações recíprocas entre as crianças presentes num registro.
Quanto ao nível de detalhamento na transcrição do episódio,
Pedrosa e Carvalho propõem como regra: o comportamento das crianças
deverá ser transcrito em detalhes apenas se essa descrição for esclarece-
dora para a compreensão do que se deseja demonstrar. Com base nesta
regra, só se descreve, por exemplo, a postura da criança em suas minúcias
morfológicas quando esta for o alvo de interesse do trabalho (por exemplo:
uma inclinação de tronco da criança pode interessar quando for seguida
de movimento semelhante por outra criança).
As autoras sugerem, ainda, o registro de impressões provocadas no
pesquisador pelas ações das crianças, distinguindo-as dos fatos observa-
dos, dando um "tom" à situação e favorecendo a compreensão do episódio.
A análise qualitativa é proposta a partir de perguntas que levam ao
exame e ao reexame dos episódios e à sua relação com as formulações
teóricas subjacentes.
Assim, dentro da perspectiva sociointeracionista-construtivista, têm
sido exploradas novas formas de análise e tratamento de dados, decorren-
tes das formulações teóricas adotadas pelos pesquisadores da área.
REFERÊNCIAS BIBLIOGRÁFICAS
ADES, C. A teia e a caça da aranha Argiope argentata. São Paulo, 1972. Tese (Doutorado)
— Faculdade de Filosofia. Letras e Ciências Humanas, USP.
ALTMANN, J. Observational study of behavior: sampling methods. Behaviour, v.49, p.227-267,
1974.
ALTMANN, S.A. Sociobiology of rhesus monkeys: the stochastics of social communication.
Journal of Theoretical Biology, London, v.8, p.490-522, 1965.
ALVES, Z.M.B.A. Análise da interação máe-criança: um estudo longitudinal (dos dois ao seis
meses) da evolução de seqüências de interação. Ribeirão Preto, 1973. Tese (Doutorado)
— Faculdade de Filosofia, Ciências e Letras, USP.
ALVES, Z.M.B.A., CARVALHO, A.M.A., MARTURANO, EM., METTEL. T.P.L. ROSSETTI-
FERREIRA, M.C. Questões metodológicas no estudo da interação humana. In: REUNIÃO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 17, 1987. Anais...
Ribeirão Preto, 1987. p.531-541.
BAER, D.M., WOLF, M.M., RISLEY, T. Some current dimensions of applied behavior analysis.
Journal of Applied Behavior Analysis, Lawrence (KS), v.1, n.l, p.91-97, 1968.
BASTOS, M.F., CARVALHO, A.M.A. Empatia entre crianças. In: REUNIÃO ANUAL DASOCI-
EDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 21,1991. Anais... Comportamento pro-
social: questões filogenéticas e ontogenéticas. Ribeirão Preto, 1991. p.l 14-116. «
BATISTA CG. Catálogo de comportamentos motores observados durante uma situação de
refeição. São Paulo, 1978. Dissertação (Mestrado) — Instituto de Psicologia, USP.
--------------. Concordância e fidedignidade na observação. Psicologia, v.3, n.2, p.39-49,1977.
--------------. Elaboração de um catálogo de comportamentos motores observados na interação
entre pais e filhos. Psicologia, v.6, n.3, p.47-81, 1980.
--------------. Mães e crianças brincando: um estudo de influências recíprocas. São Paulo, 1989.
Tese (Doutorado)— Instituto de Psicologia, USP.
BATISTA, CG. Objetivos da avaliação da fidedignidade em estudos observacionais. Psicolo-
gia: Teoria e Pesquisa, v.1, n.3. p.205-214, 1985.
BATISTA. CG., MATOS, MA. O acordo entre observadores em situação de registro cursivo:
definições e medidas. Psicologia, v.10, n.3, p.57-69, 1984.
BERGAMASCO, N.H.P. Expressões faciais de recém-nascidos em resposta a estímulos
gustativos e olfativos. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RI-
BEIRÃO PRETO. 21. 1991. Anais... Transcrição e análise de registro em vídeo. Ribeirão
Preto. 1991.p.291-292.
. . Percepção de estímulos químicos em recém-nascidos: discriminação e prefe
rências. In: REUNIÃO ANUAL DASOCIEDADE BRASILEIRA DE PSICOLOGIA, 22.1992.
Resumos de comunicações cientificas..., n.336.1. [S.I.], 1992.
BERGAMASCO, N.H.P, LIMA, A., KRUSNAUKAS, I. Valor de comunicação das respostas
faciais de recém-nascidos. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRÃO PRETO, 21, 1991. Resumos..., n.211. Ribeirão Preto, 1991.
BIJOU, S.W., PETERSON, R.F., AULT, M.H. A method to Integrate descriptive and empirical
field studies at the level of data and empirical concepts. Journal of Applied Behavior
Analysis. Lawrence (KS), v.1, n.2, p.175-191. 1968.
BLURTON JONES, N. (Org.). Ethological studies of child behavior. Cambridge: Cambridge
University Press, 1972.
BRANCO, A.U. Ontogenèse e promoção do comportamento pró-social. In: REUNIÃO ANUAL
DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 21.1991. Anais... Comporta-
mento pró-social: questões filogenéticas e ontogenéticas. Ribeirão Preto, 1991. p.110-113.
. Socialização na pré-escola: o papel da professora e da organização das ativida
des no desenvolvimento das interações sociais entre as crianças. São Paulo, 1989. Tese
(Doutorado) — Instituto de Psicologia, USP.
BRANCO, A.U., METTEL, T.P.L Comportamento pró-social: um estudo com pré-escolares.
Psicologia, v.10, n.1. p.43-61, 1984.
-------------- . A interação professora-alunos na pré-escola: uma metodologia de análise. In:
REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 19,1989.
Resumos..., n. 222. Ribeirão Preto, 1989a.
. Socialização na pré-escola: fatores interativos e ambientais relacionados às intera
ções criança-criança. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRÃO PRETO, 19,1989. Resumos..., n. 231. Ribeirão Preto, 1989b.
BRANDÃO, CR. Pesquisar-participar. In: BRANDÃO, CR. (Org.). Pesquisa participante. São
Paulo: Brasiliense. 1981.
BUSSAB, V.S.R. Comportamento pró-social: questões filogenéticas. In: REUNIÃO ANUAL
DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 21.1991. Anais... Comporta-
mento pró-social: questões filogenéticas e ontogenéticas. Ribeirão Preto, 1991. p.197-209.
-------------- . Processos de ritualização: aspectos filogenéticos e ontogenéticos. In: REUNIÃO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 18,1998. Resumos...,
n. 132. Ribeirão Preto, 1988.
CAMPOS DE CARVALHO, M.l. Arranjo espacial e distribuição de crianças de 2-3 anos pela
área de atividades livres em creche. São Paulo, 1990. Tese (Doutorado) — Instituto de
Psicologia, USP.
CAMPOS DE CARVALHO, M.l. Organização espacial da área de atividades livres em cre-
ches. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO,
18, 1988. Anais... Condições ambientais na educação do indivíduo especial. Ribeirão
Preto, 1988. p.305-310.
CARVALHO, A.M.A. Abordagem etològica: desenvolvimento, socialização. São Paulo, 1978.
Apostila utilizada no curso de Pós-Graduação do Departamento de Psicologia Expe-
rimental. Instituto de Psicologia, USP.
-------------- . Algumas reflexões sobre o uso da categoria "interação social". In: REUNIÃO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 18, 1988. Anais...
Avanços recentes em Psicologia do desenvolvimento. Ribeirão Preto, 1988. p.511-515.
-------------- . Alguns dados sobre a divisão de trabalho entre obreiras de Atta sexdens rubropi-
losa, Forel, 1908 (Hymenoptera-Formicidae), em colônias iniciais, mantidas em labo-
ratório. São Paulo, 1972. Tese (Doutorado) — Faculdade de Filosofia, Letras e Ciências
Humanas, USP.
-------------- . Critérios para a descrição e análise de relações interindividuais: revisão crítica e
análise empírica. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO
PRETO, 21,1991. Resumos..., n. 202. Ribeirão Preto, 1991a.
-------------- . Questões conceituais. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRÃO PRETO, 21, 1991. Anais... Comportamento pró-social: questões filoge-
néticas e ontogenéticas. Ribeirão Preto, 1991b. p.104-106.
. Relações interpessoais: o nível de recorte. In: REUNIÃO DA SOCIEDADE BRA
SILEIRA DE PSICOLOGIA, 22. 1992. Resumos de comunicações científicas..., n.342.2.
[S.I.], 1992.
CARVALHO, A.M.A., BERALDO, K.E.A. Interação criança-criança: ressurgimento de uma
área de pesquisa e suas perspectivas. Cadernos de Pesquisa, São Paulo, v.71, p.55-61,
1989.
CATANIA, A.C. The nature of learning. In: NEVIN, J.A., REYNOLDS, G.S. (Orgs.). The study
of behavior. Glenview: Scott, Foresman and Co, 1973.
CHAGURI, AC, RUBIANO, M.R.B., SILVA JR., V., ROSSETTI-FERREIRA, M.C. A organi-
zação de crianças em creches com diferentes enfoques pedagógicos. In: REUNIÃO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 21,1991. Resumos...,
n.205. Ribeirão Preto, 1991.
COPI, I.M. Introdução à lógica. Trad. por Álvaro Cabral. São Paulo: Mestre Jou, 1974.
CORRAZE, J. As comunicações não-verbais. Trad. por Roberto C. Lacerda. Rio de Janeiro:
Zahar, 1982.
COUTINHO. S.M.G.. ZANNON, C.M.L.C. Estudo exploratório de interações sociais em setor
de emergência pediátrica. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRÃO PRETO, 21, 1991. Resumos.... n. 88. Ribeirão Preto, 1991.
CREPALDI, M.A., ZANNON, C.M.LC. Hospitalização infantil: estudo da interação equipe
família em unidade pediátrica. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRÃO PRETO, 19, 1989. Resumos..., n. 40. Ribeirão Preto, 1989.
CUNHA, W.H.A. Acerca de um curso pós-graduado destinado ao treino da observação
científica no domínio das ciências do comportamento. Ciência e Cultura, São Paulo, v.27,
p.846-853, 1974.
CUNHA, W.H.A. Alguns princípios de categorização, descrição e análise do comportamento.
Ciência e Cultura, São Paulo, v.28, p.15-24, 1976.
------------- . O estudo etològico do comportamento animal. Ciência e Cultura. São Paulo, v.27
p.262-268, 1975.
------------- . Exploração no mundo psicológico das formigas: uma investigação de algumas
modificações de comportamento. São Paulo, 1967. Tese (Doutorado) — Faculdade de
Filosofia, Letras e Ciências Humanas, USP.
------------- . Introdução ao desenvolvimento histórico e aos princípios básicos da etologia.
Palestra apresentada no I Encontro de Etologia. Jaboticabal, 1983.
DANNA, M.F., MATOS, M.A. Ensinando observação: uma introdução. São Paulo: Edicon,
1982.
DELAMONT, S., HAMILTON, D.A. A pesquisa em sala de aula: uma crítica e uma nova
abordagem. In: PATTO, M.H.S. (Org.) Introdução à Psicologia Escolar. Sao Paulo: TA.
Queiroz, 1981.
DELEVATI, N.M., LIRA, B.B.P., CÉSAR, O.P., PIRES, S.G., OTTA, E. Influência do sorriso na
percepção de pessoas em função de características do sujeito e do modelo. In: REUNIÃO
ANUAL DA SOCIEDADE BRASILEIRA DE PSICOLOGIA, 22,1992. Resumos de comu-
nicações científicas..., n.30. [S.I.], 1992.
DESSEN, M.A.S.O, METTEL, T.P.L. Interação pais-primogênito quando da chegada de uma
segunda criança na família - um estudo de caso. Psicologia, v.10, n.2, p.27-39, 1984.
DURAN, A.P. O estudo da interação professor-aluno no Brasil: algumas tendências, algumas
questões. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO
PRETO, 17,1987. Anais... Perspectivas para estudo da relação professor-aluno. Ribeirão
Preto, 1987. p.77-85.
. Padrões de comunicação oral e compreensão da comunicação escrita na universi
dade: estudos no Nordeste. São Paulo, 1981. Tese (Doutorado) — Instituto de Psicologia,
USP.
FAGUNDES, A.J.F.M. Definição e análise da resposta de sorrir em situação de leitura de
textos humorísticos. Psicologia, v.4, n.3, p.53-108, 1978.
------------- . Descrição e registro de comportamento. São Paulo: Edicon, 1981.
GIL-CENEVIVA, M.S.A. Interação professor-aluno: estudo descritivo das perguntas dos
alunos em uma sala de aula de primeira série do Primeiro Grau. João Pessoa, 1985.
Dissertação (Mestrado)— Universidade Federal da Paraíba.
GIL, M.S.C.A. Análise funcional da interação professor-aluno: um exercício de identificação
de controles recíprocos. São Paulo, 1990. Tese (Doutorado) — Instituto de Psicologia,
USP.
. Análise funcional da interação professor-aluno: In: REUNIÃO ANUAL DA SOCIE
DADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 21,1991. Anais... Ciclo de estudos em
análise do comportamento IV: novos problemas e novas soluções. Ribeirão Preto, 1991.
p.315-321.
HALL, R.V. Manipulação de comportamento - parte 1: modificação de comportamento. Trad.
por Waldir Bettoi. São Paulo: EPU: EDUSP. 1973.
HINDE, R.A. Animal behaviors synthesis of ethology and comparative psychology. New York:
McGraw-Hill, 1966.
HINDE. R.A. The bases of a science of interpersonal relationships. In: DUCK, S., GILMOUR, R.
(Eds.). Personal relationships. Londres: Academic Press, 1981. v.1.
----------------. On the design of check-sheets. Primates, Aichi, v.14, p.393-406. 1973.
HUIT, S.J., HUTT, C. Observação direta e medida do comportamento. Trad. por Carolina M. Bori.
Sao Paulo: EPU: EDUSP, 1974.
JOHNSON, S.M., BOLSTAD, OD. Methodological issues in naturaliste observation: some
problems and solutions for field research. In: HAMERLYNCK, LA., HANDY, L.C., MADH, E.J.
(Eds.). Behavior change-, methology, concepts and practice. [S.I.]: Research Press, 1973.
KERBAUY, R.R. Autocontrôlé: manipulação de condições do comportamento alimentar. São
Paulo, 1972. Tese (Doutorado) — Faculdade de Filosofia, Letras e Ciências Humanas, USP.
LEMOS, C. de. Interactional processes in the child's construction of language. In: DEUTSCH, W.
(Ed.). The child's construction of language. Londres: Academic Press, 1981.
LI NHARES, M.B.M. Interação professora-aluno em uma classe de 1a. série com substituição de
professoras. São Paulo, 1988. Tese (Doutorado) — Instituto de Psicologia, USP.
LOPES, M.F., BUENO, J.L.O., BARNABE. "OBS": uma ferramenta para análise seqüencial e de
freqüência e duração de varias categorias comportamentais. In: REUNIÃO ANUAL DA
SOCIEDADE BRASILEIRA DE PSICOLOGIA, 22, 1992. Resumos de comunicações
científicas, n.233. [S.I.], 1992.
LYRA, M.C., GALINDO, W.C.M., CIPRIANO, A.M. A mediação construída "face-a-face" na diade
mãe-bebê: a produção vocal e o sorriso. In: REUNIÃO ANUAL DA SOCIEDADE DE
PSICOLOGIA DE RIBEIRÃO PRETO,20,1990. Resumos..., n.16. Ribeirão Preto, 1990.
LYRA. M.O. CABRAL, EA, PANTOJA, A.P.F. A produção vocal do bebê: diferenciação das
interações "mãe-objeto-bebê". In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRÃO PRETO, 21,1991. Resumos..., n.214. Ribeirão Preto, 1991.
----------------. Estudo da interação verbal criança-mãe. Sao Paulo, 1972. Tese (Doutorado) —
Faculdade de Filosofia, Letras e Ciências Humanas, USP.
MARTURANO, E.M. Interação professor-aluno: desafios à pesquisa. In: REUNIÃO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 22,1987. Anais... Perspectivas para
estudo da relação professor-aluno. Ribeirão Preto, 1987. p.86-90.
— ---------. A lógica do sistema de categorias e a análise do comportamento verbal. In: REU
NIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 18, 1988.
Anais... Avanços recentes em Psicologia do desenvolvimento. Ribeirão Preto, 1988. p.517-
520.
-------------. Relação entre o julgamento da professora e o comportamento dos alunos — estudo
de um caso. Psicologia, v.12, n.3, p.47-58, 1986.
MARTURANO, EM., BERTOLDO, A.A., CAMELO, A.L.P. Estudo descritivo do intercâmbio verbal
em sala de aula através da análise de contingência — uma contribuição metodológica.
Psicologia, v.8, n.3, p.19-36, 1982.
MICHAEL, J. Characteristics of a good definition. Washington, DC, 1975. Apostila para distri-
buição interna na American University.
MORAIS, G.S. (Org.). Pesquisa e realidade no ensino de primeiro grau. São Paulo: Cortez, 1980.
--------------- . Pesquisas sobre interação professor-aluno e intervenção na escola. In: REUNIÃO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 17, 1987. Anais...
Perspectivas para estudo da relação professor-aluno. Ribeirão Preto, 1987. p.94-98.
OLIVEIRA, Z.M.R. Jogo de papéis-, uma perspectiva para análise do desenvolvimento humano.
São Paulo, 1988a. Tese (Doutorado) — Instituto de Psicologia, USP.
OTTA, E., SARRA, S. Uma análise motivacional do sorriso e do riso. In: REUNIÃO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 18. 1988. Resumos..., n. 131. Ribeirão
Preto, 1988.
PATTO. M.H.S. A observação antropológica na interação professor-aluno: resumo de uma
proposta. In: PATTO. M.H.S. (Org.). Introdução à Psicologia Escolar. São Paulo: TA.
Queiroz, 1981.
PEDROSA. M.I.P.C. Interação criança-criança: um lugar de construção do sujeito. São Paulo,
1989. Tese (Doutorado) — Instituto de Psicologia, USP.
PEDROSA. M.I.P.C, CARVALHO, A.M.A. Análise qualitativa de interação entre crianças como
processo de construção mútua. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRÃO PRETO, 21, 1991. Anais... Transcrição e análise de registro em vídeo.
Ribeirão Preto, 1991. p.285-290.
PEDROSA, G.B. Relações entre crianças pequenas de mesma idade: algumas características
da dinâmica das díades. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRÃO PRETO, 22,1992. Resumos de comunicações científicas, n.146. Ribeirão Preto.
1992.
PRADO, L.E.S. Fato e significado. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRÃO PRETO, 18, 1988. Anais... A questão da subjetividade em Psicologia. Ri-
beirão Preto, 1988. p.411-417.
RAMOS, A.T.A. Estudo descritivo das relações contingenciais no intercâmbio verbal de
criança com retardo no desenvolvimento da fala, com a professora e a mãe, em situação
natural. São Paulo, 1979. Dissertação (Mestrado)— Instituto de Psicologia, USP.
RAMOS CERQUEIRA, A.T.A. Análise de relações de contingência do repertório verbal de
mães e crianças num contexto Interativo. In: REUNIÃO ANUAL DA SOCIEDADE DE
PSICOLOGIA DE RIBEIRÃO PRETO, 18,1988. Resumos.... n. 196. Ribeirão Preto. 1988a.
. Estudo descritivo do repertório verbal de mães e crianças de baixo nível sócio-
econômico num contexto interativo. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICO
LOGIA DE RIBEIRÃO PRETO, 18, 1988. Resumos..., n.197. Ribeirão Preto, 1988b.
REBER, A.S. The Penguin dictionary of Psychology. London: Penguin, 1985.
RIBEIRO, F.L. Um estudo sobre o comportamento da fêmea durante a fecundação da colônia
em Atta sexdens rubropilosa, Porei, 1908 (Hymenoptera-Formicidae). São Paulo, 1972.
Tese (Doutorado) — Faculdade de Filosofia. Letras e Ciências Humanas, USP.
RICHARDS, M.P.M., BERNAL, J. An observational study of mother-infant interaction. In:
JONES, Blurton (Ed.). Ethological studies of child behaviour. Cambridge: Cambridge
University Press, 1972.
RODRIGUES, M.A.C. Psicologia infantil: a independência da criança pré-escolar. São Paulo:
Edicon, 1985.
ROSSETTI-FERREIRA. M.C. Development of a method for the study of mother-child inter-
action during meal-time. Londres, 1967. Tese (Doutorado).
--------------. Mãe e criança - separação e reencontro: observação em situação de grupo. São
Paulo: Edicon, 1986.
RUBIANO, M.R.B. Ocorrência de atividades lúdicas e compartilhadas em diferentes "settings".
In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 21,
1991. Anais... Transcrição e análise de registro em vídeo. Ribeirão Preto, 1991. p.281-284.
------------- . Suportes ambientais e organização social de crianças em creches. São Paulo, 1990.
Tese (Doutorado) — Instituto de Psicologia, USP.
SATO, T. Classificação numérica do comportamento I - a construção de matrizes métricas.
Psicologia, v.13, n.l, p.55-64, 1987.
SCHERER, K-, EKMAN, P. (Orgs.)- Handbook of methods in nonverbal behavior research.
Cambridge: Maison des Sciences de l'Homme: Cambridge University Press, 1982.
SIDMAN, M. Tactics of scientific research: evaluating experimental data in Psychology. New
York: Basic Books, 1960.
SILVA, A.A. Julgamento de expressões faciais de emoções: fidedignidade, erros mais fre-
qüentes e treinamento. São Paulo, 1987a. Tese (Doutorado) — Instituto de Psicologia,
USP.
-------------- . Expressões faciais de emoções: algumas questões centrais que ainda não foram
pesquisadas ou foram pesquisadas de uma forma insatisfatória. In: REUNIÃO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 17,1987. Anais... Pesquisas que
visam emoções. Ribeirão Preto, 1987b. p. 123-129.
SKINNER, B.F. Ciência e comportamento humano. Trad. por João Cláudio Todorov e Rodol-
pho Azzi. Brasília: Ed. UnB, 1967.
-------------- . Contingências do reforço. Trad. por Rachel Moreno. In: OS PENSADORES. São
Paulo: Abril Cultural, 1975. v.51.
-------------- . Verbal behavior. Englewood Cliffs (NJ): Prentice-Hall, 1957.
SLATER, P.J.B. Describing sequences of behavior. In: BATESON, P.P.G., KLOPFER. P.H.
(Eds.). Perspectives in ethology. Londres: Plenun Press, 1973.
SOLLITTO, N.A. Observação da interação mãe-nenê em uma situação natural. São Paulo,
1972. Tese (Doutorado) — PUC-SP.
STADDON, J.E.R. On the notion of cause, with applications to behaviorism. Behaviorism,
Reno (NV), v.1, p.25-63,1973.
STELLA, E.M. A field-descriptive and experimental study of verbal behavior in one year old
children. Londres, 1974. Tese (Doutorado).
THIOLLENT. M. Notas para o debate sobre pesquisa- ação. In: BRANDÃO, CR. (Org.).
Repensando a pesquisa participante. São Paulo: Brasiliense, 1984.
VAN HOOF, J.A.R.A.M. Categories and sequences of behavior: methods of description and
analysis. In: SHERER, K.R., EKMAN, P. (Eds.). Handbook of methods in nonverbal
behavior research. Cambridge: Maison des Sciences de l'Homme: Cambridge University
Press, 1982.
VIEIRA, T. Estudo observacional sobre modalidades de ações representativas em brinquedo
de faz-de-conta. In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEI-
RÃO PRETO, 18, 1988. Resumos..., n.128. Ribeirão Preto. 1988a.
------------- . Brinquedo de faz-de-conta: um estudo sobre interesse de crianças em objetos.
In: REUNIÃO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRÃO PRETO, 18,
1988. Resumos..., n.129. Ribeirão Preto, 1988b.
VIEIRA, T.A.M. Elaboração de um catálogo de categorias de comportamento: uma contri
buição para o estudo etologico do homem. São Paulo, 1975. Dissertação (Mestrado) —
Instituto de Psicologia, USP.
WEICK, KE. Systematic observation methods. In: LINDZEY, G, ARONSON, E. (Eds.). The
handbook of sodai psychology. New York: Addison Wesley, 1968. v.2.
WITTER, G.P. Discriminação de forma oposição: conhecimento da contingência de reforço.
São Paulo, 1969. Tese (Doutorado) — Faculdade de Filosofia, Letras e Ciências Huma-
nas, USP.
CAPÍTULO 11
A MEDIDA DA CRIATIVIDADE
Fidedignidade
Nas várias medidas de criatividade disponíveis na literatura, sobre-
tudo nas que dizem respeito aos testes de pensamento divergente, as três
distintas formas de se estimar fidedignidade têm sido encontradas. Tanto
a abordagem teste-reteste — ou seja, a correlação entre a mesma forma
de um teste aplicado em diferentes momentos, como formas alternativas
ou paralelas de um mesmo instrumento — como a abordagem de consis-
tência interna têm sido empregadas para estimar a fidedignidade.
Entretanto, segundo Michael e Wright (1989), dependendo da modalidade
de medida de criatividade, um ou outro tipo de abordagem seria mais
adequado. Segundo estes autores, no caso de medidas de pensamento
divergente, por exemplo, o uso de formas alternativas seria mais adequa-
do, ao passo que, no caso de qualquer tipo de avaliação que envolva
observação, que é o que ocorre, por exemplo, quando se utilizam juizes
para avaliar a criatividade de produtos, as abordagens de consistência
interna são as mais apropriadas.
Como discutido anteriormente por Fleith e Alencar (no prelo), a
fidedignidade nas medidas de criatividade pode ser afetada principalmente
pela heterogeneidade do domínio amostrado, ou seja, pela ausência de um
universo claramente definido a respeito de criatividade, do qual os itens
dos instrumentos são retirados, pela amostragem de conteúdo, pela subje-
tividade do avaliador e pelos fatores motivacionais (tanto do avaliador
quanto do avaliado) presentes na situação de avaliação.
Algumas das dificuldades encontradas com relação à fidedignidade
devem-se ao fato de que há dados sobre pessoas criativas que sugerem
variações substanciais da mesma em diferentes períodos em sua produção
criativa. Ademais, fatores motivacionais e mesmo do contexto podem afetar
o desempenho do sujeito em um teste, e isto naturalmente vai refletir em
alguns índices de fidedignidade da medida. Apesar destes aspectos, no
caso do Teste Torrance de Pensamento Criativo, que é o mais utilizado em
pesquisa, há diversos estudos no manual do mesmo (Torrance, 1966,1974)
indicando coeficientes de fidedignidade teste-reteste acima de 0,50 para
as diferentes medidas. Em um de seus estudos apresentados no manual,
com uma amostra de estudantes universitários, Torrance obteve coeficien-
tes variando de 0,68 a 0,85 para os vários testes de sua bateria em um
intervalo de três meses. Os estudos revistos por Torrance indicam ainda
coeficientes de fidedignidade mais altos para adultos do que para crianças
e maiores nas medidas de fluencia e flexibilidade dos testes verbais. Em
um estudo realizado pela autora (Alencar, (1974a), em uma amostra de 159
sujeitos de 4ª e 5a séries, obtiveram-se coeficientes variando de 0,01 a 0,56
para 12 medidas de criatividade dos Testes Torrance de Pensamento
Criativo em um intervalo de quatro meses, bem mais baixos, portanto, do
que os coeficientes citados na literatura.
Validade
Vários são os autores que examinaram, no contexto da avaliação da
criatividade, algumas questões relativas à validade. Esta, como se sabe,
é o aspecto mais importante a ser considerado, e está ancorada, segundo
Wolf (apud Michael, Wright, 1989), em três questões, a saber: a) o que o
teste supõe medir; b) o que o escore derivado da aplicação de um teste
significa; c) como o escore de um indivíduo em uma medida se relaciona
com outros fatos observáveis relativos ao indivíduo.
Com relação à validade de critério, que inclui tanto a validade con-
corrente como a preditiva, o grande desafio tem sido a identificação de
medidas de critério relevantes e que sejam plenamente satisfatórias. No
caso da validade concorrente, esta tem sido, muitas vezes, levantada através
da comparação de resultados de testes com avaliações feitas por profes-
sores e colegas, que, como vimos anteriormente, muitas vêzes apresenta
dificuldades. Por outro lado, com relação à validade preditiva, especial-
mente no caso da Bateria Torrance, inúmeros estudos têm apontado para
correlações significativas observadas entre resultados de testes obtidos em
um dado momento e o registro de atividades criativas por parte dos
mesmos sujeitos cinco ou mais anos após. Este aspecto foi examinado por
Treffinger para os Testes Torrance de Pensamento Criativo, tendo este
autor observado correlações positivas e significativas entre resultados nos
testes e critérios de realizações criativas em estudos envolvendo períodos
que variaram de 9 meses a 22 anos (Treffinger, 1985).
Examinando a validade de critério de testes de criatividade, Michael
e Wright (1989) lembram alguns fatores que podem afetar a interpretação
de um coeficiente de validade, às vezes adversamente. Estes autores
lembram, por exemplo, a necessidade de que o observador ou avaliador
de comportamentos criativos se previna contra o uso que, às vezes,
consciente ou inconscientemente, faz de informações obtidas através da
administração prévia de testes, no momento em que estiver fazendo um
julgamento do desempenho do sujeito em algumas medidas do critério.
Ademais, segundo estes autores, o grau de fidedignidade, tanto do preditor
mas especialmente da medida de critério, é um elemento potencialmente
atenuante da magnitude do coeficiente de validade. Na maior parte das
circunstâncias, a fidedignidade da medida de critério tende a ser mais
baixa do que aquela associada com o teste. Caso a variável de critério ou
teste não for estável e consistente, isto certamente vai afetar o grau de
correlação entre as medidas.
Com relação à validade de construto, tem sido lembrado que um dos
requisitos para o seu estabelecimento é a validade convergente, ou seja,
a demonstração de que a medida selecionada de um dado comportamento
se relacione com outras medidas do mesmo construto e com outras
variáveis relativas ao critério, que tenham uma relação com o construto.
Um segundo requisito se refere à validade discriminativa, demonstrando
que a medida selecionada é independente de variáveis de outros
construios teoricamente distintos (Michael, Wright, 1989).
Um dos aspectos que têm sido discutidos com relação à validade de
construto diz respeito ao fato de que uma vez que a criatividade engloba
um conjunto complexo de construios interrelacionados, um dos grandes
desafios reside na operacionalização de construios teóricos claros que
constituam o fundamento do comportamento criativo.
Várias evidências de validade de construto têm sido apontadas para
alguns dos instrumentos disponíveis na área, especialmente para a Bateria
Torrance. Entretanto, há necessidade de mais pesquisas no caso da vasta
maioria de instrumentos disponíveis para que os padrões de qualidade
apontados pela psicometria sejam atendidos.
Quanto à validade de conteúdo, o grande desafio para os construto-
res de testes é atender às exigências de que o conteúdo do instrumento
efetivamente abranja uma amostra representativa do domínio em questão.
Este desafio foi inclusive apontado por Torrance (1974, p.21), no manual do
seu teste, quando afirma:
"Uma vez que a pessoa pode se comportar criativamente em um número
quase infinito de maneiras, na opinião do autor seria ridículo tentar desenvolver
uma bateria compreensiva de testes de pensamento criativo que constituísse
uma amostra de qualquer tipo de universo de habilidades de pensamento
criativo. O autor não acredita que alguém possa atualmente especificar o número
e amplitude de testes necessários para dar uma avaliação completa ou mesmo
adequada das potencialidades de uma pessoa para o comportamento criativo."
Condições de aplicação
Com relação a este aspecto, especialmente Michael e Wright (1989)
lembram a necessidade de controle de alguns fatores, como os especifica-
dos a seguir: a) tempo disponível para o examinando responder ou para
o observador fazer o seu julgamento; b) nível de dificuldade das palavras
e maneira de apresentar as instruções, incluindo número comparável de
exemplos ilustrativos para todos os que irão responder ao instrumento; c)
controle de fatores que poderiam distrair a atenção do sujeito, como
barulho, iluminação inadequada, clareza das instruções e ilustrações
contidas no instrumento e até mesmo a seqüência e número de testes
administrados.
Com relação a este último aspecto, a autora deste capítulo tem
observado, por exemplo, que no caso da Bateria Torrance, a aplicação de
toda a parte verbal mostra-se bastante cansativa, não só para crianças
mas até mesmo para adultos. Isto faz com que muitos sujeitos não dêem
o número de respostas que poderiam, especialmente nos últimos testes.
Treffinger (1987) fez uma revisão de vários estudos sobre o efeito de
condições de aplicação e clima predominantes durante a mesma no
desempenho em testes de criatividade. Estes estudos mostram que os
resultados nestes testes são afetados pelos procedimentos utilizados
durante a administração dos instrumentos. Por esta razão, é necessário
uma orientação segura e mesmo um treinamento para aqueles que vão
aplicar testes, no sentido de se assegurar condições adequadas e compa-
ráveis em todas as aplicações.
A nossa experiência tem mostrado também que um cuidado especial
deve ter o pesquisador no uso de testes de criatividade, quando a
aplicação é grupai e não individual. Sobretudo no caso da utilização de
testes de pensamento criativo para crianças e adolescentes e para sujeitos
de status sócio-econômico baixo, o fator motivacional afeta em muito o
desempenho nos testes — e, em grupo, é difícil de se controlar esta
variável. O próprio Torrance, autor do teste mais utilizado de pensamento
criativo, lembra que a maneira como o seu teste é aplicado afeta os
resultados. Segundo ele, até o momento em que é aplicado (final de
semestre, por exemplo) exerce efeito no desempenho, tendo Torrance
constatado que alunos, ao final do semestre, não saíam tão bem neste
instrumento como anteriormente, mesmo após um treinamento de criati-
vidade e com alta motivação (Torrance, 1988).
Uma análise do estado da arte em medidas de criatividade nos leva,
pois, a concluir que estamos ainda em um estágio bem preliminar de
domínio de conhecimento nesta área, com muitas conquistas a serem feitas
para que possamos clarificar muitas das questões a respeito de medidas
de criatividade, que não foram ainda respondidas ou o foram de maneira
incompleta ou inadequada. Como lembra Petrosko (1978), o grande desafio
de se medir criatividade reside no paradoxo de se tentar construir uma
maneira padronizada de se capturar algo que foge à padronização.
REFERENCIAS BIBLIOGRÁFICAS
. Torrance tests of creative thinking: norms- technical manual. Princeton (NJ): Person
nel Press, 1966.
--------------- . Torrance tests of creative thinking: norms and technical manual. Bensenville (II):
Scholastic Testing Service, 1974.
--------------- . The nature of creativity as manifest in its testing. In: STERNBERG, R.J. (Ed.). The
nature of creativity, contemporary psychological perspectives. Cambridge: Cambridge
University Press, 1988.
TORRANCE, E.P., KHATENA, J. What kind of person are you? Gifted Child Quarterly, Williams-
ville (NY), V.14, p.71-76, 1970.
TREFFINGER, D.J. Research on creativity assessment. In: ISAKSEN, S.G. (Ed.). Frontiers of
creativity research: beyond the basics. Buffalo (NY): Bearly. 1987.
URBAN, K.K. Recent trends in creativity research and theory. Western Europe, v.1.n.O, p.99-
113,1990.
ESTRATEGIAS E MEDIDAS
EM ANÁLISE DE CONTEÚDO
Edson A. de Souza Filho
Universidade Estadual do Norte Fluminense, Campos, RJ
M6
o
Ia
Ib
le
AP
AB
CONCLUSÕES E PERSPECTIVAS
FISHBEIN, M., AJZEN.. I. Belief, attitude, intention and behavior, an introduction to theory and
research. Cambridge (MA): Addison-Wesley. 1975.
GHIGLIONE, R.. BLANCHET. A. Analyse de contenu et contenus d'analyses. Paris: Dunod, 1991.
HOLSTI. O.R. Content analysis. In: LINDZEY. G., ARONSON. F. (Eds.). Handbook of social
psychology. Cambridge (MA): Addison-Wesley. 1969.
KATZ, E. The two steps of communication. In: SCHRAMM. W. (Ed.). Mass communication.
Glencoe: Free Press, 1960.
McCLELLAND. D.C.. FRIEDMAN. CA. Across-cultural study of the relationship between child
training practices and achievement motivation appearing in folk tales. In: SWANSON. G.E.,
NENCOMB. T.M.. HARTLEY, E.H. (Eds.). Readings in social psychology. New York: Holt
1953.
OSGOOD, CE. The representational model. In: POOL, S. (Ed.). Trends in content analyses.
Urbana (IL): University of Illinois Press, 1959.
OSGOOD, CE., WALKER, G. Motivation and language behavior: a content analysis of suicide
notes. Journal of Abnormal and Social Psychology, v.59, p.58-67, 1959.
PÉCHEUX, M. Analyse automatique du discours. Paris: Dunod. 1966.
POTTER, J., WETHERELL, M. Discourse and social psychology. Londres: Sage. 1987.
SOUZA FlLHO, E.A. de. Alguns pressupostos teóricos e metodológicos do estudo de repre-
sentações sociais. SIMPÓSIO BRASILEIRO DE PESQUISA E INTERCÂMBIO CIENTÍFICO EM
PSICOLOGIA, 3, 1990. Anais..., p.384-387. [S.I.: s.n.), 1990.
--------------- . Heterossexuais e homossexuais no Rio de Janeiro no contexto da AIDS. No prelo.
WICKLUND, R.A.. DUVAL, S. A theory of objective self awareness. New York: Academic Press,
1972.
CAPÍTULO 13
MEDIDA PROJETIVA
REFERÊNCIAS BIBLIOGRÁFICAS
ABT, LE. Una teoria de Ia psicologia proyectiva. In: ABT, LE.. BELLAK, L. Psicologia progredi-
va. Buenos Aires: Paidós, 1%7. p.37-53.
ANZIEU. D. Os métodos projetivos. Rio de Janeiro: Campus. 1981.
ARLOW, J.A., BRENNER. C. Psychoanalytic concepts and the structural theory. New York:
International Universities Press. 1964.
BELLAK, L Sobre los problemas del concepto de proyección: una teoria de la distorción
aperceptiva. In: ABT, L.E.. BELLAK. L. Psicologia proyectiva. Buenos Aires: Paidós. 1967.
p.25-36, 1967.
-------------- . El uso clinico de las pruebas psicológicas del TAT, CAT y SAT. Mexico: Manual
Moderno. 1979.
BELLAK, L. BELLAK, S. Teste de apercepção temática (com figuras animais). São Paulo:
Mestre Jou, 1981.
BELLAK. L. HURVICH, M., GEDIMAN, H.K. Ego functions in schizophrenics, neurotics and
normals. New York: Wiley-Interscience, 1973.
BERG, M. Borderline psychopathology as displayed by psychological tests. Journal of Person-
ality Assessment, Portland (OR), v.47, n.2. p. 120-133,1983.
BERGER, M. Psychological testing. In: RUTTER, M., HERSON, L. Child psychiatry, modern
approaches. London: Blackwell. 1977. p.306-333.
BERNSTEIN, J. Introducción: I. Métodos proyectivos. In: MURRAY. H.A. Test de apercepción
temática (TAT). Buenos Aires: Paidós, 1951. p. 13-23.
BLATT, S.S. Whore have we been and where are we going? Reflections on 50 years of person-
ality assessment Journal of Personality Assessment, Portland (OR), v.50, n.3, p.343-346
1986.
BLATT, S.S., BERMAN, W.H. A methodology for the use of the Rorschach in clinical research.
Journal of Personality Assessment. Portland (OR), v.4ª, n.3, p.226-239, 1984.
CARR, L.C., GOLDSTEIN, E.G. Approaches to the diagnosis of borderline conditions by use
of psychological tests. Journal of Personality Assessment, Portland (OR), v.45, n.6, p.563-
574,1981.
--------------- . Sistema comprensivo del Rorschach. 2,ed. Madrid: Pablo del Rio, 1980. v.1.
--------------- . Sistema comprensivo del Rorschach. Madrid: Pablo del Rio, 1978. v.2.
EXNER, J.E., EXNER, D.E. How clinicians use the Rorschach. Journal of Personality
Assessment, Portland (OR), v.36, p.403-408, 1972.
FERREIRA, A.B.H. Novo dicionário da Lingua Portuguesa. 2.ed. Rio de Janeiro: Nova Fronteira,
1986.
FREUD, A. Infância normal e patológica. Rio de Janeiro: Zahar, 1971.
FREUD, S. Formulações sobre os dois princípios de funcionamento mental. In: EDIÇÃO
STANDARD brasileira das obras psicológicas completas de Sigmund Freud. Rio de Janeiro:
Imago, 1969a. v.12. p.277-286.
GARTNER, J., HURT, S.W., GARTNER, A. Psychological signs of borderline personality disorder:
a review of the empirical literature. Journal of Personality Assessment, Portland (OR), v.53,
n.3, p.423-441,1989.
MUNDY, J. The use of projective techniques with children. In: WOLMAN, B. (Ed.). Manual of
childpsychopathology. New York: MacGraw-Hill, 1972. p.791-819.
MURRAY, H.A. Test de Apercepción Temática (TAT). Buenos Aires: Paidós, 1951.
MURSTEIN, B.I., PRYER, R.R. The Concept of projection: a review. Psychological Bulletin,
Washington, D.C., v.56, n.5, p.353-374,1959.
PETERSON, C.A., SCHILLING, KM. Card pull in projective testing. Journal of Personality Assessment.
Portland (OR), v.47, n.3. p.265-283. 1983.
PHARES, E.J. Clinical psychology, concepts, methods, and profession. Homewood (IL): Dorsey, 1984.
PIOTROWSKI, C, SHERRY. D.. KELLER, J.W. Psychodiagnostic test usage: a survey of the Society
for Personality Assessment. Journal of Personality Assessment. Portland (OR), v.49, n.2, p.115-
119, 1985.
POLLYSON, J.. NORRIS, D., OTT, E. The recent decline in TAT research. Professional Psychology:
Research and Practice. Washington, D.C., v.16, n.2, p.26-28, 1985.
PRUITT. J.A., SMITH, M.C.. THELEN. M.H.. LUBIN, B. Attitudes of academic clinical psychologists
toward projective technique: 1968-1983. Professional Psychology: Research and Practice,
Washington, D.C., v. 16, n.6. p.781-788, 1985.
RAPAPORT, D. El modelo psicanalitico, la teoria del pensamiento y las técnicas proyectivas. Buenos
Aires: Hormé, 1978.
. Sobre la teoria psicanalitica del pensar. In: GILL, M.M.. RAPAPORT, D. Aportacio
nes a la tècnica psicanalitica. Mexico: Pax-Mexico, 1962, p.97-117.
-------------- . Tests de diagnòstico psicològico. Buenos Aires: Paidós, 1965.
RAPAPORT, D., GILL, M.M., SCHAFER, R. Diagnostic psychological testing, ed.rev. New York:
International Universities Press, 1972.
ROSENBERG, P.H., MILLER, G.A. Comparing borderline definitions: DSM-III borderline and
schizotypal personality disorders. Journal of Abnormal Psychology. Washington, D.C., V.98. n.2,
p.161-169, 1989.
SARGENT, H. Projective methods: their origins, theory and application in personality research.
Psychological Bulletin. Washington, D.C., v.42, n.5, p.257-293,1945.
SCHAFER, R. Projective testing and psychoanalysis. New York: International Universities Press, 1978.
SHNEIDMAN, E. Projective Technique. In: WOLMAN, B. (Ed.). Handbook of clinical psychology. New
York: McGraw-Hill, 1965. p.498-521.
VANE. J.R.. GUARNACCIA. V.C. Personality theory and personality assessment measures:
How helpful to the clinician? Journal of Clinical Psychology, Brandon (VT), v.45, n. 1. p.5-
19, 1989.
WADE. T.C., BAKER, T.B. Opinions and use of psychological tests - a survey of clinical
psychologists. American Psychologist, Washington, D.C., p.874-882, Oct. 1977.
WEINER, I.B. Conceptual and empirical perspectives on the Rorschach assessment of psycho-
pathology. Journal of Personality Assessment, Portland (OR), v.59, n.3. p.472-479, 1986.
------------- . The future of psychodiagnosis revisited. Journal of Personality Assessment Portland
(OR). V.47, n.5. p.451-461. 1983.
WERLANG, B.G., CUNHA, J.A. Avaliação da personalidade sob o enfoque projetivo. In:
CUNHA, J.A. Psicodiagnóstico-R. 4.ed.rev. Porto Alegre: Artes Médicas, 1993. p.123-129.
WOLFF, W., PRECKER, J.A. El movimiento expressivo y los métodos de la psicologia experi-
mental profunda. In: ANDERSON. H.H.. ANDERSON, G.L. Técnicas proyectivas de
diagnóstico psicológico. Madrid: Rialp. 1976, p.515-559.
ZUBIN, J.. ERON, L.D., SCHUMER, F. An experimental approach to projective techniques.
New York: Wiley. 1965.
CAPÍTULO 14
S
egundo Fishbein (1980), é possível explicar e predizer o comporta-
mento humano usando apenas alguns conceitos, ligados entre si
por uma estrutura teórica de caráter compreensivo e global. Nesse
texto, Fishbein atribui, pela primeira vez, o nome de Teoria da Ação
Racional ao conjunto de seus trabalhos, justificando a escolha deste
nome pelo pressuposto básico da teoria de que as pessoas agem de
modo racional, processando implícita ou explicitamente as informações
de que dispõem e utilizando-as como insumos em suas decisões. A teo-
ria, porém, não assume que as informações processadas sejam necessa-
riamente completas ou verídicas, apenas que, estando estas disponíveis,
são usadas, e quando não o estão, ativamente buscadas. O autor afirma
também nesse texto que a teoria está ainda incompleta e em busca de
aperfeiçoamento, mas que a mesma tem-se revelado útil, pois fornece
aos pesquisadores um enfoque sistemático para o estudo do comporta-
mento volitivo em um grande número de áreas; além disto, a Teoria da
Ação Racional pode servir como instrumento para a identificação de fato-
res que distinguem as pessoas que realizam determinado comportamento
das que não o fazem, sejam estas diferenças explicadas pelo modelo
teórico ou oriundas de variações sociodemográficas ou de personalidade.
O objetivo da Teoria da Ação Racional é compreender e predizer o
comportamento, o que exige uma definição operacional deste compor-
tamento. A teoria assume que a maioria das atividades humanas possui
relevância social e está sob controle volitivo; como decorrência deste
pressuposto, a teoria considera a intenção de realizar ou não uma
atividade como o melhor preditor do comportamento futuro. Embora não
exista uma correlação perfeita entre o dizer e o fazer, na maioria dos
casos, salvo quando fatores situacionais interferem, a pessoa se comporta
de acordo com a sua intenção. Como uma teoria deve ultrapassar o nível
da predição dos fenômenos para chegar à sua explicação, torna-se
necessário identificar os determinantes da intenção e, portanto, do
comportamento.
Segundo a Teoria da Ação Racional, a intenção de realizar uma
ação, chamada de intenção comportamental (I), está sob a influência de
dois determinantes básicos, um pessoal e o outro social. O fator pessoal
é a ponderação probabilistica das possíveis conseqüências da ação e sua
avaliação em termos de nível de favorabilidade; este determinante leva o
nome de atitude em relação ao comportamento (ATc). O fator social é a
percepção, pela pessoa, das pressões sociais sofridas na realização ou
não de um comportamento específico; como se trata da percepção das
normas sociais, este fator é chamado de norma subjetiva (NS). De modo
geral, a intenção de realizar uma atividade, tal como ir a uma festa, resulta
de uma avaliação pessoal positiva das possíveis conseqüências desta
ação e da percepção de que ela será socialmente aprovada. A importância
relativa de cada um destes dois determinantes da intenção varia segundo
a pessoa e o tipo de comportamento a ser realizado, tornando-se assim
o cálculo do peso de cada um destes fatores uma questão empírica. O
modelo teórico permitirá determinar, para cada ação estudada, o fator que
mais contribuiu para a intenção comportamental. Esta relação entre as
diversas variáveis do modelo pode ser expressa através de uma equação:
+3 +2 +1 0 -1 -2 -3
+3 +2+1 0 -1 -2 -3
+3 +2 +1 0 -1 -2 -3
+3 +2+1 0 -1 -2 -3
bom------------------------------------------------------------ mau
+3 +2 +1 0 -1 -2 -3
bom------------------------------------------------------------ mau
+3 +2 +1 0 -1 -2 -3
bom------------------------------------------------------------ mau
+3 +2+1 0 -1-2 -3
+3 +2 +1 0 -1 -2 -3
provável------------------------------------------------------------ improvável
+3 +2 +1 0 -1 -2 -3
provável------------------------------------------------------------ improvável
+3 +2 +1 0 -1 -2 -3
A medida em situações de escolha
Em muitos casos estamos diante de uma escolha entre dois ou mais
comportamentos mutuamente exclusivos. Nestes casos, a medida da ati-
tude deve ser feita em relação a cada uma das alternativas, para melhorar
o nível de previsão da intenção comportamental e, através dela, a previsão
do comportamento. Assim, se o indivíduo tem de escolher entre dois com-
portamentos, como fazer ou não dieta para perder peso, a diferença
algébrica entre os escores da atitude em relação a cada uma das alter-
nativas será melhor preditora da intenção que o escore atitudinal em
relação a qualquer um dos dois comportamentos.
No caso de várias alternativas, como beber refrigerante, suco de
fruta ou cerveja, a ordenação pelos sujeitos destas alternativas será a
melhor preditora de sua intenção de beber cerveja, já que esta terá o
primeiro lugar na sua ordenação. No caso da norma subjetiva, a opinião
dos referentes e a motivação para acatá-la também devem ser medidas
para todas as alternativas, a fim de melhorar a predição da intenção. Estas
medidas devem manter para cada alternativa a unidade de ação (beber),
contexto (local) e momento (dia, hora), embora variem os objetivos
(bebidas).
Um exemplo da medida em situação de várias alternativas foi dado
por Ajzen e Fishbein (1969), quanto às possíveis atividades de 100 estu-
dantes universitários nas noites de sexta-feira.
Os autores listaram oito possíveis atividades, mutuamente exclusi-
vas, que poderiam ser realizadas pelos estudantes:
1 — Ira uma festa
2 — Visitar uma exposição de arte moderna
3 — Ver um filme na televisão
4 — Ira um concerto
5 — Jogar póquer
6 — Irão cinema
7 — Participar de um grupo de debates
8 — Ler um livro policial
Resultados
Uma análise de variância foi usada para cada uma das 76 medidas.
1 — A predição da intenção comportamental de ato único (I) foi feita
através de uma regressão múltipla, tendo como variáveis independentes
ATc, NSp e NSs. Os resultados podem ser vistos na tabela 14-2.
CONCLUSÃO
AJZEN, I. Attitudes, personality and behavior. [S.I.]: Milton Keynes Open University Press,
1988.
AJZEN, I., FISHBEIN, M. Attitudes and normative beliefs as factors influencing behavioral
intentions. Journal of Personality and Social Psychology, Washington, D.C.,v.21,n. 1, p. 1-
9, 1972.
--------------. Attitudes towards objects as predictors of single and multiple behavioral criteria.
Psychological Review, Washington, D.C., v.81, n.l, p.59-74, 1974.
--------------. Attitudinal and normative variables as predictors of specific behaviors. Journal of
Personality and Social Psychology, Washington, D.C., v.27, n.l, p.41-57,1973.
------------- . The prediction of behavioral intentions in a choice situation. Journal of Experimental
Social Psychology, New York, v.5, p.400-416, 1969.
-------------- . Understanding attitudes and predicting social behavior. Englewood Cliffs (NJ):
Prentice-Hall. 1980.
FISHBEIN, M. A theory of reasoned action: some applications and implications. In: HOWE,
H.E., PAGE, M.M. (Eds.). Beliefs, attitudes and values: Nebraska Symposium on
Motivation, 1979. Lincoln (NB): University of Nebraska Press, 1980.
FISHBEIN, M., AJZEN, I. Beliefs, attitude and intention: an introduction to theory and research.
Reading (MA): Wesley, 1975.
CAPITULO 15
DESENVOLVIMENTO DE INSTRUMENTO
PARA LEVANTAMENTO DE DADOS (SURVEY)
Hartmut Günther
Estrutura do Instrumento
A estrutura do instrumento assegura que todos os temas de
interesse do pesquisador sejam tratados e que se mantenha o interesse
do respondente em continuar. Uma primeira regra é que itens tratando de
uma mesma temática devem ficar juntos, recebendo uma introdução que
ajuda o respondente focalizar na temática a ser tratada:
Inicialmente, gostaria de saber da sua opinião sobre o sistema de segu-
rança pública ...
Uma segunda consideração é que os conjuntos de itens que tratam
de uma mesma temática devem seguir uma ordem. Esta ordem é do
mais geral para o mais específico; do menos delicado, menos pessoal,
para o mais delicado, mais pessoal. Desta forma, o último conjunto de
itens trata das características socioeconómicas do respondente.
Dependendo do assunto, a mesma regra 'do geral para o específico'
pode ser aplicada à seqüência dos itens dentro de uma determinada
temática. Ressalve-se entretanto que, em se tratando de um conjunto de
itens que constituem uma escala, os itens devem ser misturados, para
evitar que dois itens tratando essencialmente de um mesmo aspecto
sejam apresentados um após o outro.
Na pesquisa hipotética entre moradores de um bairro realizada em
forma de entrevista pessoal, a parte formal da coleta de dados poderia
ser precedida por perguntas gerais sobre a situação do respondente na
cidade e bairro:
Há quanto tempo mora nesta cidade? [Caso
apropriado] Antes, morava onde? Em geral,
está satisfeito em morar aqui?
Estas perguntas iniciais serviriam menos para obter informação do
respondente e mais para estabelecer um relacionamento de confiança
entre respondente e pesquisador. Entretanto, deve-se atentar para o fato
de que estas perguntas terão que ser repetidas de maneira formal mais
adiante, dentro da entrevista, enquadrando-se os dois primeiros itens
dentro do conjunto da caracterização socioeconòmica e o terceiro na
série sobre satisfação com o bairro.
Um terceiro princípio de organização do instrumento é que, na
medida apropriada, este deve seguir uma ordem lógica. Usando a hipo-
tética pesquisa sobre moradia como exemplo, pergunta-se inicialmente
a cidade, depois sobre o bairro, a rua e o prédio onde o respondente
mora. Além de progredir do geral para o mais específico, também vem se
aproximando do respondente, i.é, uma pergunta sobre o relacionamento
entre os moradores da cidade é menos pessoal, menos ameaçadora do
que sobre o relacionamento do respondente com seu vizinho. Fazendo
perguntas mais pessoais após ter estabelecido um certo nível de
confiança entre entrevistador e entrevistado ajuda a eliciar respostas
confiáveis (veja Günther, Brito, Silva, 1989).
Assim, perguntas pessoais sobre o respondente constituiriam o
último conjunto:
Concluindo, gostaríamos de fazer algumas perguntas para melhor caracte-
rizar os respondentes desta pesquisa...
Um erro comum de instrumentos é o de começar com perguntas
pessoais, muitas vezes numa seção chamada 'identificação'. Em se
tratando de pesquisa, não convém identificar o respondente. Antes, pelo
contrário, geralmente há que se assegurar que a pesquisa não visa
identificar indivíduos, mas que perguntas sócio-demográficas, como sexo,
idade, educação, estado civil, composição da família, renda, tempo de
moradia, etc, servem apenas para caracterizar a amostra. Perguntar o
nome no início de uma entrevista pessoal pode facilitar trato interpessoal,
mas, mesmo sem registrá-lo, pode contradizer qualquer afirmação de
confidencialidade da entrevista.
DESENVOLVIMENTO DE ITENS
Linguagem
Quanto à linguagem usada na formulação dos itens, atenta-se,
inicialmente, para a compreensão dos mesmos pela população-alvo da
pesquisa. Abreviações, gíria profissional, termos regionais devem ser
evitados, da mesma maneira que termos especiais ou sofisticados para
uma determinada população-alvo.
Ambigüidade
Relacionado à questão da linguagem em si está o problema da
ambigüidade. O respondente está entendendo aquilo que o pesquisador
está perguntando?
Viés e ênfase
Finalmente, a escolha das palavras pode dirigir as respostas.
Quando se pergunta sobre utilização de áreas comuns num bloco de
residência, pode-se indagar se algo deve ser 'proibido', 'não permitido',
'evitado' ou 'impedido'. Da mesma maneira que os avisos 'proibido
estacionar' e 'pede-se não estacionar* provocam comportamentos dife-
rentes, o número de respondentes que concordam com um item que
contém a palavra 'proibir' e 'não permitir' varia (Schuman, Presser, 1981).
Assim, convém sempre realizar um estudo piloto para verificar se e
como as perguntas estão sendo entendidas pelos respondentes.
Escala nominal
Conforme os exemplos dados na Tabela 15-1, numa escala nominal
utilizam-se números ou símbolos somente para identificar pessoas,
objetos ou categorias. Exemplos para as ciências sociais seriam local de
nascimento, sexo, estado civil, bem como certos atributos (como cor de
cabelo) ou uso de aparelhos (como óculos ou bengala). A forma de
apresentar estes itens é a seguinte:
Qual o estado civil de V.Sa.?
Solteiro(a) .................................................................... 1
Casado(a) ........................................................................... 2
Vivendo maritalmente ..................................................... 3
Desquitado(a) .............................................................. 4
Divorciado(a)................................................................. 5
Separado(a) .................................................................. 6
Viúvo(a) ........................................................................ 7
Outro ........................................................................... 8
Apontamos para alguns aspectos deste item. Primeiro, mesmo ao
se preparar um instrumento para auto-aplicação, deve-se pensar em um
diálogo com o respondente. Contrariamente a uma declaração de renda ou
ficha de procura de emprego, convém estabelecer um bom raport com o
respondente. Assim, uma frase como 'qual o estado civil de Va.Sa.?' (ou,
conforme relacionamento com a população-alvo, 'o seu') soa melhor do
que solicitar simplesmente 'estado civil'. Conforme o que nós sabemos
sobre a população-alvo, mais ou menos alternativas podem ser apresen-
tadas. Muitas vêzes, 'solteiro, casado, outro1 é suficiente. O importante é
que as opções sejam a) mutuamente exclusivas e b) cubram todas as
alternativas. Uma outro maneira de formular alternativas do estado civil é:
Nunca casado(a) ................................................................ 1
Sempre casado(a), i.é, casado(a) e nunca divorciado(a).......... 2
Divorciado(a)...................................................................... 3
Recasado(a) ..................................................................... 4
Dependendo do objetivo da pesquisa para o qual um determinado
item está sendo utilizado, o primeiro ou o segundo exemplo do item
'estado civil' pode ser mais apropriado. Entretanto, da mesma maneira
como o leitor pode ter reagido inicialmente ao segundo exemplo, sem
dúvida, a maioria dos respondentes reagiria ainda mais. É um exemplo
concreto de distinguir entre o conceito subjacente que se quer analisar
numa determinada pesquisa (i.é, as quatro categorias do segundo
exemplo) e o que se pode, do ponto de vista prática e conceitualmente
factível, perguntar à maioria dos respondentes.
Escala ordinal
Conforme os exemplos dados na Tabela 15-1, numa escala ordinal
os números ou símbolos, além de identificarem pessoas, objetos ou
categorias, os ordenam numa dimensão subjacente. Exemplos para as
ciências sociais seriam hierarquização de preferência entre objetos, status
social ou itens de uma escala Likert. A forma de apresentar estes itens é
a seguinte:
Como você sabe, a Prefeitura está lançando um programa de recuperação
dos bairros da cidade. Solicitamos que indique entre as medidas listadas a
seguir qual a que deve ser realizada primeiro, qual a segunda a ser realizada,
qual a terceira e qual a quarta:
N° de ordem de
realização
Consertar a infra-estrutura (calçadas, iluminação pública, etc.) ____
Consertar as vias e sinalização de transito............................ ____
Construir/consertar escolas do bairro ................................... ____
Construir/consertar os postos de saúde do bairro ................. ____
Outros, quais? .................................................................... ____
A tarefa do respondente é a de marcar a ordem de importância no
espaço indicado. Para cada um dos quatro itens ou, posteriormente,
variáveis, pode-se determinar uma distribuição de freqüência: Quantas
vezes 'sinalização de trânsito' foi mencionada como sendo a mais
importante, a segunda, a terceira e a quarta medida. Ainda, é possível
sumariar estes dados indicando quantas vezes cada um dos itens (no
caso, medidas da prefeitura) foi mencionado como o mais importante.
Desta maneira, os valores modais e medianos podem ser calculados, mas não a
média. Um outro exemplo de escalas ordinais é apresentado pela escala de
valores de Rokeach (1973; Günther, 1981). A tarefa do responderte consiste em
ordenar 18 valores segundo a sua importância para si. Apesar de Rokeach ter
sugerido o uso de etiquetas para forçar o responderte a atribuir um determinado
valor hierárquico a cada valor ou item no lugar de espaços como no exemplo
anterior, os dados apresentam uma série de dificuldades para análise. Moore
(1975) mostrou que, apresentando os 18 valores da escala de Rokeach na
versão original ou como 18 itens de uma escala tipo Likert (veja a seguir),
obtêm-se, essencialmente, os mesmos resultados, sendo que a escala Likert é
mais fácil de responder e analisar.
Escala Likert
Por ter sido citada como exemplo de escala ordinai e escala intervalar,
consideremos a escala tipo Likert separadamente. Ela é a mais utilizada nas
ciências sociais, especialmente em levantamentos de atitudes, opiniões e de
avaliações. Nela apresenta-se um determinado número de alternativas para
julgar um enunciado, conforme o seguinte exemplo:
Inicialmente, gostaríamos de saber o que os moradores do bairro acham
sobre os serviços oferecidos pela Prefeitura. Para cada serviço a seguir,
indique, por favor, se você o avalia como (1) muito ruim, (2) ruim, (3) razoável,
(4) bom ou (5) muito bom. Para isto, faça um círculo em volta do número que
melhor representa sua avaliação:
Escala intervalar
Conforme consta na Tabela 15-1, numa escala intervalar as
características não somente podem ser ordenadas numa dimensão
subjacente, mas os intervalos têm um tamanho conhecido e podem ser
comparados, enquanto que itens de uma escala tipo Likert com alternativas
na dimensão concordo—discordo mostram uma certa dificuldade em ser
considerados como uma escala de intervalo. Isto pode ser contornado
apresentando-se uma verdadeira escala ou régua:
Utilizando a seguinte escala, que varia de muito ruim a muito bom, avalie os
serviços prestados pela Prefeitura, riscando o ponto na mesma que melhor
representa sua avaliação:
Serviço de Limpeza Urbana Muito I _____________________ I Muito
Ruim Bom
Enquanto este tipo de representação visual de um escala pode
'medir' com maior certeza o grau de avaliação, é muito difícil de apurar,
uma vez que se precisa de uma régua milimetrada para determinar exata-
mente onde o respondente marcou sua resposta nesta escala. Um outro
exemplo clássico de uma escala intervalar é a utilizada por Milgram (1974)
para determinar o grau de obediência dos participantes às instruções nas
suas pesquisas. Ostensivamente, o participante aplicava choques elétricos
que variavam entre 15 e 450 volts. O grau de obediência correspondia à
voltagem onde o participante se recusava a continuar aplicando mais
choques, i.é, quanto mais baixa a voltagem, menos obediente.
Além das escalas tipo Likert, são as do tipo Thurstone que satisfa-
zem as exigências da escala intervalar. Na base de estudos pilotos,
estabelece-se o valor atitudinal de cada item que será atribuído ao res-
pondente, caso concorde com a afirmação. A apresentação dos itens não
difere da do exemplo anterior da Escala de Ambiente de Trabalho.
Escala de razão
Exemplos da escala de razão utilizada nas ciências sociais são
salário ou tempo gasto com uma determinada tarefa. A apresentação dos
itens reverte a perguntas abertas:
Considerando o seu tempo livre e de recreação, solicitamos que indique:
REFERÊNCIAS BIBLIOGRÁFICAS