A Indexação e o Usuário
A Indexação e o Usuário
A Indexação e o Usuário
VINICIUS FERRO
Porto Alegre
2014
VINICIUS FERRO
Porto Alegre
2014
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
Reitor: Carlos Alexandre Netto
Vice Reitor: Rui Vicente Oppermann
F368iFerro, Vinicius
BANCA EXAMINADORA
Agradeço a minha mãe por tudo e por ela falar que sou lindo! Mãe, obrigado por
sempre estar comigo, auxiliando-me, incentivando-me, apoiando-me e por me dar esse
carinho de sempre, amo-te mamãe!
Ao meu irmão, Vilian Ferro, pela grande parceria e amizade.
Ao meu pai, Narciso Ferro, que partira no decorrer desta trajetória, pelo apoio, carinho
e exemplo. Pai, hoje sou um pouco de você, teu sangue é meu sangue, amo-te.
A minha Professora orientadora Rita do Carmo Ferreira Laipelt pelos ensinamentos,
auxílios e aportes dados, que fundamentalmente contribuíram para a construção deste
trabalho.
À Bibliotecária Francine Feldens, pela oportunidade de estágio, paciência e
ensinamentos durante os dois anos de estágio num ambiente harmônico, amigável,
encorajador e não tradicional, onde pude vivenciar a prática biblioteconômica em todos os
seus alcances, desenvolvendo assim meu lado profissional e cidadão. Aprendi muito, obrigado
chefe.
Às bibliotecárias da Biblioteca da Escola de Engenharia/UFRGS pelo apoio e
instrução no estágio curricular.
Aos colegas da Biblioteconomia Lara Hladovetz, Samara Ayres, Janice Moser,
Andressa Balverdu pelo companheirismo e amizade.
Aos professores do Curso de Biblioteconomia que contribuíram de forma substancial
na minha formação acadêmica.
À ciência e à tecnologia, sem elas não somos nada.
"No vivimos para cultivar la memoria mirando hacia atrás. Creo
que el ser humano tiene que saber cicatrizar sus heridas y
caminar en la perspectiva del futuro, pues no podemos vivir
esclavizados por las cuentas pendientes de la vida. Es
importante no olvidarse de nada, pero pienso que es necesario
mirar hacia el mañana. No se vive de recuerdos. Es importante
mirar el pasado, pero también es necesario perderle el respeto".
1 INTRODUÇÃO.................................................................................... 15
1.1 JUSTIFICATIVA E PROBLEMA DE PESQUISA............................. 16
2 OBJETIVOS......................................................................................... 19
2.1 OBJETIVO GERAL.............................................................................. 19
2.2 OBJETIVOS ESPECÍFICOS................................................................. 19
3 REFERENCIAL TEÓRICO............................................................... 20
3.1 INDEXAÇÃO........................................................................................ 20
3.1.1 Análise de assunto e tradução................................................................ 23
3.1.2 Política de indexação............................................................................. 26
3.2 O INDEXADOR.................................................................................... 29
3.3 CONSISTÊNCIA DA INDEXAÇÃO................................................... 32
3.4 LINGUAGEM DOCUMENTÁRIA...................................................... 36
3.5 TESAURO............................................................................................. 40
3.6 O USUÁRIO.......................................................................................... 42
4 TERMINOLOGIA............................................................................... 48
4.1 TEORIA COMUNICATIVA DA TERMINOLOGIA......................... 49
4.1.1 Termo e Conceito................................................................................... 53
4.1.2 Variantes terminológicas........................................................................ 55
5 METODOLOGIA................................................................................ 64
5.1 TIPO DE PESQUISA............................................................................ 64
5.2 PORTAL LexML................................................................................... 67
5.3 VOCÁBULÁRIO CONTROLADO BÁSICO...................................... 69
5.4 COLETA DE DADOS........................................................................... 71
5.5 CONSTITUIÇÃO DO CORPUS TEXTUAL....................................... 73
5.6 VALIDAÇÃO DO CORPUS DE PESQUISA...................................... 78
5.7 ORGANIZAÇÃO DOS DADOS DO CORPUS DE PESQUISA......... 81
5.8 APRESENTAÇÃO DOS RESULTADOS............................................ 84
5.9 LIMITAÇÃO DA PESQUISA.............................................................. 86
6 ANÁLISE DOS DADOS E RESULTADOS...................................... 87
6.1 ANÁLISE DOS RESULTADOS DA CATEGORIA LEGISLAÇÃO 90
6.2 ANÁLISE DOS RESULTADOS DA CATEGORIA VARIANTES 94
DENOMINATIVAS..............................................................................
6.3 ANÁLISE DOS RESULTADOS DA CATEGORIA 102
ESPECIFICIDADE................................................................................
6.4 IDENTIFICAÇÃO DAS INCONSISTÊNCIAS NO PROCESSO DE 105
INDEXAÇÃO.......................................................................................
7 CONCLUSÃO...................................................................................... 107
REFERÊNCIAS BIBLIOGRÁFICAS............................................... 112
APÊNDICE A- Seleção inicial de expressões de busca...................... 119
APÊNDICE B - Expressões de busca qualificadas para a análise........ 121
APÊNDICE C - Comparação entre expressão de busca e descritor 123
representativo do mesmo no VCB.........................................................
APÊNDICE D - Categorias das expressões de busca e descritores 124
respectivos..............................................................................................
15
1 INTRODUÇÃO
conceitual do documento, mas também da forma com que o usuário reconhece aquela
informação.
2 OBJETIVOS
Para a elaboração desta pesquisa, foram definidos o objetivo geral que se pretende
alcançar e os objetivos específicos que concorrem para a efetivação do objetivo geral.
3 REFERENCIAL TEÓRICO
3.1 INDEXAÇÃO
[...] a escolha adequada de pontos de acessos que traduzam, de forma clara e precisa,
a informação contida nos documentos, identificada no processo de análise
documental, fará o diferencial no processo de recuperação da informação (2008, p.
3).
Nessa perspectiva, Dumont (2006, p. 8) diz que “[...] a apropriação do texto pelo leitor
implica a produção de sentido, que é onde se imprime a singularidade da leitura”, sendo que
esta se caracteriza pela “[...] construção de sentidos e de significados”. Assim, a indexação
exige várias competências, que vão desde o domínio de técnicas e métodos relativamente
simples até a proficiência na aplicação de complexas linguagens de indexação (DUMONT,
2006).
Sintetiza-se o conceito de indexação como uma técnica de aplicação de análise de
conteúdo, por meio da leitura e interpretação/tradução da informação, com a finalidade de
extrair do documento informações que levem a representação da informação presente no
documento. Necessariamente, a indexação deve ser condizente com a informação relatada no
documento e deve estar voltada ao atendimento das necessidades dos usuários, ou seja,
descrever a informação que é de interesse da comunidade usuária e fazê-la da forma mais
completa, que possibilite sua recuperação.
Na realização da indexação, Lancaster (2004) afirma que todo o processo deve ser
conduzido por meio de elementos norteadores que possibilitem ao indexador proceder de
forma a garantir qualidade ao processo de indexação e que atenda às necessidades dos
usuários. Os elementos norteadores destacados pelo autor referem-se ao indexador, ao
vocabulário, ao documento e ao processo.
23
A análise conceitual busca compreender a faceta do assunto que está sendo tratado no
documento. Constitui-se de passos que buscam esclarecer e identificar a abordagem temática
do documento. Dentre estes passos, destacam-se a leitura, a interpretação, a associação e
observação de fatores que possam contribuir para a indexação com mais clareza e exatidão da
informação. Rubi (2009, p. 82) afirma que “[...] a análise de assunto realizada durante a
catalogação deverá ser norteada por princípios de política de indexação que devem fazer parte
de um manual de indexação da instituição e sobre a qual o bibliotecário deve ter
conhecimento e domínio [...]”.
Lancaster (2004) sugere a formulação de perguntas sobre o documento, a fim de
extrair informações que identifiquem a temática do mesmo, os aspectos que o tornam de
interesse ao usuário e também os motivos pelos quais ele foi incorporado ao acervo. Esse
processo extrairá informações das características, ideias e fenômenos associados ao
24
documento, que podem auxiliar o indexador a destacar aspectos na indexação que tenham
mais importância aos usuários do sistema de informação, qualificando assim a recuperação da
informação e promovendo a sua disseminação. Na análise conceitual, o indexador busca
esclarecer para si que aspectos estão explícitos e implícitos no texto. Esses aspectos dizem
respeito à caracterização que deve ser levantada para a indexação que se realizará, visando a
obtenção de termos que possam representar de forma específica o documento.
A indexação, por se tratar de um processo que tem o objetivo de difundir a
informação, se constrói atendendo as necessidades dos usuários daquela informação e,
também, dentro das características da base de dados na qual ela está sendo realizada. Entende-
se, assim, que a indexação está diretamente ligada à administração da informação e, mais
especificamente, ao contexto da sua organização (CIANCONI, 1990).
Com o aumento considerável da produção informacional em todas as áreas,
principalmente no meio técnico e científico, surge a necessidade de melhorar a forma de se
indexar a informação dispersa por diferentes bases de dados, repositórios, bibliotecas e pela
própria Internet. O condicionamento de recuperação ou não da informação gerado pela
indexação, principalmente no meio técnico-científico, evidencia a necessidade de estudo e
acompanhamento da indexação, para que a pontualidade, o acesso e a fidedignidade que se
espera da informação não sejam perdidos no processo de recuperação da informação.
As diversidades de formas de representação possíveis da informação fazem com que
surjam diferentes conjuntos de termos indexadores para representar um mesmo documento.
Essa diversidade possível é dependente dos critérios utilizados para se chegar ao conjunto de
termos utilizados na indexação e também da destinação deste documento, ou seja, para que
público ele se destina (LANCASTER, 1993). Assim, estabelecem-se parâmetros para a
realização da indexação, levando em consideração os aspectos que envolvem a base de dados
em que ela é realizada, os usuários e o contexto organizacional da instituição. Ao encontro
disso, Fujita diz que
Para tanto, é necessária a identificação dos conceitos dos assuntos por meio de
abordagem sistemática, com finalidade de identificação daqueles conceitos que são os
elementos essenciais na descrição do assunto (ASSOCIAÇÃO BRASILEIRA DE NORMAS
TÉCNICAS, 1992, p. 2). Através desta síntese inicial, o indexador estabelece a representação
por conceitos, que assume função preponderante entre o significado do conteúdo
documentário e o termo que o representa. Desse modo, a representação, num sistema de
informação, será possibilitada pelo termo, ainda que seja preciso também considerar que a
representação durante a análise pode ser realizada por conceitos (FUJITA, 2013).
Fujita afirma que:
destacados para uma linguagem de indexação que possa representar da forma mais completa a
informação presente no documento analisado.
[...] uma política de indexação, como um guia para tomada de decisões, deve levar
em consideração os seguintes fatores: a) características e objetivos da organização,
determinantes do tipo de serviço a ser oferecido; b) identificação dos usuários, para
atendimento de suas necessidades de informação; c) recursos humanos, materiais e
financeiros, que delimitam o funcionamento de um sistema de recuperação de
informações. São elementos a considerar na política de indexação: cobertura de
assuntos, seleção e aquisição de documentos, o processo de indexação (níveis de
exaustividade e especificidade, capacidade de revocação e precisão, linguagem),
estratégia de busca, forma de saída, tempo de resposta do sistema, avaliação do
sistema (1985, p. 221).
[...] os objetivos de uma política de indexação são a definição das variáveis que
afetam o desempenho do serviço de indexação, o estabelecimento dos princípios e
critérios que servirão de guiana tomada de decisões para otimização do serviço, a
racionalização dos processos e a consistência das operações envolvidas (1998, p.
330).
preferível ou usual”. De forma prática, a constituição de uma rede de remissivas tem por
função viabilizar as relações semântico-conceituais entre as unidades linguísticas, propiciando
que um assunto seja recuperado por todas as suas formas de manifestação, sejam elas oriundas
da linguagem especializada ou da linguagem geral.
Assim, os aspectos fundamentais na elaboração de uma política de indexação,
conforme Rubi (1985), estão ligados entre si, de modo que a alteração de algum elemento que
compõe o sistema afetará os demais como um todo, criando um ciclo de interdependência que
deve ser observado por inteiro sempre que se mudar o planejamento de um sistema de
recuperação da informação.
De maneira geral, o estabelecimento de uma política de indexação possibilita uma
interação entre o sistema e o usuário com o objetivo de assegurar a organização e a
transferência da informação armazenada no sistema. Esses critérios prescritivos auxiliam o
indexador no processo de tomada de decisão e elevam a padronização na representação da
informação.
3.2 O INDEXADOR
Embora não se tenha uma regra formalizada de quais partes do texto devem ser
analisadas numa estratégia de identificação de assuntos, sabendo-se da impossibilidade de
efetuar uma leitura extensa do documento, opta-se por uma leitura técnica das partes que
podem conter indicadores do conteúdo do documento. Na medida em que o indexador faz
uma análise que lhe dê subsídios suficientes para a identificação dos assuntos, em partes do
texto que contenham representatividade da informação, considera-se que o que foi analisado é
adequado para a indexação (CINTRA, 1983).
O contexto profissional do indexador, que também influência no processo de
indexação, é composto por uma rotina de contato tanto com a prática da indexação, quanto
com a informação, o sistema de recuperação da informação, os usuários e suas demandas.
Esses fatores acabam gerando um conhecimento extensivo, uma habilidade própria que lhe
permite fazer uma análise mais detalhada, observando e reconhecendo elementos intrínsecos,
sutilezas e especificidades não aparentes nos documentos, que podem reforçar e qualificar a
indexação. Assim Fujita e Redigolo dizem que:
c) reunir ou ligar termos cujos significados apresentem uma relação mais estreita
entre si, como as relações hierárquicas e as não hierárquicas (ou associativas).
Rowley (2002) destaca as vantagens e desvantagens da utilização de um vocabulário
controlado para a organização do tratamento da informação. A autora estabelece como
vantagens da utilização de um vocabulário controlado o fato e ele solucionar problemas
semânticos, proporcionar a identificação de relações de gênero-espécie, além de mapear áreas
do conhecimento. Entre as desvantagens identificadas pela autora e são o alto custo, a
desatualização do vocabulário, a imprecisão de cobertura, os erros de construção e a
dificuldade de representar no sistema todas as relações relevantes entre os termos.
O vocabulário controlado tem papel importante também na recuperação da
informação, visto que os termos utilizados para representação do assunto de um documento,
oriundos de um vocabulário controlado, podem orientar os usuários na “[...] elaboração das
estratégias de busca de informações no sistema” (FUJITA; REDIGOLO, p. 128, 2009).
Há diversidade nas formas de busca e expressões que o usuário pode empregar no
processo de busca informacional, visto que a linguagem natural é permissiva quanto às
construções que comportam todas as intenções do usuário no processo comunicativo de busca
de informação. Assim, “[...] neste contexto, o vocabulário controlado torna-se o ponto de
convergência entre as linguagens utilizadas por autores, indexadores e pesquisadores,
premissa fundamental para comunicação de informações dentro de um sistema”
(STREHL,1998, p. 331).
Boccato e Fujita (2010) afirmam que os indexadores desenvolvem a atividade de
tratamento temático da informação por meio da adoção de sistemas de organização do
conhecimento. O uso de um vocabulário controlado para a organização da informação amplia
o acesso à mesma, visto que o próprio vocabulário controlado acaba por ser um retrato de um
conjunto de documentos disponíveis no catálogo de uma base de dados, e ainda delimita
conceitos, define termos e remete à informação.
Agrega-se qualidade, com o uso de um vocabulário controlado, ao sistema de
informação tanto no processo de indexação da informação como na recuperação, evitando que
diferentes termos com mesmo significado venham a representar conteúdos informacionais
idênticos, causando uma dispersão dos resultados de pesquisa. Para tanto, é necessário que o
vocabulário controlado, que tem por objetivo servir de ligação entre o usuário e o documento
por ele representado, funcione também como uma forma de controle terminológico no que diz
respeito às variantes terminológicas.
39
3.5 TESAURO
Como linguagem documentária, o tesauro tem como uma das principais características
ser a ligação entre os termos, segundo critérios estabelecidos, de modo que alguns termos
conduzam a outros (CURRÁS, 2005). Essencialmente uma linguagem de representação de
uma especialidade, o tesauro é baseado numa estrutura conceitual de uma determinada área
temática, onde cada conceito deve ser representado por uma única forma verbal (DODEBEI,
2002). De acordo com Moreira e Moura (2006, p.7), “[...] um tesauro é uma linguagem de
documentação com a característica específica de possuir relações entre os termos que o
compõe”. Assim,
[...] o tesauro surgiu da necessidade de manipulação de grande quantidade de
documentos especializados, onde é preciso trabalhar com vocabulário mais
específico e uma estrutura mais articulada e integrada do que aquela presente nos
cabeçalhos de assunto (remissivas e referências cruzadas tipo 'ver' e 'ver também').
Parte do desejo de uma comunidade de usuários em recuperar documentos de uma
área específica, na qual é necessária maior sistematização para a recuperação
(MOREIRA; MOURA 2006, p. 7).
atualidade; servir de conversor da linguagem natural dos documentos, para uma linguagem
controlada, que possa representar a informação contida nos documentos; servir como uma
ponte entre os documentos e os usuários; é, portanto, a linguagem que tanto o indexador como
o usuário utilizarão.
3.6 O USUÁRIO
Sanz Casado (1994, p. 19) traz uma definição de usuário da informação como “[...]
aquele indivíduo que necessita de informação para o desenvolvimento de suas atividades”.
Imprescindível para o processo de indexação, o usuário ocupa papel decisivo em um sistema
de informação e, ao mesmo tempo, é a parte envolvida que mais percebe as consequências,
tanto positivas como negativas, das decisões que são tomadas na indexação, já que todas as
ações realizadas durante o ciclo de tratamento informacional dentro de um sistema de
informação, afetarão de alguma forma, a comunicação com o usuário.
Cada vez mais os sistemas de informação voltam seu olhar e atenções para o usuário,
com o intuito de assegurar-lhes serviços que possam atender as suas demandas
informacionais. O usuário, ao buscar informação, demonstra um desejo, expressa uma
vontade. Assim Sanz Casado diz que a busca informacional é
Por conseguinte, Ferreira (2002) identifica uma abordagem alternativa aos estudos de
usuários, em que seu direcionamento visa ao próprio usuário da informação, onde se
considera que o comportamento do usuário, a necessidade de informação, o uso da
informação e a forma como usuário se relaciona com o sistema de informação passam a
constar na forma de abordagem. Assim, começa-se a observar o usuário como sendo
construtivo, ativo, orientado situacionalmente, que focaliza aspectos cognitivos, possui
individualidades e se orienta de forma qualitativa (FERREIRA, 2002).
A lógica básica por trás dessa perspectiva centrada no usuário é que os sistemas de
informação devam ser modelados de acordo com o usuário, com a natureza de suas
necessidades de informação e com seus padrões de comportamento na busca e no
uso da informação, de modo a maximizar sua própria eficiência (FERREIRA, 2002,
p. 6).
Nesse sentido, os sistemas de informação devem estar atentos aos serviços que
prestam e à forma com que os executam, principalmente no que envolve a recuperação da
informação, visto que o usuário cria expectativas sobre a sua intenção informacional, e uma
44
recuperação ineficiente acabaria por frustrá-lo. Dodebei (2002, p. 51) afirma que “[...] o
processo de comunicação se dá, portanto, quando o indivíduo reduz o que pensa e o que quer
a um sistema de convenções comunicativas, ou seja, quando o que pensa e quer é
socializado”.
Assim, conhecer o usuário e sua linguagem passa a ser uma obrigação dos sistemas de
informação, pois ele pode contribuir com melhorias em todo o sistema, posto que, ao passo
que utiliza o sistema, acaba por reconhecer todas as intempéries que enfrenta no processo de
busca e recuperação da informação. Guinchat e Menou (1994, p. 482) afirmam, portanto, que
“[...] o usuário é um agente essencial na concepção, avaliação, enriquecimento, adaptação,
estímulo e funcionamento de qualquer sistema de informação”. Bocatto e Fujita dizem que:
[...] que o uso da linguagem natural tem dificuldades a serem superadas, da mesma
forma que a linguagem controlada apresenta certas desvantagens, pois os termos
preferidos pelos indexadores frequentemente não são os termos utilizados pelos
usuários em situações específicas de busca, pois, em grandes bases de dados, o
processo de indexação envolvendo diversos indexadores provoca, com certeza,
inconsistências na identificação de documentos similares (2002, p.47).
4 TERMINOLOGIA
[...] são unidades com dupla função, representativa e comunicativa. Desde o ponto
de vista de sua capacidade de representação permitindo referir-se a uma realidade
especializada, com diferentes níveis de especialização [...]. Desde o ponto de vista
de sua capacidade de transferência, permitindo a comunicação em diferentes níveis,
de maior ou menor especialização [...].
Kostina (2000, p. 20, tradução nossa) afirma que “[...] os termos ou unidades
terminológicas em primeiro lugar são unidades linguísticas que possuem todas as
particularidades da linguagem natural, inclusive participando da polissemia, da sinonímia e da
homonímia [...]”.
A Teoria Comunicativa da Terminologia é constituída de princípios que embasam o
tratamento terminológico e que são aplicados na pesquisa realizada, visto que tal teoria admite
as variações terminológicas e considera o termo como uma unidade denominativo-conceitual,
ou seja, como uma unidade de conhecimento com dimensão textual e discursiva de ocorrência
no âmbito especializado.
Segundo CABRÉ (1999), a Teoria Comunicativa da Terminologia é fundamentada nos
seguintes princípios:
a) possui caráter interdisciplinar, que inclui aspectos linguísticos, cognitivos e sociais,
caracterizando, assim, a poliedricidade do termo;
b) observa o conhecimento geral e o especializado sem dissociá-lo na competência do
falante especialista, devendo considerar as diferenças do conhecimento
especializado e a forma com que é compreendido cognitivamente pelo falante;
c) deve considerar a interdisciplinaridade dos termos, seu caráter poliédrico em função
das diferentes aplicações terminológicas em face a sua atribuição representativa em
diferentes áreas especializadas;
d) deve considerar como um conceito pode formar parte de uma estrutura de diferentes
áreas, observando a utilização conceitual. Este princípio aporta a definição de que
nenhum termo pertence de forma natural a nenhum âmbito, mas são usados em
determinados âmbitos (situações), embora reconheça a existência da criação de
termos dentro de âmbitos especializados.
52
pertencem a um âmbito, mas sim são usados em um âmbito com valor singularmente
específico [...]”.
O trabalho terminológico dentro da Teoria Comunicativa da Terminologia tem a
função de descrever as características das unidades léxicas que podem vir a constituir uma
terminologia especializada, explicando as relações entre a constituição de uma estrutura
conceitual de uma área e permitindo a representação e a transferência do conhecimento
especializado. A comunicação especializada, assim como a comunicação geral, se manifesta
por meio da linguagem, linguagem esta construída pelo conhecimento científico manifesta por
meio de unidade linguística, o termo, que designa um conceito (KRIEGER e FINATTO,
2004).
Cabré (2008, p. 3, tradução nossa) define o termo como “[...] uma unidade de forma e
conteúdo que indissociável entre si que representam, no plano da verbalização ou expressão,
um conceito”. A função do termo é, ao mesmo tempo, designativa, pelo fato de apontar a uma
referência; denominativa, por dar nome a um conceito e significativa, pois o termo em si
possui informações sobre o conteúdo que transmite (CABRÉ, 2008).
O termo enquanto elemento fundamental de análise da Terminologia e componente de
um discurso especializado é compreendido de forma poliédrica pela TCT, ou seja, possui uma
dimensão linguística, uma cognitiva e outra social, como já mencionado. A implicação dessa
proposição trata da dimensão social que é estabelecida pela formação do objeto e das classes
de objetos; a dimensão linguística é evidenciada pelo plano semiótico, que abrange a
construção de cada conceito e uma ou mais unidades terminológicas da língua natural, ou até
mesmo a criação de unidades terminológicas artificiais; e a dimensão cognitiva diz respeito à
formação do conceito e seu entendimento, compreensão mental (CABRÉ, 2008).
O termo pode ser compreendido pela associação direta entre um conceito e suas
representações, isto é, abre margem para o tratamento das variantes no plano terminológico.
Esse entendimento é provocado pelo fato da forma de um termo e o seu conceito se darem de
modo independente, ou seja, o conceito é independente da sua denominação (CABRÉ, 2008).
O termo pode ser constituído de uma palavra apenas ou também por meio de um sintagma
terminológico que tem a mesma função representacional e comunicativa. Os sintagmas
terminológicos constituem uma única unidade de sentido, a partir da junção de palavras
estruturadas em uma determinada ordem sintática (VAN DER LAAN, 2002).
Kostina (2000, p. 19, tradução nossa) diz que “[...] o termo é uma unidade léxica
específica da linguagem especializada que denomina os conceitos especializados [...]”. Assim,
a comunicação especializada usufrui de elementos próprios de sua terminologia para
55
Freixa (2002) entende que os textos especializados divergem quanto aos níveis de
especialização, níveis sociais e comunicativos, utilizando, para tal, uma terminologia que
atenda e se adapte ao contexto, de modo que, para tanto, se faça uso no discurso especializado
de diferentes denominações para tratar de um mesmo assunto de uma especialidade,
resultando, assim, na variação terminológica. O resultado mais evidente dessa postura
comunicativa é a terminologia alternativa que se cria para atender as necessidades de cada
situação comunicativa, onde vários termos podem corresponder mais ou menos ao mesmo
conceito, criando uma espécie de competição terminológica, ou que o mesmo termo parece
corresponder a diferentes denominações, no todo ou em parte, ou seja, ocorre uma
terminologia polissêmica.
A ocorrência das variantes terminológicas se dá no contexto da comunicação
científica, visto que é nesse contexto que o processo comunicativo ocorre, ou seja, é nesse
contexto que a conversão dos resultados da investigação científica se torna um novo
conhecimento. Por isso, o processo comunicativo configura-se em um sistema de
comunicação composto por três elementos básicos, que são o emissor, o canal de
comunicação e o receptor (STUMPF, 2000).
Weitzel (2006, p. 88) diz que a “[...] comunicação científica pode ser entendida como
um processo que envolve a construção, comunicação e uso do conhecimento científico para
possibilitar a promoção de sua evolução”. A natureza especializada da comunicação científica
lhe concede a propriedade de manifestação diversa de seus discursos com base no
direcionamento que lhe é dado. Quando da comunicação entre pares, é tendência que o texto
especializado adquira características de uma linguagem mais particularizada, com uma
terminologia que se adapte ao direcionamento que lhe é dado. Ou seja, a unidade léxica
utilizada no discurso especializado logicamente possui características de especialização, o
mesmo podendo não ocorrer quando a comunicação que se deseja fazer é voltada para o
público leigo, por exemplo.
É na linguagem especializada, mais especificamente nas situações comunicativas, e
em função das próprias necessidades comunicativas que se manifestam as variantes
terminológicas; em decorrência da possibilidade gramatical oferecida pela língua ou
linguagens de especialidade que compõem um conjunto de meios linguísticos próprios de um
campo do conhecimento (BARROS, 2004). Cabré (1993, p. 125, tradução nossa) diz que “[...]
uma língua é um sistema complexo e heterogêneo de subsistemas inter-relacionados, em que
cada um dos quais é suscetível de ser descrito em distintos níveis [...]”. Para tanto, Cabré
(1993) afirma que os elementos mais importantes de caracterização de uma língua são aqueles
57
que também compõem o léxico especializado, e que se manifestam por meio de diferentes
níveis de descrição linguística, a saber:
a) nível fonológico – fonema;
b) nível morfológico – morfema;
c) nível léxico – palavra;
d) nível sintático – oração;
e) nível discursivo – texto.
Embora estabelecido em forma de níveis, para Cabré (1993, p. 125, tradução nossa), o
sistema linguístico “[...] não se limita aos distintos níveis descritivos: mas se manifesta
também em uma série de modalidades denominadas variedades dialéticas e funcionais [...]”.
Portanto, não há limitação quanto às unidades alternativas substituírem às básicas dentro de
um conjunto linguístico, ou até mesmo unidades que compõem mais de um nível de
descrição, como é o caso dos sintagmas terminológicos ou dos fragmentos do discurso.
Assim, o nível de descrição gramatical está para Cabré (1993, p. 126, tradução nossa) “[...]
condicionado pelas características das situações comunicativas”.
O contexto da comunicação científica é manifesto por meio do texto especializado,
definido por Barros (2004, p. 44) como os “[...] discursos orais ou escritos produzidos por
uma área do saber [...] que [...] têm por objetivo maior transmitir uma informação [...]”. Sendo
esse o principal objetivo do texto especializado, é de entendimento que o mesmo usufrua de
uma linguagem que aborde aspectos próprios da terminologia da área.
Segundo Barros (2004, p. 44) “[...] os discursos especializados também subjazem
normas discursivas próprias [...], por tanto, a eficácia do discurso especializado também está
ligada à argumentação, com a utilização do léxico especializado em diferentes níveis”. A
propagação do conhecimento se dá por meio do texto especializado, que se utiliza de unidades
léxicas específicas do domínio em questão e que são pertinentes no nível do discurso. Além
do mais, adaptam-se a quem este texto se destina e ao canal de comunicação utilizado. Pode-
se assim identificar a ocorrência da variação terminológica, uma vez que a destinação da
informação e o meio de comunicação utilizado no âmbito profissional podem requerer um
nível maior ou menor de especialização do texto científico.
A linguagem de especialidade ou especializada, manifestada por meio da comunicação
especializada ou científica, campo de estudo da Terminologia, é considerada por Barros
(2004, p. 43) como “[...] as manifestações e potencialidades de um sistema linguístico [...]”,
conhecida também como “tecnoletos”, um subsistema de uma língua geral que possui na
linguagem natural suas bases constitutivas. Portanto, o termo adquire valor terminológico
58
devido ao seu uso por um domínio especializado “[...] em toda sua variada amplitude,
temática, perspectiva, nível de especialização, propósito comunicativo, propósito funcional,
tipo de texto, tipo de discurso, etc...” (CABRÉ, 1993, p. 120). Assim, para Barros (2004,
p.59) “[...] a sinonímia, a homonímia, a polissemia e a variação linguística (léxica) de
diferentes tipos passam a ser previstas, aceitas e tratadas em um estudo terminológico de
perspectiva comunicativa”.
Por conseguinte, cabe um recorte referencial de separação da língua geral e da língua
especializada (linguagem de especialidade), para que se possa caracterizar a variante
terminológica. Cabré (1993) ressalta que determinadas característica de uma linguagem são o
elo de estabelecimento de sua especialização e, consequentemente, de suas peculiaridades
enquanto texto comunicativo especializado. Assim, para Cabré, uma linguagem de
especialidade é
muito ligada à situação de contexto da mesma, que no discurso textual tem sua principal
forma de veiculação (CABRÉ, 1993).
Cabré (1993, p. 139-140) estabelece os critérios de definição de uma linguagem
especializada, pressuposto para a análise terminológica, caracterizada por três variáveis: a
temática, os usuários e as situações de comunicação:
a) considera-se especializada a linguagem temática que forma o conhecimento geral
dos seus falantes e que, portanto, é objeto para aprendizagem especializada;
b) considera que os usuários de uma linguagem de especializada são os especialistas,
os quais participam do processo comunicativo como produtores e receptores de
informação especializada;
c) a situação comunicativa pressupõe a utilização de códigos linguísticos apropriados,
ou seja, utiliza-se um subconjunto da língua regulados por critérios profissionais ou
científicos, impondo uma formalidade para a comunicação;
d) são considerados como subconjuntos especializados de uma língua, que se regulam
por critérios das situações comunicativas, apresentando características específicas
para o tipo linguístico (unidades linguísticas utilizadas e suas regras) e para o texto,
em função de seu tipo e tipo de documento;
e) entende-se que a linguagem especializada apresenta uma variedade alternativa de
expressões em função do uso e características comunicacionais, emergindo, assim,
as variantes terminológicas. Estas, por sua vez, têm sua ocorrência ligada à
temática, aos destinatários da informação e à função comunicativa que o emissor se
propõe no texto, abrindo espaço para a utilização de termos com a mesma função
em textos especializados, porém, com propósitos comunicativos diferentes. Além
disso, podem atuar como fatores na ocorrência de variantes terminológicas os
dialetos geográficos, históricos e sociais, além do estilo pessoal do autor para a
construção do texto;
f) as linguagens especializadas possuem características da linguagem natural,
podendo, então, afirmar que a mesma é um subconjunto da linguagem natural e;
g) considera-se que a linguagem especializada mantém uma relação próxima com a
linguagem natural, inclusive existindo uma intersecção entre a linguagem natural e
mais de uma linguagem especializada, onde as mesmas compartilham
características, unidades e convenções de uso.
Cabré (1993, p. 142, tradução nossa) afirma que “[...] dentro de cada linguagem
especializada determinada pela temática, podemos verificar distintos graus de abstração, que
60
Evidencia-se, aqui, a questão da pronúncia e da grafia que podem manter uma diferenciação
entre a forma com que o termo é pronunciado e a sua forma escrita. Do ponto de vista
terminológico, Cabré (1993) explica que, por vezes, os termos não possuem características
próprias para diferenciá-los das palavras em geral, visto que a grafia está condicionada às
regras gerais da língua.
A variação de morfologia está ligada à possibilidade de decomposição do termo em
unidades distintivas e significativas, conhecidos como morfemas. Cabré (1993, p. 174,
tradução nossa) diz que o “[...] morfema é uma unidade pequena do sistema linguístico que
cumpre dupla condição formal e semântica, para além de ser também uma unidade de
distinção no interior da palavra”. Dessa forma, o fonema cumpre sua função distintiva, porém
não possui significação própria quando sozinho. Este tipo de variação é caracterizado pela
ocorrência de uma base léxica de constituição do termo, conhecida também como raiz, onde
são acoplados sufixos ou prefixos com a intenção de constituir uma forma derivativa de um
termo com base na estrutura morfológica da linguagem natural (CABRÉ, 1993).
Segundo Cabré (1993, p. 176, tradução nossa), os termos podem ser classificados por
“[...] distintos critérios que se agrupam em torno de quatro aspectos diferentes: a forma, a
função, o significado e a procedência”. A autora aponta os critérios de pertencimento dos
termos a cada grupo, de acordo com a forma:
a) segundo o número de morfemas;
b) segundo os tipos de morfemas que intervém na formação dos termos, podendo eles
serem derivados, formados por agregação à base léxica se sufixo ou prefixo, ou
compostos formados por combinações de bases léxicas, podendo, inclusive,
comportar sufixos ou prefixos;
c) segundo a sua complexidade, determinada pela combinação de palavras a uma
determinada estrutura sintática, ou seja, essas estruturas são conhecidas como
sintagmas terminológicos, que fazem uso da combinação entre palavras para a
representação de um assunto e;
d) segundo sua formação de origem, sendo o caso aqui das siglas, dos acrônimos, das
abreviaturas e formas abreviadas.
A partir do ponto de vista da função no discurso especializado, Cabré (1993, p. 180,
tradução nossa) afirma que os “[...] termos podem classificar-se em vários grupos ou
funcionalidades: substantivos, adjetivos, verbos e advérbios”. Porém, a quantidade de
substantivos no léxico especializado é muito maior frente a adjetivos e verbos.
63
5 METODOLOGIA
______________________
¹ Disponível em: <http://www.lexml.gov.br/>.
65
A análise das expressões de busca contidas em logs de acesso inclui-se nesses critérios
de definição da pesquisa como qualitativa, visto que os mesmos representam uma forma de
comunicação humana, mediada por meio do uso de um sistema informatizado. É da interação
do usuário com o Portal LexML que surgem os logs de pesquisa, que comportam os dados de
interesse, as expressões de busca. Os dados armazenados pelos logs são o conjunto de
informações que individualizam a pesquisa do usuário no Portal LexML, que oferta
documentos indexados por meio de uma linguagem documentária, que nem sempre pode ser a
mesma utilizada pelo usuário para realizar as pesquisas. Portanto, a característica qualitativa
da pesquisa fica preservada ao passo que se justifica uma análise manual, amparada por
instrumentos de consulta, como um Código Penal e a CDDir (Classificação Decimal de
Direito), além da validação do especialista e a verificação da utilização da possível variante
terminológica na jurisprudência da área do Direito Penal, escolhida para análise como formas
de garantia de pertencimento a área em questão e de utilização pelo especialista.
O delineamento metodológico da pesquisa ressalta os procedimentos técnicos que
foram utilizados para a coleta e análise dos dados da pesquisa. O objetivo é analisar as
expressões de busca informacional dos usuários que utilizam o Portal LexML de informação
jurídica e legislativa, a fim de que, a partir da análise e interpretação dos dados possa-se
fornecer subsídios para a melhora da indexação das informações disponibilizadas por esse
Portal. Assim, optou-se por uma pesquisa documental, visto que Gil (2004, p.45) afirma que a
mesma “[...] vale-se de materiais que ainda não receberam tratamento analítico, ou podem ser
reelaborados de acordo com os objetos da pesquisa”.
Por si só, as expressões de busca na pesquisa informacional são informações que estão
em seu estado bruto de ocorrência e que ainda não receberam nenhum tipo de tratamento
analítico, constituindo-se praticamente num relatório representativo do uso do Portal LexML
por parte dos usuários, no que se refere às formas de busca utilizadas pelos mesmos. Embora
as características da pesquisa documental remetam à questão do suporte da informação em
papel, as expressões de busca coletadas se constituem num documento gerado
eletronicamente por um sistema informatizado de coleta de dados que não exige contato direto
com os sujeitos da pesquisa, evitando uma coleta manual das expressões de busca. O tipo de
investigação científica realizada e sua natureza, abordagem e desenvolvimento possuem
respaldo em Gil (2004) e Gibbs (2009).
Para garantir a clareza e compreensão da pesquisa, elaboramos a definição de alguns
termos empregados na mesma. Por mais que o conceito de determinados termos, aqui
utilizados, ainda gerem discussões quanto a sua amplitude de representação, estabelecemos os
67
seguintes termos e suas definições visando à compreensão plena de seu emprego nessa
pesquisa:
a) expressão de busca – texto utilizado pelo usuário do Portal LexML para realizar a
sua pesquisa e que foram extraídas dos logs de pesquisa;
b) descritor – termo autorizado e utilizado pelo VCB para representar um assunto;
c) logs de pesquisa – registro eletrônico de dados de pesquisas de usuários realizadas
no sistema de buscas do Portal LexML;
d) termo não autorizado – termo reconhecido pelo VCB e que não deve ser utilizado
em detrimento de outra forma definida e padronizada.
Assim, Nascimento e Guimarães (2004, p. 33) definem documento jurídico como “[...]
o conjunto de espécies documentais geradas pelo e/ou para o Direito [...]”, que “[...] diz
respeito às relações jurídicas existentes entre os indivíduos ou destes para com o Estado e
vice-versa [...]” com o objetivo de alcançar a “[...] necessária convivência social, validando
fatos e atos de natureza jurídica por meio da proteção à integridade dos mesmos, que retratam
uma manifestação da vontade”. Enquadram-se como documento jurídico os oriundos de três
fontes documentais características do Direito: a legislação, a jurisprudência, e a doutrina.
Entende-se por legislação, segundo Diniz (1998, p. 75) como o “[...] conjunto de leis
de um país, de um estado-membro ou município”. Por jurisprudência, entende-se o “[...]
conjunto de decisões uniformes de juízes e tribunais sobre uma dada matéria” (DINIZ, 1998,
p. 28). Já a doutrina é entendida, ainda conforme Diniz (1998, p. 244) “[...] como estudo de
caráter científico que os juristas realizam a respeito do direito”.
O Portal LexML tem por diretriz, não sendo exatamente uma obrigatoriedade, o fato
de que as informações por ele disponibilizadas sejam indexadas com base no Vocabulário
Controlado Básico do Senado Federal (VCB). Tal medida visa assegurar a padronização na
representação da informação indexada pelo Portal, dar uma maior consistência a indexação
realizada e também possibilitar que a utilização do VCB seja um instrumento de recuperação
da informação por ele indexada.
Portanto, a partir do Portal LexML foram extraídos os logs de pesquisa, que
comportam as expressões de busca dos usuários, o objeto de análise deste estudo. A
especialização do Portal LexML vai ao encontro das demais premissas desta pesquisa, além
do fato de o mesmo utilizar uma linguagem de indexação controlada, o VCB. O Portal
LexML oferece resultados de pesquisa que indicam a subárea de pertencimento do assunto
dentro da área do Direito, o tipo de documento (artigo, livro), a categoria do documento
(jurisprudência, doutrina, legislação), os assuntos que foram usados pelo indexador e outros
detalhes, como autor, data, idioma e biblioteca de localização/origem. Além do que, é
fornecida a quantidade de resultados e a classificação na CDDir – aspectos primordiais para a
avaliação da correspondência da linguagem do usuário com a linguagem de indexação. Tem-
se, a seguir, um exemplo de resultado de pesquisa com o descritor “delinquente juvenil” do
VCB:
69
Fonte: adaptado pelo autor, através do Portal LexML, disponível em: <http://www.lexml.gov.br/>. Acesso em: 11 maio 2014.
A coleta dos dados, ou seja, a coleta de logs de pesquisa dos usuários do Portal
LexML se deu de forma automatizada, executada pelos profissionais responsáveis pela
tecnologia da informação do Portal. A execução desta coleta por parte dos responsáveis pelo
Portal LexML está ligada ao fato de que a coleta de dados faz parte da pesquisa de doutorado
da Professora Rita do Carmo Ferreira Laipelt, da Universidade Federal do Rio Grande do Sul,
e que também foi usada para esta pesquisa, entretanto, com diferente enfoque. Isso justifica o
fato de que a coleta de dados tenha sido realizada anteriormente ao início da pesquisa, porém
ressalta-se que a coleta por si só não gera resultados conclusivos e nem o fato de ter sido
executado por terceiros influenciaria nos resultados, já que foi realizada de forma
automatizada.
A coleta ocorreu por meio da utilização de software que registra as formas com que o
usuário pesquisou no Portal, compondo assim os logs de pesquisa. Os dados compilados
trazem informações sobre o tipo de pesquisa executada, a expressão de busca utilizada e os
dados que individualizam a pesquisa executada pelo usuário, além de informações adicionais
de data, hora, localização geográfica. Com o intuito de viabilizar a pesquisa, foi definido um
período de tempo para delimitar a abrangência da coleta de dados, ora já realizada pelos
responsáveis técnicos pelo Portal LexML. O período de tempo definido foi do dia seis de
julho a cinco de agosto de 2013, totalizando assim um montante de 31 dias de coleta, de modo
que o registro dos logs de acesso também foi efetuado aos finais de semana. Os logs de
pesquisa estão alocados em planilhas do programa Excel, software editor de planilhas
produzido pela Microsoft Office®, que organiza os dados em linhas e colunas. Dessa forma, o
arquivo de logs de pesquisa de um dia de buscas é disposto em doze colunas e em linhas que
variam em torno de duas mil linhas nos menores logs e chegando a mais de 11 mil linhas nos
maiores logs diários. Cada linha corresponde a uma pesquisa realizada, ou seja, após o usuário
digitar o texto na caixa de busca e clicar no comando “encontrar”, oferecido pelo Portal
LexML, gera-se um log de pesquisa unitário e a soma dos logs de pesquisa unitários, ao longo
do dia, gera o log de pesquisa diário, portanto, representa uma coleta.
A coleta dos dados realizada foi um procedimento que não deixou de observar a
privacidade do usuário do Portal LexML, pois não permitiu a atribuição de nenhuma coleta a
um usuário em específico. Isso se deve ao fato de que a comunicação gerada no processo de
busca é intermediada por computadores, em que apenas os dados de comunicação entre as
72
máquinas ficaram salvos, não havendo permissão da identificação de nenhum usuário e nem a
coleta de informações pessoais.
A importância deste tipo de coleta de dados reside no fato de que o usuário se expressa
livremente no momento da pesquisa. Assim, ele deixa marcas, expressões e estratégias de
busca que podem identificar características da sua linguagem, fornecendo subsídios para a
pesquisa que se realizou. O processo de armazenamento de logs (dados) utilizou como
parâmetro o endereço de protocolo de Internet (IP), responsável por parte da comunicação
entre computadores,que pode ser identificado como uma sequência numérica que identifica e
individualiza um computador (dispositivo) empregado como meio para a busca informacional.
Esta forma de coleta de dados contrapõe-se a estratégia anteriormente aplicada para
este tipo de pesquisa, que era o acompanhamento presencial do usuário no momento da busca.
Esta possibilidade é oriunda dos avanços tecnológicos que, além de fornecerem acesso a
inúmeras informações instantaneamente, também possibilitam o acompanhamento das formas
com que o usuário executa suas pesquisas, transformando-se assim numa ferramenta de gestão
do sistema de informação. A seguir, apresentamos um exemplo de log da pesquisa:
Figura 3 – Exemplo de parte de um log de pesquisa.
Colunas
1 2 3 4 5 6 7 8 9 10 11 12
Fonte: adaptado pelo autor, do log de pesquisa do dia sete de julho de 2013.
c) Terceira, quarta, quinta, sexta, sétima, oitava colunas: dados de data e hora
da pesquisa;
d) Nona coluna: país de origem da pesquisa;
e) Décima coluna: expressão de busca utilizada pelo usuário para realizar a
pesquisa.
f) Décima primeira coluna: campo de verificação de delimitação da pesquisa
básica. As opções oferecidas pelo Portal LexML são: “tudo”, “legislação”,
“jurisprudência”, “proposições legislativas” e “doutrina”. No exemplo em questão, o
usuário não selecionou nenhuma opção, embora a pesquisa, por definição do sistema,
foi realizada com busca em todas as áreas, ou seja, no campo “tudo”; representada
apenas pelos sinais gráficos de aspas. Caso o usuário selecionasse uma delimitação
para a pesquisa, que não a opção “tudo”, a mesma apareceria nesta coluna entre aspas.
g) Décima segunda coluna: resultado da pesquisa indicado pelas palavras
“sucesso” e “falha”. A qual não se reveste de importância para a pesquisa, pois se
refere à comunicação entre o servidor (informática) e o computador do usuário.
Abaixo é apresentada a parte do log de pesquisa que contém a expressão de busca do
usuário que foi utilizada, com a finalidade de responder ao problema de pesquisa e atingir aos
objetivos do estudo. A figura 4 representa a décima coluna da composição do log de pesquisa.
Os demais dados não foram considerados devido à visão que se está atribuindo ao objeto,
considerando-se que o intuito não é analisar a estratégia de busca do usuário e, sim, se a
expressão de busca (assunto, variante terminológica) utilizada é compreendida ou não pela
indexação realizada pelo Portal LexML.
Figura 4 – Exemplo de expressão de busca contida em um log de pesquisa.
Fonte: adaptado pelo autor, do log de pesquisa do dia sete de julho de 2013, linha 3353.
A coleta de dados realizada gerou uma quantidade enorme de registros, então, buscou-
se estabelecer alguns critérios para restringir o número de dados que foram analisados e,
assim, tornar viável a pesquisa, tanto em função do tempo para sua realização, quanto pela
questão de que a análise pretendida pode ser feita por meio da utilização de parte destes
74
dados. A área do Direito escolhida para se tornar a base de orientação para a análise das
expressões de busca foi a área do Direito Penal.
A partir desta etapa, todos os procedimentos executados foram realizados de forma
manual, sem o emprego de qualquer mecanismo de auxílio. Tal forma é uma exigência
imposta pelas características da pesquisa qualitativa realizada em função do objeto e dos
objetivos pretendidos. Procedeu-se com a identificação, dentro da expressão de busca
utilizada pelo usuário no processo de recuperação da informação, de possíveis termos, ou
partes de termos, da área do Direito Penal, que permitam um comparativo entre a linguagem
do usuário e a linguagem e indexação utilizada pelo Portal LexML. No âmbito desta pesquisa,
utilizamos a locução “expressão de busca” no decorrer da mesma, para identificar o termo,
parte de termo ou sinônimo, variante terminológica, sigla, acrônimo, número de lei, artigo de
lei que estiver sendo empregado pelo usuário no processo de busca informacional e que
estiver presente nos logs de pesquisa analisados.
A constituição do corpus para a pesquisa se deu a partir dos dados coletados, ou seja, a
partir da seleção das expressões de busca que possuíam ligação com a área do Direito Penal
utilizadas pelos usuários do Portal LexML. Os dados utilizados na pesquisa compreendem as
expressões de busca empregadas pelos usuários do Portal LexML no momento da ação de
busca e recuperação da informação. Essas expressões de busca são parte integrante do log de
pesquisa do usuário junto ao Portal LexML e constituem o registro das ações dos usuários no
processo de busca informacional dentro da base de dados mencionada.
Deste modo, a análise das expressões de busca foi amparada por instrumentos
especializados que possibilitaram observar a correlação do possível termo com a área de
interesse da pesquisa. Um desses instrumentos é a Classificação Decimal de Direito (CDDir)²,
uma expansão da classe 340 da tradicional Classificação Decimal de Dewey (CDD),
desenvolvida em 1948 pela bibliotecária e bacharela em Direito Doris de Queiroz Carvalho
para a aplicação na biblioteca do Ministério da Fazenda. A expansão é voltada para a
aplicação em obras jurídicas nacionais, pois agrega as especificidades do Direito Pátrio, tanto
que é considerada até a atualidade, já estando em sua quarta edição como uma obra de
referência para a área e é utilizada, inclusive, pelo Senado Federal como base em suas
linguagens documentárias controladas.
75
Item a
Item a
Fonte: adaptado pelo autor, através do Portal LexML, disponível em: <http://www.lexml.gov.br/>. Acesso em: 12 maio 2014.
Item c
Item b
Fonte: adaptado pelo autor, através do Portal LexML, disponível em: <http://www.lexml.gov.br/>. Acesso em: 12 maio 2014.
Item a
Fonte: adaptado pelo autor, através do Vocabulário Controlado Básico do Senado Federal.
Para exemplificar essa terceira etapa, utilizou-se uma expressão que está
compreendida pelo VCB, a fim de ilustrar de forma clara quando a expressão de busca é um
termo variante já reconhecido. Com outras expressões de busca essa etapa pode não ser
possível, quando a expressão de busca for uma variante terminológica não reconhecida pelo
VCB, contudo, a expressão de busca é, sim, utilizada pelo usuário e também pelo especialista
da área, como se pode identificar nas etapas anteriores. Este fato é considerado nos resultados
da pesquisa, a fim de analisar cada caso das 34 expressões de buscas analisadas, com a
intenção de fornecerem subsídios para a melhora da indexação.
Nos casos em que a expressão de busca não foi identificada no VCB, mas é utilizada
pelo usuário e especialista, realizou-se uma aferição nos Códigos de Justiça Penal para
identificar como o assunto (expressão de busca) está sendo disposto em lei. Isto permitiu
identificar os casos de omissão do VCB em relação a assuntos da área e também possibilitou
identificar se o assunto é tratado de forma mais genérica ou específica pelo VCB.
A realização das etapas anteriores resultou no APÊNDICE A, que é tomado por base
para a validação do corpus de pesquisa com o qual se trabalhou. Dentro das 61 expressões de
busca utilizadas pelos usuários, procurou-se a identificação de palavras, expressões ou termos
que possuíam significado de análise e que pudessem ser utilizados para observação da
79
_________________
4
Disponível em: <http://www4.planalto.gov.br/legislacao>. Acesso em: 12 maio 2014.
80
corpus validado, pois não preencheram os requisitos estabelecidos, como a validação pelos
especialistas da área, pertencimento ao Direito Penal ou utilização na jurisprudência.
já possuem uma estrutura conceitual consolidada na área do Direito Penal, visto que
integram leis, ou Códigos de Justiça Penal.
“drogas” “entorpecente”
Fonte: autor.
realizada no Portal LexML. Este roteiro tem por objetivo demonstrar as etapas que foram
realizadas para analisar as expressões de busca selecionadas, a fim de responder ao problema
de pesquisa e atingir os objetivos propostos. Além disso, buscou-se demonstrar que a análise
de expressões de busca dos usuários de um sistema de informação, recolhidas por meio de
logs de pesquisa, pode ser uma ferramenta de análise da consistência da indexação realizada.
Utilizam-se as expressões ‘pesquisa geral’ e ‘pesquisa campo assunto/indexação’ no
decorrer deste roteiro, com as seguintes denominações, respectivamente: pesquisa livre na tela
inicial do Portal LexML sem a seleção de qualquer tipo de documento em específico; e
pesquisa avançada em que se procurava a expressão de busca ou descritor apenas como
assunto indexado para representar um documento. A ‘pesquisa geral’ é uma forma de busca
que desempenha o papel de investigar a expressão de busca ou o descritor em qualquer parte
do documento. Já a busca ‘campo assunto/indexação’ pesquisa apenas a expressão de busca
ou o descritor presente no campo usado pelo indexador do documento para atribuir termos ao
documento indexado, ou seja, limita o sistema a apenas um campo de pesquisa que
recorrentemente é usado para indexar os documentos a partir de uma linguagem de indexação.
As etapas realizadas foram aplicadas a cada caso específico de ocorrência ou
representadas por um item de mesma forma de ocorrência, dentro da mesma categoria, de
modo que nem todas as expressões de busca da mesma categoria se encaixaram em todas as
etapas propostas, pois ou não possuíam representação no VCB, ou não eram tratadas com
especificidade pelo VCB, ou eram variantes terminológicas já reconhecidas. Portanto, a
análise da expressão de busca se adéqua a uma ou mais etapas de cada categoria presente no
roteiro abaixo, com o intuito de demonstrar na prática as inconsistências da indexação
realizada no Portal LexML. Esta avaliação reconheceu aspectos presentes na linguagem do
usuário que possibilitaram estabelecer quais as origens da problemática que impede que o
descritor recupere a mesma quantidade de documentos que a expressão de busca que faz
correspondência ao mesmo de forma clara e objetiva. Seguem as etapas:
a) verificar se ocorre no VCB algum tipo de descritor relacionado à legislação,
especificamente que cite leis ou parte das leis;
b) verificar se a expressão de busca já está relacionada como variante terminológica de
descritor do VCB;
c) verificar a recuperação de documentos, utilizando-se a expressão de busca que não
possui descritor no VCB, tanto na ‘pesquisa geral’ como na pesquisa pelo ‘campo
assunto/indexação’ do Portal LexML;
86
Por vezes, os avanços dessa área ocorrem primeiramente fora de seu instrumento
próprio de comunicação – a legislação –, de modo que parte de seus avanços surge na forma
jurisprudencial, ou seja, do posicionamento da justiça sobre determinado assunto, como
resultado de demandas e imposições inadiáveis da sociedade, que ainda não estão previstas
em lei ou regulamento próprio. A análise dos resultados apresentou indícios desse fenômeno,
pois demonstra que nas expressões de busca dos usuários ocorre esse tipo de fato (novos
assuntos e terminologias) e isso só valida a análise das expressões de busca como uma
ferramenta de auxílio na melhora da consistência da indexação.
Sendo assim, se a elaboração de uma linguagem documentária da área levar em
consideração apenas a temática já consolidada em lei, pode deixar de fora as demandas
informacionais de temas ainda não consolidados em lei, mas que são utilizados pelos usuários
e pelos especialistas. Dodebei (2002, p. 56) conceitua linguagens documentárias como “[...]
linguagens de comunicação entre a informação documentária e o usuário que dela necessita”.
Cada vez mais se ressalta a importância da linguagem documentária em observar o usuário
nos seus processos, visto que ele é o destinatário da informação.
Além do mais, a análise das expressões de busca pode conduzir a uma avaliação das
etapas da indexação, mais precisamente a etapa de tradução. Verificou-se que a demanda do
usuário expressa na busca informacional não é atendida como se espera, pois o Vocabulário
Controlado Básico do Senado Federal deixa de atender por igual áreas de mesmo nível. Por
exemplo, alguns capítulos do Código Penal têm seus assuntos descritos com maior
abrangência, primando pela especificidade, e outros, de mesmo nível, são tratados de forma
mais genérica. Também se verificou a desatualização, anão utilização de descritores para
representar as leis e seus artigos e a falta de reconhecimento de variantes terminológicas. A
inconsistência da indexação é deflagrada pelo uso de termos não autorizados pelo VCB na
representação de documentos no campo assunto/indexação. Esse problema afeta a qualidade
da indexação e, consequentemente, a recuperação da informação; pois tendo em vista que
expressões de busca, ou até mesmo com o descritor que a representa, encontrou-se diferenças
nos resultados no Portal LexML. Também se pode verificar que são usados termos que não
estão presentes no VCB para indexar documentos da área do Direito Penal. Porém, para a
consistência da indexação é necessária a utilização do vocabulário controlado, pois ele “[...]
torna-se o ponto de convergência entre as linguagens utilizadas por autores, indexadores e
pesquisadores, premissa fundamental para comunicação de informações dentro de um
sistema” (STREHL, p. 331, 1998).
Esses termos usados como assunto, que não os do VCB, são oriundos provavelmente
da interpretação do indexador do documento, podendo os mesmos termos serem variantes
terminológicas, parte de um descritor ou até mesmo parte de uma variante, que dificultam a
recuperação da informação, já que não são provenientes da linguagem de indexação utilizada
pelo Portal LexML. Isto é reflexo de uma indexação inconsistente, que não segue a política
adotada, qual seja, o uso do VCB como linguagem de indexação.
As expressões de busca da área do Direito Penal selecionadas para a análise, conforme
a metodologia, apresentaram características de ocorrência que possibilitaram elencá-las em
categorias, sendo que seis expressões de busca pertencem à categoria ‘Legislação’, dezenove
expressões de busca pertencem à categoria ‘Variantes terminológicas’ e nove expressões de
busca pertencem à categoria ‘Especificidade’’. Pode-se, assim, visualizar semelhanças que se
enquadram em categorias não apenas por serem variantes terminológicas, muito comuns
quando se trabalha com a terminologia de uma área, mas também por conterem necessidades
informacionais dos usuários que se caracterizam pela especificidade na construção da
expressão de busca e que não são absorvidas pelo VCB. Destacaram-se, neste quesito, as
expressões de busca ligadas à legislação, com expressões que buscavam apenas partes dos
Códigos de Justiça Penal (exemplo: ‘artigo 20 do Código Penal’) e expressões que continham
a representação nominal de leis (exemplo: ‘Lei Maria da Penha’).
Nas expressões de busca que se referem ao nível de profundidade no tratamento de
assuntos da área, identificou-se a desigual utilização da premissa da especificidade, sendo que
alguns temas são trabalhados com maior especificidade, com a identificação dos seus
assuntos, já outros temas são representados por descritores mais genéricos, que não
identificam os assuntos que são abrangidos por ele, prejudicando, assim, a recuperação de
informações quando o usuário realiza uma pesquisa mais específica. Conforme Lancaster
(1993, p. 77) “[...] deixar de utilizar o termo mais específico disponível para representar um
assunto [...]” configura uma falha na tradução, umas das etapas da indexação.
90
Esse tipo de problema se torna mais preocupante ao passo que ambos os temas estão
apresentados nos Códigos de Justiça Penal de forma igual, porém o VCB os trata de forma
desigual, ou seja, é mais genérico no tratamento de determinados temas do que em outros, nos
quais imprime uma especificidade maior na representação do assunto.
Já nas etapas metodológicas de reconhecimento das expressões de busca para a seleção
inicial de um conjunto que pudesse ser validado, pode-se identificar que o VCB não atende a
todas as necessidades dos usuários, pois peca na identificação dos assuntos, na representação
de leis e artigos e no reconhecimento de variantes terminológicas. Esse fato nos levar a crer
que, independentemente da área selecionada, poder-se-á encontrar deficiências na indexação,
devido ao fato de que o VCB possui limitações em sua estrutura. Por outro lado, esse dado só
reforça a necessidade de que deva existir, sim, uma padronização da representação descritiva
dos documentos por meio de uma linguagem documentária que atenda aos anseios não só do
indexador, mas também do usuário. Nota-se que a análise conceitual somente pode se
concretizar com plenitude, ao passo que a tradução, etapa posterior, seja realizada seguindo-se
uma política de indexação que represente os objetivos do sistema de informação e,
indiscutivelmente, utilize um vocabulário controlado para indexar.
informacional específica que regula com as características da área do Direito, como é o caso
dos temas abrangidos na legislação penal. O usuário tem a sua necessidade informacional
centrada em partes de uma lei ou código, porém o VCB não identifica isso, como pode ser
verificado a seguir.
No item 1, ocorre uma busca informacional por meio do nome pelo qual ficou
conhecida a lei que trata de violência doméstica. Muito embora não seja exclusividade desta
lei, pois algumas leis ficam conhecidas por um nome diferente do padrão que, via de regra, é
representado por um número seguido pela data de sua criação. Ao se realizar a pesquisa no
VCB constatou-se que a lei citada na expressão de busca não possui um descritor no catálogo
de assuntos. A lei é apresentada no VCB como uma entrada do catálogo de autoridades,
conforme a seguinte notação: Lei n. 11.340, de 7 de agosto de 2006, sendo ela uma entrada
não permitida e que remete à entrada autorizada: Brasil. [Lei Maria da Penha (2006)].
O fato de a lei em questão ser reconhecida como uma entrada autorizada no catálogo
de autoridades para autor, não exclui a necessidade de representá-la enquanto um descritor de
assunto, visto que o Código de Catalogação Anglo-Americano (2004), usado para a
catalogação, trabalha com diferentes catálogos para identificar uma entrada por autoridade e
uma entrada secundária por assunto. Isso demonstra a necessidade de incluir no catálogo de
autoridades para assuntos descritores que façam referência a leis, fato este que pode ser
identificado nesta pesquisa, pois representa uma demanda informacional específica do
usuário.
Caso semelhante ocorre com o item 25, visto que o mesmo comporta uma expressão
de busca que difere em muito do descritor utilizado pelo VCB para representar o assunto,
porém mantém correspondência direta com o mesmo. O usuário informa ao sistema de
informações que busca documentos relacionados à expressão “lei anticorrupção”, citando o
nome pelo qual a lei ficou conhecida no meio jurídico, porém a expressão não é reconhecida
como variante terminológica do descritor, o que, com toda a certeza, influenciará na
recuperação de documentos no Portal LexML. Segundo Cabré (1993), as variantes se
apresentam como formas variadas de um mesmo termo representativo de um conceito. Este
tipo de variante terminológica apresentada é conhecida como variante denominativa, assim
entendida por Suaréz e Cabré (2002, p. 1, tradução nossa) como “[...] a presença de formas
distintas para referir-se a um mesmo conceito”. Ela ocorre em situações comunicativas, ou
seja, a variação de um conceito sob diferentes formas está ligada ao texto especializado.
Freixa (2002) indica que a aparição de sinônimos tanto do discurso especializado como sua
92
utilização pelo usuário, que se apropria do conhecimento apresentado, é uma das marcas da
terminologia.
Esta ocorrência demonstra que o VCB precisa definir políticas mais objetivas em
relação à descrição de leis, fato que se comprova com o item 25 em comparação ao item
apresentado acima. Ambos os temas possuem uma lei que os descreve dentro da área penal,
mas apenas a expressão de busca “Lei Maria da Penha” tem uma descrição no VCB em
formato relacionado à legislação, não ocorrendo o mesmo com a expressão de busca “lei
anticorrupção”, que possui o descritor ‘Corrupção administrativa’ que não comporta o nome
pelo qual a lei ficou conhecida e nem a sua numeração como termos não autorizados na rede
de remissivas.
Esta distorção no tratamento de assuntos de igual tipologia demonstra uma
necessidade de atualização do VCB, com a definição de políticas que evitem este tipo de
representação diferenciada para assuntos idênticos. Lancaster (2004) afirma que todo o
processo deve ser conduzido por meio de elementos norteadores que possibilitem ao
indexador proceder de forma a garantir qualidade ao processo de indexação e que atenda às
necessidades dos usuários. Ou seja, é necessária a utilização de políticas que definam a
construção, uso e atualização da linguagem de indexação utilizada pelo sistema.
A constatação que se possibilitou fazer, a partir da análise da expressão de busca do
usuário, foi que o VCB não apresenta os descritores para leis que não ficaram conhecidas por
um nome. Neste quesito, obteve-se uma surpresa negativa quanto à expectativa, pois se
presumia que as leis fossem também representadas, porém o VCB não possui descritores que
representem leis, ou seja, o indexador do Portal LexML não possui a opção de utilizar um
descritor formalizado e padronizado para representar uma lei.
Tomando-se por base a análise da expressão de busca e do descritor acima, que
apresentou uma grande diferença na recuperação de documentos – mesmo tendo um descritor
formalizado – entende-se que, quando não é dada essa opção, a possibilidade de que ocorram
diferentes formas de representação do mesmo assunto aumenta e, provavelmente, o número
de documentos recuperados também varie em função da inconsistência na indexação. O
importante é que se estabeleçam critérios que serão utilizados para se chegar ao conjunto de
termos utilizados na indexação e também na destinação deste documento, ou seja, para que
público ele se destina (LANCASTER, 1993).
O item 8 da categoria legislação, foi a expressão de busca que mais apresentou dúvida
sobre a necessidade informacional do usuário, visto que não se possui uma clara identificação
da intenção da busca. Porém, como dentro do Direito Penal existe apenas um Código Penal,
93
acredita-se que o usuário faz menção a uma possível atualização, reforma ou acréscimo de
conteúdo ao mesmo, que pode ser identificada pelo adjetivo “novo” presente na expressão de
busca. Dentro do VCB, identificamos que o mesmo possui um descritor que representa uma
possível atualização, reforma ou acréscimo de conteúdo ao Código Penal por meio do
descritor “Reforma Penal”; entretanto, não possui nenhuma variante reconhecida. Portanto,
entende-se que VCB deva reconhecer este tipo de expressão de busca como uma variante
denominativa do descritor apresentado, pois, ao se realizar uma pesquisa geral, percebe-se que
a expressão de busca recupera 10149 documentos, sendo que muitos deles possuem o
descritor “Reforma Penal” relacionado no campo assunto, dando a entender, assim, que a
expressão trata mesmo de uma forma variante do descritor autorizado e merece o seu
reconhecimento, pois é utilizada tanto pelo usuário quanto pelo especialista.
Já nos itens 13, 31 e 34 ocorre à busca por partes específicas do Código Penal, que
pertence ao Direito Penal. Porém, o VCB não possui descritores que representem partes deste
Código, assim como não possui um descritor que represente uma lei em específico. Isso
indica uma incoerência do VCB no trato da legislação, pois possui, na sua estrutura,
descritores que representam os Códigos de Justiça, porém não possui descritores para leis e
seus artigos ou artigos destes próprios Códigos.
Tomando-se por base a expressão no item 34, “Código penal art. 26”, para confirmar
que a necessidade do usuário deve ser atendida, buscou-se demonstrar que a mesma, quando
aplicada na busca campo assunto/indexação não recupera nenhum documento; contudo,
quando utilizada na pesquisa geral, recupera 1908 documentos. O que se ressalta no resultado
da pesquisa geral é que a expressão de busca é encontrada principalmente nos documentos
que compõe a jurisprudência disponibilizada pelo Portal LexML. Isso é identificado devido à
forma com que o Portal apresenta os resultados da busca, separando-os em categorias
(jurisprudência, doutrina, legislação), por autoridade, por localidade, por biblioteca, dentre
outras separações. Em tempo, pode-se identificar que a ocorrência da expressão está na
ementa dos documentos jurídicos, que é o resumo de assuntos que eles contêm e que são
extraídos do próprio texto, ou seja, são oriundos da linguagem do especialista.
Esta recuperação corrobora para a ideia de que o VCB precisaria, sim, criar descritores
que representem partes de uma lei ou código. Isso ocorre em função de que essas expressões
de busca comportam uma necessidade informacional do usuário e também são utilizadas pelos
especialistas da área, os operadores do Direito, para representar assuntos da própria área.
Além do mais, percebeu-se, na pesquisa, que são utilizadas diferentes formas para representar
a mesma expressão. Tomando, ainda, por base o item 34, visualizou-se nos resultados da
94
busca que o indexador, por não possuir um descritor padronizado, representa o assunto de
diferentes formas, o que gera uma recuperação desigual quando se utiliza uma dessas
variações, embora sua significação como assunto seja a mesma.
A análise dos demais itens, por comportarem as mesmas características de ocorrência
do item 34, conduziria para o mesmo resultado, apontando para a necessidade da criação de
descritores que representem parte de leis ou códigos, visto que são demanda do usuário e são
empregados nos textos especializados.
Os assuntos tratados nesta categoria de legislação possuem correspondência direta
com uma representação numérica característica da sua forma de apresentação. Ou seja, um
assunto da área pode ser referenciado tanto pela sua forma nominal, como pela forma
numérica, oriunda da estrutura da legislação a que pertence, mais especificamente, os artigos
da lei ou código em questão. Isto ficou evidenciado na análise das expressões de busca dos
usuários conforme tabela acima, onde se pode constatar que os usuários realizam suas
pesquisas usando expressões que claramente citam os artigos do Código Penal. Porém, o VCB
não possui descritores que referenciam os artigos dos códigos penais e nem de qualquer outro
tipo de lei.
VCB. Este tipo de inconsistência de indexação pode ser contornado com base numa política
de indexação. Conforme Rubi:
Nas condutas as quais a autora cita, que devem estar incluídas na política de
indexação, pode-se destacar a questão da obrigatoriedade do uso do VCB como linguagem
para a representação dos documentos no Portal LexML. Essa ação faria com que
representações dos assuntos presentes no documento fossem traduzidas para a linguagem de
indexação de forma padronizada e conseguissem atender as exigências dos usuários,
indexando de forma mais precisa e correta possível a informação (CARNEIRO, 1985).
A análise dos itens 2, 9, 14 e 17 apresentam características de ocorrência que
permitem uma análise em conjunto e levam ao mesmo resultado. Apontam para a necessidade
de definição clara das políticas adotadas pelo sistema de informação, no que tange a adoção
de um vocabulário controlado e de sua utilização por parte dos indexadores. Esses quatro itens
acima apontados são variantes terminológicas dos descritores que os acompanham no quadro,
sendo eles reconhecidos pelo VCB como termos não autorizados e, portanto, não deveriam ser
utilizados para representar documentos como assunto.
Tomando por base o item 14, representado pela expressão de busca ‘menor infrator’,
que já é reconhecida pelo VCB como uma variante terminológica e, portanto, já está incluída
em sua estrutura como um termo não autorizado, percebe-se claramente o não seguimento à
política de uso do VCB como vocabulário controlado pelos indexadores do Portal LexML. Ao
se realizar uma pesquisa no campo assunto/indexação utilizando a expressão de busca,
encontrou-se uma totalidade de 651 documentos recuperados, já na pesquisa no campo
assunto/indexação pelo descritor do VCB ‘delinquente juvenil’ recuperou-se 209 documentos.
A expressão de busca, que já é uma variante terminológica reconhecida e utilizada na
estrutura do VCB como remissiva para o descritor autorizado, recupera mais documentos do
que o próprio descritor. Ou seja, o VCB não está sendo usado como vocabulário controlado
para representar os assuntos.
A indexação baseada na instituição de política que padronize o seu processo,
principalmente com a definição de premissas, faz-se necessária para que o sistema de
97
informação consiga junto ao seu corpo técnico (indexadores) desenvolver uma indexação
consistente. Nota-se que o problema reconhecido por meio das expressões de busca diz
respeito a uma das etapas da indexação, a tradução, precisamente quanto à questão do uso do
vocabulário controlado como ferramenta padrão para representar a informação. Strehl diz que
[...] os objetivos de uma política de indexação são a definição das variáveis que
afetam o desempenho do serviço de indexação, o estabelecimento dos princípios e
critérios que servirão de guia na tomada de decisões para otimização do serviço, a
racionalização dos processos e a consistência das operações envolvidas (1998, p.
330).
forma padronizada, ao passo que as demais estarão elencadas como formas (termos) não
autorizadas.
Na análise das expressões de busca referentes aos itens 3, 4, 11, 12, 21, 23 e 32, do
Quadro 6, deparou-se com problemas de inconsistência no padrão com que o descritor
representativo do assunto é formalizado, sem fornecer clareza ao conceito a que se refere, não
representando assuntos da área, falta de equidade na representação dos assuntos ou falta de
capacidade do VCB em compreender a linguagem do usuário, na medida em que possui uma
estrutura muito rígida, que não absorve expressões de busca que não podem ser classificadas
como variantes terminológicas propriamente.
O item 32, ‘motorista embriagado’, retrata muito bem este tipo de ocorrência, onde o
descritor no VCB que trata do assunto é ‘Embriaguez ao volante’. A forma com que o usuário
rotula a sua necessidade informacional descrita por meio da expressão é uma variação do
descritor do VCB e ambas as formas trazem resultados positivos na recuperação de
documentos no Portal LexML. A representação de um objeto possui variações atribuídas às
situações de uso de uma linguagem por parte dos usuários, onde, segundo Freixa (2002, p. 21
tradução nossa) as variantes possuem características que se atribuem em função das situações
de uso da língua, sendo elas “[...] características geográficas, sociais ou históricas dos falantes
[...]”. Por isso que se destaca a necessidade do usuário em conhecer e ter acesso ao VCB, pois,
segundo Strehl (p. 331, 1998), “[...] o vocabulário controlado torna-se o ponto de
convergência entre as linguagens utilizadas por autores, indexadores e pesquisadores,
premissa fundamental para comunicação de informações dentro de um sistema”.
A lógica básica por trás dessa perspectiva centrada no usuário é que os sistemas de
informação devam ser modelados de acordo com o usuário, com a natureza de suas
necessidades de informação e com seus padrões de comportamento na busca e no
uso da informação, de modo a maximizar sua própria eficiência (FERREIRA, 2002,
p. 6).
determinado assunto, ou seja, ele descreve a ocorrência do assunto, rotulando-o por meio de
seu conceito. Este tipo de evento ocorre pela falta de conhecimento sobre como o VCB
representa o assunto em questão, por isso sugere-se que o sistema de informação, no caso o
LexML, faça uma divulgação clara do uso do VCB como seu vocabulário controlado e o
disponibilize em sua página de pesquisa, como uma fonte a mais para o usuário consultar, no
caso de dúvidas no processo de recuperação informacional. O vocabulário controlado tem
papel importante também na recuperação da informação, visto que os termos utilizados para
representação do assunto de um documento, oriundos de um vocabulário controlado, podem
orientar os usuários na “[...] elaboração das estratégias de busca de informações no sistema”
(FUJITA E REDIGOLO, p. 128, 2009).
O objetivo da pesquisa apesar de ser a análise do uso de expressões de busca para a
melhora da indexação, não pode deixar de elencar o problema supracitado como uma forma
de conduzir a recuperação documental satisfatória, que também é o objetivo de uma
indexação consistente. É bem provável que nunca se consiga chegar a um ponto em que se
atenda a todas as necessidades informacionais dos usuários por meio da indexação, visto que
o conhecimento não para e sempre produz novas formas de representação, assim como o seu
uso cotidiano. Contudo, entende-se que se for ofertada ao usuário a possibilidade de pesquisar
no VCB, para que possa esclarecer dúvidas sobre qual é o descritor que é utilizado para
representar determinados assuntos e/ou conceitos, a probabilidade de que ele tenha sua
demanda informacional atendida aumentaria consideravelmente.
As expressões de busca presentes nos itens 3, 4, 21 e 32 caracterizam-se por uma
necessidade informacional especificada pelos usuários por meio de variações linguísticas de
parte do próprio descritor. Tanto o item 3, ‘documento falso’, como o item 4, ‘falsificação
assinatura’, são variações de partes do assunto e fazem referência ao mesmo descritor do VCB
‘Falsificação de documentos’. O VCB possui dois descritores ‘Falsificação de documentos’,
porém, um possui um qualificador que indica o seu pertencimento a área civil do Direito e,
nesse descritor da área civil, encontra-se o item 3, sendo reconhecido como uma variante
terminológica do descritor; o mesmo não ocorre com o descritor ‘Falsificação de documentos’
da área penal, o que denota uma falta de equidade no tratamento do assunto e na construção
do VCB.
O papel do VCB na representação de formas controladas para atender as expectativas
da indexação pode contribuir tanto ao indexador, dando-lhe aporte para a representação dos
documentos, como para o usuário, esclarecendo qual descritor é usado para determinado
assunto. Assim, Fujita afirma que:
101
No que tange os itens 11, 12 e 23, faz-se a seguinte análise: o item 11, ‘teoria
finalista’, é uma expressão de busca que não apresenta descritor no VCB, mas recupera
documentos, tanto na pesquisa geral (192 documentos), como na pesquisa campo
assunto/indexação (9 documentos). Deduz-se da análise da expressão de busca uma falha no
VCB, devido à falta de representação para o mesmo já que a expressão ocorre com certa
representatividade no Portal LexML frente ao número de documentos recuperados.
Já nos itens 12 e 23, encontrou-se um problema de indexação relacionado à falta de
correspondência entre a forma padronizada do descritor de um assunto e suas variantes
utilizadas no dia a dia da prática do Direito, em face de preferências de uso, ou aceitação pela
comunidade especializada. Ambas as expressões não são reconhecidas como variantes
terminológicas, o que acarreta problemas na recuperação tanto na pesquisa geral, como na
pesquisa no campo assunto/indexação.
102
Esta categoria de ocorrência das expressões de busca dos usuários representa uma
característica que remete à questão da aplicação de um tratamento mais específico para a
representação dos assuntos no VCB, em oposição a uma representação mais genérica.
103
7 CONCLUSÃO
Assim, nada mais justo que se inclua na estrutura do VCB, podendo ser como termo
não autorizado, as variantes terminológicas que advém da própria estrutura que embasa a
construção desta linguagem controlada: a legislação. Esse tipo de acréscimo traria resultados
positivos à consistência da indexação, que se estaria reconhecendo todas as possíveis formas
com que um assunto pode ser conhecido.
No que concerne à categoria ‘Variantes denominativas’, tem-se como principal
problema o não reconhecimento das variantes terminológicas dos descritores. Cabe destacar
que esse tipo de problema afeta diretamente a consistência da indexação realizada, ao passo
que ela possui a garantia do especialista, pois é utilizada pelo mesmo e pelo usuário, contudo
109
não é absorvida pela indexação, ou seja, o VCB não consegue traduzir todas as diferentes
formas com que o assunto se manifesta. Destaca-se também, dentro desta categoria, o fato de
que o VCB não é o utilizado como vocabulário padrão para a etapa da tradução dentro da
indexação, visto que se encontraram variantes terminológicas reconhecidas pelo VCB,
indexando documentos e recuperando mais documentos que o próprio descritor. O item 14 do
APÊNDICE D, representado pela expressão de busca ‘menor infrator’ ilustra claramente isso.
Dentre os demais problemas de consistência de indexação evidenciados por meio da
análise de expressões de busca estão o uso de descritor mais genérico em detrimento da falta
de descritor mais específico, que destaca, assim, uma falha de tradução e a falta da definição
dos conceitos junto aos descritores. Esse último problema afeta tanto ao usuário, que
desconhece qual a representatividade do descritor, e, principalmente, ao indexador, na medida
em que desconhece qual seria o melhor descritor que representaria os assuntos oriundos da
análise conceitual. Kostina (2000, p. 19, tradução nossa) diz que [...] “o termo é uma unidade
léxica específica da linguagem especializada que denomina os conceitos especializados” [...].
Portanto, se o termo denomina um conceito, nada mais coerente que este seja incluindo na
estrutura do VCB, dentro do registro do descritor. Isso facilitará a atuação do indexador, que
terá uma garantia de estar traduzindo o conceito mais adequado da análise conceitual para o
VCB e, assim, para o documento.
Já na categoria ‘Especificidade’, destacou-se o uso de descritor mais genérico em
detrimento da falta de descritor mais específico no VCB, que também ocorre na categoria
‘Variantes denominativas’. Fujita e Redigolo (2006, p. 126) afirmam que a “[...] necessidade
de tratar tematicamente a informação de uma forma mais específica é devido às
especializações dos acervos [...]”. O Portal LexML já apresenta uma especialização em seu
acervo. Considerando a área estudada, a do Direito Penal, foi identificado que não se está
tratando de forma específica a informação, embora o usuário manifeste sua necessidade
informacional de forma específica.
Além dos problemas acima mencionados, emergiram as seguintes falhas de indexação:
a desatualização do VCB, a não utilização de qualificador para diferenciar assuntos com
ocorrência em mais de uma área temática, a falta de equidade na representação de assuntos no
VCB de áreas temáticas idênticas presentes nas estruturas dos Códigos de Justiça Penal e a
não utilização de remissivas para absorver o uso de formas ou nomes populares pelos quais
determinados assuntos ficaram conhecidos.
A análise das expressões de busca dos usuários deflagrou inconsistências de indexação
que basicamente centram-se em dois eixos de ocorrência. O primeiro é representado pelo
110
A lógica básica por trás dessa perspectiva centrada no usuário é que os sistemas de
informação devam ser modelados de acordo com o usuário, com a natureza de suas
necessidades de informação e com seus padrões de comportamento na busca e no
uso da informação, de modo a maximizar sua própria eficiência (FERREIRA, 2002,
p. 6).
REFERÊNCIAS BIBLIOGRÁFICAS
ALVORCEM, Rochelle Martins; VAN DER LAAN, Regina Helena. A terminologia expressa
da área da ciência da informação no discurso do especialista um estudo de caso. Revista
Brasileira de Biblioteconomia e Documentação, São Paulo, v.3, n.2, p.107-115, jul-dez.
2007.
BOCCATO, Vera Regina Casari. A linguagem documentária vista pelo conteúdo, forma e uso
na perspectiva de catalogadores e usuários. In: FUJITA, M. S. L., org., et al. A indexação de
livros: a percepção de catalogadores e usuários de bibliotecas universitárias. Um estudo de
observação do contexto sociocognitivo com protocolos verbais [online]. São Paulo: Editora
UNESP; São Paulo: Cultura Acadêmica, 2009. p. 119-135. Disponível em:
<http://books.scielo.org/id/wcvbc/pdf/boccato-9788579830150-06.pdf>. Acesso em: 19 out.
2013.
BOCCATO, Vera Regina Casari; FUJITA, Mariângela Spotti Lopes. O uso de linguagem
documentária em catálogos coletivos de bibliotecas universitárias: um estudo de avaliação
sociocognitiva com protocolo verbal. Perspect. ciênc. inf., 2010, vol.15, no.3, p.23-51.
113
BORBA, Diego dos Santos; VAN DER LAAN, Regina Helena; Chini, Bernadete Ros.
Palavras-chave: convergências e diferenciações entre a linguagem natural e a terminologia.
Perspect. ciênc. inf. vol.17 n. 2, Belo Horizonte abr./jun. 2012. Disponível em:
<http://dx.doi.org/10.1590/S1413-99362012000200003>. Acesso em: 17 out. 2013.
CARNEIRO, Marília Vidigal. Diretrizes para uma política de indexação. Revista da Escola
de Biblioteconomia da UFMG, Belo Horizonte, v.14, n.2, p.221-241, set. 1985.
CINTRA, A.M.M. et al. Para entender as linguagens documentárias. 2. ed. São Paulo:
Polis, 2002.
CÓDIGO de Catalogação Anglo-Americano (CCAA2). 2. ed. rev. São Paulo: FEBAB, 2004.
COSTA, Luciana Ferreira da; SILVA, Alan Curcino Pedreira da; RAMALHO, Francisca
Arruda. (Re)visitando os estudos de usuário: entre a “tradição” e o
“alternativo”.DataGramaZero - Revista de Ciência da Informação - v.10 n.4 ago/09.
Disponível em: <http://www.dgz.org.br/ago09/Art_03.htm#R1>. Acesso em: 19 out. 2013.
DIAS, Eduardo Wense; NAVES, Madalena Martins Lopes. Análise de Assunto: teoria e
prática. Brasília: Thesaurus, 2007.
FERREIRA, Sueli Mara Soares Pinto. Novos paradigmas e novos usuários de informação.
Ciência da informação. Brasília, v. 25, n. 2, 1996.
GIBBS, Graham. Análise de dados qualitativos. Tradução de Roberto Cataldo Costa. Porto
Alegre: Artmed, 2009.
GIL, Antonio Carlos. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2008.
GIL LEIVA, I. Manual de indización: teoría y práctica. Gijón: Ediciones TREA, 2008.
GIL LEIVA, Isidoro. Aspectos conceituais da indexação. In: _______. Política de indexação.
São Paulo: Cultura Acadêmica, 2012.
GUINCHAT, Claire; MENOU, Michel. Introdução geral às ciências e técnicas da
informação e documentação. Brasília: IBICT, 1994.
MOREIRO, José Antonio. Criterios e indicadores para evaluar la calidad del análisis
documental de contenido.Ci. Inf., Brasília, v. 31, n. 1, p. 53-60, jan./abr. 2002. Disponível
em: < http://revista.ibict.br/ciinf/index.php/ciinf/article/view/174/153>. Acesso em: 23 set.
2013.
PONTES, Adriana Moura de. OPAC como recurso para a gestão da informação no
contexto da biblioteca central da UFPB. João Pessoa: UFPB, 2006. 85 p. Monografia
(Especialização) – Curso de Especialização em Gestão de Unidades de Informação, da
Universidade Federal da Paraíba, João Pessoa, 2006.
ROBREDO, J.; CUNHA, M. B. da. Documentação de hoje e amanhã. Brasília: ed. Autor,
1986.
Categoria: Especificidade.
ITEM EXPRESSÃO DE BUSCA¹ DESCRITOR NO VCB¹
14 ocultação de cadáver Cadáver
18 constrangimento ilegal Crime contra a liberdade individual
20 progressão regime Regime penitenciário
22 crime de trânsito Delito de trânsito
24 Anistia política Anistia
27 bingos Jogo de azar
28 bullying Assédio moral
30 pirâmide financeira Crime contra a economia popular
33 desacato Desacato à autoridade
¹ Conforme APÊNDICE C.