Lenguajes Documentales

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 342

Lenguajes

documentales
Manela Junc Campdepadrs
Damin Martnez Ferreras
PID_00143955

Lenguajes documentales

CC-BY-NC-ND PID_00143955

Manela Junc Campdepadrs


Licenciada en Geografa e Historia
por la Universidad de Barcelona y
posgrado de Informacin y Documentacin en la empresa ICT. Ha diseado diversos sistemas de informacin: en el Comit organizador
de los Juegos Olmpicos de Barcelona 1992, en el Servicio de archivos
del Departamento de Cultura y en el
Archivo Nacional de Catalunya, y en
ejercicio libre ha participado en numerosos msters de la Universidad
de Girona. Actualmente es consultora en la UOC. Las reas de inters
son los Lenguajes documentales y
las Fuentes de informacin.

Damin Martnez Ferreras


Licenciado en Geografa e Historia
por la Universidad de Deusto. Actualmente ocupa el puesto de responsable del rea de Research para
Espaa y Portugal en la empresa de
consultora Accenture. Experto en
la implantacin de Sistemas de Gestin del Conocimiento y en Primary
Research. Mster en Documentacin Digital por la UPF y de Liderazgo y Gestin de Equipos por AEDE
Business School. Ha sido profesor
asociado de la Universidad Carlos III
en el rea de Documentacin e Informacin y actualmente es consultor de la UOC.

Primera edicin: septiembre 2009


Manela Junc Campdepadrs, Damin Martnez Ferreras
Todos los derechos reservados
de esta edicin, FUOC, 2009
Av. Tibidabo, 39-43, 08035 Barcelona
Diseo: Manel Andreu
Realizacin editorial: Eureca Media, SL
ISBN: 978-84-692-4642-9
Depsito legal: B-33.217-2009

Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es

CC-BY-NC-ND PID_00143955

Contenidos

Mdulo didctico1
La cadena documental
Manela Junc Campdepadrs
1.

Cadena documental

2.

Fase de entrada

3.

Fase de anlisis y tratamiento

4.

Fase de salida

5.

Cadena documental y cooperacin

6.

Los lenguajes documentales dentro de la cadena

Mdulo didctico2
Anlisis de contenido: resumen e indizacin
Manela Junc Campdepadrs
1.

El anlisis de contenido

2.

El resumen

3.

La indizacin

4.

Los lenguajes documentales

5.

Tipologa de los lenguajes documentales

Mdulo didctico3
Sistemas de clasificacin documentales
Manela Junc Campdepadrs
1.

Clasificar y sistemas de clasificacin

2.

La clasificacin decimal universal

3.

Estructura de la clasificacin decimal universal

4.

Empezamos a clasificar

5.

Prcticas con la CDU

6.

Creacin de un sistema de clasificacin propio

Mdulo didctico4
Listas de encabezamientos de materia y listas de autoridades
Manela Junc Campdepadrs
1.

Las autoridades en el anlisis de contenido

2.

Qu es una lista de encabezamientos de materia?

3.

Origen y evolucin de las listas de encabezamientos

4.

Tipologas de las listas de encabezamientos

5.

Principios de las listas de encabezamientos

6.

Encabezamientos y subencabezamientos

7.

Reglas de vocabulario y signos de puntuacin de las LEM

8.

Trminos simples y compuestos

9.

Las relaciones semnticas

10. Aprendiendo a indizar con una lista de encabezamientos


11. La lista de autoridades

Lenguajes documentales

CC-BY-NC-ND PID_00143955

Mdulo didctico5
Los tesauros
Damin Martnez Ferreras
1.

El tesauro

2.

Estructura del tesauro

3.

Formas de presentacin del tesauro

4.

Creacin y utilizacin de un tesauro

5.

Sistemas automatizados de gestin de tesauros. Tesauros en lnea

6.

Tesauros y ontologas

Mdulo didctico6
Listado de descriptores libres y listado de palabras clave
Manela Junc Campdepadrs
1.

Lenguajes documentales libres

2.

Listado de descriptores libres

3.

Listado de palabras clave

Lenguajes documentales

La cadena
documental
Manela Junc Campdepadrs
PID_00143966

CC-BY-NC-ND PID_00143966

Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es

La cadena documental

La cadena documental

CC-BY-NC-ND PID_00143966

ndice

Introduccin...............................................................................................

Objetivos.......................................................................................................

1.

Cadena documental...........................................................................

2.

Fase de entrada...................................................................................

2.1.

Seleccin ......................................................................................
2.1.1.

3.

archivstico .....................................................................

10

2.1.2.

Herramientas para seleccionar .......................................

11

2.1.3.

Evaluacin del documento ............................................

11

2.1.4.

Expurgar documentacin ..............................................

12

2.2.

Adquisicin ..................................................................................

14

2.3.

Recepcin ....................................................................................

15

2.4.

Conclusiones ...............................................................................

16

Fase de anlisis y tratamiento........................................................

17

3.1.

Anlisis documental ....................................................................

18

3.1.1.

Del documento a la referencia documental ..................

18

3.1.2.

Anlisis formal ...............................................................

19

3.1.3.

Anlisis de contenido ....................................................

20

3.1.4.

Intercambio entre SID ...................................................

21

3.1.5.

Referencias bibliogrficas ...............................................

22

3.1.6.

Conclusiones ..................................................................

22

Procesamiento tcnico ................................................................

23

3.2.1.

Signatura topogrfica .....................................................

23

3.2.2.

Ordenacin ....................................................................

23

3.2.3.

Almacenamiento y conservacin ..................................

25

3.2.4.

Conclusiones ..................................................................

26

Fase de salida......................................................................................

28

4.1.

28

3.2.

4.

Instrumentos de bsqueda ..........................................................


4.1.1.

5.

Tamao y contenido de una coleccin y un fondo

Fuentes bibliogrficas para bibliotecas y centros de


documentacin ..............................................................

28

4.1.2.

Documentacin de archivo ...........................................

29

4.1.3.

Instrumentos de bsqueda para recursos en lnea .........

30

4.2.

Servicios de difusin ...................................................................

31

4.3.

Conclusiones ...............................................................................

33

Cadena documental y cooperacin...............................................

34

La cadena documental

CC-BY-NC-ND PID_00143966

6.

Los lenguajes documentales dentro de la cadena......................

37

Actividades..................................................................................................

39

Glosario........................................................................................................

40

Bibliografa.................................................................................................

44

CC-BY-NC-ND PID_00143966

Introduccin

Este mdulo os introduce en los procesos documentales, que se llevan a cabo


en archivos, bibliotecas y centros de documentacin. Estos procesos se conocen como cadena documental.
Itinerariodeestudio
El mdulo empieza con una tabla que describe esta cadena. Acto seguido se
analiza cada una de las fases y subfases y se aplican a los tres tipos principales de servicios de informacin: archivos, bibliotecas y centros de documentacin, comentando las particularidades de cada uno. Finalmente se sitan los
lenguajes documentales, que son el cuerpo central de esta asignatura dentro
de la cadena.
Conceptos ms importantes
Concepto

Ved

Seleccin

2.1. Seleccin

Adquisicin

2.2. Adquisicin

Recepcin

2.3. Recepcin

Anlisis documental

3.1. Anlisis documental

Anlisis formal

3.1.2. Anlisis formal

Anlisis de contenido

3.1.3. Anlisis de contenido

Procesamiento tcnico

3.2. Procesamiento tcnico

Instrumentos de bsqueda

4.1. Instrumentos de bsqueda

Servicios de difusin

4.2. Servicios de difusin

La cadena documental

CC-BY-NC-ND PID_00143966

Objetivos

Con el estudio de los materiales asociados a este mdulo alcanzaris los objetivos siguientes:

1. Conocer las fases y subfases de la cadena documental.


2. Aproximarse al desarrollo de la cadena en diferentes servicios de informacin.
3. Situar los lenguajes documentales en la cadena.

La cadena documental

CC-BY-NC-ND PID_00143966

La cadena documental

1. Cadena documental

(1)

La cadenadocumental es el conjunto de operaciones y tcnicas que se

SID es la sigla de servicio de informacin y documentacin.

aplican a la coleccin o fondo documental de un servicio de informacin y documentacin (SID1) y que comprenden las fases de entrada,
anlisis-tratamiento y difusin.

Cuando un usuario consulta un catlogo o una base de datos encuentra perfectamente organizados todos los documentos. Cada uno de ellos ha sufrido
un proceso, conocido como cadena documental2, que lo ha llevado desde el
punto donde se ha generado el documento (editorial, despacho...) hasta las
estanteras a punto de ser consultado. El documentalista del SID, de acuerdo a
las diferentes polticas de adquisicin o de gestin documental definidas en la
organizacin, ha decidido que vala la pena seleccionarlos, los ha registrado,
ha analizado tanto los atributos formales como los de contenido de acuerdo
con las normativas nacionales e internacionales y finalmente los ha preparado
para ser difundidos entre los usuarios.
Los procesos de la cadena se aplican a todo tipo de SID (archivos, bibliotecas y
centros de documentacin) y de documentos (textos, audiovisuales, tanto en
papel como electrnicos). Los procesos no se aplican, sin embargo, de manera
uniforme en todos los casos, ya que la documentacin de archivo generada en
procesos internos se trata de manera diferente a la documentacin incluida en
la cadena bibliogrfica de una biblioteca o de un centro de documentacin,
ya que se utilizan normas de descripcin diferentes y se generan instrumentos
de bsqueda tambin diferentes.
Documentos de archivo y colecciones

Documentosdearchivo:
Documentos que se originan en el seno de un archivo, fruto de sus actividades y
procesos (memorias, balances, actos, facturas, albaranes, cartas, informes, catlogos
de productos, etc.), cuyo tratamiento se har a partir de las tcnicas archivsticas y
las polticas de gestin documental.

Colecciones:
Documentos que una biblioteca o un centro de documentacin adquieren para llevar a cabo su actividad principal de gestionar informacin (libros, revistas, bases
de datos, material audiovisual, etc.), cuyo tratamiento se har segn las normas desarrolladas por la biblioteconoma.

La cadena documental consta de tresfases: entrada, anlisis y tratamiento, y


salida o difusin. Cada una de ellas se divide en diferentes subfases, donde se
recogen los diferentes instrumentos relacionados con tcnicas tanto archivsticas como bibliogrficas, como podis ver en el esquema siguiente:

(2)

La cadena tambin se conoce


con el nombre de proceso documental.

CC-BY-NC-ND PID_00143966

El tratamiento detallado de las diferentes partes de la cadena documental es


objeto de estudio de otras asignaturas.

La cadena documental

CC-BY-NC-ND PID_00143966

La cadena documental

2. Fase de entrada

La fase de entrada consta de tres subfases: seleccin, adquisicin y recepcin.

2.1. Seleccin

La seleccin es el proceso en el que se decide qu documentos se aaden


o eliminan de la coleccin o del fondo de archivo.

Es un proceso relativamente nuevo que nace de las siguientes circunstancias:

El elevado volumen de obras disponibles en el mercado editorial y en la


web.

El crecimiento de las colecciones que determina que algunas obras queden


obsoletas.

Las limitaciones de espacio y de presupuesto de los SID o de los archivos.

La imposibilidad de llevar a cabo el anlisis documental del total de documentos interesantes para el centro.

El crecimiento de documentos generados diariamente en la actividad cotidiana de las organizaciones.

Todos los SID tienen una poltica de fondos de archivo y/o de desarrollo de
la coleccin que permite construir un til y equilibrado fondo bibliogrfico
o archivstico. Esta poltica incluye la seleccin como una de las fases ms
relevantes, adems de la planificacin de recursos a compartir, por ejemplo,
reemplazar obras perdidas o daadas, deseleccionar tems (no renovar suscripciones) y expurgar documentos.

Seleccin

CC-BY-NC-ND PID_00143966

10

La seleccin es un proceso complejo en el que intervienen muchos factores.


Con respecto a la coleccin, la adquisicin de documentos depende de las necesidades del centro y de sus usuarios, de estadsticas de uso, recursos humanos
y recursos econmicos, mientras que con respecto a los fondos de archivos, la
seleccin est vinculada al sistema de gestin documental.
La seleccin y su plasmacin real en la fase siguiente, la adquisicin, son las
fases de ms peso econmico de toda la cadena para bibliotecas y centros de
documentacin. La mayor parte del presupuesto de una red o un SID se dedica
a la adquisicin de fondos. Tema aparte son los archivos, ya que la entrada de
documentos est condicionada por la propia actividad de la organizacin.
2.1.1. Tamao y contenido de una coleccin y un fondo
archivstico

La cadena documental

Ved tambin
Los factores que intervienen
en el proceso de seleccin son
objeto de estudio en las asignaturas Gestin integral de archivos y Gestin documental.

El recurso de la economa
de escala
Dado que la mayor parte del
presupuesto se dedica a la adquisicin de fondos, los consorcios bibliotecarios dedican
muchos esfuerzos a confeccionar economas de escala y
conseguir pactar mejores condiciones econmicas en los
contratos de paquetes documentales.

En las bibliotecas, la seleccin da respuesta a cuestiones de tipo cuantitativo


(se relacionan con el tamao) y cualitativo (se relacionan con el contenido).

El tamaodelacoleccin responde a la pregunta cuntos documentos hace falta seleccionar?

Decidir el tamao ptimo es una tarea compleja, ya que una coleccin grande
no es forzosamente la mejor, pero si no contiene un nmero adecuado de documentos, puede dejar algunas necesidades sin cubrir. Existen normas cuantitativas, editadas por organismos como las asociaciones y federaciones de bibliotecas, que dan pautas del tipo de 2 a X volmenes por habitante o estudiante, nmero de volmenes mnimos de una coleccin, incremento anual,
etc. Se aplican sobre todo en bibliotecas pblicas.

Con respecto a los criterios de contenidodelacoleccin, responden


a: qu tipo de documentos?

Actualmente las colecciones son muy diversas y no estn formadas slo por
un tipo de documento, como tiempo atrs. Los tipos de documentos a seleccionar son muy variados: obras de referencia, monografas, publicaciones peridicas, publicaciones oficiales, bases de datos de revistas, etc., tanto en formato impreso como electrnico. La documentacin no es original (excepto
algunos ejemplares antiguos y raros), lo que permite que sea reemplazado si se
deteriora o se pierde. Este hecho hace de la documentacin bibliotecaria una
documentacin estable y segura.

Obras de referencia:
Enciclopedias, diccionarios,
manuales, estadsticas, anuarios, directorios, guas, fuentes geogrficas, fuentes bibliogrficas, catlogos, repertorios,
boletines, ...

CC-BY-NC-ND PID_00143966

11

En los centros de documentacin se debe hacer una mencin especial a la

La cadena documental

Literatura gris:

literatura gris, es decir, a toda la documentacin que no se distribuye por los

Tesis, informes, normativas,


patentes, dosieres de prensa,
actas, ...

canales habituales de distribucin. Dado su elevado grado de especializacin


y actualizacin, es realmente significativa en un centro de documentacin.
En los archivos, el tamao y el contenido del fondo vendrn definidos por
la poltica de gestin documental de cada organizacin, plasmada en un sistema de gestin documental donde se definir la eleccin y eliminacin de
documentos.
2.1.2. Herramientas para seleccionar
Los documentalistas seleccionan a partir de las herramientas siguientes:

Catlogos comerciales de editoriales, distribuidoras y algunos libreros de


viejo.

Bases de datos de publicaciones en serie (revistas).

Contacto con las entidades o personas que producen literatura gris.

Bibliografas nacionales y temticas.

Repertorios bibliogrficos como la base de datos del ISBN3 que recoge toda
la produccin editorial.

(3)

ISBN es la sigla de International


Standard Book Number, Nmero
Normalizado Internacional del Libro.

Peticiones de lectores profesionales. Se da especialmente en bibliotecas


universitarias, donde los profesores piden las ltimas novedades.

Sistema de gestin documental de la organizacin, donde se identifican


los documentos que son evidencias de las actividades de la organizacin
y que, por lo tanto, forman parte del sistema.

2.1.3. Evaluacin del documento


La seleccin es una tarea discriminativa que supone separar una cosa de otra mediante su
eleccin o eliminacin. Ahora bien, para discriminar es necesario valorar los documentos
segn el provecho que se espera obtener. Por lo tanto, la valoracin es el principal filtro,
aunque no el nico, de la tarea selectiva.
M.a ngeles Lpez (1996, pg. 145).

Para evaluar la calidad de una obra lo mejor es disponer de un ejemplar y


objetivamente valorar aspectos fsicos y de contenido (Carrizo, 2000):
a)Aspectosfsicos: la encuadernacin, la facilidad en el manejo, la tipografa.

Lectura complementaria
Podis ampliar la informacin sobre la seleccin leyendo la obra siguiente:
M.A.LpezHernndez
(1996). La seleccin documental. Revista general de informacin y documentacin.
Madrid.

CC-BY-NC-ND PID_00143966

12

b)Aspectosdecontenido: ttulo suficientemente explcito, cobertura adecuada al SID (cobertura temtica, cronolgica y geogrfica). Los elementos ms
definitivos son los de contenido intelectual: la autora reconocida del organismo y autor, los elementos constitutivos de la obra (prlogo, introduccin,
etc.), la organizacin del contenido (sumarios, ndices, cuadros, imgenes, bibliografa, etc.), la exhaustividad y las posibilidades de actualizacin (suple-

La cadena documental

Lectura complementaria
Podis encontrar el trabajo
de Gloria Carrizo en:
G.CarrizoSaineroet al.
(2000). Manual de fuentes de
informacin. Madrid: CEGAL.

mentos, nuevas ediciones, etc.).


Tambin se seleccionan y evalan otras fuentes como los recursos web, que
aunque no supongan una limitacin de espacio, son tan abundantes y de cualidades tan diversas, que hay que hacer una eleccin. Para evaluar tambin los
recursos web se aaden los parmetros de acceso a la informacin, ergonoma
y facilidad de utilizacin, luminosidad, ubicuidad y aprendizaje.
La poltica de seleccin de recursos webs gratuitos de la biblioteca de la
UOC
La biblioteca de la UOC utiliza un criterio de excelencia ms que uno de exhaustividad.
De los muchos recursos web gratuitos, selecciona un mnimo de 5 y un mximo de 15
por nodo temtico. Dentro de cada nodo temtico se desarrollan unas formas documentales mnimas: portales temticos, organismos e instituciones, revistas electrnicas, webs,
enciclopedias y diccionarios. Siempre que sea posible, tambin se intenta desarrollar el
mximo de las formas restantes: colecciones de textos, directorios, estadsticas, prensa,
publicaciones oficiales, traductores, base de datos, documentos de trabajo, documentos
electrnicos, libros electrnicos, normativas y estndares, buscadores, listas de discusin,
recursos docentes, tesis, TFC-Prcticums. No hay limitaciones geogrficas, se valora el
contenido especializado y de licencia libre. Con el fin de valorar la calidad de cada recurso, la UOC utiliza los parmetros de Llus Codina: autora/fuente, contenido, acceso a la
informacin, ergonoma y facilidad de utilizacin y, finalmente, luminosidad, ms dos
complementarios: ubicuidad y aprendizaje.

Ved tambin
Los parmetros establecidos
por Llus Codina se estudian en
la asignatura Fuentes de informacin.

Por ltimo, la evaluacin del documento de archivo se hace de acuerdo con


el sistema de gestin documental definido en la organizacin, donde estn
establecidas las tablas de evaluacin documental.
2.1.4. Expurgar documentacin

Expurgar es hacer una evaluacin crtica de la coleccin y del fondo a


partir de criterios materiales e intelectuales que nos permitan retirar de
manera temporal o definitiva una parte de la coleccin o del fondo con
el fin de reorganizar los contenidos del SID y ofrecer un mejor servicio.

Segn Vall (2006), el expurgo se tiene que entender como un proceso ms de


la gestin de la coleccin y el fondo, y por lo tanto los criterios que se seguirn
se han de incluir en la poltica documental de cada centro.
a)Expurgarfuentesdearchivos

Trminos sinnimos
Otros trminos sinnimos de
expurgar son: descartar, retirar, hacer una seleccin negativa. UNE-ISO 15489-1:2006.
Informacin y documentacin:
gestin de documentos parte 1 Generalidades. UNE-ISO
15489-2:2006. Informacin y
Documentacin. Gestin de documentos parte 2 directrices.

CC-BY-NC-ND PID_00143966

13

Hay que expurgar la documentacin archivstica porque la documentacin


sigue un ciclo de vida documental: primero se genera en la actividad diaria
de la gestin del centro, en segundo lugar pasa a tener valor administrativo y
finalmente puede tener valor histrico.
En muchos pases, el expurgo est regulado por ley. En el mbito del Estado
espaol, hay comunidades autnomas que disponen de comisiones evaluadoras y de normativa especfica.
b)Expurgarcoleccionesdebiblioteca
En colecciones de bibliotecas y centros de documentacin hay que expurgar
para:

Mantener la pertinencia de la coleccin, eliminando los documentos no


usados. Se calcula a partir de la fecha de la ltima consulta y circulacin
del documento. Estos ndices se adaptan a los diversos mbitos, ya que no
es lo mismo la pervivencia de los documentos cientficos (breve) que la de
los documentos de humanidades (mucho ms larga, ya que no dependen
tanto de la actualizacin).

Evitar la duplicidad de formatos (revistas que ahora se han reconvertido


en bases de datos, revistas que ahora tienen edicin electrnica, etc.).

Favorecer un mejor manejo de la coleccin: los documentos en las estanteras son los ms pedidos y no hay que buscar entre toda la produccin.

Solucionar problemas de espacio.

Eliminar ejemplares deteriorados y envejecidos.

En la opinin de Vall (2006), durante mucho tiempo el modelo bibliotecario


nacional ha sido preservador y conservador de las colecciones documentales,
pero ahora se enfrenta a la fuerte presin del crecimiento constante del fondo.
La solucin pasa por la expurgacin de la coleccin.
Marco legal y normativo de la expurgacin en bibliotecas
A nivel internacional se cuenta con las directrices de la IFLA/UNESCO para bibliotecas
pblicas (2002) y la gua para la revisin de colecciones de biblioteca de la American
Library Association (1999). En Espaa se cuenta con las normas y directrices para bibliotecas universitarias y cientficas de REBIUN (1999), y en Catalua hay dos leyes y un decreto del ao 1993 sobre patrimonio, servicios y personal del sistema de lectura pblica.

La cadena documental

Lectura complementaria
Podis ampliar la informacin sobre el tema de la expurgacin en:
A.VallCasa (2006). Esporgar: per qu, com i quan.
BID Textos universitaris de biblioteconomia i documentaci
(n. 16, junio, pg. 2). Barcelona.

Lectura recomendada
Marc legal de lesporgament
en arxius; Comissi Nacional
dAccs, Avaluaci i Tria Documental (CNATD). Generalitat de Catalunya.

CC-BY-NC-ND PID_00143966

14

El destino de los documentos expurgados puede ser diverso. Algunos se quedan en la biblioteca, otros se retiran, se dan a otras bibliotecas, se hacen donaciones solidarias a ONG, van a la Central de Prstamo del gobierno correspondiente, se guardan en almacenes (como el proyecto GEPA del Consorcio
de Bibliotecas Universitarias de Catalua), se regalan, se venden (opcin muy
establecida en el mundo anglosajn y no tanto aqu), o se destruyen.
2.2. Adquisicin

La cadena documental

El CBUC
En Catalua, el Consorci de
Biblioteques Universitries de
Catalunya (CBUC) mantiene
el programa GEPA (Garanta
de Espacio para la Perpetuidad
del Acceso), que es un almacn cooperativo donde conservar y preservar los documentos
de bajo uso del consorcio.

Los SID adquieren o incorporan volmenes y documentos a travs de diferentes vas, algunas de ellas gratuitas y otras de pago:
1) Acceso gratuito (open acces): es toda aquella informacin dispuesta de
forma gratuita y universalmente accesible va Internet.
Open access es un nuevo modelo de distribucin de informacin acadmica desarrollado por investigadores y documentalistas para contrarrestar las limitaciones impuestas por los comerciales (suscripciones elevadas), particularmente en el campo de las ciencias de la salud y la tecnologa.
2)Compra: puede ser directa o por suscripcin al editor, la librera, el proveedor. Es la va ms habitual en bibliotecas y centros de documentacin. Implica
un conocimiento elevado de la produccin bibliogrfica, los canales de distribucin y venta.
3)Donacin: es la cesin gratuita de documentos. Puede venir por parte del
autor de la obra, por un particular o por la propia dinmica de la institucin.
Las donaciones pueden ser definitivas o temporales. Se da, sobre todo, en las
donaciones de las editoriales, de las administraciones pblicas y en los lotes
fundacionales que la administracin estatal o autonmica remite a las bibliotecas pblicas de su titularidad. Entre las donaciones podemos distinguir los

Adquisicin

Open Acces
Ejemplos de informacin gratuita son los repositorios institucionales, los depsitos de archivos abiertos o los recolectores.

Web recomendada
En esta direccin podis consultar todas las instituciones
espaolas que tienen archivos en abierto:
OpenDOAR (Directory
of Open Access Repositories).

legados y los depsitos:

Los legados son donaciones provenientes de testamentos y estn formados por colecciones particulares completas o parciales.

Los depsitos son donaciones en las que la propiedad contina siendo del
donante.

4)Intercambio: como su nombre indica, consiste en el intercambio de material duplicado (o poco solicitado) entre dos centros. El intercambio se acostumbra a dar ms fcilmente en las redes de SID. Se intercambian duplicados,
publicaciones propias o de las instituciones a las que estn vinculados y literatura gris.

Webs recomendadas
En la web de la Biblioteca de
Catalunya podemos consultar las condiciones y el listado de donantes.
En la web del Arxiu Nacional
de Catalunya, concretamente
en el apartado de descripcin
del fondo, podemos consultar la tipologa de fondos que
han llegado por donacin.

CC-BY-NC-ND PID_00143966

15

No es un procedimiento totalmente gratuito, ya que requiere una contrapar-

La cadena documental

Instituciones

tida.

Son ejemplos de intercambios


entre instituciones las publicaciones de la diputacin o del
consejo comarcal.

5)Depsitolegal(DL4): es la exigencia impuesta por ley de depositar, en una


o diversas agencias especificadas, ejemplares de las publicaciones de todo tipo,
en cualquier soporte, por cualquier procedimiento de distribucin (venta, alquiler, etc.). El primero en instaurarlo fue Francisco I en 1537 en Montpellier.

(4)

DL es la sigla de depsito legal.

En Espaa lo instaur Felipe III el ao 1619. El DL es un sistema de adquisicin


propio de un reducido nmero de bibliotecas, concretamente las nacionales.
Los documentos susceptibles de DL son: libros, folletines, hojas impresas, publicaciones peridicas y seriadas, partituras musicales, grabados, mapas y planos, carteles, postales, naipes, diapositivas, producciones cinematogrficas. Est estipulado depositar cinco ejemplares de las obras que llevan ISBN y tres
para el resto, dos para los audiovisuales y un ejemplar para los guiones de cine.
El papel del DL es mucho ms que una simple va de adquisicin, ya que entre sus objetivos destacan formar la coleccin nacional del pas y elaborar la
bibliografa nacional.
6)Transferencias: se da sobre todo en archivos. Es el acto por el cual un conjunto de documentos es trasladado de la unidad administrativa que lo ha producido a un servicio de archivos con plenos derechos para su tratamiento y
disposicin. Este traslado se efecta mediante la presentacin de un instrumento denominado formulario de transferencia (Alberch, 1999).
2.3. Recepcin

Lectura complementaria
Sobre las transferencias podis consultar la obra siguiente:
R.AlberchiFugueras
(1999). El tractament tcnic
dels documents. Gesti integral darxius. Barcelona: Fundaci per a la Universitat
Oberta de Catalunya.

La recepcin es el ltimo proceso de la fase de entrada y consta de tareas administrativas, el registro y la preparacin del material.
Las tareas administrativas vinculadas a la adquisicin son diferentes segn la
documentacin haya llegado por compra, transferencia, donacin, etc.
Con respecto a las compras, las tareas son comprobar el estado del pedido,
aceptar la factura o, si es el caso, reclamar y gestionar los pagos. Con respecto
a los documentos procedentes de la actividad y el proceso de organizacin,
las tareas a realizar en el momento de la recepcin son la evaluacin y el registro, de acuerdo con los procedimientos definidos en el sistema de gestin
documental.

Recepcin

CC-BY-NC-ND PID_00143966

16

La cadena documental

Finalmente, el proceso acaba con operaciones de preparacin de los diferentes


tipos de material, como sellar el documento, forrar, reforzar para que no se
deterioren fcilmente, magnetizar o etiquetar para el prstamo.
En cuanto a los documentos de archivo, hay operaciones especficas: ser delicado con la documentacin histrica, desdoblar documentos como planos o
mapas, retirar clips y fundas plastificadas que puedan estropear la documentacin a largo plazo, etc.
2.4. Conclusiones
La fasedeentrada consta de tres subfases:
1) La seleccin: es el proceso en el que se decide qu documentos se aaden o
eliminan de la coleccin o fondo. Es un proceso complejo en el que intervienen muchos factores: las necesidades del centro, las de sus usuarios, estadsticas de uso, recursos humanos y recursos econmicos o el sistema de gestin
documental si se trata de un archivo.
La seleccin da respuesta a cuestiones de tipo cuantitativo (se relacionan con
el tamao) y cualitativo (se relacionan con el contenido). Los documentalistas
seleccionan usando diversas herramientas, por ejemplo catlogos comerciales,
bases de datos, contactos directos, bibliografas, repertorios y desideratas.
El principal criterio a la hora de seleccionar es evaluar la calidad de una obra.
Hay que valorar los aspectos fsicos y los de contenido. Un tipo especial de
seleccin es la expurgacin, que consiste en retirar de manera temporal o definitiva una parte del fondo con el fin de reorganizar los contenidos del SID
y ofrecer un mejor servicio.
2) Laadquisicin: las vas de adquisicin son el acceso gratuito, la compra, la
donacin, el intercambio, el depsito legal y la transferencia.
3) La recepcin: consta de tareas administrativas, el registro y la preparacin
del material.

Ved tambin
Todas estas operaciones ligadas a los documentos de archivo son objeto de estudio en las
asignaturas Gestin integral de
archivos y Gestin documental.

CC-BY-NC-ND PID_00143966

17

3. Fase de anlisis y tratamiento

La fase deanlisisytratamiento incluye dos operaciones: el anlisis


documental y el procesamiento tcnico. Su funcin es organizar los documentos seleccionados en la primera fase y producir herramientas que
faciliten la recuperacin.

El anlisis documental transforma el documento original en un registro documental que se introduce en el catlogo o inventario. El procesamiento tcnico
se ocupa de ordenar y conservar los documentos en condiciones ptimas.

La cadena documental

CC-BY-NC-ND PID_00143966

18

La cadena documental

3.1. Anlisis documental


El anlisis documental es la operacin intelectual de aplicar tcnicas especficas y normalizadas a un colectivo de documentos con la finalidad de hacerlos controlables y recuperables.
Garca Gutirrez (1984, pg. 77).

3.1.1. Del documento a la referencia documental

Anlisisdocumental

Los documentos tienen una serie de atributos formales (autor, ttulo, edicin,
extensin, etc.) y atributos de contenido (la materia, el resumen); los documentos de archivo tienen, adems, el contexto histrico y social en el que fueron generados. El analista vaca estos atributos de acuerdo con normas descriptivas y elabora otro producto documental nombrado referenciadocumental,
que contiene todos los datos identificativos y descriptivos del documento. Es-

Documentos de archivo
Dada la extensin de un registro archivstico, para ver
un ejemplo recomendamos
la consulta directa a la norma
ISAD(G), pg. 99, fondo del
organismo Consejo real de Espaa e Indias.

ta referencia se introduce en el catlogo y se convierte en la herramienta que


representa el documento para futuras bsquedas.
Referencia documental de Vocabulario bsico de la historia medieval, de
Pierre Bonnassie
Ejemplo de referencia documental
Autor

Bonnassie, Pierre

Ttulo

Vocabulariobsicodelahistoriamedieval/PierreBonnassie;trad.
cast.yadapt.deManuelSnchezMartnez

Descripcin

Barcelona: Crtica, 1994

Edicin

4. ed.

ISBN

8474232015

Coleccin

Serie general (Crtica). Estudios y ensayos; 110

Materia

Historia medieval - Terminologa

Terminologa
No hay consenso terminolgico sobre el trmino referencia documental. Otros nombres
son resea, ficha catalogrfica, registro bibliogrfico (usado en catlogos), registro documental (usado en bases de
datos documentales).

Como se puede apreciar, la referencia documental es la representacin condensada del documento/fondo. Puede ir acompaada del sumario y el resumen de la obra.
Por qu necesitamos referencias documentales? Porque no es operativo trabajar con los documentos originales, ya que estos slo pueden estar en un lugar a la vez, y porque a veces no son unidades independientes sino que forman
parte de otra obra. Por ejemplo, el documento de un expediente, etc.

Portada de Vocabulario bsico de la historia


medieval, de Pierre Bonnassie

19

CC-BY-NC-ND PID_00143966

La cadena documental

Construir la referencia documental es una tarea intelectual, la ms intelectual


de toda la cadena. El analista tiene a su disposicin normativas, reglas y listados para consultar, que le indican qu informacin tiene que seleccionar,
cmo la tiene que introducir, en qu campo y en qu formato.
El anlisis documental se divide en dos anlisis diferenciados: el anlisis formal
y el anlisis de contenido.
3.1.2. Anlisis formal
El objetivo del anlisis formal5 es describir los atributos estructurales de los
documentos, proporcionando una representacin del documento que lo des-

(5)

El anlisis formal tambin se conoce por el nombre de catalogacin y descripcin bibliogrfica.

criba de manera nica, sin ambigedades.


Los objetivos concretos y la normativa usada en cada caso es la siguiente:
1) Obtener parte de los elementos que componen una referencia documental:
autor, ttulo, ao, edicin, lugar de edicin, coleccin, ISBN, etc.
En documentacin archivstica, el anlisis formal se lleva a cabo segn una
6

descripcin normalizada acordada a nivel internacional: las ISAD(G) del International Council on Archives.
En Catalua, la Norma de Descripci Arxivstica de Catalunya (NODAC7) se

(6)

ISAD(G) es la sigla de General International Standard Archival Description (Norma Internacional General de Descripcin Archivstica).
(7)

NODAC es la sigla de Norma de


Descripci Arxivstica de Catalunya.

articula en siete reas de informacin descriptiva que renen los veintisis


elementos identificados y definidos por la ISAD(G).
Para colecciones de biblioteca se utilizan las International Standard for Biblio8

graphic Description (ISBD ), publicadas por la International Federation of Library Associations and Institutions (IFLA9) y la primera parte de las AngloAmerican Cataloguing Rules (AACR2R10), que nos indican los elementos esenciales de la descripcin documental, de qu partes del documento se tienen
que sacar, en qu orden hay que ponerlas, y qu signos de puntuacin y caracteres grficos se tienen que usar. Hay una ISBD(G) que es el marco general
y abstracto y toda una serie de ISBD para los diferentes tipos de documentos.
Ejemplos de ISBD

ISBD(A): libros antiguos.


ISBD(ER): recursos electrnicos.
ISBD(CM): documentos cartogrficos.
ISBD(M): monografas.
ISBD(NBM): documentos no libros.
ISBD(PM): msica impresa.
ISBD(S): publicaciones en serie.

(8)

ISBD es la sigla de International


Standard for Bibliographic Description, Norma Internacional para la
Descripcin Bibliogrfica.
(9)

IFLA es la sigla de International


Federation of Library Associations
and Institutions, Federacin Internacional de Asociaciones e Instituciones de la Biblioteca.
(10)

AACR2R es la sigla de AngloAmerican Cataloguing Rules.

Ved tambin
Las normas ISBD y AACR2R se
estudian en la asignatura Anlisis documental, y la norma
ISAD(G) en la asignatura Gestin integral de archivos.

CC-BY-NC-ND PID_00143966

20

La cadena documental

2) Establecer y normalizar los puntos de acceso bibliogrficos por autor y ttulo. Los puntos de acceso son nombres, cdigos o trminos que sirven para
localizar y buscar el documento. Los ms habituales en este anlisis formal son
el autor y el ttulo, pero en entornos automatizados cualquier elemento puede
ser recuperado (como el lugar y el ao de edicin, el ISBN).
Para alcanzar este objetivo con colecciones de biblioteca utilizaremos la segunda parte de las AACR2R; 2. edicin revisada: puntos de acceso por autor y
ttulo. En archivos, la norma para el control de autoridades es la Norma Inter-

(11)

ISAAR(CPF) es la sigla de Norma Internacional sobre los Registros


de Autoridad de Archivos Relativos a
Instituciones.

nacional sobre los Registros de Autoridad de archivos relativos a instituciones,


personas y familias (ISAAR[CPF]11) del Consejo Internacional de Archivos.
Campos propios del anlisis formal en la referencia de Pierre Bonnassie
Autor

Bonnassie, Pierre

Ttulo

Vocabulariobsicodelahistoriamedieval/PierreBonnassie;trad.cast.y
adapt.deManuelSnchezMartnez

Descripcin

Barcelona: Crtica, 1994

Edicin

4. ed.

ISBN

8474232015

Coleccin

Serie general (Crtica). Estudios y ensayos, 110

Ved tambin
El anlisis formal se estudia en
la asignatura Anlisis documental.

3.1.3. Anlisis de contenido


El objetivo del anlisis de contenido es identificar y representar de manera
precisa la materia de los documentos, con el objetivo de permitir la recuperacin. Esta parte del anlisis documental establece los puntos de acceso por
materias o contenidos de los documentos.
Se basa en dos operaciones:
a) El resumen, que es la representacin abreviada y precisa del contenido.
b) La indizacin, que consiste en representar el contenido del documento
mediante trminos de indizacin extrados de lenguajesdocumentales: notaciones, encabezamientos de materias, descriptores, identificadores, palabras
clave, unitrminos. Cuando se representa el contenido siguiendo un sistema
de clasificacin en lugar de una indizacin se conoce como clasificacin.
Las normativas que usamos en esta parte del anlisis documental son:

UNO 50-103-90, preparacin de resmenes.

UNO 50-121-91, mtodos para el anlisis de documentos, determinacin


de su contenido y seleccin de trminos de indizacin.

Reflexin
El material que tenis en las
manos trata precisamente del
anlisis de contenido de la cadena documental.

CC-BY-NC-ND PID_00143966

21

La cadena documental

Las normativas propias de cada lenguaje documental: vocabulario, combinaciones, mantenimiento, actualizacin.
Campos propios del anlisis de contenido en la referencia de Pierre
Bonnassie: materia y resumen
Campos propios del anlisis de contenido en la referencia de Pierre Bonnassie
Materia

Historia medieval - Terminologa

Resumen

Este es un libro poco corriente. Ni diccionario ni manual, significa una nueva y eficaz forma de introduccin -a la
vez analtica y sinttica- a los problemas de la historia de la Edad Media. En efecto, a partir del anlisis de medio
centenar de conceptos fundamentales y de su evolucin semntica, el profesor Pierre Bonnassie, de la Universidad de Toulouse, consigue definir, con inslita precisin, las grandes cuestiones que hoy tiene planteadas la historia medieval. El resultado es un texto innovador, de uso obligado para profesores y estudiantes, que encontrarn en l un instrumento de trabajo insustituible.

Los lenguajes documentales usados tradicionalmente en los archivos son cuadros de clasificacin construidos a medida del fondo. El anlisis de contenido
es sinttico, no se analizan los documentos individualmente, sino el fondo
en su conjunto, dado que un documento forma parte de una cadena de documentos ordenados (cronolgicamente, orgnicamente, funcionalmente) y

Clasificacin orgnica
La clasificacin orgnica es el
retrato de la estructura orgnica de la entidad que haya generado la documentacin.

aislado pierde su contexto. La clasificacin puede ser orgnica, funcional (por


funciones, por grandes materias) o mixta.
En bibliotecas y centros de documentacin se usan la mayora de los lenguajes
documentales. Los ms habituales son los sistemas de clasificacin, como la

(12)

CDU es la sigla de Clasificacin


Decimal Universal.

Clasificacin Decimal Universal (CDU12) o la Clasificacin Dewey, los listados


de autoridades, las listas de encabezamientos de materia, los tesauros y la indizacin automtica por palabras clave.
3.1.4. Intercambio entre SID
Con el mismo espritu cooperativo y de intercambio de las ISBD y AACR, sur13

ge el formato Machine Readable Catalog (MARC 21 ). Este formato permite


intercambiar registros entre diferentes bases de datos y sus normas codifican,
almacenan e intercambian datos bibliogrficos.
Consulta del registro de Bonnassie en el catlogo de la Biblioteca de la
UOC, en el icono MARC

(13)

MARC 21 es la sigla de Machine


Readable Catalog.

22

CC-BY-NC-ND PID_00143966

La cadena documental

A nivel de archivo, el intercambio de informacin en el contexto de sistemas


y redes telemticas est menos adelantado, por el hecho de que la descripcin
responde a documentos especficos de cada organismo.

Ved tambin
El formato MARC se estudia en
la asignatura Anlisis documental.

3.1.5. Referencias bibliogrficas


No es una tarea de la cadena documental, pero por la similitud de nombres es
conveniente evitar las confusiones entre referencia documental y referencia
bibliogrfica.
Una referencia bibliogrfica es la descripcin del documento primario al que
se remite al lector. En trminos especializados, es el documento que ha sido
citado expresamente en un trabajo de investigacin y al que es obligatorio,
tica y textualmente, hacer alusin (Borgos, 1999, pg. 22).
Ejemplo
Si en una bibliografa citamos la obra de Pierre Bonnassie, su referencia bibliogrfica es:
BONNASSIE, Pierre. Vocabulario bsico de la historia medieval. Manuel Snchez Martnez
(trad.). Barcelona: Crtica, 1994. 246 p. Serie general (Crtica). Estudios y ensayos; 110.
ISBN 8474232015.

Las normativas para hacer estas referencias son:

Para materiales publicados, la norma ISO 690 (traducida al castellano como UNE 50-104).

Para materiales electrnicos, la ISO 690-2.

Ved tambin
Estas dos normativas se estudian en la asignatura Fuentes
de Informacin.

3.1.6. Conclusiones
A modo de resumen, a continuacin tenis una tabla que recoge los conceptos ms importantes de las operaciones y normativas que hacen referencia al
anlisis documental.
Resumen de operaciones y normativas del anlisis documental
Operacin
Anlisis formal

Obtener parte de los elementos que componen una referencia documental.

Normativaconlacualsealcanza
ISBD y la primera parte de las AACR2R con
respecto al material bibliogrfico.
ISAD(G) con respecto a la descripcin de documentos de archivo.

Elaborar los puntos de acceso bibliogrficos La segunda parte de las AACR2R. 2 edicin
por autor y ttulo.
revisada para material bibliogrfico.
Anlisis de contenido

Resumir

Norma UNE 50-103-90; preparacin de resmenes.


ISAD(G); campo: alcance y contenido para
documentos de archivo.

23

CC-BY-NC-ND PID_00143966

En conjunto

La cadena documental

Indizar

Norma UNE 50-121-91; mtodos para el


anlisis de documentos, determinacin de su
contenido y seleccin de trminos de indizacin.
La normativa propia de cada lenguaje documental sobre vocabulario, combinaciones,
mantenimiento, actualizacin.

Intercambiar formato MARC

MARC 21 para material bibliogrfico.

3.2. Procesamiento tcnico


En este momento de la cadena, el documento est a punto para ser ordenado,
ya sea en una estantera, una carpeta o unos archivadores. En paralelo, el SID
tiene que prever que las condiciones del almacn sean ptimas, hecho que
implica medidas de conservacin y una poltica de prevencin.

Este conjunto de tareas, ordenacin, almacn y medidas de conservacin, se conoce como procesamientotcnico.

3.2.1. Signatura topogrfica

La signaturatopogrfica es el cdigo que identifica cada material en


las salas y estanteras del SID.

La signatura queda registrada en la referencia documental y tambin en la obra


en cuestin. Est estrechamente relacionada con la gestin del espacio y, en
consecuencia, con la ordenacin.
3.2.2. Ordenacin
Los SID tipo archivos ordenan su documentacin en cajas archivadoras y en
muebles compactos que ahorran espacio. Estos muebles no estn al alcance de
los usuarios. Los documentos de un fondo se ordenan en series y expedientes.
Fsicamente se ordenan en cajas archivadoras, carpetas o camisas. Los documentos con formatos que impidan su ordenacin en cajas, como pergaminos,
planos, carteles, material audiovisual, etc., se ponen en cajoneras aparte. En
estos casos, se clasifican con el resto de su fondo, pero se les da un topogrfico
diferente.
Las bibliotecas dan acceso libre y pueden ordenar sus colecciones segn diferentes criterios espaciales: por el tipo de documentos (todas las monografas juntas, las revistas juntas, etc.), por temas (apartado para ciencias sociales,
ciencias exactas, etc.) o en funcin del pblico (sala para adultos, sala infantil).

Signatura topogrfica
Los libros, por ejemplo, llevan
la signatura topogrfica en el
extremo inferior del lomo.

CC-BY-NC-ND PID_00143966

24

La cadena documental

Combinacin de criterios
Estos criterios se pueden combinar en una misma biblioteca. Por ejemplo, una biblioteca pblica de una ciudad de 30.000 habitantes puede tener una sala infantil y el resto
del edificio para adultos; dentro de cada espacio, los documentos ordenados por temas,
y dentro de cada tema, por tipo (dentro de geografa, primero los atlas, despus monografas, dvd, etc.), y finalmente una sala o espacio para documentos con algn formato
especial.

Una vez los documentos estn en los compactos o las estanteras, hay tres tipos
de ordenaciones (Maniez, 1993):
a)Ordenacionesnosignificativas: son aquellas en las que no hay relacin
con el contenido del documento. Es una ordenacin til en SID que no den
acceso libre a las estanteras, y que la recuperacin la haga el documentalista.
Apropiado para SID que tengan su coleccin en el depsito y no en la sala de
lectura. Es el mtodo ms usado en Archivos.
Ordenaciones no significativas
Un ejemplo de ordenacin no significativa sera ordenar segn el nmero asignado a la
llegada.

b)Ordenacionesconsignificadolimitado: se ordenan por algn criterio. Es


la ordenacin que encontramos en libreras, bibliotecas personales o bibliotecas pequeas.
Ordenaciones con significado limitado
Ejemplos de criterios utilizados en este tipo de ordenacin seran la lengua del documento, el autor, el tema.

c)Ordenacionesaltamentesignificativas: se ordena a partir de un cuadro


de clasificacin, de manera que los contenidos afines se colocan uno al lado
del otro. Es apropiada para SID de libre acceso, como las bibliotecas pblicas
y universitarias.
Ordenaciones altamente significativas
Un ejemplo sera ordenar siguiendo las clases de la CDU.

Los tres tipos de ordenaciones se pueden combinar en un mismo SID.

Lectura complementaria
Podis encontrar ms informacin sobre estos tres tipos
de ordenacin en la obra siguiente:
J.Maniez(1992). Los lenguajes documentales y de clasificacin: concepcin, construccin
y utilizacin en los sistemas documentales. Madrid: Pirmide
/ Fundacin Germn Snchez
Ruiprez.

CC-BY-NC-ND PID_00143966

25

Combinacin de criterios
Estos criterios se pueden combinar en una misma biblioteca. Por ejemplo, una biblioteca
pblica puede ordenar de la siguiente manera:

Ordenaciones no significativas: prensa, boletines, revistas, etc.

Ordenaciones con significado limitado: novelas. Se hacen distinciones entre novela


histrica, ciencia-ficcin, biografas, etc. Dentro de cada grupo las novelas se ordenan
alfabticamente por autores.

Ordenaciones altamente significativas: todo el resto de la coleccin. Es el grueso mayor.

Sea cual sea la ordenacin, cada documento tiene que tener un lugar nico
y el sistema tiene que ser susceptible de ampliacin (estanteras parcialmente
vacas). En los SID de libre acceso la ordenacin tiene que ser sencilla y comprensible para el usuario.
3.2.3. Almacenamiento y conservacin
El ao 1979 es un hito en la historia de la conservacin de las colecciones
bibliogrficas. En esta fecha, la IFLA, a travs de su Seccin de Conservacin,
present un documento que se edit el ao 1986 con el nombre de Principios
para la preservacin y conservacin de los materiales bibliogrficos.
Hasta entonces, la conservacin documental se relacionaba con dos operaciones: la encuadernacin y la restauracin de libros y manuscritos antiguos. Estas actividades se consideraban casi un lujo reservado slo a selectivas bibliotecas y archivos con fondo de extraordinario valor.

El documento de la IFLA ampli el concepto de conservacin documental en todo tipo de SID y de fondo. Distingue tres actividades: la preservacin, la conservacin y la restauracin.

Las causas que provocan la degradacin pueden ser internas o externas al documento (Cid 1999, basado en Borell y Bello 1995):
a)Causasinternas. La naturaleza orgnica del papel, los aditivos y las tintas
de los documentos los hacen susceptibles de deterioro.
b)Causasexternas. Pueden ser:

Fisicomecnicas: producidas por el uso cotidiano y la manipulacin de los


documentos. Afecta tanto a los usuarios como al personal tcnico del SID.
Hace falta mantener la higiene de las manos, no humedecerse los dedos
para pasar pgina, no doblar los mrgenes de las pginas, no escribir sobre
la documentacin, no comer ni beber, etc.

La cadena documental

La ordenacin de las
novelas
Por qu las novelas no se ordenan siguiendo la clasificacin CDU, es decir de manera altamente significativa? La
CDU clasifica las novelas por
el idioma original del texto, de
manera que una obra de Paul
Auster est clasificada como
novela norteamericana, y una
de Jorge Luis Borges como novela argentina, aunque el SID
la tenga en cataln o castellano. Buscar por el pas de origen del escritor puede resultar
complicado, as que se prefiere
un criterio alfabtico.

CC-BY-NC-ND PID_00143966

26

La cadena documental

Ambientales: por humedad, temperatura, luz intensa. La humedad y la


temperatura son los factores ms importantes para la conservacin. Se
aconseja entre un 50-60% de humedad relativa y entre 18-20 C de temperatura. Estos niveles se tienen que mantener sin oscilaciones bruscas.
La luz solar se tiene que matizar porque es un factor muy degradador. La
luz artificial es mejor que sea de fluorescente, y se tiene que mantener en
torno a los 100 lux en las salas de exposiciones y 50 lux para los materiales
delicados.

Qumicas: contaminacin, polucin atmosfrica. La solucin es mantener


las salas ventiladas, instalar filtros en el aire acondicionado.

Biolgicas: hongos, bacterias, insectos, roedores, etc. Las salas y depsitos


tienen que estar limpios y desinfectados para evitar los microorganismos
y roedores. Por otra parte, el mantenimiento de las condiciones mencionadas de temperatura, ventilacin e iluminacin dificulta el crecimiento
de las especies biblifilas.

Causas extraordinarias: incendios, inundaciones, robos. Se instalan sistemas de deteccin del fuego y puertas cortafuegos. Los documentos se alejan de los cuadros elctricos y depsitos de agua. Alarmas conectadas con
los sistemas de seguridad de la ciudad.

Las medidas de conservacin son muy importantes en la documentacin histrica de archivo: digitalizacin o microfichas de los documentos cuya con-

Precauciones especiales
Algunos tipos de documentos
necesitan unas precauciones
especiales, por ejemplo los vdeos, que se tienen que alejar
de los campos magnticos, o
los negativos de fotografas,
que se tienen que guardar con
papel de PH neutro.

servacin peligre o sea muy voluminosa, medidas contra los excesos de humedad, temperatura y luz, de control de plagas, talleres de restauracin de
documentos, etc.
Documentacin delicada
Ejemplos de documentacin que corre un peligro especial son la documentacin de los
primeros siglos, los documentos con una tinta poco estable, los documentos realmente
muy valiosos, las grandes colecciones, etc.

La preservacin de documentos electrnicos, y ms concretamente los especficos de archivo, que llevan incorporada la firma electrnica, es otro aspecto
que hay que tener en cuenta en esta parte de la cadena.
3.2.4. Conclusiones
La fase de anlisis y tratamiento incluye dos subfases:
1)Elanlisisdocumental. Esta etapa es la operacin intelectual de aplicar
tcnicas especficas y normalizadas a un colectivo de documentos con la finalidad de hacerlos controlables y recuperables. El anlisis documental transfor-

Ved tambin
La preservacin de documentos electrnicos se estudia de
manera ms detallada en la
asignatura Preservacin de documentos digitales y gestin documental.

CC-BY-NC-ND PID_00143966

27

ma el documento original en un registro documental que se introduce en el


catlogo o inventario y es la representacin condensada del documento original. El anlisis documental se divide en dos anlisis diferenciados:

El anlisis formal. El objetivo de este anlisis es describir los atributos


estructurales de los documentos, proporcionando una representacin del
documento que lo describa de manera nica, sin ambigedades.

El anlisis de contenido tiene por objetivo identificar y representar de


manera precisa la materia de los documentos, con la finalidad de permitir
la recuperacin. Esta parte del anlisis documental establece los puntos de
acceso por materias. Tiene dos operaciones: el resumen y la indizacin.

El formato MARC permite intercambiar registros entre diferentes bases de datos y sus normas codifican, almacenan e intercambian datos bibliogrficos.
2)Elprocesamientotcnico. Esta subfase se ocupa de ordenar y conservar
los documentos en condiciones ptimas. Hay tres tipos de ordenaciones:

Las no significativas.

Las de significado limitado.

Las altamente significativas.

En cuanto al almacenaje y la conservacin, la IFLA distingue tres actividades:

La preservacin.

La conservacin.

La restauracin.

Las causas que provocan la degradacin pueden ser internas o externas al documento.

La cadena documental

CC-BY-NC-ND PID_00143966

28

La cadena documental

4. Fase de salida

La misin de la cadena documental es ofrecer el fondo documental de un SID


al usuario. Para hacerlo pone a su disposicin un conjunto de instrumento
para la busca y unos servicios de difusin.

4.1. Instrumentos de bsqueda


Los SID ponen a disposicin de sus usuarios una serie de fuentes bibliogrficas
(los inventarios, los catlogos, las guas de lectura, las bases de datos de sumarios o los boletines de nuevas adquisiciones) y de recursos de informacin en
red. Todos ellos son fuentes de informacin secundaria (los buscadores, los directorios y los portales), ya que ofrecen la referencia documental y el resumen.
Fuentes primarias y fuentes secundarias
Hay que recordar que las fuentesprimarias son aquellas que nos dan informacin nueva
u original, es decir, de primera mano. Por otra parte, las fuentessecundarias son aquellas
que tienen por finalidad indicar qu fuente o documento contiene o nos puede proporcionar la informacin final.

4.1.1. Fuentes bibliogrficas para bibliotecas y centros de


documentacin
Dentro de las fuentes bibliogrficas para bibliotecas y centros de documentacin encontramos:
1)Catlogos: recopilan el fondo de una biblioteca, archivo o centro de documentacin. Su funcin no es tan slo identificar las obras, sino tambin
localizarlas. Los catlogos colectivos son la suma de los catlogos de diversas

Instrumentosdebusca

CC-BY-NC-ND PID_00143966

29

La cadena documental

bibliotecas de la misma temtica o red institucional con la finalidad de compartir registros y tareas como la catalogacin colectiva y el prstamo interbibliotecario.
Catlogos
Consultad, por ejemplo, el catlogo de la Biblioteca de la UOC y el Catlogo Colectivo
de las Universidades de Catalunya, al cual pertenece.
Otro catlogo colectivo es el Catlogo de Bibliotecas Universitarias de Rebiun.

2)Basesdedatosdocumentales: los SID contratan en la fase de entrada bases


de datos de artculos de revistas internacionales y nacionales, tanto especializadas como de cariz ms general. Las bases de datos que se suscriben pueden
ser referenciales o de texto completo.
Bases de datos documentales
Algunos ejemplos de bases de datos en documentacin son:

CSIC: ISOC - Biblioteconoma y Documentacin.


Dialnet.
ISI Web of Knowledge (base de datos de acceso restringido, pero podis acceder a
travs de la biblioteca del Campus de la UOC).

3)Guasdelectura: son recopilaciones de fuentes y recursos web sobre un


tema particular. Tambin se conocen como exposiciones virtuales o exposiciones bibliogrficas. Las confeccionan las bibliotecas pblicas y universitarias.
Guas de lectura
Algunos ejemplos de guas de lecturas son:

Las del sistema de bibliotecas municipales de Girona.


Guas de lectura de la Universidad Autnoma de Barcelona.
Biblioteca Universitaria de Sabadell

4)Boletines: son recopilaciones de ltimas informaciones sobre un tema concreto.


Boletines
Por ejemplo, el Observatorio SIC (Servicio de informacin y conocimiento) de ESADE
es un boletn semanal que se enva por correo electrnico a la comunidad acadmica
e investigadora, para informar sobre la actualidad empresarial y econmica nacional e
internacional.

4.1.2. Documentacin de archivo


Dentro de la documentacin de archivo encontramos:
1)Catlogos: en cuanto a los archivos, el catlogo tiene como objetivo describir la pieza o unidad documental, tanto si se trata de un documento suelto
(pergamino, cdula real o fotografa) como de un expediente o una agrupacin

Lectura complementaria
Podis encontrar ms informacin sobre la cuestin de
los catlogos en:
R.AlberchiFugueras
(1999). Gesti integral
darxius. Barcelona: Fundaci
per a la Universitat Oberta de
Catalunya.

CC-BY-NC-ND PID_00143966

30

La cadena documental

de documentos referidos al mismo asunto. Por la exhaustividad y la minuciosidad de la informacin, el catlogo se considera el instrumento culminante
de toda tarea de descripcin archivstica (Alberch, 1999).
2)Inventarios: consiste en una descripcin global y sistemtica de las series
documentales, entendidas como un conjunto de documentos relacionados
desde el punto de vista de procesos, funcional u orgnico. Permite conocer las
series ms relevantes, su volumen y el alcance cronolgico (Alberch, 1999).
3)Basesdedatosdegestindocumental: especficos para gestionar los documentos asociados a los expedientes resultantes de la actividad y los procesos
especficos de la organizacin donde la base de datos est implementada.
4)Guas: la gua sirve para orientar al usuario sobre el conocimiento general
del contenido de un archivo o de un conjunto de archivos (Alberch, 1999).
4.1.3. Instrumentos de bsqueda para recursos en lnea
En cuanto a los instrumentos de bsqueda para recursos en lnea, tenemos los
siguientes:
1)Buscadores: son programas informticos con un robot que rastrea la red
de forma automtica. Su misin es ir de una pgina en otra usando los hiperenlaces y guardar la informacin en una base de datos. Actualmente hay dos
grandes buscadores: Google y Yahoo, ya que han ido absorbiendo el resto de
motores anteriores. Estn diseados para indizar y recuperar pginas HTML,

Trminos sinnimos
Otros sinnimos de buscadores son motores de bsqueda,
search engines, araas (spiders),
robots.

pero sus prestaciones son cada vez ms amplias, indizando documentos de


audio, imagen, pdf, doc, archivos comprimidos y ejecutables, etc.
Los buscadores ofrecen los resultados de la bsqueda en un listado. Los sistemas anteriores a Google combinaban los factores de repeticin de la palabra
buscada y su posicin en la pgina; a partir de Google y su Pagerank, las pginas mejor posicionadas son las que reciben mayor nmero de enlaces.
2)Directorios: como los buscadores y los portales, los directorios son instrumentos que ofrecen enlaces a recursos de Internet seleccionados por el SID,
pero su particularidad es que los organizan en una clasificacin temtica. Los
directorios estn realizados por un equipo humano, lo que implica una seleccin de fuentes, identificacin del contenido e indizacin ms valiosa que la
realizada por un robot, como en el caso de los buscadores. Por eso los directorios se conocen como productos de informacin de alto valor aadido.
Directorios
Ejemplos de directorios son las guas temticas, como la de la Universitat de Barcelona
o la de la Universidad Carlos III de Madrid.

Trminos sinnimos
Otros sinnimos de directorios
son ndices temticos, guas temticas, Internet subject gateways.

CC-BY-NC-ND PID_00143966

31

La cadena documental

3)Portales: son pginas de entrada a un conjunto de recursos y servicios electrnicos organizados para permitir al usuario acceder a un gran volumen de
informacin. Un portal siempre es una pgina web, pero no a la inversa: no
todas las pginas web son portales. Hay dos tipos de portales: los genricos y
los especializados. Entre estos ltimos destacan los portales corporativos.
Portales
Algunos ejemplos de portales son:

El portal genrico de Telefnica


El portal especializado en documentacin Internet library for librarians.
El portal corporativo de la UOC

4.2. Servicios de difusin


Los SID ofrecen servicios de informacin colectivos y servicios personalizados.
Algunos servicios requieren la presencia fsica del usuario y otros son consultables virtualmente.
Los servicios de difusin ms destacados son:
1)Accesoalfondo
Hay dos tipos de acceso al fondo:
a)Accesodirecto. El usuario puede pasear, hojear y leer los documentos de la
sala. Pasear por las salas y estanteras es un derecho adquirido en el mbito de
las bibliotecas pblicas y universitarias. Acceder directamente al fondo tiene
ventajas, como ver la cantidad de obras que hay de un determinado tema,
poder hojear el sumario de la obra que nos llame la atencin, consultar obras
de temticas afines que no conocamos pero que hemos encontrado al lado
de una conocida... El acceso libre comporta que el documentalista tiene que
tener la coleccin ordenada de forma significativa, los materiales tienen que
estar forrados porque su desgaste es superior y las estanteras tienen que estar
debidamente sealizadas.
b)Accesoindirecto. El usuario no tiene acceso a los documentos, slo a la
coleccin de referencia. Tiene que consultar el catlogo o inventario y esperar
en la sala de consulta a que le lleven la documentacin. Este tipo de acceso se
da en archivos. El motivo es la naturaleza delicada de la documentacin, su
vala o que est sujeta a algn tipo de restriccin en la consulta.
2)Serviciosdeinformacinydereferencia

Serviciosdedifusin

Ved tambin
En el subapartado 3.2.2 de este mdulo se tratan las diversas maneras de ordenar fsicamente un fondo en las estanteras: ordenaciones no significativas, con significado limitado y altamente significativas.

CC-BY-NC-ND PID_00143966

32

La cadena documental

Los servicios de informacin y de referencia son los servicios que prestan los
SID para orientar y ayudar al usuario en la consulta del fondo, en la bsqueda, localizacin, seleccin e identificacin de las fuentes de informacin y la
informacin final. Son servicios personalizados. Los servicios ms destacados
son:

El mostrador del bibliotecario/archivista al cual nos hemos dirigido para


pedir informacin. En este caso hace falta la presencia fsica.

Los servicios llamados de referencia o los iconos del tipo Pngase en contacto con nosotros, en los cuales podemos enviar un mensaje electrnico
o iniciar un chat pidiendo la informacin.

Los servicios de difusin selectiva de informacin (DSI14). La filosofa de


este servicio es poner a disposicin de los usuarios una clasificacin de
temas y que el usuario marque sus reas de inters. Cuando el SID recibe
una noticia o documento nuevo de este tema, automticamente enva un
mensaje al usuario. Si la informacin es en lnea, el SID facilita la direccin
del recurso web. Entre las informaciones ofrecidas hay las ltimas nove-

Trminos sinnimos
Otros trminos sinnimos de
servicios de referencia son servicio de referencia virtual (en ingls, virtual reference services;
vase la Biblioteca Virtual de
la UOC), servicio de referencia
digital (en ingls, digital reference services; vase la seccin
Preguntad al bibliotecario
de la Universidad de Barcelona), mostrador digital (Deskstop reference) y Pregunte: las
bibliotecas responden (Ask-AnExpert).

dades adquiridas, los sumarios de revistas previamente seleccionadas por


el usuario, las ltimas noticias sobre un tema, etc.
Servicios de difusin selectiva de informacin

(14)

DSI es la sigla de Servicios de difusin selectiva de informacin.

La biblioteca de la UOC, por ejemplo, en el apartado Servicios nos ofrece diversos servicios: servicio de referencia (La biblioteca respon), servicio de obtencin de documentos
(SOD), sumarios (Distribuci de sumaris) y difusin selectiva (Butlletins de biblioteca).

3)Prstamoyprstamointerbibliotecario
El prstamo es la entrega de un documento por un tiempo determinado y
bajo ciertas condiciones. Se presta todo tipo de documentos a excepcin de los
documentos valiosos (manuscritos), ejemplares nicos de los cuales es difcil
encontrar una copia, las obras de referencia y las publicaciones peridicas.
El prstamointerbibliotecario es la modalidad de prstamo que se da entre
bibliotecas. Junto con los catlogos colectivos, son las modalidades ms bsicas de cooperacin bibliotecaria.
4)Reprografa
La reprografa consiste bsicamente en un servicio de fotocopias.
5)Formacindeusuarios
Los SID elaboran guas de uso general, de consulta de su centro o sobre el
funcionamiento de sus bases de datos.

Obras de referencia
Ejemplos de obras de referencia son los anuarios, los atlas,
los diccionarios, las enciclopedias, las guas, las estadsticas,
los manuales, los tratados. Las
obras de referencia se usan como material de consulta para
obtener una informacin breve, rpida y exacta.

CC-BY-NC-ND PID_00143966

33

4.3. Conclusiones
La misin de la cadena documental es ofrecer el fondo documental de un SID
al usuario. Para hacerlo pone a su disposicin un conjunto de instrumentos
para la bsqueda y unos servicios de difusin. Los instrumentos de bsqueda
son:

Los inventarios.

Los catlogos.

Los buscadores.

Los directorios.

Los portales.

Las guas de lectura.

Los boletines de sumarios y los boletines de nuevas adquisiciones.

Estos instrumentos son fuentes de informacin secundarias, ya que ofrecen la


referencia documental y el resumen.
Los servicios de difusin ms destacados son:

El acceso al fondo.

Los servicios de referencia

El prstamo y el prstamo interbibliotecario.

La reprografa.

La formacin de usuarios.

La cadena documental

Formacin de usuarios
La biblioteca de la UOC,
por ejemplo, elabora guas
de uso de los diversos programas y bases de datos
del centro, como el manual
sobre el programa Gestor
de referencias bibliogrficas
Refworks.
La Universidad de Barcelona elabora tutoriales sobre
biblioteconoma y documentacin.
La Universidad de Mlaga
tambin hace sus tutoriales.

34

CC-BY-NC-ND PID_00143966

La cadena documental

5. Cadena documental y cooperacin

A medida que el uso generalizado de normas para el anlisis formal (ISBD,


AACR2R, ISAD[G]) y el anlisis de contenido (sistemas de clasificacin, encabezamientos de materia, tesauros, etc.) se ha ido extendiendo, los SID han
podido hablar un lenguaje comn que ha hecho posible el intercambio entre
ellos.
Hoy en da la normalizacin se ha convertido en una necesidad, no se concibe
hablar de redes, cooperacin (de creacin de colecciones, de catalogacin, de
prstamo, de MARC 21), bibliotecas virtuales y accesos a recursos compartidos
sin que existan normas que lo sistematicen.
La normalizacin posibilita la colaboracin en forma de redes y consorcios
donde las fases de la cadena documental se pueden trabajar de forma compartida.
Redes y consorcios
Algunos ejemplos de redes y consorcios:

Red de archivos comarcales.


Consorcio de bibliotecas universitarias catalanas.
Sistema de lectura de bibliotecas pblicas de Catalua.
Consorcio de bibliotecas universitarias de Rebiun.

La cooperacin entre bibliotecas aparece a finales del siglo XIX en Estados Unidos y en los aos noventa en Espaa. Las bibliotecas cooperan entre ellas, pero
adems, como dice Miquel Trmens (2005, pg. 166) en una etapa ms adelantada tambin se coordinan y colaboran.

Por coordinacin entendemos que establecen acuerdos comunes sobre


la misin y objetivos de los centros.

Lectura complementaria
Sobre el tema de la cooperacin de las bibliotecas podis
leer:
M.TrmensGraells(mayojunio, 2005). Los consorcios
una nueva etapa de la cooperacin bibliotecaria. El profesional de la informacin (vol.
14, n. 3, pgs. 166-173).

Por colaboracin entendemos que llegan a crear estructuras formales


de trabajo, incluso de cariz legal, que incluyen alguna forma de autoridad para planificar y operar un conjunto de misiones. Estas estructuras
son los consorcios e implican un sentido de cooperacin ms profundo,
siendo la adquisicin de documentos una de las piezas clave.

En Espaa el primer consorcio fue el Consorci de biblioteques universitries


15

de Catalunya (CBUC ), fundado en 1995. Su misin era crear un catlogo colectivo y hacer catalogacin compartida. Ms adelante, con el proyecto de la
Biblioteca digital de Catalunya, tambin incorpor las adquisiciones de documentacin electrnica.

(15)

CBUC es la sigla de Consorci de


biblioteques universitries de Catalunya.

CC-BY-NC-ND PID_00143966

35

La cadena documental

Siguieron el mismo ejemplo los consorcios siguientes:

Consorcio de universidades de la comunidad de Madrid y de la UNED para


la cooperacin bibliotecaria (Madroo).

Consorcio de Bibliotecas Universitarias de Andaluca (CBUA16).

Consorcio de Bibliotecas universitarias de Galicia (Bugalicia).

(16)

CBUA es la sigla de Consorcio de


Bibliotecas Universitarias de Andaluca.

Hay fondos, sin embargo, que no se pueden analizar de manera compartida,


como es el caso de la documentacin de archivo, que es nica, y, en las colecciones bibliotecarias, la coleccin local, que es el fondo bibliogrfico de la
localidad en la que se encuentra el centro. Es especialmente importante en
la biblioteca pblica. Est constituido por monografas, diarios y revistas, programas de actos y fiestas, fotografas, etc., de la ciudad y sus habitantes. Es
responsabilidad de la biblioteca (y no de la red) hacer la seleccin y anlisis.
La cooperacin favorece las tres fases de la cadena documental.
1)Enlafasedeentrada:

La seleccin: la cooperacin evita duplicidades de esfuerzos en la localizacin de novedades, as como en el apoyo tcnico y en la compra de software de gestin. Cooperando se accede a fondos de financiacin, para adquirir fondos o para migrar hacia sistemas electrnicos y en red.

La adquisicin compartida: es un procedimiento de adquisicin en el


que intervienen diversas bibliotecas para comprar de forma coordinada.
Las ventajas son: mayor cobertura temtica de las colecciones, reduccin
de gastos y tareas tcnicas e intelectuales, mejor servicio al usuario.

La compra: se proponen compras conjuntas para toda la red, pactos de


mejora de las condiciones econmicas para los contratos de paquetes documentales. Se consigue un cierto ahorro presupuestario gracias a las compras en conjunto y la economa de escala que representa.

2)Enlafasedeanlisisytratamiento:
La catalogacin compartida slo se da en bibliotecas y centros de documentacin. La cooperacin entre bibliotecas permite que la catalogacin se pueda
llevar a cabo de forma centralizada y cooperativa:

Catalogacincentralizada: el proceso de catalogacin lo realiza una biblioteca que distribuye las referencias documentales al resto de bibliotecas
de la red. Implica que hay una autoridad central que asume la responsabilidad.

El ahorro es relativo
El ahorro es relativo; no es que
colaborando ahorren, sino que
un SID que acta en consorcio consigue mucho ms por
el mismo precio que actuando
en solitario.

CC-BY-NC-ND PID_00143966

36

Catalogacincooperativa: consiste en la aportacin de referencias documentales por parte de diferentes bibliotecas que juntas crean un catlogo
colectivo. En este caso, hay que corregir las desigualdades en la descripcin
bibliogrfica.

3)Enlafasedesalida:

Instrumentosdebsqueda: catlogos colectivos y repositorios institucionales, que multiplican exponencialmente el acceso a la documentacin de
otros SID. Permite pasar del concepto de documentacin en propiedad al
de acceso a la documentacin.

Serviciosdedifusin: prstamo interbibliotecario, ofrecer servicios de referencia en lnea (ask-an-expert), ms visibilidad social, llegan a ms ciudadanos, amplan la cobertura informativa en diversos apoyos y el mantenimiento de la coleccin es ms seguro.

La cadena documental

CC-BY-NC-ND PID_00143966

37

La cadena documental

6. Los lenguajes documentales dentro de la cadena

Esta asignatura se llama Lenguajes documentales y trata de los vocabularios de


conceptos, libres o controlados, que usamos para indizar, es decir, para responder a la pregunta: cul es el tema de este documento? Adems de la indizacin hay otra operacin que nos permite representar el contenido: son los
resmenes.
Durante el curso dedicaremos mucho ms tiempo a la indizacin que al resumen. Y es que para indizar hacen falta los lenguajes documentales.
En color se destaca el itinerario conceptual que sita los resmenes y los
lenguajes documentales dentro de la cadena documental:

Localizacin de los lenguajes documentales en la cadena documental

Todas las operaciones y normativas se desarrollan en los mdulos siguientes.

Ved tambin
La indizacin se trata en los
mdulos Sistemas de clasificacin documental, Listas de
encabezamientos de materia
y listas de autoridades y Los
tesauros, mientras que el resumen se trata slo en el mdulo Anlisis de contenido:
resumen e indizacin.

Observacin
Estadsticamente este material
dedica un 25% de los contenidos al marco general de la
cadena y la fase de anlisis de
contenido; un 2% al resumen
y el 73% a la indizacin.

CC-BY-NC-ND PID_00143966

39

La cadena documental

Actividades
Proponemos las siguientes actividades para practicar los conocimientos de este mdulo:
1. Consultad la base de datos Temaria y localizad artculos donde se describa el proceso de
la cadena documental en cualquier tipo de SID.
2. Imaginad que tenis que redactar un artculo cientfico sobre el SID en el cual trabajis.
Redactad un esquema de la cadena documental como guin para describir las actividades
de vuestro SID.
3. Localizad datos sobre la poltica de seleccin en webs de los archivos y bibliotecas de
vuestro entorno.
4. Consultad las webs de la BC y la BNE y localizad informacin sobre los lenguajes documentales que usan en el anlisis documental.
5. Consultad la web de una biblioteca pblica o un archivo municipal. Observad los instrumentos de bsqueda disponibles y los servicios de difusin a vuestro alcance.
6. Consultad la base de datos CSIC-ISOC de Documentaci. Observad las posibilidades de
bsqueda.

Reflexin
Las soluciones de las actividades se tratarn en el tabln de
la asignatura.

CC-BY-NC-ND PID_00143966

40

Glosario
acceso directo m Modalidad de acceso al fondo de la coleccin de un SID. El usuario puede
pasear, hojear y leer los documentos de la sala. Pasear por las salas y estanteras es un derecho
adquirido en el mbito de las bibliotecas pblicas y universitarias.
acceso indirecto m Modalidad de acceso al fondo de la coleccin de un SID. EL usuario
no tiene acceso a los documentos, slo a la coleccin de referencia. Tiene que consultar el
catlogo o inventario y esperar en la sala de consulta a que le lleven la documentacin. Este
tipo de acceso se da en los archivos.
adquisicin f Accin de incorporar documentos nuevos al SID. Las vas de adquisicin
son: gratuidad (open access), compra, donacin, intercambio y depsito legal.
adquisicin compartida f Procedimiento de adquisicin en el que intervienen diversas
bibliotecas para comprar de forma coordinada. Las ventajas son mayor cobertura temtica de
las colecciones, reduccin de gastos y tareas tcnicas e intelectuales, mejor servicio al usuario.
almacenamiento y conservacin m Operaciones de la segunda fase de la cadena que
procuran un espacio y unas medidas de proteccin al documento. La IFLA distingue tres
actividades: la preservacin, la conservacin y la restauracin.
anlisis de contenido m Operaciones de anlisis que identifican y representan de manera precisa la materia de los documentos, con el objetivo de permitir la recuperacin. Las
operaciones son dos: el resumen y la indizacin. Esta parte del anlisis documental establece
los puntos de acceso por materias.
anlisis documental m Operacin que analiza los atributos formales y de contenido de
un documento, con tcnicas especificas y normalizadas con la finalidad de hacerlos controlables y recuperables.
anlisis formal m Descripcin de los atributos estructurales de los documentos (autor,
ttulo, edicin, coleccin, etc.), proporcionando una representacin del documento que lo
describa de manera nica, sin ambigedades. Esta parte del anlisis documental establece los
puntos de acceso por autor y por ttulo.
anlisis y tratamiento m Segunda fase de la cadena documental. Incluye dos operaciones: el anlisis documental y el procesamiento tcnico. Su funcin es organizar los documentos seleccionados en la primera fase y producir herramientas que faciliten la recuperacin.
araas f Ved Buscadores.
buscadores m Programas informticos con un robot que rastrea de forma automtica la
red. Su misin es ir de una pgina a otra usando los hiperenlaces y guardar la informacin
en una base de datos. Actualmente hay dos grandes buscadores, Google y Yahoo, ya que han
ido absorbiendo el resto de motores anteriores.
cadena documental f Conjunto de operaciones y tcnicas que comprenden las fases de
entrada, anlisis y tratamiento y difusin de los documentos, que se llevan a cabo en un
centro de documentacin o en una unidad administrativa o de trabajo.
catalogacin f Ved Anlisis formal.
catalogacin centralizada f Catalogacin realizada por una biblioteca que distribuye
las referencias documentales al resto de bibliotecas de la red. Implica que hay una autoridad
central que asume la responsabilidad.
catalogacin cooperativa f Catalogacin consistente en la aportacin de referencias
documentales por parte de diferentes bibliotecas que juntas crean un catlogo colectivo. En
este caso, hay que corregir las desigualdades en la descripcin bibliogrfica.
catlogos m Fuente de informacin o instrumento que recopila el fondo de una biblioteca, archivo o centro de documentacin. Su funcin no es tan slo identificar las obras,
sino tambin localizarlas. Los catlogos colectivos son la suma de los catlogos de diversas
bibliotecas de la misma temtica o red institucional con la finalidad de compartir registros y
tareas como la catalogacin colectiva y el prstamo interbibliotecario.
compra f Modalidad de adquisicin. La compra puede ser directa o por suscripcin al editor, la librera, el proveedor. Es la va ms habitual en bibliotecas y centros de documentacin.
Implica un conocimiento elevado de la produccin bibliogrfica, los canales de distribucin
y venta.

La cadena documental

CC-BY-NC-ND PID_00143966

41

depsito legal (DL) m Modalidad de adquisicin. El depsito legal (DL) es la exigencia


impuesta por ley de depositar, en una o diversas agencias especificadas, ejemplares de las
publicaciones de todo tipo, en cualquier soporte, por cualquier procedimiento de distribucin (venta, alquiler...). El DL es un sistema de adquisicin propio de un reducido nmero de
bibliotecas, las nacionales. Los documentos susceptibles de DL son: libros, folletines, hojas
impresas, publicaciones peridicas y seriadas, partituras musicales, grabados, mapas y planos,
carteles, postales, naipes, diapositivas, producciones cinematogrficas.
descartar v Ved expurgar.
descripcin bibliogrfica f Ved Anlisis formal.
difusin selectiva de informacin (DSI) f Informacin que peridicamente se facilita
a los usuarios y que previamente ha sido pactada; tambin se facilita bajo demanda.
directorios m Fuentes de informacin o instrumento que ofrecen enlaces a recursos de
Internet seleccionados por el SID organizados en una clasificacin temtica. Los directorios
estn realizados por un equipo humano, lo cual implica una seleccin de fuentes, identificacin del contenido e indizacin ms valiosa que la realizada por un robot, como en el caso
de los buscadores. Es por eso que los directorios se conocen como productos de informacin
de alto valor aadido.
donacin f Modalidad de adquisicin. Es la cesin gratuita de documentos. Puede venir
por parte del autor de la obra, por un particular o por la propia dinmica de la institucin. Las
donaciones pueden ser definitivas o temporales. Entre las donaciones podemos distinguir
los legados y los depsitos. Los legados son donaciones provenientes de testamentos, estn
formados por colecciones particulares completas o parciales. Los depsitos son donaciones
en las que la propiedad contina siendo del donante.
expurgar v Evaluacin crtica de la coleccin a partir de criterios materiales e intelectuales
que nos permitan retirar de manera temporal o definitiva una parte del fondo con el fin de
reorganizar los contenidos del SID y ofrecer un mejor servicio.
formacin de usuarios f Conjunto de acciones que los SID llevan a cabo para ayudar
a los usuarios en su bsqueda, consistentes en la elaboracin de guas de uso general, de
consulta del centro o sobre el funcionamiento de sus bases de datos.
guas de lectura f Recopilaciones de fuentes y recursos web sobre un tema particular.
Tambin se conocen como exposiciones virtuales o exposiciones bibliogrficas. Las confeccionan las bibliotecas pblicas y universitarias.
instrumentos de bsqueda m Fuentes de informacin secundaria que ofrecen la referencia y el resumen del documento original. Son instrumentos los inventarios, los catlogos,
los buscadores, los directorios, los portales, las guas de lectura, los boletines de sumarios y
los boletines de nuevas adquisiciones.
intercambio m Modalidad de adquisicin. Como su nombre indica, consiste en el intercambio de material duplicado (o poco solicitado) entre dos centros.
International Standard Bibliographic Description (ISBD) m Normas internacionalmente admitidas para la descripcin en el anlisis formal.
inventarios m Fuentes de informacin e instrumentos de bsqueda. Descripcin global y
sistemtica de las series documentales de archivo.
ISAD(G) m Norma internacional general de descripcin archivstica.
Machine Readable Catalog (MARC 21) m Formato que permite intercambiar registros
entre diferentes bases de datos; sus normas codifican, almacenan e intercambian datos bibliogrficos.
motores de bsqueda m Ved buscadores.
NODAC f Norma de Descripcin Archivstica de Catalua.
Open Access Modalidad de adquisicin. Se trata de toda aquella informacin dispuesta de
forma gratuita y universalmente accesible va Internet, como los repositorios institucionales,
depsitos de archivos abiertos o los recolectores.
ordenaciones altamente significativas f Criterio de ordenacin. Se ordena a partir de
un cuadro de clasificacin, de manera que los contenidos afines se colocan uno al lado del

La cadena documental

CC-BY-NC-ND PID_00143966

42

otro. Es apropiado para SID de libre acceso, como las bibliotecas pblicas y universitarias. Por
ejemplo, til para ordenar siguiendo las clases de la CDU (Clasificacin decimal universal).
ordenaciones con significado limitado f Criterio de ordenacin. Se ordenan, por
ejemplo, por la lengua del documento, el autor, o el tema. Es la ordenacin que encontramos
en libreras, bibliotecas personales o bibliotecas pequeas.
ordenaciones no significativas f Criterio de ordenacin. Son aquellas en las que no hay
relacin con el contenido del documento. Por ejemplo, ordenar segn el nmero asignado
a la llegada. Es una ordenacin til en SID que no den acceso libre a las estanteras, y donde
la recuperacin la haga el documentalista. Apropiado para SID que tengan su coleccin en
el depsito y no en la sala de lectura. Es el mtodo ms usado en archivos.
portales m Fuentes de informacin o instrumento. Los portales son pginas de entrada a
un conjunto de recursos y servicios electrnicos organizados para permitir al usuario acceder
a un gran volumen de informacin. Un portal siempre es una pgina web, pero no a la
inversa: no todas las pginas web son portales.
prstamo m Ved prstamo interbibliotecario.
prstamo interbibliotecario m Entrega de un documento por un tiempo determinado
y bajo ciertas condiciones. Se presta todo tipo de documentos a excepcin de los documentos
valiosos (manuscritos), ejemplares nicos de los cuales es difcil encontrar una copia, las
obras de referencia y las publicaciones peridicas.
procesamiento tcnico m Conjunto de tareas de ordenacin, almacenamiento y medidas
de conservacin.
proceso documental m Ved cadena documental.
recepcin f Proceso de la fase de entrada, que consta de tareas administrativas, el registro
y la preparacin del material.
referencia documental f Producto documental que contiene todos los datos identificativos y descriptivos del documento. La referencia documental es la representacin condensada del documento original. Esta referencia se introduce en el catlogo y se convierte en la
herramienta que representa el documento para futuras bsquedas.
referencias bibliogrficas f Descripcin del documento primario al que se remite al
lector. En trminos especializados es el documento que ha sido citado expresamente en un
trabajo de investigacin y es obligatorio, tica y textualmente, hacer alusin a l.
reprografa f Servicio de fotocopias.
robots m Ved buscadores.
search engine m Ved buscadores.
seleccin f Proceso en el que se decide qu documentos se aaden o eliminan de la coleccin. La seleccin es un proceso complejo en el que intervienen muchos factores: las necesidades del centro, las de sus usuarios, estadsticas de uso, recursos humanos y recursos
econmicos.
seleccin negativa f Ved expurgar.
servicios de difusin pl Servicios de la fase de salida puestos a disposicin de los usuarios
para hacer difusin de la coleccin, por ejemplo el acceso al fondo, servicios de referencia,
prstamo, reprografa y formacin de usuarios.
servicios de referencia m Servicios que prestan los SID para orientar y ayudar al usuario
en la consulta del fondo, en la bsqueda, la localizacin, la seleccin, la identificacin de las
fuentes de informacin y la informacin final.
SID m Servicio de informacin y documentacin.
signatura topogrfica f Cdigo que identifica cada material en las salas y estanteras
del SID. Es el conjunto de nmeros, letras y smbolos que localiza y ordena fsicamente el
documento en la estantera.
salida f ltima fase de la cadena que pone a disposicin de los usuarios un conjunto de
instrumentos para la bsqueda y unos servicios de difusin.

La cadena documental

CC-BY-NC-ND PID_00143966

43

spiders f pl Ved buscadores.


transferencia f Traslado del conjunto de documentos de la unidad administrativa que
los ha producido a un servicio de archivos con plenos derechos para su tratamiento y disposicin.

La cadena documental

CC-BY-NC-ND PID_00143966

44

Bibliografa
Alberch i Fugueras, R. (1999). Gesti integral darxius. Barcelona: Fundaci per a la Universitat Oberta de Catalunya.
Allo Manero, A. (2002). Conservacin de la coleccin. En: Luisa Orera Orera (ed.). Manual
de Biblioteconoma. Madrid: Sntesis (pg. 181-200).
Asociacin Espaola de Normalizacin y Certificacin (1994). Referencias bibliogrficas. Contenido, forma y estructura. UNE 50-104:1994. Madrid: AENOR.
Ayuso Garca, M. D. y Martnez Navarro, V. (2006). Evaluacin de calidad de fuentes
y recursos digitales: gua de buenas prcticas. Anales de Documentacin, nm. 9, pg. 17-42.
Biblioteca UOC (2005). Criteris de selecci de recursos web gratuts. Document de treball. Barcelona (revisin marzo del 2006).
Borgos, M. D. (1999). Anlisis de redaccin de referencias y citas bibliogrficas en literatura
cientfica, a travs del estudio de la normalizacin bibliogrfica. Tesis doctoral. Directora Celia
Chan Navarro. Universidad de Murcia, Departamento de literatura espaola y teora de la
literatura.
Carrizo Sainero, G. et al. (2000). Manual de fuentes de informacin. Madrid: CEGAL.
Cid Leal, P. (1999). Fonaments de llenguatges documentals. Barcelona: Fundaci per la Universitat Oberta de Catalunya.
Codina, Ll. (2000). Evaluacin de recursos digitales en lnea: conceptos, indicadores y
mtodos. Revista Espaola de Documentacin Cientfica, vol. 23, pg. 9-44.
Fuentes, J. J. (2005). Bibliotecas nacionales y consorcios bibliotecarios. Jornadas sobre
bibliotecas nacionales. Las biblotecas nacionales del siglo XXI. Valencia.
Garca Gutirrez, A. L. (1984). Lingstica documental. Barcelona: Mitre.
Garca Rodrguez, A. (2002). Servicios de lectura en sala y prstamo. En: Luisa Orera
Orera (ed.). Manual de Biblioteconoma. Madrid: Sntesis (pg. 247-263).
Garca Valenzuela, H. (2002). El soporte de la biblioteca. En: Luisa Orera Orera (ed.).
Manual de Biblioteconoma. Madrid: Sntesis (pg. 201-214).
ISAD(G): Norma internacional general de descripci arxivstica: adoptada per la Comissi Ad Hoc
de Normes de Descripci, Sucia, 21-23 de gener de 1993: versi final aprovada pel CIA. Barcelona:
Associaci dArxivers de Catalunya: Departament de Cultura de la Generalitat de Catalunya,
1995. ed. orig.: Ottawa: CIA, 1994. ISBN 84-605-4625-X.
Lpez Hernndez, M. A. (1996). La seleccin documental. Revista general de informacin
y documentacin. Madrid.
Maniez, J. (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez Ruiprez.
Melero, R.; Abad, M. F. (2008). Revistes daccs obert: caracterstiques, models i
tendncies. BID Textos universitaris de biblioteconomia i documentaci (juny). Barcelona.
Orera Orera, L. (2002). La coleccin, formacin, desarrollo y mantenimiento En: Luisa
Orera Orera (ed.). Manual de Biblioteconoma. Madrid: Sntesis (pg. 92-112).
Pacios Lozano, R. (1995).El control de la gestin de las adquisiciones. Revista general de
informacin y documentacin, vol 5, Nm. 2. Madrid.
Termens Graells, M. (2005). Los consorcios una nueva etapa de la cooperacin bibliotecaria. El profesional de la informacin (mayo-junio), vol. 14, nm. 3, pg. 166-173.
Turiel, J. (2006). Recursos web per a les adquisicions. BID Textos universitaris de biblioteconomia i documentaci, nm. 16 (juny). Barcelona.
Vall Casa, A. (2006). Esporgar: per qu, com i quan. BID Textos universitaris de biblioteconomia i documentaci, nm. 16 (juny). Barcelona.

La cadena documental

CC-BY-NC-ND PID_00143966

45

Vilchez Pardo, J. (2002). Tratamiento y ubicacin de la coleccin En: Luisa Orera Orera
(ed.). Manual de Biblioteconoma. Madrid: Sntesis (pg. 113-135).

La cadena documental

Anlisis de
contenido:
resumen e
indizacin
Manela Junc Campdepadrs
PID_00143964

CC-BY-NC-ND PID_00143964

Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es

Anlisis de contenido: resumen e indizacin

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

ndice

Introduccin...............................................................................................

Objetivos.......................................................................................................

1.

El anlisis de contenido...................................................................

2.

El resumen...........................................................................................

11

2.1.

Tipos de resmenes .....................................................................

14

2.2.

Resumen automtico ...................................................................

16

La indizacin.......................................................................................

20

3.1.

Lenguaje natural y lenguaje documental ...................................

20

3.1.1.

Nmero de trminos .....................................................

21

3.1.2.

Control de las formas ....................................................

22

3.1.3.

Control del significado ..................................................

22

3.1.4.

Relaciones de significado de los trminos .....................

24

3.2.

Cmo se indiza? ........................................................................

26

3.3.

Calidad y coherencia de la indizacin .......................................

31

Los lenguajes documentales............................................................

33

4.1.

Los trminos de indizacin ........................................................

33

4.2.

Evolucin histrica de los lenguajes documentales ...................

35

4.3.

Cundo son necesarios los lenguajes documentales? ...............

39

4.4.

Complementariedad de los lenguajes documentales ..................

42

Tipologa de los lenguajes documentales....................................

44

5.1.

Naturaleza del trmino: codificado o natural .............................

44

5.2.

Nivel de control: libre o controlado ...........................................

45

5.3.

Nivel de coordinacin: precoordinado o postcoordinado ..........

46

5.4.

Estructura: jerrquica o combinatoria ........................................

48

5.5.

Nivel de anlisis: materias, conceptos, palabras clave ................

50

5.6.

Conclusiones ...............................................................................

52

Actividades..................................................................................................

53

Glosario........................................................................................................

54

Bibliografa.................................................................................................

58

3.

4.

5.

CC-BY-NC-ND PID_00143964

Introduccin

Este mdulo os introduce en los procesos documentales de la segunda fase de


la cadena documental, llamada anlisisdecontenido,formada por el resumen y la indizacin.
Itinerariodeestudio
El mdulo empieza con un captulo dedicado al anlisis de contenido, para
situar al estudiante en las dos operaciones mencionadas, el resumen y la indizacin.
El apartado dedicado al resumen est diseado para responder a las preguntas
de qu es un resumen, quin lo redacta, qu utilidades tiene y cuntos tipos
de resmenes hay. Finalmente, se presentan los resmenes automticos, explicando su evolucin y funcionamiento.
La indizacin es el grueso de esta asignatura y en este mdulo tiene tres apartados. El primero de ellos trata de dar respuesta a las preguntas de qu es indizar, quin indiza, por qu hacen falta los lenguajes documentales y cmo se
indiza. El apartado titulado Lenguajes documentales responde a las preguntas de qu son los lenguajes, cuntos hay, qu son los trminos de indizacin,
cmo han evolucionado, cundo son necesarios y cul es su uso en solitario o
combinados. El ltimo apartado, titulado Tipologa, trata de los diferentes
criterios usados para clasificar los lenguajes.
Este es un mdulo bsico para el aprendizaje de la terminologa que se usar
en el resto de mdulos.
Conceptos ms importantes
Concepto

Ved

Resumen informativo
Resumen indicativo
Resumen selectivo
Resumen automtico

1. El resumen

Ambigedad
Lenguaje natural
Exhaustividad
Especificidad
Traduccin
Univocidad

2. La indizacin

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

Concepto

Ved

Lenguaje documental
Sistemas de clasificacin
Listados de encabezamientos
de materia
Listados de autoridades
Tesauros
Listados de descriptores libres
Listados de palabras clave
Notacin
Encabezamiento
Descriptor
Identificador o autoridad
Palabra clave

4. Los lenguajes documentales

Codificado
Natural
Libre
Controlado
Precoordinado
Postcoordinado
Jerrquico
Combinatorio
Materias
Conceptos
Palabras clave

5. Tipologa de los lenguajes documentales

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

Objetivos

Con el estudio de los materiales asociados a este mdulo alcanzaris los objetivos siguientes:
En cuanto al resumen:

1. Aprender a hacer resmenes de manera intelectual: resmenes informativos, indicativos y selectivos.


2. Aprender a hacer resmenes con programas de resmenes automticos.
En cuanto a la indizacin:

1. Analizar los factores necesarios para que haya una buena comunicacin
documental: entender los problemas del lenguaje natural y la funcin de
los lenguajes documentales dentro de esta comunicacin.
2. Conocer los procesos de indizacin: examen del documento, seleccin y
traduccin.
En cuanto a los lenguajesdocumentales:

1. Conocer las caractersticas principales de los lenguajes documentales.


2. Conocer la evolucin histrica de los lenguajes documentales.
3. Aprender a distinguir y saber utilizar la diferente tipologa de los lenguajes documentales: sintticos-analticos, precoordinados-postcoordinados, controlados-libres, jerrquicos-combinatorios, materias-conceptospalabras clave.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

1. El anlisis de contenido

Elanlisisdecontenido se sita en la segunda fase de la cadena documental


y rene todo el conjunto de operaciones destinadas a representar la materia
de los documentos para una posterior recuperacin.
Son tareas de cariz intelectual en las que la formacin y la habilidad del analista
juegan un papel importante.

Representar la materia o describir el contenido es responder a la


pregunta: cul es el tema de un documento?.

Para representar el contenido de un documento el analista tiene que llevar a


cabo dos operaciones:
1) El resumen, que condensa el contenido en un texto ms breve y manejable.
2) La indizacin, que identifica los conceptos o temas principales. Tambin
se conoce como descripcin caracterstica.
Estas dos operaciones admiten una elaboracin humana o automtica. Por lo
tanto, habr resmenes elaborados por documentalistas y resmenes elaborados por programas, y tambin indizaciones hechas por analistas e indizaciones
elaboradas por un software.
Operaciones humanas y automatizadas
Humano

Automatizado

Resumen

Resumen informativo
Resumen indicativo
Resumen selectivo

Resumen automtico

Indizacin

Sistemas de clasificacin
Listas de encabezamientos de materia
Listados de autoridades
Tesauros
Listados de descriptores libres

Listado de palabras clave

Los dos sistemas tienen ventajas e inconvenientes. La calidad y coherencia


que aporta un documentalista supera en estos momentos la que ofrecen los
programas informticos, pero en cambio los sistemas automticos son instantneos, baratos y capaces de asumir ingentes cantidades de documentos.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

10

La rama cientfica que estudia cmo emular el conocimiento humano, en

Anlisis de contenido: resumen e indizacin

Ved tambin

cuanto a la identificacin de los conceptos y las frases con contenido relevante

Trataremos el procesamiento
del lenguaje natural en el subapartado 2.4 y en el apartado
3.

para el resumen y la indizacin, es el procesamiento en lenguaje natural.

El procesamiento en lenguaje natural (PLN1) es una rama de la inteligencia artificial y de la lingstica computacional que estudia los lenguajes que usan los humanos para interactuar con los ordenadores en
contextos escritos y orales.

A modo de conclusin
Para representar o describir el contenido de un documento el analista tiene que llevar
a cabo dos operaciones:

El resumen, que condensa el contenido en un texto ms breve y manejable.

La indizacin, que identifica los conceptos o temas principales. Tambin se conoce


como descripcin caracterstica.

Las dos operaciones se pueden llevar a cabo de manera humana o automtica.

(1)

PLN es la sigla de procesamiento


en lenguaje natural.

Lectura complementaria
I.GilLeiva;J.V.Rodrguez
Muoz (1996). El procesamiento del lenguaje natural
aplicado al anlisis del contenido de los documentos.
Revista general de informacin y documentacin (vol.
6, nm. 2, pg. 205-218).

CC-BY-NC-ND PID_00143964

11

Anlisis de contenido: resumen e indizacin

2. El resumen

Segn la norma UNE 50-103-90 Preparacin de resmenes, un resumen es


la presentacin abreviada y precisa de un documento, sin interpretacin
ni crtica y sin mencin expresa del autor del resumen.

Ved tambin
Encontraris la norma UNO
50-103-90 en el espacio Materiales y fuentes de las aulas.

Cuando decimos documento nos estamos refiriendo a todo tipo de documento, sea cual sea su soporte material. Podemos resumir un texto, la imagen de
una fotografa, un vdeo, audios, informacin en lnea o hipertextos.
Los resmenes, como la indizacin, pueden ser de elaboracin humana o automtica. En el primer caso hay cuatro tipos de personas que pueden redactar
un resumen. En el caso de los resmenes automticos, se trata de un software.
1)Resumenhumano:
a) Elautor del documento. Los resmenes elaborados por los propios autores
son muy habituales en el mundo de las comunicaciones cientficas y tecnolgicas.
b) Un especialista en la materia de la que trata el documento.

Resmenes para revistas


Las revistas acostumbran a dar
directrices a sus autores para
la elaboracin de resmenes.
Ved, por ejemplo, la revista EPI
en su apartado Instrucciones
para los autores.

c) Laeditorial. Son los resmenes que aparecen en la contraportada de los


libros impresos y que tienen una funcin claramente publicitaria.
d) Un profesionaldeladocumentacin. Aporta su conocimiento sobre la redaccin de buenos resmenes y los elabora pensando en las utilidades futuras.
2)Resumenautomtico: los programas se conocen como programas resumidores de textos o Automatic Text Summarizer.
La norma internacional ISO 214:1976, traducida por AENOR como norma
UNE 50-103-90 Preparacin de resmenes, establece las directrices que se tienen
que seguir para presentar los resmenes en los documentos. Pone especial nfasis en la preparacin de resmenes por parte de los autores de los documentos primarios y en la misma publicacin.

Programas resumidores
de textos
Un ejemplo de programas resumidores de textos es Swesum, que hace un anlisis estadstico del texto y elabora
el resumen con los fragmentos que contienen las palabras
ms ponderadas (ms repetidas pero con significado).

CC-BY-NC-ND PID_00143964

12

Anlisis de contenido: resumen e indizacin

Redactar un resumen es fcil. Lo difcil es redactar un buen resumen. El punto


de inflexin es la calidad del resumen, que lo har ms o menos til en un
sistema documental. Un resumen propagandstico no aportar muchos conceptos principales para indizar, aunque haya sido un buen reclamo para las
ventas.
Ejemplo de resumen elaborado por la editorial con finalidad publicitaria
SAGAN, Carl. Cosmos. Traducci: Albert Santamaria i Martnez; prleg: Ricard Guerrero.
Barcelona: Publicacions i Edicions de la Universitat de Barcelona: Omnis Cellula, cop.
2006.
He aqu una de las obras ms destacadas de la literatura internacional de divulgacin
cientfica, publicada por primera vez en cataln. Una obra imprescindible de uno de los
grandes maestros de la divulgacin, que nos introduce en los grandes enigmas que la
humanidad ha tratado de entender y explicar desde tiempos inmemoriales, y por los
cuales ha nacido lo que llamamos ciencia.
Desde la infinitud del Universo hasta el mundo invisible de los tomos, desde el nacimiento de las estrellas hasta la aparicin de la vida, Carl Sagan consigue transmitir los
conocimientos de la ciencia actual de una manera clara y apasionante.
Para un analista slo tendra utilidad el ltimo prrafo, en qu aparecen trminos como
universo, tomos, estrellas, vida.

El resumen es til en dos fases de la cadena, en los procesos de seleccin


y adquisicin que se da en la primera fase de la cadena y en la fase
de salida, donde es un excelente instrumento de recuperacin, ya que
el resumen ofrece ms datos que la simple referencia documental. La
principal utilidad del resumen es la de difundir la informacin.

En todos los casos es indudable el valor informativo que aporta el resumen


para difundir el contenido del documento de la coleccin. Pero adems, el
resumen tiene otras utilidades, tal como dice la norma UNE 50-103-90:
a) Determinar la pertenencia: un resumen bien elaborado capacita a los lectores para identificar de forma rpida y precisa el contenido de un documento
y decidir si hay que leerlo en su totalidad.
b) Evitar la lectura del texto completo en documentos de inters secundario.
Un resumen bien elaborado proporciona suficiente informacin sobre temas
que no sean de inters principal para el lector. Ahorra tiempo al usuario.
c) Ayudar en la bsqueda automatizada. Los resmenes automatizados incorporados en los catlogos son muy tiles para:

Extraer trminos de indizacin de su texto, es decir, indizar a partir del


resumen.

Hacer bsquedas de palabras clave que no se encuentran en el ttulo.

Difundir la informacin
Cada vez ms bases de datos referenciales ofrecen el resumen de sus monografas y
revistas, como por ejemplo
Ebsco, Dialnet, Compludoc,
CBUC, Eric database o ISI current contents connect. Tambin lo hacen las bases de datos de novedades editoriales,
por ejemplo la editorial Trea
(recomendamos el acceso desde la biblioteca de la UOC).

CC-BY-NC-ND PID_00143964

13

Anlisis de contenido: resumen e indizacin

Servir de control bibliomtrico, al comparar los trminos usados en una


ecuacin de bsqueda con los trminos que aparecen en un resumen y as
establecer la pertinencia de la recuperacin.

Ayudar a la difusin desde los servicios de alerta.

Segn Mara Pinto (1992), las caractersticasdeunresumen son las siguientes:

Brevedad. Se tienen que omitir datos preliminares o temas del conocimiento comn.

Pertinencia. El resumen se tiene que adecuar al mensaje principal del documento, sin obviar o interpretar los datos.

Claridad y coherencia. Frases completas, dotadas de coherencia lineal y


global.

Profundidad. Vara en funcin del tipo de resumen o de los diferentes niveles de detalle que se persigan.

Consistencia lingstica. Un resumen se tiene que adaptar a las pautas lingsticas en uso y tiene que tener en cuenta las reglas morfolgicas y sintcticas correspondientes.

Proximidad cronolgica entre las ediciones del documento original y el


resumen. Es importante que el tiempo transcurrido entre la publicacin
del original y el resumen no sea excesivo, especialmente en mbitos cientficos y tcnicos.
A modo de conclusin

El resumen es la presentacin abreviada y precisa de un documento, sin interpretacin ni crtica y sin mencin expresa del autor del resumen.

El resumen puede ser redactado por el autor del documento, un especialista en la


materia, la editorial, un documentalista o un programa informtico.

El resumen es til en dos fases de la cadena: en los procesos de seleccin y adquisicin


que se da en la primera fase de la cadena y en la fase de salida, donde es un excelente
instrumento de recuperacin.

La principal utilidad del resumen es la de difundir la informacin, pero adems, el


resumen tiene otras utilidades, como determinar la pertinencia, evitar la lectura del
texto completo en documentos marginales y ayudar a la bsqueda automatizada.

Los resmenes automatizados incorporados en los catlogos son muy tiles para extraer trminos de indizacin del texto, para hacer bsquedas de palabras clave que no
se encuentran en el ttulo, para servir de control bibliomtrico y ayudar a la difusin
a travs de los servicios de alerta.

Lectura complementaria
Podis ampliar la informacin sobre el resumen leyendo la obra siguiente:
M.PintoBatanea (1992). El
resumen documental: principios
y mtodos. Madrid: Pirmide/
Fundacin Germn Snchez
Ruiprez (Biblioteca del Libro, Y).

CC-BY-NC-ND PID_00143964

14

2.1. Tipos de resmenes


Hay diversos tipos de resmenes, segn el tamao, los usuarios y la profundizacin en el contenido. Los tipos ms habituales son los resmenes informativos, indicativos y selectivos.
1)Resumeninformativo
Redactaremos el tema central, temas adicionales, naturaleza y objetivo del documento, metodologa, resultados, conclusiones y anexos. La idea de fondo es
que un resumen informativo puede sustituir en ocasiones la lectura del documento original. La norma UNE 50-103-90 recomienda que el esquema a seguir
sea el de:
objetivo + metodologa + resultados (o conclusiones)
Sin embargo, no hay que seguir forzosamente este orden, ya que hay entornos,
como el tcnico cientfico, donde se prefieren los resmenes orientados a los
resultados (para que la discriminacin sea ms rpida).
En cuanto al tamao del resumen, la norma da pautas pero advirtiendo que el
contenido del documento es ms significativo que las pautas para determinar
la extensin del resumen. De todas maneras la norma nos sugiere:

Monografas, informes, tesis: 500 palabras.

Artculos de revista, captulos de monografas: 250 palabras.

Comunicaciones breves: 100 palabras.


Ejemplo de resumen informativo
CONSUEGRA FERNNDEZ, Jess: El Ajedrez: evolucin y claves de un juego milenario.
En Mundo antiguo. Madrid: 2002. n 3-4, ao 1, p. 60-61.
Artculo divulgativo sobre el juego del ajedrez, estructurado segn sus orgenes, antigedad, expansin, variantes y simbolismo.
El origen del ajedrez es hind y el primer representante conocido es el Ghaturanga, aparecido entre el 3000 y el 2000 a.C. en Sri Lanka, aunque no aparece documentado hasta
el siglo VII d.C.
Del Ghaturanga proceden en cascada las diferentes variantes del ajedrez: de la India viaj
a Persia en el siglo VI d.C., donde pas de los 4 jugadores originales a 2 en la versin persa
Shatranj. Desde Persia se extendi hacia Occidente y hacia Oriente.
Hacia Occidente: paralela a la expansin rabe, el juego llega a la Pennsula Ibrica durante la Alta Edad Media, y desde aqu se expande al resto de Europa y al resto del mundo
en la poca de las colonizaciones.
Hacia Oriente: en la China, en el s. VII d.C., el ajedrez toma la forma del ajedrez chino
Xiang qi; en el Japn, el Shogi; en Indochina, el ajedrez birmano y tailands. Tanto en
Oriente como en Occidente, el ajedrez presenta innumerables variaciones locales.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

15

El tablero y las fichas parecen poseer un significado simblico. El tablero, con la alternancia de casillas blancas y negras, forma un mandala. El simbolismo de las fichas es
menos esotrico y ha ido cambiando segn los tiempos: obispos, elefantes, etc.
El autor concluye que el ajedrez, adems de un juego, es una herramienta educativa de
primer orden, casi una ciencia.
Como podis comprobar, este resumen tiene 237 palabras.

2)Resumenindicativo
Redactaremos slo las ideas centrales del documento. Su lectura no puede sustituir la lectura del original. Como su nombre sugiere, el resumen indicativo
presenta de forma abreviada y muy sinttica el contenido o la tipologa del
documento. Su extensin puede oscilar entre una frase o 4 lneas de texto.
Ejemplo de resumen indicativo
CONSUEGRA FERNNDEZ, Jess: El Ajedrez: evolucin y claves de un juego milenario.
En Mundo antiguo. Madrid: 2002. n 3-4, ao 1, p. 60-61.
Artculo divulgativo sobre el juego del ajedrez, trata de su origen hind, antigedad,
expansin histrica tanto en Oriente como en Occidente, variantes nacionales y simbolismo del tablero y las fichas.

3)Resumenselectivo
Redactaremos slo una parte concreta del documento. El ms habitual es el
resumen de conclusiones, pero tambin hay otros tipos, como la resea (review), que es un anlisis del documento con elementos crticos. Este tipo de
resumen se adapta muy bien a las necesidades de los usuarios, por ejemplo investigadores o tcnicos que necesitan un dato muy concreto sobre el objetivo
del documento o las conclusiones a las que llega.
Ejemplo de resumen selectivo
CONSUEGRA FERNNDEZ, Jess: El Ajedrez: evolucin y claves de un juego milenario.
En Mundo antiguo. Madrid: 2002. n 3-4, ao 1, p. 60-61.
El ajedrez, adems de un juego, es una herramienta educativa de primer orden, casi una
ciencia.
A modo de conclusin
Los resmenes ms habituales son el resumen informativo, el indicativo y el selectivo:

El resumeninformativo consigna el tema central, temas adicionales, naturaleza y


objetivo del documento, metodologa, resultados, conclusiones y anexos. La idea de
fondo es que un resumen informativo puede sustituir en ocasiones a la lectura del
documento original.

El resumenindicativo consigna slo las ideas centrales del documento. Su lectura


no puede sustituir a la lectura del original.

El resumenselectivo consigna slo una parte concreta del documento. El ms habitual es el resumen de conclusiones, pero tambin hay otros tipos, como la resea
(review).

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

16

Anlisis de contenido: resumen e indizacin

2.2. Resumen automtico

Una de las necesidades ms perentorias ante el aumento de informacin digital debido al crecimiento exponencial de Internet es manejar y filtrar el gran
volumen de informacin. Una de las soluciones aportadas por el PLN han sido los programas de resumen automtico, que actan sobre textos, imgenes,
webs y correo electrnico.
Los primeros en trabajar en el campo de la automatizacin de los resmenes
fueron Hans Peter Luhn en el ao 1958 y Edmundson en 1969, que aplicaron
tcnicas como la frecuencia de las palabras, o la posicin de una frase dentro
de un documento para redactar resmenes sin intervencin humana.

Hans Peter Luhn

A partir de estas primeras investigaciones se han perfeccionado muchas tcnicas diferentes basadas en conocimiento y recursos lingsticos (como las de
Lin y Hovy, 2002; Gotti et al., 2007) o basadas en mtodos estadsticos y de
aprendizaje automtico (Hirao et al., 2002; Svore, 2007) (autores citados en
Lloret et al., 2008; y Mateo et al., 2003).
ltimamente las investigaciones giran en torno al resumen multidocumento,
es decir, resumir ms de un documento (Goldstein et al., 2000; Qiu, 2007; Huo
y Chen, 2008) de contenidos afines o redundantes (autores citados en Lloret
et al., 2008; y Mateo et al., 2003).
Los resmenes automticos se conocen tambin como extracts. La terminologa anglosajona diferencia as los extracts y los abstracts. Los extracts son los
resmenes formados a partir de la extraccin de algunas frases del texto previamente seleccionadas por un programa, mientras que los abstracts son los
resmenes elaborados por una persona.

La base de todas las tcnicas de funcionamiento de un programa de


resmenes automtico es el cmputo de la frecuencia de las palabras.

Hay diversas herramientas para hacer estos clculos, por ejemplo WVTool. Se
trata de contar cuntas veces sale una palabra no vaca en el texto.

Lecturas
complementarias
Podis consultar los resultados de las investigaciones de
estos autores en los artculos
siguientes:
E.Lloret;O.Ferrndez;R.
Muoz;M.Palomar (2008).
Integracin del reconocimiento de la impliacin textual en tareas automticas de
resmenes de textos. Procesamiento del lenguaje natural,
n. 41, pg. 183-190.
P.L.Mateo;J.C.Gonzlez;
J.Villena;J.L.Martnez
(2003). Un sistema para resumen automtico de textos en
castellano.

Ved tambin
Encontraris una explicacin
detallada sobre las palabras vacas en el mdulo Indizacin
automtica y descriptores libres.

CC-BY-NC-ND PID_00143964

17

Anlisis de contenido: resumen e indizacin

Ejemplo de funcionamiento de un programa de resmenes automtico


(extrado de Lloret et al., 2008)
Tropical storm Gilbert formed in the eastern Caribbean and strengthened into a hurricane Saturday night. There were no reports of casualties.
Oracin 1:

Tropical (2) storm (6) Gilbert (7) formed (1) in (0) the (0) eastern (1) Caribbean (1) and (0) strengthened (1) into (0) a (0) hurricane (7) Saturday (4)
night (2).

Oracin 2:

There (0) were (0) no (0) reports (1) of (0) casualties (1).

Lo primero que vemos es que las palabras vacas, es decir, las palabras que no tienen
significado (preposiciones, artculos, verbos) no se computan.
Al lado de cada palabra con significado vemos el nmero de veces que sale en todo el texto. Se suman los valores, de manera que la oracin 1 tiene 3,2 puntos y la oracin 2, 0,2.
El programa seleccionar la frase 1 como ms representativa para el resumen automtico.

Este sistema de resumir a partir de las frases con las palabras ms significativas
en el texto parece simplista pero tiene cierta justificacin. Segn Kupiec et al.
(1995) aproximadamente el 80% de las frases en resmenes humanos estn
copiadas literalmente o con pequeas modificaciones del texto original.
A partir de esta base estadstica se incorporan otras tcnicas para dotar al programa de ms conocimiento y paliar la escasa coherencia del resultado, como
puede ser, por ejemplo, la resolucin de la anfora o aplicar programas (por
ejemplo, WordNet) que proporcionen relaciones como las de sinonimia o hiperonimia, o mecanismos para detectar y eliminar la redundancia.
Definimos brevemente qu son las anforas y la hiperonimia:
a) Las anforas son la relacin de referencia entre un elemento lingstico y
otro anterior en el discurso.
b) Decimos que una palabra es hipernima cuando tiene un campo significativo que incluye otro de menor extensin.
Los expertos consideran que la tecnologa actual no tiene problemas para detectar las frases con ms significado, pero s para ordenarlas segn su importancia.
Los programas funcionan a grandes rasgos de la siguiente manera: se copia

Anfora
El Saln del Hobby ha tenido
ms de 60.000 visitantes este
ao. Este saln se ha convertido en la feria de ocio familiar
ms visitada.
En este ejemplo, la anfora se
da en este saln, que hace
referencia al Saln del Hobby,
expresado en la frase anterior.
Como se puede comprobar, si
en el resumen automtico aparece slo la segunda frase, el
lector no sabr a qu saln hace referencia.

el texto a resumir o bien se escribe la direccin del documento. Se escoge el


tipo de documento (acadmico, periodstico, etc.) y el tanto por ciento de
reduccin del texto.
A continuacin tenis unos cuantos programas de los ms conocidos:

Hiperonimia
Color es un hipernimo. Su
contrario es hipnimo: amarillo, naranja, verde son hipnimos.

CC-BY-NC-ND PID_00143964

Connexor

Daedalus

Extractor

FociSum

InTEXT (Dynamic Summarizing)

Inxight Summarizer

IslandInText

K-Site de Daedalus

Pertinence Summarizer

Sinope Summarizer

Summarizer

SweSum2

System Q

TextAnalyst

Trestle

18

El programa K-Site de Daedalus


De entre los programas de resumen automtico mencionados, veamos el funcionamiento
del programa K-Site de Daedalus. Este programa tiene cinco mdulos:

Mdulo1:Anlisismorfosintctico. En este mdulo se determina la categora lxica de cada palabra: sustantivo, verbo, adjetivo, artculo, preposicin, etc. Tambin se
determina el lema. Estas operaciones permiten distinguir las palabras con significado
(sustantivos, adjetivos, verbos) de las vacas (artculos, preposiciones, pronombres,
etc.). El lema permite agrupar todas las palabras que son flexiones de otra (info/informar/informacin/informador/informacional/etc.). El producto final es un listado
con las palabras puntuadas y un listado de frases candidatas.

Mdulo2:Ponderacindefrases. Este mdulo recibe las palabras etiquetadas por


el mdulo anterior, y su funcin es escoger entre todas las frases candidatas. Para
hacerlo se ayuda de diversos submdulos que ponderan las frases segn los parmetros siguientes: la frecuencia, la presencia de palabras indicativas (buscan palabras
como importante, esencial, conclusiones, etc.), buscan frases que contengan palabras
que aparezcan en el ttulo, o que tengan nombres propios, o que la tipografa sea
destacada (negritas, cursivas, tamao superior, etc.) y seleccionan frases que aparezcan en posiciones destacadas en el texto (al principio de cada prrafo, al final a modo
de conclusin).

Mdulo3:Deteccindeanforas. Una vez tiene las frases seleccionadas, puede ser


que se d el caso de anforas mal resueltas (una frase contiene una anfora que se
encontraba en la frase previa y que no ha sido seleccionada). El programa busca las
anforas (especialmente los demostrativos pronominales o pronombres personales,
por ejemplo este, aquel, lo que, eso) y su posicin en la frase: al principio, entre las seis
primeras palabras, en otras posiciones.

Mdulo4:Seleccindefrases. Este mdulo computa toda la informacin recogida


en las fases anteriores: frases candidatas, puntuaciones, deteccin de anforas. Selecciona las frases candidatas de puntuacin ms alta hasta llegar al tanto por ciento
pedido por el usuario. Si entre estas frases hay alguna que contenga una anfora, se
selecciona la frase anterior (que contiene la palabra a la cual se est haciendo referencia) siempre y cuando forme parte de las frases candidatas y no sobrepase la longitud
del resumen.

Mdulo5:Postprocesadodelextracto. Su funcin es detectar expresiones que conectan partes del texto, ya sea para mostrar causalidad, contraposicin, etc. Son expresiones del tipo por lo tanto, en contra, etc. Como en el caso de las anforas, si forman parte de una frase seleccionada, se procura incluir en el resumen la frase con la
cual estn relacionadas.

Anlisis de contenido: resumen e indizacin


(2)

Podis practicar con el programa


Swesum, que es gratuito y traduce
al espaol.

CC-BY-NC-ND PID_00143964

19

Por ltimo, debemos recordar que algunos procesadores de textos, como Microsoft Word, tambin ofrecen esta opcin (Autosummarize o Auto-resumen).
A modo de conclusin

Los resmenes automticos (extracts) son una de las soluciones aportadas por el PLN
para hacer frente al manejo de grandes volmenes de informacin en lnea.

Los primeros en trabajar en el campo de la automatizacin de los resmenes fueron


Hans Peter Luhn en el ao 1958 y Edmundson en 1969.

Las tcnicas han evolucionado de los primeros cmputos sobre la frecuencia de las
palabras, o la posicin de una frase dentro de un documento, a las tcnicas basadas
en conocimiento y recursos lingsticos o en mtodos estadsticos y de aprendizaje
automtico.

La base de todas las tcnicas es el cmputo de la frecuencia de las palabras. A partir


de esta base estadstica, se incorporan otras tcnicas para dotar al programa de ms
conocimiento y paliar la escasa coherencia del resultado, por ejemplo la resolucin de
la anfora o se aplican programas que proporcionen relaciones como las de sinonimia
o hiperonimia o mecanismos para detectar y eliminar la redundancia.

Los expertos consideran que la tecnologa actual no tiene problemas para detectar las
frases con ms significado, pero s para ordenarlas segn su importancia.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

20

Anlisis de contenido: resumen e indizacin

3. La indizacin

Indizar es la accin de describir o identificar un documento con relacin a su contenido.


Norma UNE 50-121-91.

Indizar es el resultado de examinar el documento, seleccionar los conceptos y almacenarlos en una base de datos.

Esta definicin implica tres acciones, de las cuales la ms significativa es la


seleccin de los conceptos y su traduccin al lenguaje documental.
Al igual que se ha tratado en el resumen, la indizacin la puede realizar una
persona o un programa.
Si la indizacin es intelectual, es decir, la llevan a cabo personas, estas personas
pueden ser:

Profesionales (documentalistas), que llevan a cabo la tarea de indizacin

Ved tambin
La indizacin se estudia en los
mdulos Sistemas de clasificacin documentales, Listas
de encabezamientos y listados
de autoridades, Los tesauros y Listado de descriptores
libres y listado de palabras clave.

de manera individual o en equipo. A su vez, los equipos pueden indizar


de manera centralizada o coordinada.

Amateurs (usuarios de Internet que indizan de manera social o tagging


por ejemplo, en Delicious).

Ved tambin
La forma de indizar de los
equipos se trata en el apartado
5 del mdulo La cadena documental de esta asignatura.

El elemento humano permite un anlisis ms rico del documento, captando


conceptos y matices que un programa no llegara a detectar, pero tiene el inconveniente del tiempo que se tiene que dedicar y la coherencia entre indizadores.
La indizacin automtica se realiza a travs de un programa informtico. Su
funcionamiento es muy sencillo: extrae del ttulo, resumen o texto completo
las palabras ms significativas. Es un mtodo econmico y muy rpido.
3.1. Lenguaje natural y lenguaje documental
Para indizar necesitamos los lenguajes documentales. Qu diferencia hay entre el lenguaje natural y el documental?

Ved tambin
La indizacin automtica se estudia en el mdulo Listado de
descriptores libres y listado de
palabras clave.

CC-BY-NC-ND PID_00143964

21

Anlisis de contenido: resumen e indizacin

Por lenguajenatural entendemos el lenguaje que usamos de forma cotidiana: cataln, castellano, vasco, gallego, francs, etc.
Por lenguajedocumental entendemos el listado o vocabulario de trminos que usamos para indizar y que puede estar en formato libre o
controlado.

Y por qu hay que controlar los trminos del lenguaje natural? Porque el lenguaje natural es ambiguo, los conceptos se pueden representar de formas diversas, dando lugar a problemas de recuperacin. El lenguaje natural es rico en
terminologa, en formas (plurales y singulares), tiempos verbales, acrnimos,
sinnimos, polisemias, etc.
La principal diferencia entre el lenguaje natural y el documental controlado es
precisamente el control terminolgico, que permite representar los conceptos
de forma unvoca, sin ambigedades.
Para ser ms concretos, las diferencias se dan en el nmero de trminos del
vocabulario, el control de las formas, el control del significado y las relaciones

La riqueza del lenguaje


natural
Ejemplos de sinnimos del
mismo concepto: Cosmos
/ Universo / Infinito / Firmamento / Cielo.
Ejemplo del mismo concepto en formas diferentes, siglas o frases, y en idiomas
diferentes: OTAN / NATO /
Organitzaci del Tractat de
lAtlntic Nord / Organizacin del Tratado del Atlntico Norte / North Atlantic
Treaty Organization.
Ejemplo de polisemia: Banco / Planta / Carta / Sierra /
Estrella / Lengua / Capital.

de significado entre trminos.


3.1.1. Nmero de trminos

Los lenguajes documentales son entrpicos (Blanca Gil, 2004, pg. 20),
es decir, tienden a la seleccin, a la restriccin del vocabulario. Es el
proceso contrario del lenguaje natural, que tiende a la abundancia, a la
reiteracin de conceptos, a la sinonimia en beneficio de una expresin
ms rica.

Los lenguajes documentales reducen considerablemente el nmero de trminos del lenguaje natural, ya que slo tienen en consideracin los sustantivos
y algunos sintagmas nominales, pero no adjetivos, preposiciones, conjunciones, adverbios, verbos, etc. Adems, entre todos los sustantivos, escogen uno
que representar al resto cuando el significado sea el mismo. Y entre diversas
formas aceptadas por el mismo trmino, slo una ser la aceptada, como es
el caso de las siglas.
Los lenguajes documentales son en esencia sencillos, su eficacia aumenta a
medida que las reiteraciones y la redundancia son controladas en una nica
forma que rene conceptos afines.

Univocidad
La univocidad consiste en representar un concepto con un
nico trmino.

22

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

3.1.2. Control de las formas

Los lenguajes documentales controlan las formas plural/singular, el uso


de acrnimos y siglas y la construccin de las frases, y de esta manera
establecen unos modelos.

Ejemplo
Modelo

Ejemplo

Sustantivo

Pintura

Sustantivo + adjetivo

Pintura medieval

Sustantivo + preposicin + sustantivo

Pintores de vitrales

Estas reglas gramaticales y sintcticas unifican las palabras seleccionadas y las

Ved tambin

frases.

Los mejores ejemplos se ven


en los mdulos Listas de encabezamientos y listados de
autoridades y Los tesauros.

Ejemplos en las listas de encabezamientos de materia

Se acostumbra a usar el singular para expresar conceptos abstractos. As, por ejemplo,
es solidaridad y no solidaridades.

No se permite el uso de siglas; se prefiere la expresin entera del concepto y en la


3

lengua del servicio de informacin y documentacin (SID ). Por ejemplo, Organizacin del Tratado del Atlntico Norte.

Es preferible la expresin natural del concepto compuesto, y no su forma inversa. Es


correcto Objetos de arte, y no Arte, objetos de.

3.1.3. Control del significado


Los problemas ms importantes en cuanto al significado son la sinonimia y
la polisemia.
a)Sinonimia: decimos que las palabras son sinnimas cuando tienen el mismo significado. En un sistema documental, si no se controlan y se usan indiscriminadamente, comportan silencio documental. En el caso de alimento,
nutriente, comida, provisin, el usuario puede estar buscando por alimento
y no recuperar documentos porque se encuentran indizados con otras formas,
como nutriente. La solucin de los lenguajes controlados es recoger todos
los trminos sinnimos y seleccionar uno para representar a todo el conjunto
de trminos que tienen el mismo significado, porque dos sinnimos son sustituibles el uno por el otro en cualquier contexto.

(3)

SID es la sigla de servicio de informacin y documentacin.

CC-BY-NC-ND PID_00143964

23

Ejemplo
Una lista de encabezamientos de materia como la del Consejo Superior de Investigaciones
Cientficas (CSIC) recoge todos estos sinnimos:

Hispanoamericanos.
Iberoamericanos.
Latinoamericanos.
Sudamericanos.

Pero slo da como trmino aceptado Latinoamericanos. Si al SID4 llegara un documento titulado Los sudamericanos del siglo XX, el analista lo indizara como Latinoamericanos, ya que es el trmino aceptado.

b)Polisemia: decimos que dos palabras son polismicas cuando el mismo signo lingstico, palabra o sonido tiene ms de un significado. Habitualmente el
contexto de la conversacin o lectura donde est insertada la palabra deshace
los problemas de ambigedad, pero una palabra polismica introducida en un
sistema documental, sin el contexto, puede dar lugar a ruido documental.
Ejemplo
Un usuario puede estar buscando sobre columnas en arquitectura y recuperar datos sobre
columnas tipogrficas de diarios. Los lenguajes documentales controlan la polisemia diferenciando cada significado con parntesis, usando el plural o el singular, adjetivando,
etc.

Un tipo de polisemia es la homonimia. La diferencia entre ellas radica en la


etimologa de la palabra. Si la etimologa de las dos palabras es la misma, hablamos de polisemia; si la etimologa es diferente, hablamos de homonimia.
Ejemplos de polisemia y homonimia
Mismaetimologa=polisemia
La polisemia se da cuando una palabra tiene un nico origen etimolgico y acaba teniendo significados diferentes sin cambiar su categora gramatical: por ejemplo, no pasa
de sustantivo a verbo, como pasa en castellano entre el vino (bebida) y el vino (verbo
venir). Es una palabra que con el tiempo ha ido adquiriendo diferentes significados, pero
aun as, todos guardan entre s una relacin de significado; por ejemplo, en cataln y
castellano fulla/hoja, que viene del latn folia, tiene diversos significados, como hoja de
una planta, hoja de metal de una herramienta, pgina de un libro, cada una de las partes
de una puerta doble o ventana, etc. Y en todos los significados lleva implcita la idea de
una lmina.
Si queremos saber si una palabra es gramaticalmente polismico, basta con consultar un
diccionario etimolgico y ver si proviene de un mismo origen. Encontraremos la palabra,
un nico origen y una lista de diferentes significados. En castellano podemos consultar
el Diccionario de la Real Academia.
Ms ejemplos de polisemia:

Servicio, del latn servitium, que ha dado lugar a oficios religiosos, lavabos, misiones
militares, cubiertos para comer y, en deportes, poner la pelota en juego. Y en todos
ellos permanece la idea de ser til.

Crucero, del latn crux, significando cruz, interseccin entre las dos naves de una
iglesia, encargado de llevar la cruz a la cabeza de una procesin, viaje de placer por
el mar, etc. En estos significados la idea es la de la forma de cruz, el cruzar como ir
de un extremo a otro.

Columna, del latn columna, que usamos para referirnos a los pilares arquitectnicos,
las partes verticales de una pgina impresa de un diario, en fsica la forma que adoptan

Anlisis de contenido: resumen e indizacin


(4)

A partir de ahora denotamos servicios de informacin y documentacin con la sigla SID.

CC-BY-NC-ND PID_00143964

24

algunos fluidos, como columnas de humo, en el mbito militar, la formacin de


barcos o soldados. Y la idea que permanece es la de verticalidad.
Diferenteetimologa=homonimia
La homonimia se da cuando dos conceptos han llegado a tener el mismo nombre, la
misma forma, pero vienen de orgenes diferentes y, por lo tanto, tienen etimologas diferentes.
Por ejemplo, metro puede ser el transporte urbano, una unidad de medida o el utensilio
para medir. Pero el origen etimolgico entre el transporte y los otros dos significados es
evidente: el primero es una abreviacin de la palabra inglesa metropolitan, y en el segundo
caso viene del griego y significa medida.
Otro ejemplo: la palabra castellana botn puede venir del latn bota y significar calzado
hasta el tobillo, o puede venir del alemn bytin y significar premio de una conquista.
En castellano y cataln este fenmeno es menos frecuente que en otras lenguas, como el
ingls o el francs, en las que abundan las palabras homnimas que dan mucho juego
en los chistes.
Dentro de la homonimia podemos diferenciar las palabras que escribindose igual tienen
significados diferentes, llamadas homgrafas, como las anteriores metro o botn, de las
palabras que sonando igual tambin tienen significados diferentes, conocidas como palabras homfonas: vell/bell en cataln, o tubo/tuvo en castellano.

En resumidas cuentas, la sinonimia provoca silencio documental y la


polisemia y variantes provocan ruido documental. El control terminolgico del vocabulario garantiza el criterio de univocidad que tienen que
tener los lenguajes documentales controlados, segn el cual un concepto se representa con un trmino y un trmino slo puede tener un significado.

3.1.4. Relaciones de significado de los trminos

Por relacionesdesignificado entendemos la relacin de genrico, especfico o relacionado que puede tener un trmino con respecto a otro.

En el lenguaje natural estas relaciones son implcitas. Por ejemplo, cuando hablamos de manzanas todos entendemos que se trata de una fruta fresca y que
las Fuji y las Golden son variedades concretas. Es decir, situamos el trmino
manzana dentro de una jerarqua de trminos conceptualmente ms genricos (fruta) y ms especficos (Golden, Fuji). Incluso podemos relacionar por
asociacin de ideas la manzana con otras frutas, como la naranja o el pltano.
Pero en un lenguaje documental hay que definir estas relaciones, agrupando
y relacionando los trminos afines.
La estructura que relaciona los trminos es implcita en el lenguaje natural,
pero en los lenguajes documentales hay que hacerla explcita. Eso se puede
hacer de dos maneras:

Anlisis de contenido: resumen e indizacin

25

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

a) En una secuencia jerrquica, donde la propia posicin del concepto ya define sus trminos genricos y especficos. Tambin deshace problemas de significado.
Ejemplo de la pesca
Ved el ejemplo de la pesca extrado de la Clasificacin Decimal Universal (CDU). El concepto pesca puede ser la actividad econmica o la pesca como deporte. Si nos fijamos en
la cadena jerrquica vemos que cada uno cuelga de una clase diferente:
6 Ciencias aplicadas. Medicina. Tecnologa
63 Agricultura y ciencias relacionadas
639 Caza. Pesca
7 Bellas artes. Juegos. Deportes
79 Diversiones. Espectculos. Juegos
799 Caza deportiva. Pesca deportiva.

b) En una presentacin alfabtica donde cada trmino se acompaa de todos


sus trminos relacionados, ya sean equivalentes, genricos, especficos o relacionados.
El tesauro del CSIC
En el tesauro de Psicologa del CSIC, consultamos Sueos y encontramos:
Sueos
TG Dinmica de la personalidad
TE Contenido del sueo
TE Pesadilla
TR
TR
TR
TR
TR

Dj vu
Interpretacin de los sueos
Sueo fisiolgico
Sueo REM
Trastornos de conciencia

Las siglas nos informan del tipo de relacin que establecen: TG significa trmino genrico (por encima de Sueos el tesauro tiene Dinmica de la personalidad), TE son los
trminos especficos (son trminos especficos de Sueos: Contenido del sueo, Pesadilla) y los TR son los trminos relacionados (se relacionan con Sueo, Dja vu, la
Interpretacin de los sueos, el Sueo REM, etc.).

Finalmente, las principales ventajas e inconvenientes del lenguaje natural y


el documental controlado son:
Ventajas e inconvenientes de los lenguajes documentales
Ventajas

Inconvenientes

Lenguajenatural

Amigable
Actualizado
Econmico

Lenguajedocumentalcontrolado

Unvoco
Caro
Facilita la bsqueda Poco actualizado

Dificulta la bsqueda
Poco preciso

A modo de conclusin
Indizar es la accin de describir o identificar un documento en relacin con su contenido.

CC-BY-NC-ND PID_00143964

26

Anlisis de contenido: resumen e indizacin

La indizacin la puede realizar una persona (de forma centralizada o de forma coordinada) o un programa.
Por lenguaje natural entendemos el lenguaje que usamos de forma cotidiana (cataln,
castellano, vasco), y por lenguaje documental entendemos el listado o vocabulario de
trminos que usamos para indizar y que puede estar en formato libre o controlado. La
principal diferencia entre el lenguaje natural y el documental controlado es el control
terminolgico:

El control del nmero de trminos del vocabulario: los lenguajes documentales son
entrpicos, tienden a la seleccin, a la restriccin del vocabulario.

El control de las formas: los lenguajes controlados, controlan las formas plural/singular, el uso de acrnimos y siglas y la construccin de las frases.

El control del significado: los lenguajes controlados controlan la sinonimia y la polisemia. Decimos que las palabras son sinnimas cuando tienen el mismo significado.
Decimos que dos palabras son polismicas cuando el mismo signo lingstico tiene
ms de un significado. La sinonimia provoca silencio documental y la polisemia y
variantes provocan ruido documental. El control terminolgico del vocabulario garantiza el criterio de univocidad que tienen que tener los lenguajes documentales
controlados, segn el cual un concepto se representa con un trmino y un trmino
slo puede tener un significado.

Las relaciones de significado entre los trminos son las relaciones de genrico, especfico o relacionado que puede tener un trmino con respecto a otro. En el lenguaje
natural estas relaciones son implcitas pero en los lenguajes documentales hay que
hacerlas explcitas a travs de una secuencia jerrquica o una presentacin alfabtica.

3.2. Cmo se indiza?


Ahora que ya hemos visto la necesidad de contar con lenguajes documentales
para paliar la ambigedad del lenguaje natural, estamos en condiciones de
preguntarnos por el proceso de indizacin que lleva a cabo un analista.
A continuacin presentamos las fases que proponen diversos autores antes de
llegar a la que nos servir como marco de referencia en este subapartado:

Dos fases: anlisis del texto y traduccin (Chaumier, 1988; Fidel, 1994).

Tres fases: anlisis del texto, identificacin de conceptos y traduccin


(Amat, 1989; Norma UNE 50-121-91).

Cuatro fases: anlisis del texto, identificacin de conceptos, traduccin y


establecer enlaces sintcticos entre descriptores (Slype, 1991).

Cinco fases: registro de datos, anlisis del texto, identificacin de conceptos, traduccin y examen de la indizacin.

En este mdulo seguiremos la normaUNE50-121-91 y sus tres etapas:


1) Examinar el documento para identificar su contenido.
2) Seleccionar los conceptos principales del contenido.
3) Traducir a un lenguaje documental.

Norma UNE 50-121-91


UNE50-121-91. Mtodos para
el anlisis de documentos, determinacin de su contenido y
seleccin de trminos de indizacin.

27

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

Ejemplo
Examinamos un libro titulado Mitos de antiguas civilizaciones. Leemos el ttulo, el resumen, el sumario, etc.
En una segunda etapa seleccionamos como conceptos principales: Mitos, Grecia, Roma,
India, Japn, Indios norteamericanos.
En la tercera etapa indizamos. Si indizamos con un lenguaje libre podemos escribir el
trmino como deseamos o como salga en el texto. Por ejemplo:
Mitologa india americana.
En cambio, si indizamos con un lenguaje controlado tendremos que traducir estos conceptos a una forma controlada. Pongamos por ejemplo que pensbamos indizar Mitologa india americana. Veamos cmo quedara en tres lenguajes documentales diferentes:
CDU
LEMAC
LEM del CSIC

259.2
Mitologia amerndia
Indios de Amrica - Religin y mitologa

A continuacin se detalla cada parte del proceso.


1)Examendeldocumentoeidentificacindelosconceptos
El analista tiene que examinar con precisin el documento. La lectura completa es, a menudo, impracticable, pero s que tiene que prestar atencin al
ttulo, resumen, sumario, introduccin, ilustraciones y palabras o frases destacadas en una tipografa diferente.
No se recomienda la indizacin slo a partir del ttulo, ya que hay ttulos que
llevan a error, y tampoco confiar en que el resumen sea un sustituto del texto,
ya que no todos los resmenes estn bien elaborados.
Ejemplo de ttulos y resmenes que no aportan datos significativos para la
indizacin

CHESNEAUX, Jean. Hacemos tabla rasa del pasado? Mxico: Siglo XXI Editores 1981.
Su materia es Historia, historiadores, historiografa. En el catlogo de la Biblioteca Nacional de Espaa (BNE5) lo encontramos indizado como Historia.

MALLOL, Tomas. Si la memria no em falla. Girona: CCG Ediciones 2005.


Su materia es Memorias, cine, coleccionismo. En la Biblioteca de Catalunya (BC6) lo
encontramos indizado como Cine amateur.

Si recordamos el resumen del libro de Carl Sagan, Cosmos, nos daremos cuenta de que
no era suficiente para indizar el contenido de la obra. Por estos motivos se recomienda
una lectura gil del resto de partes significativas del documento.

2)Seleccindelostrminosdeindizacin
Tal como dice la norma UNE, el analista tiene que identificar las nociones que
son elementos esenciales de la descripcin del contenido. Si la indizacin es
compartida, la institucin que la patrocina tiene que establecer claramente los
factores que considera importantes.

(5)

BNE es la sigla de Biblioteca Nacional de Espaa.


(6)

BC es la sigla de Biblioteca de Catalunya.

Ved tambin
Recordad que el ejemplo del
resumen del libro de Carl Sagan, Cosmos, sala en el apartado 2 de este mdulo.

CC-BY-NC-ND PID_00143964

28

Para seleccionar los conceptos del documento, el analista tiene que ser consciente del nmero de conceptos (criterio de exhaustividad) y de la exactitud
de los mismos (criterio de especificidad).
a)Exhaustividad
A medida que el analista va leyendo, tiene que ir tomando nota de los conceptos interesantes del documento.
Una buena praxis es la que identifica los conceptos relevantes sobre:

El tema.

Los nombres personales que puedan ser interesantes de indizar.

Los nombres geogrficos.

Las fechas cronolgicas.

La forma en que se presenta el documento: artculo, estadstica, formulario


o divulgacin, cientfico, etc.

La exhaustividad es un criterio relacionado con el nmero de conceptos que


se tienen en cuenta para caracterizar el contenido entero de un documento.
El principal criterio de seleccin es el valor potencial del concepto para los
usuarios de su SID.
Podemos distinguir entre una exhaustividad baja, media y alta en funcin del
nmero de descriptores. Es en este entorno donde la norma UNE 50-121-91
da sus recomendaciones en cuanto a la exhaustividad. Los criterios que el indizador tiene que tener en cuenta son:

El tipo de SID y perfil de usuario. No es lo mismo indizar para una base de


datos genrica que para una especfica.

El tipo de documento. No se indiza con el mismo nmero de descriptores


una monografa que un artculo de revista, una tesis, etc.

Tal como recomienda la norma UNE, no es conveniente ser estrictos con el


nmero de trminos, no se tiene que limitar el nmero de forma arbitraria,
tipo para una monografa dos trminos de indizacin, ya que puede conducir a una prdida de objetividad y a una deformacin de la informacin. Es
preferible sugerir un baremo, entre tantos y tantos trminos para cada tipo
documental y SID y ser flexibles, ya que los criterios que tienen que regir son
el propio contenido del documento y su posterior recuperacin.
Ejemplo
Cuervo Herrero, C.; Fernndez Gonzlez, A.: Objetos celestes errneos. Tribuna de Astronoma y Universo. Revista de Astronoma, Astrofsica y Ciencias del espacio. 2000. II poca,
n 16 octubre. p. 36-40.
A partir del siguiente resumen informativo, elaboraremos tres tipos de indizaciones sugiriendo un baremo (para esta asignatura y sus prcticas) y una finalidad:

Anlisis de contenido: resumen e indizacin

29

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

Anlisis y descripcin de los errores ms frecuentes que cometen los profesionales y aficionados a la fotografa astronmica mientras intentan descubrir nuevos objetos celestes
todava no identificados.
Estos errores son debidos a cuatro causas: errores en el proceso de positivado de la copia
como consecuencia de la presencia de partculas de polvo en los negativos o en las lentes
del equipo de laboratorio; errores en el negativo debidos a defectos de lavado, deficiencias en la emulsin, rayas y rasguos o por el uso de pelculas de color destinadas a ser
forzadas, y errores en las lentes de los objetivos, debidos a efectos de distorsin y a alteraciones en la refraccin. Finalmente se describen otras causas: reflejos de la luz del sol
sobre las antenas de satlites artificiales Iridum, retoques digitales o de fotocopiadoras y
duplicadoras, uso de objetivos sencillos y poco potentes para captar imgenes de cielo
profundo y, en ltimo trmino, oscilaciones del condensador de luz del microscopio.
Todos estos errores pueden dar lugar a imgenes falseadas: objetos inditos, dimetros
errneos, efectos de redondeo, alineaciones planetarias errneas, etc. El artculo facilita
imgenes de estos errores fotogrficos.
Los autores concluyen que hace falta ser cauteloso y hacer las oportunas comprobaciones
antes de dar a conocer el descubrimiento de un nuevo objeto celeste a las sociedades
astronmicas.
Ejemplo de los tres grados de exhaustividad
Exhaustividad baja

Exhaustividad media

Exhaustividad alta

Baremo1-3

Baremo4-6

Baremo7...

Ejemplo de uso: catlogo de una biblioteca pblica

Ejemplo de uso: bases de datos de una bi- Ejemplo de uso: bases de datos de una biblioteca especializada en astronoma
blioteca especializada en astrofotografa

Errores fotogrficos
Fotografa astronmica

Astrofotografa
Errores fotogrficos
Descubrimientos
Identificacin de objetos celestes
Objetos errneos

b)Especificidad
La especificidad est relacionada con la exactitud en que un concepto particular que aparece en un documento est representado por un trmino de indizacin.

Alineaciones planetarias
Defectos de lavado
Deficiencias de la emulsin
Dimetros errneos
Efectos de redondeo
Errores en el negativo
Errores en el positivado
Errores en las lentes
Objetos inditos
Objetivos
Oscilaciones del microscopio
Partculas de polvo
Rayadas
Reflejos del sol
Retoques digitales

30

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

Ejemplo
Si en el texto que estamos indizando aparece el concepto Diplomacia, y este trmino aparece en el lenguaje documental controlado, tenemos que indizar Diplomacia. Si indizamos Relaciones internacionales o Embajadores no estaremos siendo especficos,
como podis ver en la tabla siguiente:
Ejemplo de especificidad
Materia Correcto,yporlo
tanto:

Diplomacia

Incorrectopor:

Especfico

Genrico

Demasiado
especfico

Diplomacia

Relaciones internacionales

Embajadores

Los conceptos se tienen que identificar de la manera ms especfica posible,


pero en determinados casos se pueden preferir nociones ms genricas:

Cuando el indizador considere que un exceso de especificidad puede ser


negativa en la recuperacin; por ejemplo, puede decidir que un modelo
muy especfico de una mquina se indice con el nombre ms genrico de
este tipo de mquinas.

Cuando la idea no est plenamente desarrollada en el documento, o slo


se haga alusin a ella.

Cuando se est a la espera de validar el trmino ms especfico.

3)Traduccinaunlenguajedocumentalcontrolado
Para traducir el concepto inicial escrito en lenguaje natural a un lenguaje documental, el indizador tiene que consultar las listas del lenguaje buscando la
forma correcta de introducir el concepto.
Ejemplos
Conceptotalcomosaleeneltexto

Traduccin

Lenguajedocumentalutilizado

Tragicomdia

791.221.28

Classificacin Decimal Universal (CDU)

Eoltic

Edat de la pe- Lista de encabezamientos de materia en


dra
cataln

Matriz

tero

Lista de encabezamientos del CSIC

Monarqua absoluta

Absolutismo

Tesauro de Historia contempornea del


CSIC

Cuando el analista procede a traducir el concepto del texto se puede encontrar en las
siguientes situaciones:

CC-BY-NC-ND PID_00143964

31

Anlisis de contenido: resumen e indizacin

a) Encuentra el concepto, solo o repartido por las tablas:

Consulta el lenguaje y encuentra el concepto a la primera. Entonces indiza con este


trmino de indizacin. Por ejemplo, buscaba Eoltic y encuentra que tiene que
indizar Absolutismo.

Consulta el lenguaje y encuentra el concepto o las partes del concepto repartidos


por el lenguaje. Entonces tiene que conocer las reglas de combinacin de las partes
integrantes del trmino de indizacin. Ejemplos:
Una notacin con CDU como 391.91(961.3) Tatuajes de la isla de Samoa est
formada por 2 elementos, tatuajes + Samoa. Estos elementos van colocados en
un orden determinado por las reglas de precoordinacin de la CDU (primero la
clase principal + auxiliar).

Un encabezamiento construido con la LEM del CSIC como Agua-Aspectos econmicos est formado por dos partes: Agua + Aspectos econmicos, que es un
encabezamiento y un subencabezamiento respectivamente y van en este orden.

Con los lenguajes tesauros y listado de autoridades no hay una sintaxis de combinacin.
b) No encuentra el concepto:

Consulta el lenguaje y no encuentra el concepto. Entonces el indizador tiene que


conocer las obras de referencia que su SID considera como autoridades reconocidas en
la materia. Estas obras de referencia son diccionarios, enciclopedias, otros lenguajes
documentales (especialmente los tesauros construidos de acuerdo con las normas ISO
y UNE 50-106 y UNE 50-125), atlas, etc.

Hay lenguajes, como tesauros, donde el indizador tiene que proponer el trmino
nuevo como descriptor candidato y esperar a que la direccin del tesauro lo valide
como descriptor. Mientras tanto indiza con un trmino ms genrico.

3.3. Calidad y coherencia de la indizacin


La calidad y la coherencia de la indizacin dependen de factores como la
competencia del indizador y la calidad de los instrumentos o lenguajes documentales. La coherencia es un factor importante en el comportamiento de un
sistema de indizacin, especialmente cuando forma parte de una red de centros y la informacin se tiene que intercambiar entre ellos.
La coherencia se calcula de la siguiente manera: dos analistas indizan el mismo documento, con un lenguaje de descriptores como un tesauro. Se cuentan
separadamente el nmero de descriptores idnticos entre los dos analistas sobre el total de descriptores.
Ejemplo
Como ejemplifica van Slype:

El documentalista 1 ha asignado los descriptores A, B, C, D, E, F.


El documentalista 2 ha asignado los descriptores A, C, D, F, G, H.
Hay 4 descriptores idnticos A, C, D, F y un total de 8 descriptores diferentes. Tasa de
coherencia = 4/8 = 50% (van Slype, 1991, p. 123).

La consistencia en la indizacin suele oscilar entre el 20% de mnima y el 60% de mxima


(Isidoro Gil, 2001).
A modo de conclusin
La norma UNE 50-121-91 Mtodos para el anlisis de documentos, determinacin de su contenido y seleccin de trminos de indizacin establece tres fases:

Lectures
complementaries
Podis ampliar la informacin sobre la coherencia en
la indizacin leyendo las
obras siguientes:
G.vanSlype (1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin
en los sistemas documentales.
Madrid: Pirmide. Fundacin
Germn Snchez Ruiprez.
Biblioteca del Libro.
I.GilLeiva (2001).

CC-BY-NC-ND PID_00143964

32

Examinar el documento para identificar su contenido: el analista tiene que examinar


con precisin el documento. La lectura completa es a menudo impracticable, pero s
que tiene que prestar atencin al ttulo, resumen, sumario, introduccin, ilustraciones y palabras o frases destacadas en una tipografa diferente.

Seleccionar los conceptos principales de los contenidos: el analista tiene que identificar las nociones que son elementos esenciales de la descripcin del contenido, tiene
que ser consciente del nmero de conceptos (criterio de exhaustividad) y la exactitud
de los mismos (criterio de especificidad).

Traducir a un lenguaje documental: para traducir el concepto inicial escrito en lenguaje natural a un lenguaje documental hay que consultar el listado del lenguaje
buscando la forma aceptada.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

33

4. Los lenguajes documentales

Un lenguajedocumental es un vocabulario de trminos en lenguaje


natural o un sistema artificial de signos normalizados que facilitan la
representacin del contenido de los documentos.

Sus funciones principales son indizar el contenido de los documentos y permitir la recuperacin a partir del campo materia.
Hay seis lenguajes documentales:

Los sistemas de clasificacin.

Los listados de encabezamientos de materia.

Los listados de autoridades.

Los tesauros.

Los listados de descriptores libres.

Los listados de palabras clave.

En teora todos los documentos se pueden indizar con cualquiera de estos seis
lenguajes, pero en la prctica la tipologa del SID (si es archivo, biblioteca o
centro de documentacin) y el tipo de usuario (general o especializado) condicionan que un SID indice y recupere con uno u otro lenguaje. En lneas generales:

las bibliotecas indizan con sistemas de clasificacin + listados de encabezamientos de materia + listados de autoridades;

los centros de documentacin indizan con tesauros + listados de palabras


clave;

los archivos, con sistemas de clasificacin y/o tesauros.

Como podis observar, los SID pueden trabajar con un solo lenguaje o con
una combinacin de lenguajes.
4.1. Los trminos de indizacin

Llamamos trminodeindizacin a la representacin de un concepto


en lenguaje natural o un cdigo de clasificacin.

Anlisis de contenido: resumen e indizacin

34

CC-BY-NC-ND PID_00143964

Los trminos de indizacin pueden estar formados por una palabra o ms de


una.
La parte ms pequea con significado de un trmino de indizacin se conoce
como unitrmino.

Anlisis de contenido: resumen e indizacin

Ejemplo
Ejemplos de trminos de indizacin:
De una palabra: Bosques.
De ms de una palabra:
Fuente de informacin.

La norma UNE 50-113-92/1 define unitrmino como:


El elemento significativo ms pequeo de un lenguaje documental utilizado para representar un concepto especfico en un sistema de indizacin coordinado; no se debe confundir con palabra clave o descriptor.
UNE 50-113-92/1.

Ejemplo
El descriptor Fuente de informacin est formado por
dos unitrminos: Fuente e
Informacin. La preposicin
de no se indiza.

Cada lenguaje documental da un nombre diferente a su trmino de indizacin.


Esta es la terminologa que usaremos en esta asignatura:
Trminos de indizacin
Lenguajedocumental

Sutrminodeindizacinseconocecomo

Sistemas de clasificacin

Notacin o smbolo de clase

Listados de encabezamientos de materia

Encabezamiento

Listados de autoridades

Autoridad, identificador o descriptor

Tesauros

Descriptor

Listados de descriptores libres

Descriptor

Listados de palabras clave

Palabra clave

La norma UNE 50-113-92/1 define estos conceptos de la siguiente manera:

Notacin/Smbolo de clase: es la representacin de una clase mediante la notacin


de un sistema de clasificacin.

Identificador: nombre utilizado como descriptor.

Descriptor: trminos de indizacin asignados por el analista fruto de alguna de las


operaciones intelectuales que implica el proceso de indizacin.

Palabra clave: una palabra o grupo de palabras seleccionadas de manera automtica


del ttulo, resumen o texto de un documento del que representan su contenido y
permiten la recuperacin.

Norma UNE 50-113-92/1. Documentacin e informacin. Vocabulario. Parte 1. Conceptos


fundamentales.
A modo de conclusin
Un lenguaje documental es un vocabulario de trminos en lenguaje natural o un sistema artificial de signos normalizados que facilitan la representacin del contenido de los
documentos. Sus funciones principales son indizar el contenido de los documentos y
permitir la recuperacin a partir del campo materia.
Hay seis lenguajes documentales:

Los sistemas de clasificacin.


Los listados de encabezamientos de materia.
Los listados de autoridades.
Los tesauros.
Los listados de descriptores libres.

Lectura recomendada
Para cuestiones de terminologa recomendamos la consulta de la norma UNE 50-11392/1. Documentacin e informacin. Vocabulario. Parte 1.
Conceptos fundamentales. En:
Documentacin: Normas fundamentales. Madrid: AENOR,
1994.

CC-BY-NC-ND PID_00143964

35

Anlisis de contenido: resumen e indizacin

Los listados de palabras clave.

Llamamos trmino de indizacin a la representacin de un concepto en lenguaje natural


o un cdigo de clasificacin. Los trminos de indizacin pueden estar formados por una
palabra o ms de una.

4.2. Evolucin histrica de los lenguajes documentales


Los primeros analistas mesopotmicos, egipcios o romanos lean el documento, copiaban las primeras lneas del texto o seleccionaban los conceptos que
mejor representaban el contenido y los escriban en la tablilla, pinake, cartela
o ficha correspondiente. Poco a poco estas materias fueron conformando un
listado de temas. En la Edad Media sabemos de la existencia de catlogos de
algunas grandes bibliotecas, como la de Lorsh en Alemania, que tena 600 ttulos clasificados en 63 materias.
Edadcontempornea
Ahora bien, para muchos autores la historia de los lenguajes documentales
empieza en las bibliotecas del siglo XIX con los sistemas de clasificacin, ya que
fueron el primer intento serio de controlar las materias de los documentos.
Los sistemas de clasificacin empezaron a ser considerados propiamente lenguajes en el siglo XIX con las clasificacionesbibliogrficas de Brunet, Harris,
Dewey, Cutter o la de la Library of Congress. Eran cuadros de clasificacin
jerrquicos, de cariz enciclopdico y sus clases se combinaban de una forma
definida con anterioridad, es decir, precoordinada. Los conceptos se representaban con cdigos, no palabras. Por ejemplo, el concepto Fotografa era el
cdigo 77 (ejemplo extrado de la CDU).

Library of Congress

El siguiente paso en la evolucin de los lenguajes lo formul Charles Ammi


Cutter en 1876, creando un listado de materias escritas en lenguaje natural. Ya
no se usaba un cdigo, sino que se expresaba el concepto (como Fotografa)
con todas las letras. Estos listados, llamados listas de encabezamientos de
materia, eran alfabticos y se basaban en los principios de especificidad (hay
que indizar con el trmino especfico, no el genrico) y el de entrada directa
(hay que respetar el orden natural de las expresiones y no optar por formas
inversas del tipo Electrnico, comercio).
Las colecciones bibliotecarias estaban cubiertas con estos dos lenguajes documentales: sistemas de clasificacin + listados de encabezamientos de materia.
Los listados de autoridades controlaban el resto de autoridades. Adems, se
combinaban en los registros bibliogrficos con el fin de minimizar el inconveniente de la codificacin, ya que no era de fcil comprensin para los usuarios.
La indizacin era sinttica, sumaria, dos o tres entradas por el campo materia,
ya que tenemos que ser conscientes de que nacieron en sistemas no automatizados.

Charles Ammi Cutter

CC-BY-NC-ND PID_00143964

36

Anlisis de contenido: resumen e indizacin

A medida que la produccin cientfica iba generando cada vez ms volumen


de informacin, surgi la necesidad de indizar de una forma ms analtica, con
ms conceptos. Se crean centrosdedocumentacin con una vocacin ms
especializada que las bibliotecas. El uso de tecnologa informtica facilitaba
el acceso a un documento a travs de diversos puntos de acceso. Nacen los
lenguajes especializados por excelencia, los tesauros. Se aplican a los centros
de documentacin y a algunos archivos histricos y administrativos.
Los tesauros recogen todo lo mejor de sus antecesores: la estructura arborescente de los sistemas de clasificacin, que aplican a su presentacin jerrquica,
y la estructura combinatoria de las listas de encabezamientos de materia, que
aplican a su presentacin alfabtica. Adems incluyen nuevas estructuras de
presentacin, como la grfica y la de ndices permutados.
Los tesauros se automatizan y desde mediados de los aos setenta el crecimiento de la industria de las bases de datos posibilita la consulta en lnea de
muchas publicaciones seriadas. Nace el ltimo lenguaje documental, el listadodepalabrasclaveoindizacinautomtica.
Internet
La ltima gran etapa la marca Internet. La globalizacin de la red a partir de
la dcada de los aos 1990 impulsa el acceso a la informacin, ya no hace falta
que los SID dispongan en propiedad del documento, ya que la red permite
acceder a la informacin alojada en cualquier otro centro de informacin. La
cooperacin impulsa a todos los lenguajes documentales a automatizarse y
formar parte de proyectos colectivos (catlogos colectivos, consorcios, redes).
En el mismo sentido se buscan pasarelas entre los diferentes lenguajes para
solucionar problemas idiomticos entre pases.
Surge la necesidad de indizar la abundante produccin de recursos electrnicos, como por ejemplo con el uso de metadatos para definir e intercambiar
datos entre sistemas informticos (etiquetas del tipo <subject>,<keywords>) y
explotar la indizacin automtica en los potentes robots de los buscadores.
Tambin los usuarios pueden indizar los recursos gracias a iniciativas de indizacin social o tagging.
Los expertos opinan que en la actualidad el problema principal no es tanto
indizar o recuperar, sino presentar los resultados en algn orden significativo,
lo que implica el uso de algoritmos que valoren los resultados.
A continuacin reproducimos algunas de las fechas ms significativas, extradas de la cronologa de Isidoro Gil (2008) sobre las listas de encabezamiento
de materia, los tesauros y la indizacin automtica.

Lectura complementaria
Podis encontrar esta cronologa en la obra siguiente:
I.GilLeiva(2008). Manual
de indizacin. Teora y prctica.
Gijn: Ediciones Trea (Biblioteconoma y Administracin
cultural, 193), pg. 110-114.

37

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

Cronologa de la evolucin de los lenguajes documentales


Fechas

Concepto

Breve explicacin

30.000
a.C.

Etiquetasdebarro

Losantiguosescribasmesopotmicosguardabanlastablillasdebarro(documentos)encestasdemimbre.Por
fuera,lacestallevabaotratablilladebarroconelcontenido.

Egipto

Las cartelas de Egipto

Los egipcios introducen el papiro como soporte documental.


El papiro se enrollaba en torno a una varita de madera o metal. Para no desplegar completamente el rollo, ponan las primeras frases del documento en una etiqueta o cartela en un
extremo.

1876

CharlesA.CutterRulesforadictionarycatalog

1895

List of subject headings for use in dictionary catalogs

Publicada por la American Library Association (ALA) para bibliotecas medias y pequeas, con fondos no especializados.

1909

LibraryofCongressSubjectHeadings

NaceapartirdelalistadeALAylasreglasdeCutter.A
partirdeaquestalistaseconvierteenelreferentedetodaslaslistasdeencabezamientosdemateriadelmundo.

1923

List of subject headings for small libraries

Minnie Earl Sears es la autora de esta lista conocida como


SEARS. Es una versin reducida de la LCSH para bibliotecas
pequeas.

1934

Guaparalosencabezamientosdemateria

JuanManriqueLarapublicalaprimeralistadeencabezamientosencastellanoenMxico.Eraunatraduccinde
laLibraryofCongressSubjectHeadings(LCSH),elALAy
laSEARS.

1946

Rpertoire de vedettes-matire RVM

Primera lista de encabezamientos en francs (Universidad de


Laval Canad).

1951

Descriptor

CalvinMooersacuaeltrmino.

1952

Unitrmino

Mortimer Taube acua el trmino.

1957

Indizacinautomtica

HansMeterLuhnempiezaatrabajarenindizacinautomticaaplicandoelmtododelafrecuencia.

1960

Compatibilidad

En la dcada de los 60 se inician los primeros proyectos para


hacer compatibles los diferentes lenguajes documentales mediante tablas de equivalencia.

1961

SistemaSMART

GeraldStatondesarrollaelsistemaSMARTdeanlisisautomticodetextos.

1967

Guidelines for the development of information retrieval


thesauri

Directrices para elaborar tesauros confeccionadas por el US


Federal Council for Science and Technology de Washington

1967

Listadeencabezamientosdemateriaparabibliotecas

ListacompiladaporCarmenRovirayJorgeAguayoenespaolparalaUninPanamericana.

1974

Norma ISO 2788:1974


Guidelines for the establishment and development of monolingual thesauri

1 edicin de la norma ISO para la confeccin de tesauros


monolinges.

1980

Rpertoiredautorit-matireencyclopdiqueetalphabtiqueunifiRAMEAU

PrimeralistadeencabezamientosdemateriadelaBibliotecaNacionaldeFrancia.SebasaronenlaRVMyla
LCSH.

1983

Bilindex

Lista de encabezamientos bilinge en ingls y castellano. Es


equivalente a la LCSH. En el ao 2007 se edit la 15 ed.

1985

NormaISO5963:1985Methodsforexaminatingdocumentos

NormaISOquenoseratraducidaanormaUNEhasta
1991conelnmeroUNE50-121-91.

38

CC-BY-NC-ND PID_00143964

Fechas

Concepto

Anlisis de contenido: resumen e indizacin

Breve explicacin

1985

Norma ISO 5964:1985


Guidelines for the establishment and development of multilingual thesauri

1 edicin de la norma ISO para la confeccin de tesauros


multilinges.

1986

Abandonodelossmbolostradicionalesdelaslistasde
encabezamientosporlospropiosdelosthesaurus

LaLCSH,ensu10edicin,abandonalossmbolosdex,
see,xx,v,aporlospropiosdelostesaurosUse,BT,NT,
RT.Lasdemslistasmundialestambinlosadoptan.

1986

Unified medical language system

El sistema unificado de lenguajes en medicina es un proyecto para integrar los diferentes vocabularios de ciencias de la
salud. Es un proyecto de la Biblioteca Nacional de Medicina
de EE.UU. (actualmente coordina el MESH, Medical Subject
Headings).

1995

UniversalizacindeInternet

Internethadifundidoypopularizadoconceptos,tcnicas
yprcticaspropiasdedocumentalistas.

1995

Metadatos

Uso de metadatos para definir e intercambiar datos entre


sistemas informticos. Los lenguajes de marcaje tienen etiquetas para el resultado de la indizacin del tipo <subject>,
<keywords>.

1997

ProyectoMACS

IniciativadelaConferenceofEuropeanNationalLibrariesCENLparahacercompatiblestreslistasdeencabezamientosdemateria,laalemanaSWD,laRAMEAUfrancesaylaLCSHusadaenGranBretaaySuiza.

A modo de conclusin
Para muchos autores la historia de los lenguajes documentales empieza en las bibliotecas
del siglo XIX con los sistemas de clasificacin, ya que fueron el primer intento serio de
controlar las materias de los documentos.
El siguiente paso en la evolucin de los lenguajes lo formul Charles Ammi Cutter en
1876, creando una lista de materias escritas en lenguaje natural.
A medida que la produccin cientfica iba generando cada vez ms volumen de informacin, surgi la necesidad de indizar de una forma ms analtica, con ms conceptos. Se
crean centros de documentacin con una vocacin ms especializada que las bibliotecas.
Nacen los lenguajes especializados por excelencia, los tesauros.
Desde mediados de los aos setenta el crecimiento de la industria de las bases de datos
posibilita la consulta en lnea de muchas publicaciones seriadas. Nace el ltimo lenguaje
documental, el listado de palabras clave o indizacin automtica.
La ltima gran etapa la marca Internet. La globalizacin de la red a partir de los aos 1990
impulsa el acceso a la informacin. La cooperacin impulsa a todos los lenguajes documentales a automatizarse y formar parte de proyectos colectivos (catlogos colectivos,
consorcios, redes). En el mismo sentido se buscan pasarelas entre los diferentes lenguajes
para solucionar problemas idiomticos entre pases.
Surge la necesidad de indizar la abundante produccin de recursos electrnicos, como
por ejemplo el uso de metadatos para definir e intercambiar datos entre sistemas informticos (etiquetas del tipo <subject>, <keywords>) y explotar la indizacin automtica
en los potentes robots de los buscadores. Tambin los usuarios pueden indizar los recursos gracias a iniciativas de indizacin social o tagging.

39

CC-BY-NC-ND PID_00143964

4.3. Cundo son necesarios los lenguajes documentales?

Los lenguajes documentales son necesarios en dos momentos de la cadena documental:

La fase de anlisis y tratamiento > Anlisis documental > Anlisis


de contenido > Indizacin.

La fase de salida > Instrumentos de recuperacin.

Tanto en la fase de indizacin como en la fase recuperacin, el proceso de


anlisis-seleccin-traduccin de conceptos es el mismo. En el momento de la
indizacin el analista lee el documento, extrae conceptos y si hace falta los
traduce a un lenguaje controlado para almacenarlos en el sistema. En el momento de la recuperacin, el analista tiene que trabajar con la consulta del
usuario, extraer los conceptos y traducirlos. Si se trata de un lenguaje postcoordinado, adems tendr que saber cmo convertir los descriptores a una
ecuacin de bsqueda.
Ejemplo de la fase de recuperacin

Usuario: Necesito informacin sobre las instalaciones deportivas de hockey hierba


que se construyeron en la ciudad de Terrassa con motivo de la celebracin de los
Juegos Olmpicos de 1992.

Analista: selecciona los conceptos ms relevantes para la bsqueda: instalaciones


deportivas, hockey hierba, Terrassa, Juegos Olmpicos. El prximo paso es traducir
los conceptos a un lenguaje documental, en el ejemplo, el Tesaurus dHistria local
de Catalunya. Como se puede apreciar entre la expresin en lenguaje natural del
usuario y los descriptores aceptados del tesauro hay ciertas diferencias:

Enlaexpresindelusuario:

Traducidoaltesauro:

Instalaciones deportivas

Equipamientos deportivos (Equipaments esportius)

Hockey hierba

Hockey (Hoquei)

Terrassa

Terrassa

Olimpiadas

Juegos Olmpicos 1992 (Jocs Olmpics 1992)

Traducido a una ecuacin de bsqueda: Equipamientos deportivos AND Hockey AND


Terrassa AND Juegos Olmpicos 1992.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

40

G. van Slype (1991, pg. 161) considera que los lenguajes documentales pueden intervenir, como mximo, hasta en seis momentos diferentes en la recuperacin:
1) Seleccin de los sistemas documentales que se interrogarn: qu catlogos,
qu bases de datos, etc.
2) Seleccin de los conceptos expresados por el usuario en su enunciado.
3) Traduccin a un lenguaje documental controlado.
4) Formulacin de la ecuacin de bsqueda.
5) Extensin asistida por ordenador.
6) Evaluacin final de la pertinencia de los resultados obtenidos.
Hay una tercera funcin dentro de la cadena documental, pero slo afecta a
un lenguaje documental concreto, que son los sistemas de clasificacin:

La fase de Anlisis y Tratamiento > Procesamiento tcnico > Ordenacin.

Los cdigos numricos de los sistemas de clasificacin jerrquicos, como la


CDU, son la herramienta para ordenar los documentos en las estanteras de
acuerdo a un orden secuencial de las materias (ordenacin altamente significativa).
En teora todo documento se podra indizar con cualquiera de los seis lenguajes. En la prctica cada tipologa de SID tiende a utilizar un lenguaje o combinacin de lenguajes concreta.

Anlisis de contenido: resumen e indizacin

Lectura complementaria
Podis ampliar la informacin sobre los lenguajes documentales en la obra siguiente:
G.vanSlype(1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin
en los sistemas documentales.
Madrid: Pirmide. Fundacin
Germn Snchez Ruiprez.
Biblioteca del Libro.

41

CC-BY-NC-ND PID_00143964

Ejemplo: un documento y seis indizacions


Veamos cmo sera el resultado de indizar el mismo documento con cada uno de los seis
lenguajes documentales:
El mercado del tabaco en Espaa durante el siglo XVIII: fiscalidad y consumo / Santiago de
Luxn Melndez, Sergio Solbes Ferri, Juan Jos Laforet (ed.). Las Palmas de Gran Canaria:
Universidad de Las Palmas de Gran Canaria, Servicio de Publicaciones, 2000.
Resumen:
En este libro se ha querido poner el nfasis en un tema hasta ahora poco tratado como
es el consumo de tabaco en Espaa durante el siglo XVIII.
No obstante tambin se atienden otros aspectos como los fiscales. La obra se ha estructurado en tres partes: la primera se ocupa de la fiscalidad, la segunda atiende el rea del
monopolio y la tercera analiza los mercados regionales de Canarias y Navarra. El libro se
cierra con un apartado dedicado al cultivo del tabaco.
Ejemplo de un nico documento y seis indizaciones
Sistemadeclasificacin:CDU
336.226(460)17:663.97

Listasdeencabezamientosdemateria:LEMAC

Industria tabaquera- Espaa- Canarias


Historia - s. XVIII
Espaa
Tabaco - impuestos - Espaa Navarra
- Historia - s. XVIII

Tesauro:Tesaurus
dHistrialocalde
Catalunya(UAB)
Tabaco
Consumo
Historia
Impuesto de consumos
Cultivos
Monopolios
Siglo XVIII

Listadodeautoridades:
GranEnciclopdiaCatalana

Listadodedescriptoreslibres:Consultoresdelaasignatura
Canarias
Cultivo
Consumo
Espaa
Fiscalidad
Monopolio
Navarra
Siglo XVIII
Tabaco

Listadodepalabrasclave:programaSwesum

libro
tabaco

Aunque en este momento el estudiante no conozca el funcionamiento de estos


lenguajes, s que est en disposicin de observar algunos rasgos caractersticos
de cada uno:

El sistema de clasificacin ha indizado un cdigo, no son palabras. Es un


cdigo construido a base de nmeros y smbolos, incomprensible a primera vista para un profano.

La lista de encabezamientos de materia ha indizado dos trminos en lenguaje natural, que estn formados por diversas palabras separadas con
guiones.

La lista de autoridades ha indizado slo nombres geogrficos y ha prescindido del resto de conceptos. Tambin ha usado el lenguaje natural.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

42

Anlisis de contenido: resumen e indizacin

El tesauro ha indizado unos cuantos descriptores en lenguaje natural, poniendo un trmino bajo el otro.

El listado de descriptores libres no se diferencia a simple vista de la indizacin con tesauro. En cambio, la diferencia es fundamental ya que el tesauro es controlado y los descriptores libres son libres.

En el listado de palabras clave, la indizacin la ha realizado un programa


informtico, que ha seleccionado las palabras libro y tabaco porque salen
dos veces en el texto, son las palabras ms repetidas.
A modo de conclusin
Los lenguajes documentales son necesarios en dos momentos de la cadena documental:

La fase de anlisis y tratamiento > Anlisis documental > Anlisis de contenido >
Indizacin.
La fase de salida > Instrumentos de recuperacin.

Los sistemas de clasificacin tambin son tiles en:

La fase de anlisis y tratamiento > Procesamiento tcnico > Ordenacin.

4.4. Complementariedad de los lenguajes documentales


Indizar con ms de un lenguaje documental al mismo tiempo es muy conveniente, porque as se suman las ventajas y minimizan los inconvenientes de
los diferentes sistemas. Significa un esfuerzo aadido en el momento de la indizacin pero permite recuperar de manera ms precisa. Es decir, combinamos
lenguajes para recuperar mejor.
Algunas de las combinaciones posibles son las siguientes:

Sistema de clasificacin + listas de encabezamientos + listados de autoridades.

Sistema de clasificacin + listas de encabezamientos + listados de autoridades + palabras clave.

Sistemas de clasificacin + tesauro.

Tesauro + listados de autoridades + palabras clave.


Ejemplo de combinacin de lenguajes
Ejemplo de una captura de un registro del catlogo de la Biblioteca Nacional de Espaa
donde vemos un campo para la notacin con CDU y otro para un encabezamiento de
materia.

Ved tambin
Todos estos temas sern desarrollados en los mdulos siguientes, dedicados a cada
uno de los lenguajes documentales.

CC-BY-NC-ND PID_00143964

43

A modo de conclusin
En teora todos los documento se podran indizar con cualquiera de los seis lenguajes. En
la prctica cada tipologa de SID tiende a utilizar un lenguaje o combinacin de lenguajes
concreta.
Indizar con ms de un lenguaje documental al mismo tiempo es muy conveniente porque
se suman las ventajas y minimizan los inconvenientes de los diferentes sistemas. Significa
un esfuerzo aadido en el momento de la indizacin pero permite recuperar de manera
ms precisa. Es decir, se combinan lenguajes para recuperar mejor.

Anlisis de contenido: resumen e indizacin

44

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

5. Tipologa de los lenguajes documentales

Podemos clasificar los seis lenguajes documentales a partir de unas caractersticas o tipologas que los describen. Concretamente los lenguajes se tipifican
segn la naturaleza de sus trminos, el nivel de control, el nivel de coordinacin, la estructura y el nivel de anlisis:

Listado de descriptores libres

Listado de palabras clave

Natural
Segn el nivel de control sobre los trminos

Tesauro

Codificado

Listados de autoridades

Segn la naturaleza de los trminos

Libre
Controlado

Segn el nivel de coordinacin de los trminos Precoordinado

Postcoordinado
Segn la forma de agrupar los trminos o estructura

JerrquicooSistemtico

Pormaterias

Combinatorio
Segn el nivel de anlisis

Un lenguaje es la suma de diversas caractersticas. As, por


ejemplo, un tesauro es natural,
controlado, postcoordinado,
jerrquico y combinatorio e indiza por conceptos.

Listados de encabezamientos de materia

Sistemas de clasificacin

Tipologa de los lenguajes documentales

Tesauro

Por conceptos
Porpalabrasclave

A continuacin, vamos a ver estas caractersticas.


5.1. Naturaleza del trmino: codificado o natural
Los trminos pueden expresarse en lenguajes codificados o naturales:

X
X

CC-BY-NC-ND PID_00143964

45

Anlisis de contenido: resumen e indizacin

a)Lenguajescodificados. Entendemos por codificado el uso de un cdigo artificial compuesto de nmeros, letras y smbolos que traducen un concepto.
Por ejemplo, el Sol, en un lenguaje como la CDU, sera 523.9.
Los lenguajes codificados son lenguajes sintticos, muy usados en bibliotecas,
ya que, adems de clasificar el contenido del fondo documental, son operativos en cualquier idioma y permiten la ordenacin de los fondos. Por otra parte,
tienen el inconveniente de ser poco comprensibles por parte de los usuarios.
Slo hay un tipo de lenguaje codificado: son los sistemasdeclasificacin.
b)Lenguajesnaturales. Entendemos por natural el uso de palabras del lenguaje usual, habitual, no cdigos. Es mucho ms prximo al usuario, ms amigable. Hay cinco lenguajes documentales naturales:

Las listas de encabezamientos de materia.

Los listados de autoridades.

Los tesauros.

Los listados de descriptores libres.

Los listados de palabras clave.

5.2. Nivel de control: libre o controlado


Hace referencia al control del vocabulario, es decir, si las palabras seleccionadas para indizar corresponden al lenguaje natural o a un lenguaje artificial
construido para garantizar la indizacin y recuperacin:
a)Lenguajeslibres. Son listas de trminos extrados del lenguaje natural sin
sufrir ningn tipo de control. Normalmente los lenguajes libres se utilizan en
sistemas automatizados donde hay un fichero inverso o diccionario de la base
de datos. Tienen muchas ventajas en la indizacin, como el gasto mnimo
de construccin, la actualizacin inmediata, coherencia mxima y la riqueza
terminolgica. Pero presentan inconvenientes en la recuperacin, ya que al
trabajar con lenguaje natural, arrastran todos los problemas derivados de la
ambigedad (sinonimia, polisemia, homonimia).
Los lenguajes libres son dos:

Los listados de descriptores libres.

El listado de palabras clave.

b)Lenguajescontrolados. Consideramos lenguajes controlados aquellos que


estn redactados previamente en forma de listas o listados de trminos que se
consideran aceptados y unvocos para la indizacin. Slo los trminos de la
lista se pueden usar para indizar.

Algunos lenguajes
codificados
Son ejemplos de lenguajes codificados la Clasificacin Decimal Universal (CDU), la Clasificacin Dewey (DDC), la Clasificacin de la Library of Congress (LCC) o la Clasificacin
Colon (CC).

Ved tambin
Los sistemas de clasificacin se
estudian con ms profundidad
en el mdulo Sistemas de clasificacin documentales de
esta asignatura.

46

CC-BY-NC-ND PID_00143964

Son trminos seleccionados tanto en su forma (plural, singular, sintagma nominal, adjetivado, siglas, etc.), como en su contenido (de todos los sinnimos
se escoge uno, los homnimos se diferencian entre ellos, etc.) y como en sus
relaciones de jerarqua y asociacin (trminos conceptualmente ms genricos o especficos y trminos que se evocan mutuamente). Requieren unos gastos de construccin elevados, tanto en personal cualificado como en tiempo.
Para muchos autores son los verdaderos lenguajes documentales. Tambin se
conocen por el nombre de lenguajesartificiales.
Su funcin documental es la de representar un concepto con un nico trmino
y que slo haya un trmino por concepto, lo que se conoce como univocidad.
Los lenguajes controlados son cuatro:

Los sistemas de clasificacin.

Las listas de encabezamientos.

Los listados de autoridades.

Los tesauros.

5.3. Nivel de coordinacin: precoordinado o postcoordinado


a)Precoordinacin. La precoordinacin consiste en determinar a priori cmo
se combinan los trminos, tanto sea a la hora de construir el lenguaje como a
la hora de indizar el documento o a la de recuperarlo.
Lenguajes precoordinados
Un ejemplo de construccin con un lenguaje precoordinado como la Lista de encabezamientos de materia como la del CSIC prev que la materia Construccin de viviendas
se represente como:
Viviendas - Construccin
Es decir, por este orden y separados con un guin.
Un ejemplo de indizacin con un lenguaje precoordinado, por ejemplo, de una materia
compuesta por tres elementos como Enciclopedia de los perros pastores europeos se representa como:
Perros Pastores - Europa - Enciclopedias
El encabezamiento se hace en este orden concreto, y las reglas sintcticas del lenguaje
evitan la posibilidad de otras combinaciones.

La precoordinacin tiene dos grande ventajas:

Agrupa en proximidad todos los documentos que tienen una temtica


afn, de manera que si consultamos el catlogo de una biblioteca Viviendas,
tambin veremos otros documentos como:
Viviendas - Alumbrado
Viviendas - Arrendamiento
Viviendas - Calefaccin y ventilacin

Anlisis de contenido: resumen e indizacin

47

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

Un solo trmino de indizacin rene los elementos principales para la


bsqueda.

La precoordinacin era una autntica necesidad en el entorno de las bibliotecas manuales, ya que no se poda buscar por una combinacin de dos o ms
trminos.
b)Postcoordinacin. La postcoordinacin consiste en combinar los trminos
de indizacin en el momento de la recuperacin. Permite combinar mltiples
trminos de indizacin siguiendo la lgica de los operadores booleanos y de
esta manera profundizar en el anlisis de contenido. No tienen sintaxis en
el momento de la indizacin. Cada trmino indizado es un punto de acceso
al documento; cuantos ms trminos indizamos, ms posibilidad tenemos de
recuperarlo.
Lenguajes postcoordinados
Un lenguaje postcoordinado, como un tesauro, representara el documento anterior sobre perros pastores como:
Perros pastores
Europa
Enciclopedia
que sera recuperado siguiendo la lgica de los operadores booleanos:
Perros Pastores AND Europa

Los lenguajes postcoordinados slo tienen sentido en sistemas documentales


automatizados que dispongan de un fichero inverso. El fichero inverso est
donde se almacenan todos los descriptores que el analista va indizando, se
sitan uno detrs del otro de forma secuencial y asociados al documento al
que hacen referencia.
Los lenguajes postcoordinados son cuatro:

Listados de autoridades.

Tesauro.

Listados de descriptores libres.

Listados de palabras clave.

Ved tambin
El tema de la precoordinacin
se trata sobradamente en los
mdulos dedicados a los dos
lenguajes precoordinados:
Sistemas de clasificacin documentales y Listas de encabezamientos y listados de autoridades.

48

CC-BY-NC-ND PID_00143964

Ejemplo de fichero inverso


Fichero inverso
Documento
Documento1
Perros pastores
Europa
Enciclopedia

Fichero inverso: concepto y n. de documento


Alimentacin (2)
Enciclopedia (1,3)
Entrenamiento (2)
Europa (1)
Perros Pastores (1,2)
Qumica orgnica (3)

Documento2
Perros pastores
Alimentacin
Entrenamiento
Documento3
Qumica orgnica
Enciclopedia

5.4. Estructura: jerrquica o combinatoria


El vocabulario de los lenguajes documentales se organiza en dos estructuras
bsicas, en forma jerrquica o en forma combinatoria:
a)Jerrquica: en la estructura jerrquica o arborescente, el vocabulario se presenta en forma de cadena, con trminos genricos que agrupan trminos ms
especficos. Todos los trminos dependen de un trmino superior y de significado ms genrico. Esta estructura permite agrupar los conceptos por temas y
tambin situarlos en contexto, ya que la secuencia jerrquica nos informa de
cul es el campo temtico al que est adscrito el concepto.
Ejemplo
Pongamos un ejemplo extrado de la CDU:
37 Educacin
371 Organizacin de la educacin
372 Contenido. Materias
373 Tipo de escuelas
374 Enseanza extraescolar
376 Escuelas especiales
377 Formacin profesional
378 Universidades
As, el concepto Universidades depende del concepto 37 Enseanza, por lo tanto
hace referencia a la educacin que se imparte en la universidad y no a la arquitectura de
las universidades (que estara dentro de 72 Arquitectura).

Los lenguajes jerrquicos son dos:

Los sistemas de clasificacin.

Los tesauros (en la parte de presentacin sistemtica o jerrquica).

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

49

b)Combinatoria: en la estructura combinatoria, los trminos no forman cadena, estn listados por orden alfabtico. Este tipo de estructura surgi como
reaccin a la rigidez de la estructura jerrquica, que no era fcil de actualizar.
Ejemplo extrado de la Lista de encabezamientos del CSIC

La estructura combinatoria permite la inclusin de nuevos trminos y la eliminacin de los obsoletos sin afectar al resto de la estructura del lenguaje. La
facilidad para actualizar el vocabulario los convierte en lenguajes adecuados
para todo tipo de entornos: enciclopdicos, cientficos y tcnicos.
Los lenguajes de estructura combinatoria son cinco:

Listas de encabezamientos de materia.

Listados de autoridades.

Tesauros.

Listados de descriptores libres.

Listados de palabras clave.

Como se puede observar, los tesauros participan de las dos estructuras: tienen
una presentacin sistemtica en forma jerrquica y una presentacin alfabtica en forma combinatoria.
El descriptor Cmic
Veamos el descriptor Cmic tanto en una presentacin como en la otra (extrado del
Tesaurus dhistria local de Catalunya).
Presentacin jerrquica (izquierda) y alfabtica (derecha)

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

50

5.5. Nivel de anlisis: materias, conceptos, palabras clave


Los lenguajes pueden indizar ms o menos conceptos, de manera que podemos establecer una ltima tipologa segn la cantidad de informacin que
transmiten cada uno. En el punto ms sinttico, con uno o dos trminos de indizacin, tenemos los lenguajes que indizan por materias; en el punto medio,
los lenguajes de conceptos, tambin llamados de descriptores, y en el punto
ms analtico, los lenguajes de palabras clave.
Indizar por materias, conceptos y palabras clave est en relacin directa con
los dos paradigmas de bsqueda. La indizacin por materias es adecuada para
sistemas de browsing (o de navegacin o directorio). En cambio, las indizaciones por conceptos y palabras clave se adaptan mejor a los sistemas de interrogacin en buscadores.
a)Pormaterias: responden a la pregunta:cul es el tema de este documento?. Los lenguajes que indizan por materias son dos:

Los sistemas de clasificacin.

Las listas de encabezamientos de materia.

b)Porconceptos: indizar por conceptos significa indizar las ideas y nociones


del texto sin reducirlo a un tema principal. Responden a la pregunta: cules
son los conceptos de este documento?. Van ligados necesariamente a sistemas
automatizados, ya que no es factible elaborar tantas fichas de cartulina como
conceptos se van a indizar.
Los lenguajes que indizan por conceptos son tres:

Listados de autoridades.

Tesauro.

Listados de descriptores libres.

c) Por palabras clave: indizar por palabras clave significa indizar todas las
palabras con significado del texto. Es el proceso ms analtico que existe. No
es una tarea de indizacin humana, sino automtica. Los programas que indizan por palabras clave seleccionan slo las palabras que tienen significado
(preferentemente sustantivos).
Slo hay un lenguaje por palabras clave, y es evidentemente el nico lenguaje
automtico: el listado de palabras clave.

Anlisis de contenido: resumen e indizacin

51

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

Ejemplo de indizacin con los tres niveles de anlisis


Indizaremos con los tres niveles de anlisis el siguiente resumen indicativo:
MUOZ CRUZ, Valle. El papel del gestor de la informacin en las organizaciones a las
puertas del siglo XXI. A. Los sistemas de informacin al servicio de la sociedad: actas de las
jornadas. Valencia: FESABID, 1998, vol. 2, p. 649-660.
Artculo sobre el papel y funciones del gestor de la informacin, un nuevo profesional
de la documentacin, en las organizaciones del siglo XXI. Describe el panorama laboral
espaol, analizando la Administracin pblica y la empresa privada. Propone desarrollar
una poltica nacional de informacin y una formacin adaptada a las necesidades organizativas de las instituciones.
Ejemplo de niveles de anlisis
Por materias
Gestor de informacin

Por conceptos
Gestor de informacin
Documentacin
Administracin pblica
Empresa privada
Poltica de informacin

Por palabras clave


Adaptada
Administracin
Artculo
Documentacin
Empresa
Espaol
Formacin
Funciones
Gestor
Informacin
Instituciones
Laboral
Nacional

Necesidades
Nueve
Organizaciones
Organizativas
Panorama
Papel
Poltica
Privada
Profesional
Pblica
Siglo XXI

A modo de conclusin
Los lenguajes documentales se tipifican segn:

Lanaturalezadelostrminos: los trminos pueden expresarse en lenguaje codificado o natural. Entendemos por codificado el uso de un cdigo artificial compuesto
de nmeros, letras y smbolos que traducen un concepto. Entendemos por natural el
uso de palabras del lenguaje usual, habitual, no cdigos.

Elniveldecontroldelvocabulario: los lenguajes pueden ser libres o controlados.


Los lenguajes libres son listas de trminos extrados del lenguaje natural. Consideramos lenguajes controlados aquellos que estn redactados previamente en forma de
listas o listados de trminos que se consideran aceptados y unvocos para la indizacin. Slo los trminos de la lista se pueden usar para indizar.

El nivel de coordinacin: precoordinado o postcoordinado. La precoordinacin


consiste en determinar a priori cmo se combinan los trminos, ya sea a la hora de
construir el lenguaje, a la hora de indizar el documento o a la hora de recuperarlo. La
postcoordinacin consiste en no establecer reglas a la hora de la indizacin y combinar los trminos de indizacin en el momento de la recuperacin siguiendo la lgica
de los operadores booleanos.

Laestructura: el vocabulario de los lenguajes documentales se organiza en dos estructuras: jerrquica o combinatoria. En la estructura jerrquica o arborescente, el
vocabulario se presenta en forma de cadena, con trminos genricos que agrupan
trminos ms especficos. En la estructura combinatoria, los trminos no forman cadena, estn listados por orden alfabtico.

Elniveldeanlisis: materias, conceptos, palabras clave. Indizar por materias consiste


en indizar la materia principal del documento. Indizar por conceptos significa indizar
las ideas y nociones del texto. Indizar por palabras clave significa indizar todas las
palabras con significado del texto. Es el proceso ms analtico que existe. No es una
tarea de indizacin humana, sino automtica.

52

CC-BY-NC-ND PID_00143964

Anlisis de contenido: resumen e indizacin

5.6. Conclusiones
El estudio de las tipologas de los lenguajes documentales permite elaborar la
ficha descriptiva de cada uno.
Fichas descriptivas de cada lenguaje documental
Sistemasdeclasificacin

Sinttico por materias


Smbolos de clase o notaciones
Humana
Codificado
Controlado
Precoordinado
Jerrquico

Listadodeencabezamientodematerias

Tesauro

Analtico por conceptos


Descriptores
Humana
Natural
Controlado
Postcoordinado
Jerrquico
Combinatorio

Sinttico por materias


Encabezamientos
Humana
Natural
Controlado
Precoordinado
Combinatorio

Listadodeautoridades

Listadodedescriptoreslibres

Analtico por conceptos


Descriptores
Humana
Natural
Libre
Postcoordinado
Combinatorio

Analtico por conceptos


Identificadores y descriptores
Humana
Natural
Controlado
Postcoordinado
Combinatorio
Listadodepalabrasclave

Analtico por palabras clave


Palabras clave
Automtica
Natural
Libre
Postcoordinado
Combinatorio

CC-BY-NC-ND PID_00143964

53

Actividades
1. A partir del siguiente artculo elaborad un resumen informativo, uno indicativo, uno selectivo de conclusiones y uno automtico que tenga una extensin parecida al informativo.
VALLEZ, M; PEDRAZA-JIMNEZ, R. El Procesamiento del Lenguaje Natural en la Recuperacin de Informacin Textual y reas afines [en lnia en http://www.hipertext.net/web/
pag277.htm]. Hipertext.net, nm. 5, 2007. ISSN 1695-5498.
2. Indizad el mismo artculo con los tres niveles de exhaustividad. Argumentad en qu tipo
de base de datos y SID podra ser til cada uno.
3. Proponed dos ttulos de documentos, reales o inventados, donde la materia se exprese a
travs de dos sinnimos.
4. Imaginad dos ttulos ms donde aparezcan dos polismicos y proponed una manera de
diferenciarlos. Buscad el origen etimolgico de las palabras y decid si son polismicas u homnimas.
5. Responded las siguientes afirmaciones justificando la solucin:
a) Todo lenguaje controlado es codificado?
b) Todo lenguaje precoordinado es controlado?
c) Todo lenguaje libre es natural?
d) El lenguaje que tiene la tasa de coherencia ms elevada es el Listado de palabras clave?
6. El siguiente texto es un compendio de errores y medias verdades. Sabrais localizarlas y
argumentar por qu no son correctas?
Usar lenguajes naturales en la indizacin y recuperacin permite una buena comunicacin
documental. Los sistemas de clasificacin representan la materia de los documentos a travs
de mltiples notaciones. Los lenguajes que indizan por materias son los tesauros y las listas de
encabezamientos de materia. Para recuperar de manera precisa tenemos que utilizar sistemas
de clasificacin y listados de encabezamientos de materia. Los lenguajes controlados son muy
amigables para el analista y el usuario. Los lenguajes precoordinados permiten ordenar los
documentos en las estanteras.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

54

Glosario
abstract m Terminologa anglosajona para los resmenes redactados por personas.
anforas f Relacin de referencia entre un elemento lingstico y uno anterior en el discurso.
anlisis de contenido m Operaciones de anlisis que identifican y representan de manera precisa la materia de los documentos, con el objetivo de permitir la recuperacin. Las
operaciones son dos: el resumen y la indizacin. Esta parte del anlisis documental establece
el punto de acceso por materias.
anlisis morfosintctico m Anlisis que determina la categora lxica de cada palabra:
sustantivo, verbo, adjetivo, artculo, preposicin, etc. Tambin determina el lema. Estas operaciones permiten distinguir las palabras con significado (sustantivos, adjetivos, verbos) de
las vacas (artculos, preposiciones, pronombres, etc.). El lema permite agrupar todas las palabras que son flexiones de otra (info/informar/informacin/informador/informacional/etc.).
autoridad f Trmino de indizacin propio del lenguaje documental Listado de Autoridades. Tambin se conocen con el nombre de identificadores y descriptores.
codificado adj. Tipologa de lenguaje documental consistente en el uso de un cdigo artificial compuesto de nmeros, letras y smbolos que traducen un concepto. Slo hay un tipo
de lenguaje codificado, son los sistemas de clasificacin.
combinatoria f Tipologa de lenguaje documental consistente en estructurar los trminos
de indizacin por orden alfabtico. La estructura combinatoria permite la inclusin de nuevos trminos y la eliminacin de los obsoletos sin afectar al resto de la estructura del lenguaje. Los lenguajes de estructura combinatoria son cinco: las listas de encabezamientos de
materia, los listados de autoridades, los tesauros, el listado de descriptores libres y el listado
de palabras clave.
controlado adj. Tipologa de lenguaje documental consistente en listas de trminos seleccionados tanto en su forma (plural, singular, sintagma nominal, adjetivado, siglas, etc.) como
en su contenido (de todos los sinnimos se escoge uno, los homnimos se diferencian entre
ellos, etc.) y como en sus relaciones de jerarqua y asociacin (trminos conceptualmente
ms genricos o especficos y trminos que se evocan mutuamente). Requieren unos gastos
de construccin elevados, tanto en personal cualificado como en tiempo. Son los verdaderos lenguajes documentales. Tambin se conocen por el nombre de lenguajes artificiales. Su
funcin documental es la de representar un concepto con un nico trmino y que slo haya
un trmino por concepto, lo que se conoce como univocidad. Los lenguajes controlados son
cuatro: los sistemas de clasificacin, las listas de encabezamientos, listados de autoridades
y tesauros.
describir el contenido loc. v. Ved representar el contenido
descripcin caracterstica f Ved indizacin.
descriptor m Trmino de indizacin propio de tres lenguajes documentales: listado de
autoridades, tesauros, listado de descriptores libres.
encabezamiento m Trmino de indizacin propio del lenguaje documental de las listas
de encabezamientos de materia.
entropa f Calidad aplicable a los lenguajes documentales que tienden a la seleccin, a
la restriccin del vocabulario. Es el proceso contrario al lenguaje natural que tiende a la
abundancia, a la reiteracin de conceptos, a la sinonimia en beneficio de una expresin ms
rica.
especificidad f Criterio relacionado con la exactitud en que un concepto particular que
aparece en un documento est representado por un trmino de indizacin.
estructura f Tipologa de los lenguajes documentales que los clasifica en jerrquicos o
combinatorios.
examen del documento m Primera fase del proceso de indizacin consistente en la lectura del ttulo, resumen, sumario, introduccin, ilustraciones y palabras o frases destacadas
en una tipografa diferente.
exhaustividad f Criterio relacionado con el nmero de conceptos que se tienen en cuenta
para caracterizar el contenido entero de un documento. El principal criterio de seleccin es el

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

55

valor potencial del concepto para los usuarios de su SID. Podemos distinguir entre exhaustividad baja, media y alta en funcin del nmero de descriptores.
extract m Terminologa anglosajona para los resmenes automticos. Los extracts son los
resmenes formados a partir de la extraccin de algunas frases del texto previamente seleccionadas por un programa.
fichero inverso m Fichero donde se almacenan todos los trminos de indizacin. Estos
se sitan uno detrs del otro de forma secuencial y asociados al documento al que hacen
referencia.
hipernimo adj. Decimos que una palabra es hipernima cuando tiene un campo significativo que incluye otro de menor extensin. Ejemplo: color es un hipernimo con respecto
a amarillo, naranja, verde...
hipnimo adj. Decimos que una palabra es hipnima cuando tiene un campo significativo que queda incluido en otro de mayor extensin. Ejemplo: amarillo, naranja, verde son
hipnimos ya que pertenecen al trmino color.
homonimia f Tipo de polisemia. Se da cuando dos conceptos diferentes han llegado a
tener el mismo nombre, la misma forma, pero vienen de orgenes diferentes y por lo tanto
tienen etimologas diferentes.
identificador m Trmino de indizacin propio del lenguaje documental Listado de autoridades. Tambin se conocen con el nombre de autoridad y descriptores.
indizacin f Accin de describir o identificar un documento en relacin a su contenido.
Norma UNE 50-121-91. Indizar es el resultado de examinar el documento, seleccionar los
conceptos y almacenarlos en una base de datos. Esta definicin implica tres acciones, de
las cuales la ms significativa es la seleccin de los conceptos y su traduccin al lenguaje
documental.
indizacin por conceptos loc. v. Indizacin de las ideas y nociones del texto, sin reducirlo a un tema principal. Responden a la pregunta cules son los conceptos de este documento?, van ligados necesariamente a sistemas automatizados. Los lenguajes que indizan
por conceptos son tres: listados de autoridades, tesauros, listados de descriptores libres.
indizacin por materias loc. v. Indizacin sinttica. Responden a la pregunta cul es
el tema de este documento?. Los lenguajes que indizan por materias son dos, los sistemas
de clasificacin y las listas de encabezamientos de materia.
indizacin por palabras clave loc. v. Indizacin de todas las palabras con significado
del texto. Es el proceso ms analtico que existe. No es una tarea de indizacin humana, sino
automtica. Los programas que indizan por palabras clave seleccionan slo las palabras que
tienen significado (preferentemente sustantivos). Slo hay un lenguaje por palabras clave, y
es evidentemente el nico lenguaje automtico, el listado de palabras clave.
ISO 214: 1976 f Norma internacional, traducida por AENOR como norma UNE 50-103-90
Preparacin de resmenes.
jerrquica adj. Tipologa de lenguaje documental consistente en estructurar los trminos
de indizacin de forma arborescente. El vocabulario se presenta en forma de cadena, con
trminos genricos que agrupan trminos ms especficos. Todos los trminos dependen de
un trmino superior y de significado ms genrico. Esta estructura permite agrupar los conceptos por temas.
lenguaje artificial m Ved controlado.
lenguaje documental m Vocabulario de trminos en lenguaje natural o un sistema artificial de signos normalizados que facilitan la representacin del contenido de los documentos.
Sus funciones principales son indizar el contenido de los documentos y permitir la recuperacin a partir del campo materia.
lenguaje natural m Lenguaje que usamos de forma cotidiana: cataln, castellano, vasco,
gallego, francs, etc.
libre adj. Tipologa de lenguaje documental consistente en listas de trminos extrados del
lenguaje natural sin formar parte de ningn listado establecido a priori, ni haber pasado un
proceso de control de su vocabulario. Los lenguajes libres son dos: los listados de descriptores
libres y el listado de palabras clave.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

56

listado de autoridades m Lenguaje documental. Analtico por conceptos, natural, controlado, postcoordinado y combinatorio. Su trmino de indizacin se conoce como identificador, autoridad o descriptor.
listado de descriptores libres m Lenguaje documental. Analtico por conceptos, natural,
libre, postcoordinado y combinatorio. Su trmino de indizacin se conoce como descriptor.
listado de encabezamientos de materia m Lenguaje documental. Sinttico por materias, natural, controlado, precoordinado y combinatorio. Su trmino de indizacin se conoce
como encabezamiento.
listado de palabras clave m Lenguaje documental. Analtico por palabras clave, natural,
libre, postcoordinado y combinatorio. Su trmino de indizacin se conoce como palabra
clave.
natural adj. Tipologa de lenguaje documental consistente en el uso de palabras del lenguaje usual, habitual, no cdigos. Hay cinco lenguajes documentales naturales: las listas de
encabezamientos de materia, los listados de autoridades, los tesauros, los listados de descriptores libres y los listados de palabras clave.
naturaleza de los lenguajes f Tipologa de los lenguajes documentales que los clasifica
en codificados o naturales.
nivel de anlisis m Tipologa de los lenguajes documentales que los clasifica en lenguajes
de materias, conceptos y palabras clave.
nivel de control m Tipologa de los lenguajes documentales que los clasifica en libres o
controlados.
nivel de coordinacin m Tipologa de los lenguajes documentales que los clasifica en
precoordinados o postcoordinados.
notacin f Trmino de indizacin propio del lenguaje documental de los sistemas de clasificacin.
palabra clave f Trmino de indizacin propio del lenguaje documental de las palabras
clave o indizacin automtica. Palabra o grupo de palabras seleccionadas de manera automtica del ttulo, resumen o texto de un documento que representan el contenido y permiten
la recuperacin.
palabra vaca f Palabra sin significado en las operaciones de indizacin y resumen. Son
preposiciones, artculos, verbos, adverbios, etc.
polisemia f Propiedad de un signo lingstico de tener ms de un significado. Decimos que
dos palabras son polismicas cuando el mismo signo lingstico, palabra o sonido, tiene ms
de un significado. La palabra tiene un nico origen etimolgico y acaba teniendo significados
diferentes sin cambiar su categora gramatical.
ponderacin (de frases, de palabras) f Mtodo que evala las frases y las palabras de
un texto en funcin de parmetros como la frecuencia, la presencia de palabras indicativas
(buscan palabras como importante, esencial, conclusiones, etc.), la aparicin en lugares destacados, por ejemplo el ttulo: al principio de cada prrafo, al final a modo de conclusiones, etc.
postcoordinacin f Tipologa de lenguaje documental consistente en combinar los trminos de indizacin en el momento de la recuperacin. Los lenguajes postcoordinados slo
tienen sentido en sistemas documentales automatizados que dispongan de un fichero inverso. Los lenguajes postcoordinados son cuatro: listados de autoridades, tesauros, listados de
descriptores libres y listados de palabras clave.
precoordinacin f Tipologa de lenguaje documental consistente en determinar a priori
cmo se combinan los trminos, ya sea a la hora de construir el lenguaje, de indizar el documento, o de recuperarlo. Los dos lenguajes precoordinados son los sistemas de clasificacin
y las listas de encabezamientos de materia.
procesamiento en lenguaje natural (PLN) m Rama de la inteligencia artificial y de
la lingstica computacional que estudia los lenguajes que usan los humanos para interactuar con los ordenadores en contextos escritos y orales. EL PLN estudia cmo emular el conocimiento humano, en cuanto a la identificacin de los conceptos y frases con contenido
relevante.
relacin de significado f Ved relacin semntica.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

57

relacin semntica f Relaciones de significado de las palabras. Las relaciones pueden ser
de tipo genrico, especfico o relacionado de un trmino con respecto a otro. En lenguaje
natural estas relaciones son implcitas pero en un lenguaje documental hay que definir estas
relaciones, agrupando y relacionando los trminos afines.
representar el contenido loc. v. Expresin que significa describir el tema o los temas de
un documento.
resumen m Presentacin abreviada y precisa de un documento, sin interpretacin ni crtica
y sin mencin expresa del autor del resumen. Norma UNE 50-103-90 Preparacin de resmenes.
resumen indicativo m Resumen que consigna slo las ideas centrales del documento. Su
lectura no puede sustituir la lectura del original.
resumen informativo m Resumen que consigna el tema central, temas adicionales, naturaleza y objetivo del documento, metodologa, resultados, conclusiones y anexos. La idea
de fondo es que un resumen informativo puede sustituir en ocasiones la lectura del documento original.
resumen selectivo m Resumen que consigna slo una parte concreta del documento. El
ms habitual es el resumen de conclusiones, pero tambin hay otros tipos, como la resea
(review).
seleccin de los trminos de indizacin f Segunda fase en el proceso de indizacin
consistente en identificar las nociones que son elementos esenciales de la descripcin del
contenido. Los criterios de seleccin son el nmero de conceptos (criterio de exhaustividad)
y la exactitud de los mismos (criterio de especificidad).
smbolo de clase m Ved Notacin.
sinonimia f Palabras que tienen el mismo significado. Ejemplo: alimento, nutriente, comida, provisin. En un sistema documental, si no se controlan y se usan indiscriminadamente, comportan silencio documental.
sistema de clasificacin m Lenguaje documental. Sinttico por materias, codificado,
controlado, precoordinado y jerrquico. Su trmino de indizacin se conoce como notacin
o smbolo de clase.
trmino de indizacin m Representacin de un concepto en lenguaje natural o un cdigo de clasificacin. Los trminos de indizacin pueden estar formados por una palabra o
ms de una.
tesauro m Lenguaje documental. Analtico por conceptos, natural, controlado, postcoordinado, jerrquico y combinatorio. Su trmino de indizacin se conoce como descriptor.
traduccin a un lenguaje documental controlado f Buscar un concepto expresado
en lenguaje natural en el listado de trminos de un lenguaje documental controlado. Utilizar
el trmino controlado para indizar y recuperar.
UNE 50-103-90 Preparacin de resmenes f Norma espaola que establece las directrices que se tienen que seguir para presentar los resmenes en los documentos. Pone especial
nfasis en la preparacin de resmenes por parte de los autores de los documentos primarios
y en la misma publicacin.
UNE 50-113-92/1 f Norma espaola titulada Documentacin e informacin. Vocabulario.
Parte 1. Conceptos fundamentales. En: Documentacin: Normas fundamentales. Madrid: AENOR, 1994.
UNE 50-121-91 f Norma espaola titulada Mtodos para el anlisis de documentos, determinacin de su contenido y seleccin de trminos de indizacin. Basa el proceso de indizacin en
tres fases: examinar el documento para identificar su contenido, seleccionar los conceptos
principales de los contenidos y traducir a un lenguaje documental.
unitrmino m La parte ms pequea con significado de un trmino de indizacin. La
norma UNE 50-113-92/1 define los unitrminos como el elemento significativo ms pequeo
de un lenguaje documental utilizado para representar un concepto especfico en un sistema
de indizacin coordinado; no se debe confundir con palabra clave o descriptor.
univocidad f Representar un concepto con un nico trmino.

Anlisis de contenido: resumen e indizacin

CC-BY-NC-ND PID_00143964

58

Bibliografa
Bibliografa sobre el resumen
AENOR (1990). Documentacin. Preparacin de resmenes. UNE 50 103 90. Madrid: AENOR.
Climent, Salvador. Sistemes de resum automtic de documents. Digit. Hum. Revista digital dhumanitats. ISSN 1575-2275.
Lloret, E.; Ferrndez, O.; Muoz, R.; Palomar, M. (2008). Integracin del reconocimiento de la implicacin textual en tareas automticas de resmenes de textos. Procesamiento del lenguaje natural, nm. 41, pg. 183-190.
Mateo, P. L.; Gonzlez, J. C.; Villena, J; Martnez, J. L. (2003). Un sistema para resumen
automtico de textos en castellano.
Pinto Molina, M. (1992). El resumen documental: principios y mtodos. Madrid: Pirmide/
Fundacin Germn Snchez Ruiprez (Biblioteca del Libro, Y).
Bibliografa sobre la indizacin
Abadal, E.; Codina, L. (2005). Recuperacin de Informacin. En: Bases de Datos Documentales: Caractersticas, funciones y mtodo (cap. 2. p. 29-92). Madrid: Sntesis.
AENOR (1997). Mtodos para el anlisis de los documentos, determinacin de su contenido y
seleccin de los trminos de indizacin. Norma UNE 50-121-91. Madrid: AENOR.
AENOR (1997). Documentacin e informacin. Vocabulario. Parte 6: lenguajes documentales. Revista Espaola de Documentacin Cientfica, Norma UNE-50-113/6 (ISO 5127/6), vol.
20, nm. 4, pg. 417-436.
Cid, P.; Cuadrado, M.; Aguiriano, C. (1999). Fonaments de llenguatges documentals. [Document electrnic]. Barcelona: UOC.
Codina, L. (1994). El papel del lenguaje natural en los sistemas multimedia: una reflexin
sobre la tecno-simpleza y la ciber-ingenuidad. Cuadernos de documentacin multimedia, nm.
3 (junio).
Gil Leiva, I. (2008). Manual de indizacin. Teora y prctica. Gijn: Ediciones Trea (Biblioteconoma y Administracin cultural, 193).
Gil, I.; Rodrguez Muoz, J. V. (1996). El Procesamiento del lenguaje natural aplicado
al anlisis del contenido de los documentos. Revista general de informacin y documentacin,
vol. 6, nm. 2, pg. 205-218.
Gil Urdiciain, B. (1992). Funcin de los lenguajes documentales en el tratamiento de la
informacin en las organizaciones. Revista general de informacin y documentacin, vol. 2,
Nm. 2, pg. 195-200.
Gil Urdiciain, B. (2004). Manual de lenguajes documentales. Gijn: Ediciones Trea (Biblioteconoma y Administracin cultural, 106).
Norma UNE 50-113-92/1. Documentacin e informacin. Vocabulario. Parte 1. Conceptos fundamentales (1994). En: Documentacin: Normas fundamentales. Madrid: AENOR.
Slype, G. van (1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin en los
sistemas documentales. Madrid: Pirmide. Fundacin Germn Snchez Ruiprez. Biblioteca
del Libro.

Anlisis de contenido: resumen e indizacin

Sistemas de
clasificacin
documentales
Manela Junc Campdepadrs
PID_00143962

CC-BY-NC-ND PID_00143962

Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es

Sistemas de clasificacin documentales

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

ndice

Introduccin...............................................................................................

Objetivos.......................................................................................................

1.

Clasificar y sistemas de clasificacin...........................................


1.1.

Clasificaciones bibliogrficas o documentales ............................


1.1.1.

1.2.

1.3.

Qu son las clasificaciones bibliogrficas o


documentales? ...............................................................

10

1.1.2.

Dnde se aplican? ........................................................

10

1.1.3.

Funciones .......................................................................

11

1.1.4.

Cuntas clasificaciones hay? ........................................

12

1.1.5.

Conclusiones ..................................................................

12

Clasificaciones documentales: tipologa .....................................

14

1.2.1.

Por alcance de contenido ..............................................

14

1.2.2.

Por estructura .................................................................

14

1.2.3.

Conclusiones ..................................................................

16

Breve historia de las clasificaciones bibliogrficas ......................

17

1.3.1.

La clasificacin decimal de Dewey, de 1885 ..................

19

1.3.2.

La clasificacin decimal universal, de 1905 ..................

21

1.3.3.

La clasificacin Colon, de 1933 ....................................

22

1.3.4.

Otras clasificaciones documentales de los siglos XIX


y

2.

XX.................................................................................

24

1.3.5.

Los sistemas de clasificacin en Espaa y Catalua ......

25

1.3.6.

Conclusiones ..................................................................

27

La clasificacin decimal universal................................................

29

2.1.

Caractersticas de la clasificacin decimal universal ...................

29

2.2.

Ediciones de la CDU ...................................................................

31

2.3.

Gestin de la CDU ......................................................................

33

2.3.1.

Quin es el responsable de la gestin de la CDU? .......

33

2.3.2.

Se actualizan las clases de la CDU? ..............................

34

2.3.3.

Nuevas ediciones de la CDU y reclasificacin de los


fondos ............................................................................

34

Conclusiones ..................................................................

35

Estructura de la clasificacin decimal universal......................

36

3.1.

Clases y notaciones .....................................................................

37

3.1.1.

Clases .............................................................................

37

3.1.2.

Notacin ........................................................................

39

3.1.3.

Conclusiones ..................................................................

40

Tablas principales ........................................................................

41

2.3.4.
3.

10

3.2.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

3.2.1.
3.3.

3.4.

Tablas principales de la edicin de bolsillo CDU


2004 ...............................................................................

41

Tablas auxiliares de la clasificacin decimal universal (CDU) ....

54

3.3.1.

Tablas de auxiliares comunes ........................................

56

3.3.2.

Tablas de auxiliares especiales .......................................

65

Signos con funcin combinatoria y signos con funcin


instructiva ....................................................................................

70

3.4.1.

La importancia de los signos .........................................

70

3.4.2.

Los signos con funcin combinatoria ...........................

72

3.4.3.

Los signos puramente instructivos ................................

73

3.4.4.

Conclusiones ..................................................................

73

4.

Empezamos a clasificar....................................................................

75

5.

Prcticas con la CDU.........................................................................

78

5.1.

Ejercicios de nivel bajo ...............................................................

78

5.2.

Ejercicios de nivel medio ............................................................

80

5.3.

Ejercicios de nivel alto ................................................................

81

Creacin de un sistema de clasificacin propio.........................

83

6.1.

Estudio previo .............................................................................

83

6.2.

Metodologa .................................................................................

84

6.3.

Proceso de creacin .....................................................................

84

6.4.

Mantenimiento ............................................................................

86

Glosario........................................................................................................

90

Bibliografa.................................................................................................

94

6.

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

Introduccin

El mdulo Sistemas de clasificacin est pensado para estudiantes que no


tengan conocimientos previos sobre el mundo de las clasificaciones documentales. Se trata, pues, de un mdulo introductorio al estudio de los diferentes
sistemas de clasificacin documentales y, de manera especial, de la clasificacin decimal universal (CDU), que es el sistema ms aplicado en nuestro mbito cultural europeo.
Itinerariodeestudio
El mdulo est concebido como una aproximacin del concepto ms general
al ms concreto. La secuencia es:
Sistemas de clasificacin > Clasificaciones bibliogrficas o documentales > Clasificacin decimal universal.
Completaremos la visin del tema aportando las tcnicas ms interesantes
de Jacques Maniez (1993) sobre la construccin de un sistema nuevo, muy
adecuado para aquellos documentalistas que tengan que crear un sistema a
medida.
El mdulo es terico, normativo y en mayor medida, prctico, ya que uno de
los objetivos que se proponen es conseguir una cierta habilidad en la clasificacin de documentos con la CDU.
Conceptos ms importantes

Ved tambin

Concepto

Ved

Clasificacin documental

1.1. Clasificaciones bibliogrficas


1.2. Clasificaciones bibliogrficas: tipologa
1.3. Breve historia de las clasificaciones bibliogrficas

Clases

3.1. Clases y notacin


3.2. Tablas principales
3.3. Tablas auxiliares de la CDU

Notacin

3.1. Clases y notacin


3.4. Signos: combinatorios e instructivos

Auxiliares comunes

3.3.1. Tablas de auxiliares comunes

Auxiliares especiales

3.3.2. Tablas de auxiliares especiales

Clasificar con CDU

4. Empezamos a clasificar
5. Prcticas con la CDU

Para construir un cuadro de


clasificacin, ved el apartado 6
de este mdulo didctico.

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

Bibliografayrecursosweb
Presentamos la bibliografa en dos secciones:

una seleccin de fuentes de informacin indispensables para los estudiantes que se introducen en el estudio de las clasificaciones.

la lista entera a partir de la cual se ha hecho la seleccin anterior.

Seleccinbibliogrfica
Es indispensable la consulta de la clasificacin decimal universal en edicin
de bolsillo o en CD.
La tabla siguiente muestra que las obras de Mara Pinto (ed.), Jacques Maniez e
I. C. McIlwaine son muy indicadas con respecto a la teora de las clasificaciones; y que obras como las Miguel Benito, Carmen Diez-Carrera e I. McIlwaine
lo son para las prcticas.
Obras recomendadas
Bibliografa

Teora/historia de
las clasificaciones

Estructura Ejercicios de CDU


de la CDU
con solucin

Clasificacin Decimal Universal

(CDU) de bolsillo (2004). Madrid:


AENOR.

Benito,M.(1999). El sistema
de clasificacin decimal universal:
manual de aprendizaje. Madrid:
Taranco.

DezCarrera,C. (1999). Tcni-


cas y rgimen de uso de la CDU
(Clasificacin Decimal Universal)
(pg. 134). Gijn: Trea (Biblioteconoma y Administracin Cultural, 26).

Maniez,J. (1992). Los lenguajes


documentales y de clasificacin:
concepcin, construccin y utilizacin en los sistemas documentales.
Madrid: Pirmide / Fundacin
Germn Snchez Ruiprez.
McIlwaine,I.C. (2003). Clasificacin Decimal Universal. Gua
para uso de la CDU. Madrid: AENOR.
PintoMolina,M.(ed.) (1997).
Manual de clasificacin documental. Madrid: Sntesis (Biblioteconoma y Documentacin).

CC-BY-NC-ND PID_00143962

Bibliografa

Teora/historia de
las clasificaciones

SanSegundoManuel,R.
(1997). Principales sistemas de
clasificacin. A: M. Pinto (ed.).
Manual de clasificacin documental (pg. 67-89). Madrid: Sntesis
Biblioteconoma y Documentacin).

Sistemas de clasificacin documentales

Estructura Ejercicios de CDU


de la CDU
con solucin

Seleccinrecursosweb
Por lo que respecta a los recursos web, no podemos dejar de seleccionar las
webs de las sedes oficiales de los sistemas de clasificacin ms aplicados en el
mundo La CDU y la Dewey y los tutoriales sobre la CDU.
Clasificacindecimaluniversal(weboficial,blog):

Universal Decimal Classification Consortium Homepage. La Haya: UDC Consortium Act. 2002-08-01 [en lnea]. [Consulta: 10 de octubre de 2008].

Universal Decimal Classification Blog. UDC Consortium [en lnea]. [Consulta: 10 de octubre de 2008].

ClassificacinDewey(actualizaciones,clases,blog):

OCLC Online Computer Library Center. Dewey services, Dewey decimal classification for use with OCLCs online cataloging services. [Consulta: 10 de octubre de 2008]. [En lnea].

025.431: The Dewey blog [Consulta: 10 de octubre de 2008]. [En lnea].

Publiclibrariesusingspanish. Spanish version of the Dewey Decimal Classification System based on the 18th edition of DDC [Consulta: 10 de octubre
de 2008]. [En lnea].
Cabe destacar las pginas personales y tutoriales de Miguel Benito, Ferran
Burguillos y Enric Mestre para sus exposiciones pedaggicas:

Benito,Miguel. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10 de octubre de 2008]. O, tambin, en la URL Instituto
de Taranco [Fecha de consulta: 10 de octubre de 2008].

BurguillosMartnez, Ferran. Tutorial de la Clasificacin decimal universal


[en lnea]. [Fecha de consulta: 10 de octubre de 2008].

MestreiRibera,Enric. Classificaci decimal universal [en lnea]. [Fecha de


consulta: 10 de octubre de 2008].

CC-BY-NC-ND PID_00143962

Objetivos

Con el estudio de los materiales asociados a este mdulo, alcanzaris los objetivos siguientes:

1. Definir los sistemas de clasificacin documental y su tipologa.


2. Presentar la evolucin histrica de estos lenguajes documentales.
3. Conocer la clasificacin decimal universal: caractersticas, estructura y sintaxis.
4. Adquirir una cierta habilidad en la clasificacin de documentos con la
CDU.
5. Introducirse en la creacin de un sistema de clasificacin nuevo.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

1. Clasificar y sistemas de clasificacin

Lectura complementaria

Clasificar es distribuir en clases o categoras.

Hay tres tipos de sistemas de clasificacin (Maniez, 1992, pg. 23).


1) Las clasificaciones filosfico-cientficas que clasifican el conocimiento
humano. Catalogan las leyes universales y los fenmenos naturales. Landgridge las califica de formas primarias, ya que observan directamente el mundo y
la naturaleza del conocimiento.

Sobre los tres tipos de clasificaciones mencionados aqu,


podis consultar la obra siguiente:
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin
y utilizacin en los sistemas documentales. Madrid: Pirmide
/ Fundacin Germn Snchez
Ruiprez.

Clasificaciones filosfico-cientficas
Sistemas de Porfirio, Platn, Aristteles, F. Bacon, A. Comte, Leibniz.

2)Las clasificacionesbiolgicasotaxonomas clasifican organismos vivos e


inertes en una jerarqua. Actualmente, el trmino taxonoma se aplica tambin
en el mundo de la informacin y las fuentes disponibles en el WWW.
Clasificaciones biolgicas o taxonomas
Elementos qumicos, plantas, animales...

3) Las clasificacionesbibliogrficas o documentales clasifican el fondo de


1

un servicio de informacin y documentacin (SID ). Para Landgridge, tratan


del conocimiento cuando ya se ha fijado en los documentos; por lo tanto, no
todo el conocimiento, sino slo aquel que se ha fijado en un soporte material.
A grandes rasgos, las diferencias ms importantes entre las clasificaciones filosfico-cientficas y las documentales son que las primeras buscan organizar el
conocimiento, mientras que las segundas quieren representar el contenido de
los documentos y, adems, las primeras son tericas y las segundas prcticas
(Mara Pinto; Carmen Glvez, 1997, pg. 35).
A pesar de todo, no podemos negar que las primeras influyen en las ltimas
y que las clasificaciones documentales estn ntimamente influidas por las
sucesivas concepciones del conocimiento. De hecho, las clasificaciones son
fruto de una sociedad y de un tiempo determinado.
La influencia de Francis Bacon
El sistema filosfico de Francis Bacon influye en la clasificacin bibliogrfica de Brunet
(Francia, 1804) y en la clasificacin bibliogrfica de Harris de 1870.

(1)

SID es la sigla de servicio de informacin y documentacin.

CC-BY-NC-ND PID_00143962

10

A partir de este momento, el mdulo se centrar en las clasificaciones de tipo

Sistemas de clasificacin documentales

A modo de conclusin

bibliogrfico o documental.

Clasificar es distribuir en clases


o categoras. Hay tres tipos de
sistemas de clasificacin: los filosfico-cientficos, que clasifican el conocimiento humano
de manera genrica; los taxonmicos, que clasifican organismos vivos e inertes; y los bibliogrficos o documentales,
que clasifican el fondo documental de un SID.

Bibliografa
B.GilUrdiciain(1997). Los lenguajes de clasificacin documental. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y
Documentacin).
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y
utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez
Ruiprez.
M.PintoMolina(ed.) (1997). Manual de clasificacin documental. Madrid: Sntesis (Biblioteconoma y Documentacin).

1.1. Clasificaciones bibliogrficas o documentales


Primero definiremos qu son, dnde se aplican, qu funciones tienen y cuntas hay en el mundo. En segundo lugar, trataremos la diversa tipologa de las
clasificaciones bibliogrficas. En tercer y ltimo lugar, haremos un pequeo
viaje por la historia de las clasificaciones bibliogrficas. Empezamos!
1.1.1. Qu son las clasificaciones bibliogrficas o documentales?

Las clasificaciones bibliogrficas o documentales son un lenguaje documental que divide el conocimiento (enciclopdico o especfico de un
rea temtica) en una serie ordenada de clases y subclases basadas en
las semejanzas y diferencias.

La estructura jerrquica o facetada de estas clasificaciones refleja las relaciones


y el contexto del concepto.
Turismo econmico o turismo de ocio
Si el concepto turismo depende jerrquicamente de la clase economa, entenderemos que
hace referencia al turismo como factor econmico. Si, en cambio, depende jerrquicamente de la clase tiempo libre, entenderemos que se refiere al turismo como un elemento
de ocio y descanso. En los dos casos, la estructura refleja el contexto del concepto, a diferencia de una lista simplemente ordenada de trminos de indexacin.

1.1.2. Dnde se aplican?


Todos los servicios de informacin y documentacin, SID2, (archivos, bibliotecas y centros de documentacin) utilizan algn sistema de clasificacin, pero
difieren bastante unos de otros. En palabras de Miguel ngel Esteban:
1)Usodelossistemasdeclasificacinenlosarchivos

(2)

A partir de ahora denotamos servicios de informacin y documentacin con la sigla SID.

CC-BY-NC-ND PID_00143962

11

En los archivos se presenta como la identificacin de agrupaciones documentales naturales mediante el auxilio de un sistema de clasificacin que reproduce la estructura orgnica o el entramado funcional de la institucin generadora del fondo como resultado de
su actividad natural para el cumplimiento de sus fines.

2)Usodelossistemasdeclasificacinenbibliotecas
La clasificacin se identifica en las bibliotecas con la agrupacin intelectual e incluso
fsica de los documentos en clases que mantengan entre s relaciones de superioridad y
dependencia, a partir de la extraccin y representacin codificada de su contenido temtico principal (materia) de acuerdo con las reglas de un sistema de clasificacin jerrquico
o facetado.

Sistemas de clasificacin documentales

Lectura complementaria
Sobre los sistemas de clasificacin en los servicios de informacin y documentacin
segn Miguel ngel Esteban,
podis consultar la obra siguiente:
MaraPintoBatanea(ed.)
(1997). Manual de clasificacin documental (pg. 20).
Madrid: Sntesis (Biblioteconoma y Documentacin).

Usodelossistemasdeclasificacinenloscentrosdedocumentacin
En los centros de documentacin se considera como una actividad innecesaria habitualmente porque tiene prioridad el anlisis conceptual del contenido de los documentos,
si bien puede estar presente como una funcin auxiliar para el control de la diversidad
de la coleccin y la reduccin del rea de busca con el uso de los niveles superiores de
un tesaurus.

Aadiremos el uso de los sistemas de clasificacin para organizar el conocimiento del WWW: tal como dice I. McIlwaine, los sistemas como la CDU pueden tener dos utilidades:

Organizar y visualizar recursos de informacin dentro de los servicios de

Uso del sistema CDU


La CDU se utiliza en el portal
de las Guas temticas electrnicas del CBUC (Consorcio de
bibliotecas universitarias de
Catalua) [en lnea].

informacin de calidad.

Clasificar metadatos de documentos electrnicos.

Los cuadros de clasificacin utilizados en los archivos son por esencia originales y no extrapolables a otros fondos documentales, ya que responden a los
procesos propios de la organizacin y se estudian en otras asignaturas. En consecuencia, este mdulo se centrar en los sistemas utilizados en las bibliotecas.
1.1.3. Funciones
Los sistemas de clasificacin cumplen las tres funciones siguientes:

Representar el contenido de un documento de manera sinttica y codificada.

Ordenar fsicamente los documentos con un grado altamente significativo.


Observacin
Recordemos que podemos distinguir tres tipos de ordenaciones (Maniez, 1993, pg. 21):

Lectura recomendada
Para todos los interesado en
las aplicaciones de la CDU en
Internet, podis consultar la
obra siguiente:
I.C.McIlwaine (2003). Gua
para uso de la CDU (pg. 258272).

CC-BY-NC-ND PID_00143962

12

1) Ordenaciones no significativas, sin ninguna relacin con el contenido de los documentos, por ejemplo, ordenaciones numricas a partir del nmero de registro.
2) Ordenaciones con significado limitado: por lengua, pas, autor, disciplina, etc.
3) Ordenaciones altamente significativas: ordenacin por materias, de manera que los
documentos que traten de contenidos afines se coloquen cerca.

Generar subproductos del catlogo, sobre la base de su materia. Por ejemplo, listas bibliogrficas, ltimas adquisiciones ordenadas por temas...

1.1.4. Cuntas clasificaciones hay?


En estos momentos, hay al menos nueve sistemas de clasificacin documental
vigentes e implementados en las redes de bibliotecas universitarias y/o pblicas del mundo:
1) La clasificacin decimal universal (CDU).
2) La clasificacin Dewey (CD).
3) La clasificacin de la Library of Congress (LC).
4) La clasificacin china.
5) La clasificacin japonesa.
6) La clasificacin rusa (LBC, antigua BBK).
7) La clasificacin Colon (CC).
8) La clasificacin Bliss (CB).
9) La clasificacin Brown.
Como dice MiguelngelEsteban (1997, pg. 26):
No existe un sistema de clasificacin esencial, natural o nico que sea adecuado a priori
a la naturaleza de la realidad. En consecuencia no tiene razn juzgar en abstracto si una
clasificacin es mejor que otra, sino que habr que prestar atencin al contexto en el
cual se construy y al propsito que persigue. Como mximo podemos mantener que un
sistema clasificatorio es superior a otro porque puede aplicarse a un nmero mayor de
contextos, porque revela un nmero mayor de relaciones entre los hechos clasificados y
porque tiene una estructura ms rigurosa.

1.1.5. Conclusiones
Las clasificaciones bibliogrficas son un lenguaje documental que representa el contenido, ordena fsicamente los documentos (ordenaciones altamente
significativas) y genera subproductos de catlogo (como las listas bibliogrficas o las ltimas adquisiciones ordenadas por temas).
Se usan en todo tipo de SID: archivos, bibliotecas, centros de documentacin
y servicios de la red.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

13

A escala mundial, hay diversos sistemas de clasificacin documental: clasificacin decimal universal (CDU), clasificacin Dewey (CD), clasificacin de la
Library of Congress (LC), clasificacin china, clasificacin japonesa, clasificacin rusa (LBC, antigua BBK), clasificacin Colon (CC), clasificacin Bliss (CB),
clasificacin Brown.
En estos momentos de la lectura del mdulo, os habis de haber situado en
la secuencia:
Clasificar > Sistemas de clasificacin > Sistemas de clasificacin documentales > Aplicacin en las bibliotecas.
Ms informacin
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
M.A.Esteban(1997).Fundamentos epistemolgicos de la clasificacin documental.
En: M. Pinto (ed.). Manual de clasificacin documental (pg. 19-32). Madrid: Sntesis (Biblioteconoma y Documentacin).
M.Granados;A.Nicolau (2005, 6-8 de julio). La recuperaci de la informaci en els
catlegs en lnia: lus de la Classificaci decimal universal i la seva implicaci en la indexaci [en lnea]. 7. Congrs del Captol Espanyol dISKO. Barcelona: Departament
de Biblioteconomia i Documentaci de la Universitat de Barcelona. [Consulta: 1 octubre
de 2008].
Library of Congres Classification system [en lnea]. [Fecha de consulta: 1 de octubre de
2008].
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y
utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez
Ruiprez.
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
ClasificacinDewey(actualizaciones,clases,blog)
OCLC Online Computer Library Center. Dewey services, Dewey decimal classification for
use with OCLCs online cataloging services [en lnea]. [Consulta: 10 de octubre de 2008].
M.PintoMolina(ed.) (1997). Manual de clasificacin documental. Madrid: Sntesis (Biblioteconoma y Documentacin).
R. San Segundo Manuel (1997). Principales sistemas de clasificacin. En: M. Pinto
(ed.). Manual de clasificacin documental (pg. 67-89). Madrid: Sntesis (Biblioteconoma
y Documentacin).
025.431: The Dewey blog [en lnea]. [Consulta: 10 de octubre de 2008].
Universal Decimal Classification Blog [en lnea]. UDC Consortium. [Consulta: 10 de octubre de 2008].
Universal Decimal Classification Consortium Homepage. La Haya: UDC Consortium. Act.
2002-08-01 [en lnea]. [Consulta: 10 de octubre de 2008].

Sistemas de clasificacin documentales

14

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

1.2. Clasificaciones documentales: tipologa


Las clasificaciones documentales se pueden agrupar segn el alcance del contenido o la estructura.
Tipologa de clasificaciones
Por alcance de contenido

Clasificaciones enciclopdicas
Clasificaciones especializadas o sectoriales

Por estructura

Clasificaciones enumerativas o jerrquicas


Clasificaciones facetadas
Clasificaciones hbridas o mixtas

Esta tipologa no es excluyente, ya que una clasificacin es el resultado de la


combinacin de los elementos enciclopdica/sectorial con jerrquica/facetada/hbrida.

Tipologa no excluyente
La CDU es una clasificacin enciclopdica e hbrida.

1.2.1. Por alcance de contenido

Las clasificacionesenciclopdicas, como su nombre indica, recogen


todas las disciplinas universales. Se usan principalmente en bibliotecas
nacionales, universitarias y pblicas.

Las tablas principales nos informan de qu tratan todas las reas de conocimiento: filosofa, religin, ciencias sociales, ciencias exactas y naturales, tecnologa, arte, lenguas y literatura, geografa e historia.

Las clasificacionesespecializadas, como indica su nombre, hacen re-

Clasificaciones
enciclopdicas
Son ejemplos de clasificaciones
enciclopdicas la clasificacin
decimal universal, la clasificacin Dewey, la Library of Congress, la clasificacin Bliss.

ferencia slo a una disciplina. Tambin se las conoce por el nombre de


clasificacionessectoriales. Por su capacidad de especificacin, se usan
en centros de documentacin.

1.2.2. Por estructura


Las clasificaciones tienen dos tipos de estructura: la enumerativa y la facetada. Las dos tienen ventajas e inconvenientes; por eso, nace una tercera estructura que es la combinacin de las dos anteriores, con el objetivo de sumar
ventajas y minimizar los inconvenientes, y se conoce con el nombre de hbrida o mixta.

Las clasificacionesenumerativas o jerrquicasestructuran las clases


en forma de arborescencia.

Clasificaciones
especializadas
Clasificaciones especializadas
en el mbito mdico: clasificacin internacional de enfermedades (CIE, clasificacin internacional de enfermedades), medical subject subheadings por
la base de datos Medline.

CC-BY-NC-ND PID_00143962

15

Sistemas de clasificacin documentales

Cada clase se va dividiendo en subclases tantas veces como sea necesario para
representar el dominio entero o todos los supuestos posibles a la hora de clasificar un fondo. Las clases derivan de un punto comn y se puede recorrer
el camino desde el objeto ms especfico al ms general, siguiendo uno solo.
Cada concepto tiene un lugar, y slo uno; por ello, tambin se las conoce como clasificacionesmonojerrquicas.
Son enumerativas, es decir, enumeran de arriba abajo y de izquierda a derecha
todas las materias previstas. Tienen una estructura lgica, van de general a
especfico y las clases son disjuntas, es decir, son conjuntos mutuamente excluyentes.
Son las ms utilizadas porque son de fcil construccin y uso para el analista.
Tambin se adecuan muy bien en entornos enciclopdicos y universales.

Las clasificacionesfacetadas estn formadas por diversas clasificaciones jerrquicas autnomas a partir de una faceta (el periodo artstico,

La clasificacin de la
Library of Congress
La clasificacin de la Library
of Congress es un buen ejemplo de clasificacin jerrquica y
enumerativa.

la tcnica, etc.) que, cuando se combinan, describen la materia del documento de manera analtica. Son clasificaciones autnomas pero articuladas, combinables.

Las clasificaciones facetadas son ms flexibles que las enumerativas. El principal terico de las clasificaciones facetadas es Ranganathan, el autor de la clasificacin Colon.
Las facetas son principios de divisin basados en las caractersticas que las
materias tienen en comn. Se trata de agrupar los conceptos segn una caracterstica concreta que comparte con otras clases. Hay facetas de tipo universal,
aplicables a todos los campos del saber, y las hay propias de una materia.
Algunos ejemplos de facetas
Facetas universales son el espacio, el tiempo.
Algunas facetas propias de una materia son, para la materia Artes: Periodo artstico, Tcnica
artstica, Tema representado... As, Romnico, Gtico, Barroco, Modernismo, seran clases de
la faceta Periodo artstico que podramos aplicar a cualquier tipo de arte. Por ejemplo:
escultura modernista, pintura modernista, arquitectura modernista...

Las clasificacioneshbridas o mixtasson la combinacin de las dos


estructuras: la enumerativa con la facetada.

En este tipo de clasificaciones, las clases tienen estructura jerrquica y estn


formadas por:

Ved tambin
En el subapartado 1.3.3 se
profundiza en el estudio de las
facetas universales o frmula
PMEST de Ranganathan.

16

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

Clases principales para las grandes materias.

Tablas auxiliares para facetas de tiempo, lugar, forma, lengua...

Pequeas tablas auxiliares especiales dentro de las clases, que se corres-

La CDU: una clasificacin


hbrida

ponden a las facetas propias de una materia. Ejemplo: facetas propias para
astronoma.

La clasificacin decimal universal (CDU) combina la estructura jerrquica de las tablas con
los elementos facetados para representar conceptos ms
complejos y conceptos nuevos
a partir de la relacin de dos
conceptos preexistentes.

Signos clasificadores que permiten combinar ms de una materia expresando la relacin.


17:57 Biotica construido a partir de 17 tica y 57 Biologa

Para acabar, presentamos las ventajas y los inconvenientes que sealan B. Gil
(1997, pg. 107) y J. Maniez (1993, pg. 40):
Ventajas e inconvenientes de las clasificaciones jerrquicas y facetadas

Enumerativas o jerrquicas

Facetadas

Ventajas

La estructuracin de un dominio en trminos de ms genrico a especfico proporciona una visin completa, intuitiva y fcil para el clasificador, y tambin para el usuario que pasea por las estanteras en acceso libre.

Son analticas y, por lo tanto, permiten describir con precisin el contenido de un documento.
Son flexibles y no quedan desfasadas rpidamente.
Son fciles de automatizar, ya que los documentos se pueden buscar en conjunto o para cada faceta (tipo base de
datos relacional).

Inconvenientes

Son poco flexibles a la hora de actualizar y de combinar


diversas clases.

Su aplicacin es compleja.
Hay muchas materias que no se pueden representar fcilmente con facetas (conceptos de tipo mental, no objetos).
No todos los documentos tienen todas las facetas (por
ejemplo, la frmula PMEST de Ranganathan), lo cual hace
que la notacin no sea homognea.
La notacin es poco comprensible y memorizable.

1.2.3. Conclusiones
Las clasificaciones documentales admiten dos tipos de categoras:

Por alcance de contenido: enciclopdicas o sectoriales.

Por estructura: enumerativas o jerrquicas, facetadas, hbridas o mixtas.

Las clasificaciones jerrquicas estructuran las clases en forma de arborescencia.


Cada clase se va dividiendo en subclases tantas veces como sea necesario para
representar el dominio entero.
Las clasificaciones facetadas estructuran las clases, primero dominios de conocimiento, dentro de cada dominio por facetas, y en cada faceta de manera
jerrquica.

CC-BY-NC-ND PID_00143962

17

Las clasificaciones hbridas participan de las caractersticas de las dos anteriores, combinando la estructura arborescente propia de la jerrquica con la posibilidad de expresar facetas con tablas auxiliares comunes y especiales y signos
de valor clasificatorio.
Ms informacin
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
B.GilUrdiciain(1997). Los lenguajes de clasificacin documental. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y
Documentacin).
Library of Congres Classification outline [en lnea]. [Consulta: 1 de octubre de 2008].
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y
utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez
Ruiprez.
OnlineComputerLibraryCenter. Dewey services, Dewey decimal classification for use with
OCLCs online cataloging services [en lnea]. [Consulta: 10 de octubre de 2008].
R. San Segundo Manuel (1997). Principales sistemas de clasificacin. En: M. Pinto
(ed.). Manual de clasificacin documental (pg. 67-89). Madrid: Sntesis (Biblioteconoma
y Documentacin).
Universal Decimal Classification Blog. UDC Consortium [en lnea]. [Consulta: 10 de octubre de 2008].
Universal Decimal Classification Consortium Homepage. La Haya: UDC Consortium. Act.
2002-08-01 [en lnea]. [Consulta: 10 de octubre de 2008].

1.3. Breve historia de las clasificaciones bibliogrficas


Si hiciramos un rpido viaje por el tiempo para conocer la historia de las
clasificaciones documentales, veramos que se fueron construyendo influidas
por los sistemas filosficos contemporneos, y a medida que iban surgiendo
las necesidades. Estas necesidades han sido tradicionalmente las siguientes:
a) Compilar el conocimiento documental en general. Es el caso de la CDU,
que no naci para clasificar una biblioteca, sino para crear una bibliografa
enciclopdica y mundial, el proyecto RBU (Repertorio Bibliogrfico Universal).
b) Crear un instrumento prctico para clasificar y ordenar el fondo de una
biblioteca concreta. Es el caso de la clasificacin de la Biblioteca del Congreso
y su fondo de dos millones de libros.
c) Facilitar el acceso libre a las estanteras.
d) Crear/adaptar el sistema de clasificacin segn la ideologa imperante del
momento, como por ejemplo, la influencia del marxismo y del leninismo en
las clasificaciones de le antigua URSS y China.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

18

En la historia de las clasificaciones documentales, tambin observamos que


los cuadros de clasificacin se basan unos en otros. No hay autnticas revoluciones, sino evoluciones.
Como dice JacquesManiez (1987, pg. 151):
En clasificacin, como en cualquier disciplina, es intil reinventar la rueda.

Precisamente Aristteles ser el primer pensador que encontraremos en nuestro viaje, con la formulacin de la lgica aristotlica. Es l y el rbol dicotmico de Porfirio.
Aristteles y la lgica aristotlica
Aristteles y la lgica aristotlica: la lgica (que l llamaba analtica) no es una ciencia
sustantiva, sino un instrumento (en griego organon). No es una simple lgica formal,
sino toda una teora de la ciencia. Distingue la deduccin de la induccin y desarrolla
una teora bastante completa de una forma de razonamiento deductivo: el silogismo.
Aunque la lgica aristotlica tiene limitaciones importantes (desconoce las proposiciones
relacionales; considera slo las predicativas, y reduce la deduccin al silogismo), ha sido
la aportacin fundamental a esta ciencia hasta el siglo XIX.
Las ciencias, segn Aristteles, pueden ser de tres tipos:

Tericas: fsica, matemticas y filosofa primera o teologa.


Prcticas: moral y poltica.
Productivas: ciencias aplicadas.

Gran Enciclopdia Catalana


Porfirio y la dicotoma
Divisin en dos. Mtodo de clasificacin en que las divisiones y las subdivisiones son
binarias.
Gran Enciclopdia Catalana

A continuacin visitamos la Biblioteca de Alejandra (Egipto), fundada por


Ptolomeo aproximadamente en el ao 300 a. C., que catalogaba su coleccin
de manuscritos en pinakes (fichas con informacin sobre el nombre del autor
y el sumario del contenido).
En la Edad Media, encontramos bibliotecas en los monasterios y en las universidades. Los fondos documentales eran religiosos o de las materias propias del
Trivium (gramtica, retrica, dialctica) y Quatrivium (aritmtica, geometra,
msica, astronoma). En aquellos momentos, las clasificaciones bibliogrficas
estaban vinculadas a la coleccin que tenan que clasificar, no a una voluntad
enciclopedista, criterio que no surgir hasta el siglo XVIII.

Sistemas de clasificacin documentales

No hay revoluciones, sino


evoluciones
La clasificacin filosfica cientfica de Francis Bacon sirve de
base a Brunet y a Harris, que
a la vez es la base en la que se
inspira Dewey, que a su vez es
copiado por Otlet y La Fontaine. Cutter inspira la Library of
Congress, Ranganathan comparte cuerpo terico con Aristteles...

CC-BY-NC-ND PID_00143962

19

En la Edad Moderna, y gracias a las teoras de Francis Bacon (1561-1626), se


acaban las concepciones medievalistas de la clasificacin de las ciencias. Su
filosofa se basa en la sustitucin de la lgica deductiva medieval por un nuevo
mtodo, experimental e inductivo. De esta poca es famosa la clasificacin
Brunet (Francia, 1804), que siguiendo a F. Bacon clasificaba el saber en cinco
clases bsicas: teologa, jurisprudencia, historia, filosofa y literatura.
Y llegamos a la Edad Contempornea, pero aqu reducimos el ritmo para conocer a cuatro documentalistas que han afirmado las bases de la clasificacin
moderna. Y para hacerlo, nos situaremos aproximadamente entre 1870 y 1940.

Sistemas de clasificacin documentales

El mtodo de Francis
Bacon
Bacon propone un nuevo mtodo para el estudio de las
ciencias, basado en: observar
inducir hacer hiptesis experimentar demostrar o no
la hiptesis y concluir. Para
Bacon, todo el saber se reduca
a tres facultades humanas: la
memoria (que genera la historia), la imaginacin (que crea
la poesa y las artes) y la razn
(que produce la filosofa y las
ciencias).

La clasificacin de Harris
En 1870, un bibliotecario norteamericano llamado Harris publica su sistema de clasificacin. Agrupa las clases en ciencias, artes e historia, un esquema que sigue directamente
el estilo de las tres facultades de Bacon.
A caballo entre los siglos XIX y XX, se da una circunstancia clave que da gran importancia
a la teora de las clasificaciones: el incremento de las colecciones de las bibliotecas.

Una vez situados en el tiempo, nos ubicaremos geogrficamente: primero iremos a Estados Unidos, a visitar a un joven de 22 aos, Melvil Dewey, de Masachusetts, que tiene el honor de ser el creador de la clasificacin ms implementada por todo el mundo actualmente; despus, a Blgica, a conocer a Paul
Otlet y Henry la Fontaine, considerados padres de la documentacin moderna
y creadores de la CDU; y, finalmente, a Madrs, en la India, para conocer a
Shiyali R. Ranganathan, bibliotecario y profesor de matemticas que revolucion la teora de las clasificaciones.
Finalmente, haremos un breve resumen del resto de clasificaciones documentales surgidas durante los siglos XIX y XX.
1.3.1. La clasificacin decimal de Dewey, de 1885
Melvil Dewey era estudiante y ayudante de bibliotecario del Amherst College
de Massachusetts. En 1873, prepar como trabajo acadmico (tena 22 aos)
la clasificacin decimal, basndose en la clasificacin de Harris.
La clasificacindecimaldeDewey se public en 1876 con el nombre de A
classification and subject index for cataloguing and arranging the books and pamphlets of a Library y en 1885 se edit como Decimal classification and relatix index
(ttulo que incluye las dos grandes aportaciones de Dewey). Dewey buscaba
una clasificacin bibliotecaria prctica que permitiera solucionar dos problemas:
a) De catalogacin: teniendo en cuenta el aumento de las colecciones, haba
que reducir tiempo y gastos a la hora de catalogar.

Melvil Dewey

CC-BY-NC-ND PID_00143962

20

Sistemas de clasificacin documentales

b) De acceso: para facilitar el acceso directo a los usuarios sin tener que consultar el catlogo.
Dewey estudi las clasificaciones anteriores y adapt el sistema de divisin
decimal al sistema jerrquico de clasificacin y aadi un ndice.

Aplicacin del sistema


decimal
10 clases principales que se
pueden subdividir en 10 clases
ms, y as sucesivamente.

Este sistema tiene las ventajas siguientes:


a) Las clases se enumeran de forma decimal, de manera que se pueden aadir
clases nuevas a las previas con tendencia al infinito.
b) Los nmeros arbigos tienen la ventaja de ser casi universales (a diferencia
de las palabras o letras).
c) Las 10 clases representan una concepcin moderna (F. Bacon) del conocimiento.
d) Los documentos se pueden agrupar por materia.
e) Se acompaa de un ndice alfabtico de materias e instrucciones para el
catalogador.
Las tablas de la DDC3 son 10:
000 Computer science, information & general works
100 Philosophy & psychology
200 Religion
300 Social sciences
400 Language
500 Science
600 Technology
700 Arts & recreation
800 Literature
900 History & geography

Actualmente, la Library of Congress de Washington tiene creada una divisin


especial para su mantenimiento, la decimal classification division. Se aplica en
bibliotecas de 135 pases. La ltima edicin es la vigsimo segunda. Y se considera una clasificacin puntera, que siempre tenemos que ver como modelo,
porque est actualizada.
Ms informacin
OCLC Online Computer Library Center. Dewey services, Dewey decimal classification for
use with OCLCs online cataloging services [en lnea]. [Consulta: 10 de octubre de 2008].
025.431: The Dewey blog [en lnea]. [Consulta: 10 de octubre de 2008].

(3)

DDC es al sigla de Dewey decimal


classification.

CC-BY-NC-ND PID_00143962

21

Sistemas de clasificacin documentales

PubliclibrariesusingSpanish. Spanish version of the Dewey Decimal Classification System


based on the 18th edition of DDC [en lnea]. [Consulta: 10 de octubre de 2008].

1.3.2. La clasificacin decimal universal, de 1905


Dos abogados belgas, Paul Otlet y Henry la Fontaine, recibieron una copia de
la clasificacin decimal de Dewey en 1894. La encontraron tan magnfica y

(4)

CDU es la sigla de clasificacin


decimal universal.

apropiada a sus intereses que pidieron permiso a M. Dewey para traducirla al


francs y adaptarla a las bibliotecas europeas. As naci la clasificacin decimal
universal (CDU4).
Cules eran los intereses de estos dos abogados? Desde 1895, fecha en que
crearon el Instituto Internacional de Bibliografa, trabajaban para realizar el
repertorio bibliogrfico universal (RBU5), una bibliografa/catlogo que recogiera todo el saber cientfico del momento. Una tarea de gran magnitud que
tecnolgicamente tena como soporte fichas de cartulina, doce millones de
fichas de cartulina...

Paul Otlet
(5)

RBU es la sigla de repertorio bibliogrfico universal.

Recursos disponibles
Nos podemos hacer una idea de la magnitud del proyecto a partir de los siguientes recursos:

El Mundaneum (1910), sede del Instituto de Documentacin creado por Otlet y La


Fontaine, destruido en la Segunda Guerra Mundial por las tropas nazis y trasladado
a Mons en 1998 como museo y centro de documentacin de cariz universal.

Documental Biografa de Paul Otlet narrado por su bigrafo W. Boyd Rayward [en
lnea].

Extractos del documental de sugerente ttulo The man who want to classify the world
de Francoise Levie, colgados en YouTube [en lnea].

La RBU no era el nico proyecto de estas caractersticas. Otro proyecto contemporneo internacionalista y utpico fue la creacin de la lengua esperanto, por el mdico
polaco L. L. Zamenhof en 1887.

Con el fin de clasificar la materia de tantos documentos, necesitaban un sis-

Henry la Fontaine

tema que fuera flexible, que se pudiera ampliar. Una vez autorizados a adaptar
la Dewey (que entonces iba por la quinta edicin) la tradujeron al francs e
incorporaron novedades en ella.
En palabras de Otlet, en su tratado de documentacin y en referencia a la clasificacin
Dewey:
Han pasado 36 aos desde que una afortunada casualidad puso a nuestra disposicin
una copia de su magnfico sistema de clasificacin, cuya idea, tan simple como prctica,
abri para nosotros, ms como bibligrafos que como bibliotecarios, un camino hacia
el hito que desebamos, la construccin de un catlogo universal de todo el conjunto
de ideas que los hombres durante siglos intentaron perpetuar por escrito [...] Nuestras
necesidades bibliogrficas precisaban un sistema clasificatorio que se pudiera ampliar sin
lmites.

En 1905, publicaban la primera edicin de las tablas de la clasificacin decimal


universal con el nombre Manuel abrg du repertoire bibliographique universel;
dos aos ms tarde, editaron la versin completa, que tena 33.000 subdivisiones (actualmente, el Master Reference File tiene 62.000). Aunque la finalidad

El proyecto repertorio bibliogrfico universal

CC-BY-NC-ND PID_00143962

22

Sistemas de clasificacin documentales

inicial era la RBU y la CDU slo era la herramienta que permita clasificarlo,
la interrupcin que supuso el conflicto armado de la Primera Guerra Mundial
hizo que la clasificacin fuera ganando terreno al proyecto monumental, universal y utpico, y que, en la segunda edicin de la CDU de 1927-1933, el
objetivo fuera la propia clasificacin y no la RBU.
Clases principales de la clasificacin decimal universal:
0 Generalidades. Informacin y Documentacin. Informtica
1 Filosofa. Psicologa
2 Religin. Teologa
3 Ciencias sociales
4 sin ocupar de momento
5 Ciencias puras. Ciencias exactas y naturales
6 Ciencias aplicadas. Medicina. Tcnica
7 Bellas Artes. Artes aplicadas. Diversiones. Juegos. Deportes
8 Lenguaje. Lingstica. Literatura
9 Arqueologa. Geografa. Biografa. Historia

La CDU mantiene respecto de la Dewey:

La estructura decimal.

El alcance temtico universal.

Las Tablas auxiliares (en la Dewey los auxiliares se conocen como tablas y
las tablas principales son Schedules).

El ndice alfabtico final.

Asimismo, incorpora algunas novedades con respecto a la Dewey:

Deja una tabla principal vaca, la 4, mientras que la Dewey las utiliza todas.

Permite combinar 2 materias o ms materias con el Colon (:) y doble Colon


(::) y corchetes ([]) para subagrupamientos.

Se hacen subdivisiones cada tres dgitos.

Las subdivisiones sueo ms especficas que en la Dewey.

Mientras la Dewey nace para clasificar libros, la CDU nace con la voluntad
de clasificar informacin, ms concreta, ms especfica.

En palabras de Eric Grolier, las innovaciones de Otlet son con respecto a la


teora de las taxonomas superiores a las aportaciones de Dewey.
1.3.3. La clasificacin Colon, de 1933
El uso generalizado de esta clasificacin slo se ha dado en la India, pero su
influencia es internacional, gracias al resurgimiento de los debates sobre la
teora de las clasificaciones que provoc el concepto de las facetas.

Reflexin
La CDU tiene una gran implantacin en Europa y se estudiar de manera exhaustiva
en este mismo mdulo.

23

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

La primera edicin es de 1933, pero no ser hasta la edicin de 1944 en que


6

aparecern las facetas. Actualmente, la clasificacin Colon (CC ) va por la sp-

(6)

CC es la sigla de clasificacin Colon.

tima edicin (1971).


Shiyali R. Ranganathan, bibliotecario y matemtico indio, propuso una nueva
estructura para los sistemas de clasificacin (recordemos que el modelo bsico
era el jerrquico o enumerativo). Esta nueva estructura se basaba en el anlisis
facetado, que es aquel que estudia las caractersticas que permiten definir una
materia y que, sin embargo, se puede subdividir en subclases. Una autntica
evolucin para el concepto de clasificacin jerrquica en que cada concepto
tiene un lugar inamovible dentro del esquema general. En cambio, la CC propona una clasificacin analtico-sinttica, en la que cada documento recibe
una notacin creada para l a partir de combinaciones y relaciones. Uno de
los signos que se utilizan para unir las diferentes facetas que representarn un
concepto son los dos puntos: que en ingls se llaman, precisamente, Colon.
Shiyali R. Ranganathan

La CC es una clasificacin basada en las facetas, es decir, representa los diversos


aspectos de una materia identificando las caractersticas/categoras bsicas que
se pueden subdividir en clases.
Ranganathan identifica unas 30 clases principales o dominios (del tipo matemticas, botnica, educacin...), que a su vez pueden ser caracterizadas por cinco grandes categoras o facetas: personalidad, materia, energa, espacio, tiempo
o frmula PMEST. Algunas clases concretas tienen, tambin, facetas propias.
La frmula PMEST y las categoras gramaticales
Jacques Maniez (Maniez, pg. 46) compara la frmula PMEST con las categoras gramaticales, como se puede observar en el siguiente ejemplo:
La frmula PMEST y las categoras gramaticales
Documento: robo de coches a mano
armada el sbado en la ciudad de Vicennes
FacetasdeRanganathan:

Paralelismoconla
proposicingramatical:

EjemplodeJ.Maniez:

Personalidad

Objeto

coche

Materia

Manera

a mano armada

Energa

Verbo

robo

Espacio

Complemento de lugar

Vicennes

Tiempo

Complemento de tiempo

sbado

24

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

Ejemplo de clasificacin con la Colon


Para poner un ejemplo real de clasificacin con la Colon, tomemos el caso presentado
en el libro de Rosa San Segundo (1997, pg. 81-82):
Una monografa sobre La clasificacin de libros en las bibliotecas infantiles espaolas
Clase (BC)

Biblioteconoma

Personalidad [P]

Biblioteca infantil

,61

Materia [M]

Libros

;43

Energa [E]

Clasificacin (operacin)

:51

Espacio [S]

Espaa

Tiempo [T]

Siglo XX

.541
eN

Fuente: Rosa San Segundo Manuel, Principales sistemas de clasificacin, 1997.

La notacin resultante es: 261;43:51.541N. La notacin es alfa1rica, y utiliza letras de


los alfabetos latinos, griegos y cifras arbigas.
La notacin facetada necesita una sintaxis para traducirla, un orden en las partes que la
forman que va desde la categora con ms carga significativa hasta la ms circunstancial.
A diferencia de las clasificaciones monojerrquicas, en las que hay una lista entera de
clases, en las facetadas, cada notacin se crea especficamente para cada documento.

1.3.4. Otras clasificaciones documentales de los siglos

XIX

XX

Hay otros sistemas de clasificacin importantes a los cuales, desgraciadamente,


no podemos dedicar la misma extensin. Son los siguientes:

ClasificacinBrunet: Francia, 1804. Tuvo mucho xito a lo largo del siglo


XIX. Era heredera del sistema de Prosper Marchand y clasificaba las materias

en: teologa, jurisprudencia, historia, filosofa y literatura (secuencia de


Francis Bacon).

ClasificacinexpansivadeCutter: Boston, 1891. Charles Cutter consideraba que la Dewey no era aplicable a las bibliotecas pequeas; por eso,
ide un sistema original que se adaptaba al volumen de los fondos de la
biblioteca: la clasificacin expansiva. Consiste en pasar de una tabla a otra
de manera progresiva. Influy en la clasificacin de la Library of Congress.

ClasificacindelaLibraryofCongress: Washington, 1899-1920. Basada


en las ideas de Cutter. No es una clasificacin conjunta; est formada por
clasificaciones especializadas en cada materia e independientes unas de
otras, hasta el punto de que no se interrelacionan entre s. Tiene veintin
grupos temticos. Se usa actualmente en la Biblioteca del Congreso y en
las bibliotecas universitarias norteamericanas.

Categoras de
Ranganathan y Aristteles
Las categoras de Ranganathan
y Aristteles son parecidas: la
personalidad y la materia de
Ranganathan es la sustancia de
Aristteles; el espacio es el lugar aristotlico; la energa es la
accin, y el tiempo se corresponde con el tiempo.

CC-BY-NC-ND PID_00143962

25

Sistemas de clasificacin documentales

ClasificacinBliss: Nueva York, 1912. Clasificacin facetada. Cada materia se puede definir segn las facetas de punto de vista filosfico, terico,
histrico y prctico.

Clasificacindecimaljaponesa: Mori-Kiyosi, 1929, para la Biblioteca Imperial de Tokio. Influida por la CDU y Cutter. Tiene diez clases principales
y pocos auxiliares especiales (slo los de lugar y forma).

Clasificacin rusa (BBK, actualmente LBC): Mosc, 1924. Est fuertemente impregnada de ideologa marxista leninista (la primera clase es marxismo y leninismo, la segunda ciencias naturales...). Es el sistema de clasificacin nacional de le antigua URSS, que significa que tiene una magnitud
slo comparable a la de la Library of Congress (hablamos de volumen de
libros). La CDU tambin se usa en los pases de la ex URSS, especialmente
en las bibliotecas pblicas, gracias a la tarea que el VINITI lleva a cabo. Recordemos que VINITI, como la espaola AENOR, forma parte actualmente
del Consorcio de la CDU, entre otras.

Clasificacindocumentalchina(CDC): Beijing, 1975. Es el sistema nacional de clasificacin en China. Despus de la revolucin, la China popular propuls la creacin de un nuevo sistema de clasificacin adecuado al
cambio ideolgico. Es una clasificacin mixta o hbrida, es decir, jerrquica, pero con posibilidad de expresar facetas. Tiene cinco clases principales

Mao Zedong, bibliotecario


Como curiosidad, apuntamos
que Mao Zedong o Mao TseTung fue ayudante de bibliotecario en su juventud, antes de
iniciar su carrera poltica.

(la primera es el marxismo leninismo y el pensamiento de Mao Zedong).

1.3.5. Los sistemas de clasificacin en Espaa y Catalua


En el siglo XIX, la clasificacin ms utilizada era la Brunet, procedente de Francia y editada por primera vez en 1804. Estuvo vigente hasta la dcada de 1930.
Sin embargo, nuestros bibliotecarios estaban al corriente de las novedades que
venan de Bruselas:

En 1908, tres aos despus de la primera edicin de la CDU de 1905, el capitn Leopoldo Gimnez la aplic en la Biblioteca de Ingenieros Militares.

El 1911, Ricardo Codorniu public una monografa de temtica forestal,


de cuya causa era un defensor adaptando las clases de la CDU.

En 1920, en Catalua, Jordi Rubi Balaguer public la adaptacin de la


clasificacin de Bruselas, que recordmoslo es la CDU basada en la Dewey, al cataln. En la dcada de los 30, esta edicin se agot y hubo que
pensar en reeditarla, pero el estallido de la Guerra Civil y la posguerra aplaz las ediciones.

Ricardo Codorniu Strico


Ricardo Codorniu Strico (Cartagena, 1846-Murcia, 1923).
Fue el ingeniero forestal que
llev a cabo la repoblacin de
la sierra de Espua. Se considera un hombre visionario
que, adems de ver las posibilidades que ofreca la CDU,
tambin introdujo el esperanto en Espaa y fund la Sociedad Murciana del Esperanto en
1902. Como podemos observar, son dos de los proyectos
universalistas del momento.

CC-BY-NC-ND PID_00143962

26

Sistemas de clasificacin documentales

Jordi Rubi Balaguer


Jordi Rubi Balaguer (Barcelona, 18871982). Trabaj de profesor, bibliotecario e investigador. Fue director de la Biblioteca de Catalua y de la Escuela de Biblioteconoma. Entre
1936 y 1939, traslad la Biblioteca de Catalua al antiguo Hospital de la Santa Cruz y
contribuy decisivamente a la salvacin del tesoro bibliogrfico de Catalua. Durante
estos aos, dirigi tambin el servicio de bibliotecas del frente. En 1939, ces en sus cargos oficiales y entr a trabajar en una editorial. Particip, sin embargo, desde el primer
momento en las actividades culturales catalanas que se retomaran despus de la guerra
dentro de la ms estricta privacidad.

Durante la Segunda Repblica (1931-1939), las polticas bibliotecarias impulsan la implementacin de la CDU en las bibliotecas nacionales, universitarias,
municipales..., y una vez acabada la Guerra Civil, el ministro de Franco, Javier
Lasso de la Vega, regula el uso de la clasificacin decimal de Melvil Dewey,
modificada por el Instituto Internacional de Bibliografa de Bruselas con las
correcciones introducidas por Berln.
Esta clasificacin oficial fue abolida en 1989, pero no fue sustituida por ninguna otra recomendacin; por lo tanto, se produjo un vaco legal. Cada comunidad autnoma tena transferida la competencia de eleccin del sistema
de clasificacin.
En Catalua, el hijo de Jordi Rubi Balaguer, Jordi Rubi Lois, continu la tarea
de su padre, primero como editor en la editorial Teide de las nuevas ediciones
al cataln de la clasificacin decimal y, finalmente, en 1982, como responsable
de la cuarta y ltima edicin hasta la actualidad.
Prestad atencin al autor y coautor de la obra: Clasificacin decimal: adaptacin
para las bibliotecas catalanas; dirigida por Jordi Rubi Balaguer, 4. ed. preparada por Jordi Rubi Lois. Barcelona: Teide.
Clasificacin decimal frente a la CDU
Las ediciones catalanas de la clasificacin decimal se titulan Clasificacin decimal y no
CDU, porque la adaptacin catalana propone en ciertos casos dobles soluciones de clasificacin: la de la CDU y la de Dewey.
En palabras de Teresa Rovira (1989, pg. 11):
Por otro lado, el tronco americano y la adaptacin belga siguen una evolucin diferente:
la primera orientada [...] a la ordenacin de libros en las estanteras y de fichas en los
catlogos; la segunda hacia la clasificacin de bibliografas. Esto hace que en esta tercera
edicin catalana se diera en diversos casos cuando hay razones que lo hacen aconsejable las soluciones dobles de la CDU y la DC. Adems, no se suprime la clase 4 de lenguaje como haba hecho la CDU [...] tampoco dud en otros casos, como en las tablas de
psicologa, en dar soluciones alternativas desde la Dewey, mucho ms puestas al da. Por
todo eso, la adaptacin de 1976 no lleva ya el ttulo de clasificacin decimal de Bruselas,
sino simplemente el de clasificacin decimal, que ser, tambin, la de la cuarta y ltima
edicin, publicada en 1982, de la cual ya es plenamente responsable Jordi Rubi Lois.

En toda Espaa, podemos encontrar redes que catalogan con diferentes sistemas de clasificacin, aunque el ms usado es la CDU, y eso favorece la catalogacin cooperativa y el prstamo interbibliotecario.

La eleccin alemana
Cabe anotar el hecho de la
eleccin a raz de las relaciones diplomticas que Espaa
mantena con Alemania de la
edicin internacional alemana
que iba por la tercera edicin,
frente a otras ediciones internacionales como la inglesa,
que iba por la cuarta, o la francesa, que ya iba por la quinta.

27

CC-BY-NC-ND PID_00143962

En Catalua, se utilizan la edicin de Jordi Rubi Lois, la CDU, la Library of


Congress (aplicada en la Biblioteca de la Universidad Pompeu Fabra de Barcelona).
1.3.6. Conclusiones
Las clasificaciones documentales han evolucionado, influidas por los sistemas
filosficos y cientficos contemporneos. Entre ellos, destaca Francis Bacon,
que supuso el final de las concepciones medievalistas en la clasificacin de las
ciencias.
Las necesidades que han impulsado la redaccin de nuevos cuadros de clasificacin han sido las de querer compilar el conocimiento documental en general, o las de crear un instrumento prctico que sirviera para clasificar y ordenar
el fondo de una biblioteca concreta, sin olvidar la importancia de cuestiones
de cariz ideolgico.
En la historia de las clasificaciones documentales, tambin podemos observar
que los cuadros de clasificacin se basan unos en otros.
Grandes clasificaciones del siglo XIX: Brunet, Dewey, Cutter.
Grandes clasificaciones del siglo XX: CDU, Colon, Library of Congress, Bliss.
En Espaa y en Catalua, en el siglo

XX

el uso que est ms generalizado es

el de la CDU.
En este punto del mdulo, el estudiante tendra que situarse en la secuencia:
Clasificaciones documentales > para bibliotecas > CDU.
Bibliografa
025.431: The Dewey blog [en lnea]. [Consulta: 10 de octubre de 2008].
AENOR. Asociacin espaola de normalizacin y certificacin [en lnea].
Pilar, Arnau Riverd (2005). Documentacin: hitos histricos, precedentes - Dewey - Otlet
- FID. (pg. 96-105 y 248-255). Madrid: Mundarnau.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
B.GilUrdiciain(1997). Los lenguajes de clasificacin documental. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M.D.GiliMartnez;J.VivesGrcia (1996, julio-diciembre). La nova edici espanyola
de la CDU: arriscar-se al canvi?. tem: Revista de Biblioteconomia i Documentaci (nm.
19, pg. 94-121).

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

28

JackGlazier(2003).Las races culturales de la clasificacin modern. En: IV Coloquio


Internacional de Ciencias de la Documentacin. Salamanca: Congreso del Captulo Espaol
de ISKO. VI.
Eric Grolier (1976, noviembre-diciembre). La clasificacin cien aos despes de Dewey. Boletn Unesco (vol. XXX, nm. 6, pg. 342-350).
Library of Congres Classification outline [en lnea]. [Consulta: 1 de octubre de 2008].
JosLpezYepes (1995). La documentacin como disciplina: teora e historia (2. ed., pg.
90-106). Pamplona: Eunsa.
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y
utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez
Ruiprez.
OCLCOnlineComputerLibraryCenter. Dewey services, Dewey decimal classification for
use with OCLCs online cataloging services [en lnea]. [Consulta: 10 de octubre de 2008].
P.Otlet (1996). El tratado de documentacin: el libro sobre el libro, teora y prctica (trad. De
M. Dolores Ayuso). Murcia: Universidad de Murcia.
M.PintoMolina(ed.) (1997). Manual de clasificacin documental. Madrid: Sntesis (Biblioteconoma y Documentacin).
PubliclibrariesusingSpanish. Spanish version of the Dewey Decimal Classification System
based on the 18th edition of DDC [en lnea]. [Consulta: 10 de octubre de 2008].
LucaRosati(2005). Clasificacin facetada para los servicios comunitarios mediante el
uso de las categoras estndares del Classification Research Group. Congreso del captulo
espaol de ISKO: La dimensin del conocimient (nm. VII). Barcelona.
T.Rovira(1989, enero-junio). Jordi Rubi i Lois: la seva influencia en el mn bibliotecari
de Catalunya. Revista tem (nm. 4).
Sagredo,Flix (2001). Tras las huellas euro-norteamericanas del movimiento documental contemporneo I [en lnea]. Madrid: Revista Documentacin de las Ciencias de la Informacin (nm. 24, pg. 35-43). [Fecha de consulta: 1 de octubre de 2008].
R. San Segundo Manuel (1997). Principales sistemas de clasificacin. En: M. Pinto
(ed.). Manual de clasificacin documental (pg. 67-89). Madrid: Sntesis (Biblioteconoma
y Documentacin).
R.SanSegundoManuel (2001). Teora e historia de la clasificacin bibliotecaria en Espaa,
siglos XIX y XX. Madrid: Universidad complutense.
R.SanSegundoManuel (1999). Futura implantacin de los distintos sistemas de clasificacin en las bibliotecas del estado espaol [en lnea]. [Consulta: 1 de octubre de
2008]. 7es. Jornades Catalanes de Documentaci. Barcelona: Collegi Oficial de Bibliotecaris-Documentalistes de Catalunya.
R. San Segundo. Use of UDC classification system in Spain: implementation, applicatiom,
teaching and research [en lnea]. Universidad Carlos III. Madrid. (Presentacin) [Consulta:
1 de octubre de 2008].
Universal Decimal Classification Consortium Homepage. La Haya: UDC Consortium. Act.
2002-08-01 [en lnea]. [Consulta: 10 de octubre de 2008].

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

29

2. La clasificacin decimal universal

El grueso de este mdulo est dedicado a la clasificacin decimal universal, ya


que es la clasificacin ms usada en nuestro mbito cultural ms prximo.
En las pginas siguientes, se tratan los temas siguientes:
1) Caractersticas que definen la CDU, basadas en las tipologas estudiadas en
el mdulo 3, captulos dedicados a las tipologas de lenguajes documentales:
sinttico frente a analtico / precoordinados frente a postcoordinados / controlados frente a libres / jerrquicos frente a combinatorios frente a sintcticos.
2) Las ediciones de la CDU.
3) La gestin de la CDU.
4) La estructura de la CDU:
a) Clases principales. Clases y subclases. Notacin.
b) Tablas principales.
c) Tablas auxiliares:

Auxiliares comunes independientes.

Auxiliares comunes dependientes.

Auxiliares especiales.

d) Signos: combinatorios e instructivos.


5) Finalmente, el bloque dedicado a ejercicios prcticos de clasificacin.
a) Empezamos a clasificar.
b) Prcticas con la CDU.
Entre los ejercicios solucionados que ilustran la teora y los ejercicios propuestos como actividades de autoevaluacin, el estudiante resolver aproximadamente 200 casos de clasificacin de documentos. Se ha procurado que abarquen todas las reas de conocimiento y se han organizado por niveles de dificultad baja, media y alta. Aunque la mayora de ejercicios son nuevos, no
queremos dejar de hacer referencia a los ejemplos proporcionados por la propia CDU y la Gua de Aenor de I. McIlwaine.
2.1. Caractersticas de la clasificacin decimal universal
La clasificacin decimal universal presenta las caractersticas siguientes:

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

30

a) La clasificacin decimal universal es un lenguaje documental sinttico, porque el objetivo es sintetizar el contenido de los documentos en un nico trmino de indexacin, en este caso una notacin. Por ejemplo: 378 documento
sobre enseanza universitaria. Aunque el uso de elementos facetados (auxiliares
y signos clasificatorios) la convierte en analtico-sinttica, es decir, primero se
analizan los elementos que forman la materia del documento para despus
sintetizarlos en una notacin.
b) Es un lenguaje codificado (no natural) porque la indexacin de los documentos se basa en el uso de un sistema de notacin o cdigo artificial formado
por smbolos (numricos y alfanumricos) que traducen las materias de una
clasificacin bibliogrfica a ndices ordenados. Estos cdigos, adems, sirven
para facilitar la ordenacin fsica de los documentos. Y son internacionales;
no les hace falta traduccin. Por ejemplo: 378.
c) Es un lenguaje controlado(no libre), porque tiene como objetivo la representacin unvoca del contenido de los documentos y de las consultas: un
nico concepto por trmino y un nico trmino por concepto (eliminando la
sinonimia, polisemia y homonimia). En la indexacin, slo se pueden utilizar
los cdigos que figuran en las pginas de los sistemas de clasificacin.
d) Es un lenguaje precoordinado(no postcoordinado), porque la coordinacin de los diferentes conceptos que forman una materia se produce en el momento de la indexacin, es decir, antes de almacenarlos o incorporarlos a un
catlogo.
e) Es un lenguaje de estructura hbrida o mixta, es decir, jerrquica con elementos de tipo facetados (no sintctica) porque sigue un orden lgico que
aproxima los conceptos ms especficos y los agrupa dentro de los ms generales. Esta estructura hace que los conceptos estn ordenados siguiendo una
jerarqua: cada trmino est representado por un smbolo numrico, alfabtico o alfanumrico que indica su situacin dentro de la cadena jerrquica. La
CDU presenta una estructura jerrquica, pero tiene la posibilidad de expresar
facetas, lo cual la convierte en hbrida o mixta.
f) Es el lenguaje que permite clasificar/recuperarla materia del documento y
al mismo tiempo ordenarla fsicamente, agrupando las obras por contenidos
afines, y tambin generar subproductos del catlogo, como boletines de ltimas novedades o sumarios organizados temticamente.
g) Es enciclopdico porque incorpora todos los campos del conocimiento humano.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

31

h) Es decimal, ya que las tablas estn ordenadas por el principio de los nmeros decimales. Sus cifras tienen el valor de las fracciones decimales situadas
detrs de un 0 (cero coma) que siempre se supone. Esta estructura posibilita
que un nmero determinado se pueda subdividir indefinidamente por sucesivas agrupaciones, sin que la de partida llegue al inmediatamente superior.
Ms informacin
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000; (incluye las modificaciones de la Norma UNE 50001:2004/1M. Trad. del Master Reference File
realizada por el Centro de Informacin y Documentacin Cientfica (CINDOC) (2004) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR,.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
B.GilUrdiciain(1997). Los lenguajes de clasificacin documental. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M.Granados;A.Nicolau (2005, 6-8 de julio). La recuperaci de la informaci en els
catlegs en lnia: ls de la Classificaci decimal universal i la seva implicaci en la indexaci [en lnea]. 7. Congrs del Captol Espanyol dISKO. Barcelona: Departament de
Biblioteconomia i Documentaci de la Universitat de Barcelona. [Consulta: 1 de octubre
de 2008].
M.J.Lpez-Huertas (1997). Estructura de la clasificacin decimal universal. En: M.
Pinto (ed.). Manual de clasificacin documental (pg. 177-217). Madrid: Sntesis (Biblioteconomia y Documentacin).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.

2.2. Ediciones de la CDU


La edicin es un dato importante, ya que la CDU tiene diversos formatos. El
tronco comn es el master reference file (MRF) o fichero bsico de referencia,
que contiene cerca de 62.000 entradas, pero del cual se hacen diversas presentaciones:
a)Entera/abreviada/debolsillo: fsicamente, la edicin entera tiene 3 volmenes, la abreviada tiene 1, de 800 pginas, y la de bolsillo tambin tiene 1,
de 300 pginas aproximadamente. Su funcionamiento es idntico, pero vara
la cantidad de entradas (ms especfica en la entera, ms general en la abreviada, sinttica en la de bolsillo). Cada una de las tres presentaciones tiene una
finalidad: la entera permite clasificar documentos con un alto grado de especificidad, es til en bibliotecas especializadas. La abreviada es de implantacin
general por su buen equilibrio entre entradas y especificidad. La presentacin

Sistemas de clasificacin documentales

A modo de conclusin
La CDU es un lenguaje documental analtico-sinttico, codificado, controlado, precoordinado, de estructura hbrida,
enciclopdico y decimal.

32

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

de bolsillo est pensada para los no iniciados (ya que es mucho ms sinttica)
y para la clasificacin de pequeas bibliotecas como las escolares, infantiles,
hospitalarias, de pequeos municipios, etc.
b)Enpapel/CD-ROM

Ved tambin

c) Aos 1995/2000/2004. Las ediciones anteriores a 1992 dependan de la


Federacin Internacional de Documentacin (FID), pero a partir de 1992 dependen del Consorcio de la CDU. Aunque el funcionamiento es idntico, s

En el espacio de Recursos
del aula os damos acceso a
la edicin digital de la CDU
del ao 2000, Programa de la
CDU.

que pueden cambiar los dgitos de una clase, desaparecer conceptos, crearse
nuevos, subdividir un concepto para especificarlo ms, etc.
Cambios en las ltimas ediciones de la CDU
Tipos de cambios que se suceden en las diferentes ediciones
Cambios de la edicin 2000
(en relacin con la de 1995)
Se amplan considerablemente las entradas
(fsicamente se pasa de dos volmenes a
tres, en la edicin entera).
Edicin digital en CD.
Se potencia la facetacin de las tablas de
auxiliares comunes independientes de lugar
y lengua.
Subclases, como informtica, pasan a clase.

Cambios de la edicin 2004


(en relacin con la de 2000)
Inclusin de una nueva tabla de auxiliares
comunes de propiedad.
Reestructuracin total de la tabla 2 de religin.
Cambios a: cine, bienestar social, ciencias
medioambientales, veterinaria.

En Espaa, las ltimas publicaciones han sido:

Entera de 2000.

Abreviada de 2004.

Bolsillo de 2004.

Versin electrnica de 2000.

En todos los casos, el responsable en Espaa es AENOR.

Es importante remarcar que la tcnica de clasificacin es la misma independientemente de la edicin que se consulte.

A pesar de las diversas presentaciones y ediciones, una vez se sabe clasificar


con una edicin concreta, por ejemplo la abreviada de 1991, tambin se sabe clasificar con la ltima edicin de 2004, porque los cambios afectan a las
numeraciones de las clases, pero no a su construccin y funcionamiento, que
mantiene la sintaxis propia del lenguaje.

AENOR
AENOR es miembro del Consorcio de la CDU, con sede en
La Haya, como principal editor
en Espaa y responsable de la
edicin en castellano.

33

CC-BY-NC-ND PID_00143962

Para este curso de Fundamentos de lenguajes documentales, escogemos la

Sistemas de clasificacin documentales

A modo de conclusin

CDU en formatobolsillo o en formatoCD.

El tronco comn a todas las


presentaciones de la CDU es el
master reference file (MFR), el
cual contiene cerca de 62.000
entradas.
La CDU espaola tiene diversas
presentaciones: entera, abreviada y de bolsillo, en formato papel o digital y de diversas
ediciones.
La tcnica de clasificacin es
la misma independientemente
de la edicin que se consulte.

Ms informacin
AENOR. Asociacin espaola de normalizacin y certificacin [en lnea]. [Consulta: 10 de
octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
GerhardJ.A.Riesthuis (1998, 16-21 de agosto). The UDC Master Reference File [en
lnea]. 64th IFLA General Conference. Amsterdam. [Consulta: 1 de octubre de 2008].
C.Soria. Cambios introducidos en la ltima edicin (nov. 2000) de la CLASIFICACIN
DECIMAL UNIVERSAL [en lnea]. [Consulta: 1 de octubre de 2008].

2.3. Gestin de la CDU

2.3.1. Quin es el responsable de la gestin de la CDU?

El responsable de la gestin de la CDU es el Consorcio de la CDU con


sede en la Biblioteca Real de La Haya (accesible en lnea).

Este organismo se cre en 1992, y absorbi las responsabilidades que hasta


7

entonces tena la FID en materia de CDU.

(7)

FID es la sigla de Federacin Internacional de Documentacin.

Breve historia de la FID


La I Conferencia Internacional de Bibliografa organizada por Otlet y La Fontaine (1895)
cre en 1895 el Instituto Internacional de Bibliografa (IIB) encargado de la RBU. Durante
la Primera Guerra Mundial, las actividades del IIB se pararon y se reanudaron a partir de
1920. El ao siguiente, en 1921, pasa a llamarse Instituto Internacional de Documentacin
(IID). En 1938, con toda una serie de cambios en los objetivos, medios y estructura, se
convirti en la Federacin Internacional de Documentacin (FID).
La CDU nace y crece en el seno de estas organizaciones, hasta que en 1992 se crea el
Consorcio de la CDU como un organismo con entidad propia para velar por su mantenimiento.

En el Consorcio de la CDU, o UDC Consortium, participan diversas agencias


de normalizacin y editores como la espaola AENOR, la rusa VINITI o la
inglesa BSI. El Consorcio es el responsable de los cambios, y cada agencia los
publica en su idioma.

Representacin espaola
Dentro del Consorcio, con respecto a la representacin espaola, hay una representante de
AENOR y la profesora Rosa San
Segundo, responsable de la
adaptacin de las ediciones espaolas de la CDU de AENOR
y autora de diversa bibliografa
recomendada en este mdulo.

CC-BY-NC-ND PID_00143962

34

2.3.2. Se actualizan las clases de la CDU?

Las clases de la CDU se actualizan anualmente. La voluntad de los gestores de la CDU es ir adaptando las tablas a la realidad actual. A pesar
de todo, los cambios no se suceden con la rapidez que sera deseable.

El Consorcio publica cada mes de noviembre los cambios en el documento


Extensions and corrections to the UDC y, electrnicamente, edita el uno de enero
siguiente el master reference file o fichero bsico de referencia. De forma informtica, su soporte es el software CD-ISIS de la UNESCO.
Actualizacin de la CDU
Pondremos dos ejemplos sobre la lenta actualizacin de la CDU: los temas de religin
y de informtica.
1)Religin. La tabla Religin ha sido, desde las primeras ediciones de la CDU, muy desarrollada (en comparacin con otros campos cientficos o culturales) pero estaba dedicada, casi en exclusiva, a la Iglesia cristiana, que tena ocho de las nueve clases en que se
divida la tabla y que slo dejaba una nica clase para el resto de religiones. No ha sido
hasta la edicin de 2004 que se ha dado entrada propia a cada una de las religiones:
24
26
27
28

Budismo
Judasmo
Cristianismo
Islam

2)Informtica. Hasta la edicin de 1995, la informtica se clasificaba en la clase:


68 Inustrias varias
681 Mecnica de precisin
681.3 Equipo para el proceso de datos. Calculadoras.
Ordenadores.
Como podemos apreciar, era una subclase de 4 dgitos que colgaba de una genrica Industrias diversas, mientras que en la edicin del ao 2000 pasa a tener consideracin de
clase, sustancialmente ms relevante, con una notacin de tres dgitos, la 004, dedicada
ntegramente a la informtica:
004 Ciencia y tecnologa de los ordenadores. Informtica

2.3.3. Nuevas ediciones de la CDU y reclasificacin de los fondos


Las bibliotecas tienen que reclasificar sus fondos cada vez que aparece una
nueva edicin de la CDU? No. Los documentos no se reclasifican, sino que se
espera que el tiempo acabe haciendo desaparecer los viejos.
En palabras de MiguelBenito (2008):
Todo depende del tipo de biblioteca. Una forma prctica, sobre todo para bibliotecas en
que las colecciones son de actualidad, es la de no preocuparse por los cambios de las obras
que se hayan adquirido hasta hoy. El tiempo es un factor importante en nuestro trabajo.
De aqu a unos aos las obras adquiridas hasta hoy a duras penas existirn en la coleccin.
Hay bastante con hacer los cambios para las adquisiciones hechas a partir de hoy.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

35

La solucin es poner una referencia al catlogo, que vincule la notacin nueva


con la antigua y el topogrfico. Esta opcin significa que se modifica el registro
bibliogrfico del catlogo, pero no la signatura topogrfica del documento, y
permite recuperarlo, tanto si se hace la busca por la notacin antigua como
por la nueva.
2.3.4. Conclusiones
La CDU evoluciona, lentamente.
El responsable de las modificaciones es el Consorcio de la CDU con sede en
La Haya, que edita anualmente el documento Extensions and corrections to the
UDC y, electrnicamente, edita el uno de enero siguiente el master reference file
o fichero bsico de referencia.
No se suele reclasificar. Una solucin es poner un punto de enlace en el catlogo remitiendo la notacin antigua y nueva con la signatura topogrfica.
Bibliografa
AENOR. Asociacin espaola de normalizacin y certificacin [en lnea]. [Consulta: 10 de
octubre de 2008].
MiguelBenito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta:
10 de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta:
10 de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
T.Guardans(1989, enero-junio). Les altres religions a la classificaci decimal universal.
Revista tem (nm. 4).
I.C.McIlwaine (2003). Clasificacin decimal universal. Gua para uso de la CDU. Madrid:
AENOR.
GerhardJ.A.Riesthuis (1998, 16-21 de agosto). The UDC Master Reference File [en
lnea]. 64th IFLA General Conference. Amsterdam. [Consulta: 1 de octubre de 2008].

Sistemas de clasificacin documentales

36

CC-BY-NC-ND PID_00143962

3. Estructura de la clasificacin decimal universal

Si tuviramos la CDU en las manos, veramos que se estructura en tres partes


diferenciadas:
Introduccin

Trata de tres aspectos:


Naturaleza de la clasificacin
Estructura de la CDU
Gestin de la CDU

Partesistem- Tablasprincipales:0
tica
Generalidades
1 Filosofa. Psicologa
2 Religin. Teologa
3 Ciencias sociales
4 sin ocupar de momento
5 Ciencias puras. Ciencias exactas y naturales
6 Ciencias aplicadas. Medicina. Tcnica
7 Bellas Artes. Artes aplicadas. Diversiones. Juegos. Deportes
8 Lenguaje. Lingstica. Literatura
9 Arqueologa. Geografa. Biografa. Historia

ndicealfabtico

Tablasauxiliarescomunes:
Ia Coordinacin. Extensin
Ib Relacin
Ic Lengua
Id Forma
Ie Lugar
If Razas
Ig Tiempo
Ih Notaciones ajenas a la
CDU
Ik Caractersticas generales

Es un ndice que contiene parte de los conceptos utilizados en las tablas.

Visualmente, sera:
Introduccin
Ejemplo,pg.1.

1NATURALEZADELACLASIFICACIN
La clasificacin decimal universal (CDU) es un sistema
de clasificacin bibliogrfica en el que tiene cabida y
lugar todo el conocimiento humano, tanto en el plano
material como conceptual.
Su notacin, basada en nmeros arbigos (...)

Partesistemtica
Tablas principales
Ejemplodelaclase0.Generalidades 0Generalidades
00 Prolegmenos
01 Bibliografa. Catlogos
02 Biblioteconoma
030 Obras de referencia...
050 Publicaciones seriadas
06 Organizaciones
070 Peridicos
08 Poligrafas
09 Manuscritos
ndicealfabtico
EjemplodelaletraA

Abanicos 688.5
Abastecimiento de agua 628.1
Abdomen 617.55
Abogados defensores 364-48
Abolicin de la esclavitud 326.8
(...)

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

37

Sistemas de clasificacin documentales

Este es el orden en que aparecen en la CDU, pero en beneficio de una mejor


comprensin, empezaremos hablando de las clases y notaciones, en segundo
lugar de las tablas principales, en tercer lugar de las tablas auxiliares, y en
cuarto lugar de los signos clasificatorios, que permiten la unin de diversas
clases.
3.1. Clases y notaciones

3.1.1. Clases

Una clase, en palabras de McIlwaine (2003, pg. 286), es un concepto


simple dentro de una clasificacin. Las caractersticas principales de las
clases es que son conceptos generales y que son disjuntas.

Las clases se pueden analizar desde diversos puntos de vista:


a) Segn el alcanceconceptual:

Clases principales.

Clases y subclases.

b)Segn el principiodedivisin:

Clases dispuestas en cadena.

Clases dispuestas en serie.

c)Segn la ordenacin:

De general a particular (de psicologa a pedagoga).

De la disciplina inicial a la que depende de ella: las matemticas antes de


la fsica.

De lo que es simple a lo que es complejo.

De la teora a la practica.

En orden cronolgico: nacimiento, vida, muerte.

En orden topogrfico, partiendo de una visin europesta y occidental:


Europa en primer lugar, despus Asia, frica, Amrica, Australia y Oceana.

Segn el alcance conceptual

Las clasesprincipalesson las clases situadas en el primer nivel de la


estructura.

Conjuntos disjuntos
Dos conjuntos son disjuntos
cuando son mutuamente excluyentes. Por ejemplo: o es
escultura, o es pintura o es
grabado.
730 Escultura
75 Pintura
76 Grabado

CC-BY-NC-ND PID_00143962

38

Segn Maniez (pg. 37), no conviene que haya ni muchas ni demasiado pocas.
La base decimal nos permite llegar a tener 10 clases (la CDU, por ejemplo, tiene
10 clases principales). Si utilizamos alfabetos, podemos ampliarlas ms, ya que
adems de las letras, tenemos las combinaciones de maysculas y minsculas
y la de diferentes alfabetos como el latn o el griego.
Las clases principales tienen que contener todo el dominio. Una buena construccin prev tener una clase de generalidades comunes a todas las ciencias
y otra de diversos/otros o simplemente vaca. As, la CDU tiene la clase 0 de
generalidades y la 4 vaca. Esta estructura flexibiliza el sistema de cara a las
posibles actualizaciones.
Clasesysubclases

Las clases y subclases son todas aquellas clases no principales que conforman la secuencia jerrquica de la clasificacin.

La caracterstica principal de las clases y subclases es que se agrupan en una


sola arborescencia, lo cual significa que slo hay un camino para conectarse
con la raz. De igual forma que las clases principales, se construyen siguiendo
el mtodo de la divisin lgica para crear clases disjuntas.
Segn el principio de divisin

Una clasificacin refleja las relaciones entre los conceptos, no slo los
identifica, ya que entonces es una ordenacin y no una clasificacin.

Ejemplos de ordenacin y de clasificacin

Ordenacin: hacer una lista de ttulos de pelculas de cine ordenados alfabticamente.


Clasificacin: agrupar las pelculas de cine segn su gnero: musicales, comedia,
tragedia, de suspense, accin...

Las relaciones lgicas entre las materias son bsicamente de dos tipos: de subordinacin y de coordinacin. En la CDU se conocen con el nombre de cadena y serie, respectivamente.
Clasesdispuestasencadena

Las clasesdispuestasencadena son clases subordinadas sucesivamente


de genrico a especfico.

2 Religin
25 Religiones de la Antigedad

Sistemas de clasificacin documentales

39

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

252 Religiones de Mesopotamia


252.1 Religin de los sumerios

Clasesdispuestasenserie
Las clasesdispuestasenserieconsisten en series de clases coordinadas. Es un
grupo de clases mutuamente excluyentes, derivadas de la aplicacin de una
caracterstica.
34Derecho
341 Derecho
internacional

342 Derecho
constitucional

343 Derecho
penal

346 Derecho econmico


y financiero

Segn la ordenacin de las clases


Como podemos observar hojeando la CDU, las clases se encuentran ordenadas:

De general a particular: ciencias naturales > zoologa > invertebrados >


protozoos.

De la disciplina inicial a la disciplina de la cual depende: las matemticas


antes de la fsica.

De la teora a la prctica: primero las clases de la tabla 5 y despus sus


aplicaciones prcticas, en la clase 6.

En orden cronolgico: nacimiento > vida > muerte.

En orden topogrfico (la CDU parte de una visin europesta y occidental):


Europa en primer lugar, despus Asia, frica, Amrica, Australia y zonas
polares.

3.1.2. Notacin

La notacin es el trmino de indexacin propio de los sistemas de clasificacin. Es un cdigo artificial, no un lenguaje natural, hecho a partir de los nmeros, letras y smbolos que acompaan las rbricas. Representa la materia del documento; tambin se usa para su ordenacin
fsica.

La longitud de la notacin puede representar el grado de especificidad de la


materia de un documento (cuanto ms larga, ms especfica), pero tambin
puede estar traduciendo una arborescencia con unas pocas clases principales.
Jacques Maniez calcula que una notacin de hasta 7 dgitos es comprensible,
ms ya no. Por ejemplo, 524.42 es una notacin.

347 Derecho
civil

CC-BY-NC-ND PID_00143962

40

La notacin ser diferente en una clasificacin puramente jerrquica que en


una facetada.
a) Notacin en una clasificacin puramente jerrquica. J. Maniez (pg.
162), citando a Dobrowolski, nos dice que una notacin tiene que ser:

Breve.

Lgica.

Expresiva.

Hospitalaria (que permita ampliaciones).

Fcil de leer.

Fcil de memorizar.

Evolutiva (que no cierre la evolucin de los conocimientos).

Ha de utilizar smbolos, cuyo orden tiene que ser universalmente admitido.

b)Notacinenunaclasificacinhbridaofacetada. Desde el momento que


se usan facetas, hace falta una sintaxis. Hay que fijar el orden de sucesin en
funcin de cmo queramos agrupar los documentos en las estanteras y prever
una notacin que distinga claramente las facetas de las otras clases. En la CDU
hay una sintaxis pensada para el orden de las diferentes partes de una notacin
y cada elemento facetado se distingue por un signo concreto. Por ejemplo, el
smbolo igual = introduce un auxiliar de lengua:
=361 significa Lengua vasca
72=361 Arquitectura escrito en vasco

3.1.3. Conclusiones
Las clases tienen el rol central de la estructura de una clasificacin. Podemos
analizar las clases en funcin de su alcance conceptual (clases principales, clases y subclases), en funcin del principio de divisin (clases en cadena o en
serie) o en funcin de su ordenacin.
La notacin es el trmino de indexacin de los lenguajes de clasificacin. Es un
cdigo artificial que acompaa las rbricas. Representa la materia y ordena el
fondo documental. Diferenciamos entre la notacin de un sistema jerrquico
de la de un sistema hbrido o facetado porque, en este caso, se necesita una
sintaxis.
Bibliografa
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.

Sistemas de clasificacin documentales

41

CC-BY-NC-ND PID_00143962

J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y


utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez
Ruiprez.
JoanReitz. Odlis Online dictionary of library and information science. Western Connecticut
State University [en lnea].[Consulta: 10 de octubre de 2008].

3.2. Tablas principales

3.2.1. Tablas principales de la edicin de bolsillo CDU 2004

Tabla 0 Generalidades8
(8)

Tabla 0 Generalidades
00 Prolegmenos. Fundamentos de la ciencia y la cultura
01 Bibliografa y bibliografas. Catlogos. Listas de libros
02 Biblioteconoma. Bibliotecologa
030 Obras de referencia general. Enciclopedias
050 Publicaciones peridicas y publicaciones seriadas
06 Organizaciones y colectividades. Asociaciones. Congresos.
Exposiciones. Museos
070 Diarios. Prensa. Periodismo
08 Poligrafas. Colecciones. Series
09 Manuscritos. Libros preciosos y raros

Tabla 1 Filosofa. Psicologa9


(9)

Tabla 1 Filosofa. Psicologa


101 Naturaleza, esencia y mtodo de la filosofa
11 Metafsica
13 Filosofa de la mente y del espritu
14 Posiciones doctrinales. Sistemas
159.9 Psicologa
16 Lgica. Epistemologa. Teora del conocimiento
17 Moral. tica. Filosofa prctica

Tabla 2 Religin. Teologa10


(10)

Tabla 2 Religin. Teologa


21/29 Sistemas religiosos. Religiones y creencias
21 Religiones primitivas y prehistricas
22 Religiones del lejano Oriente
23 Religiones del subcontinente indio. Religiones hindes
24 Budismo
25 Religiones de la Antigedad. Religiones precolombinas
26 Judasmo
27 Cristianismo
28 Islam
29 Movimientos espirituales modernos

Tabla 3 Ciencias sociales. Sociologa. Estadstica. Poltica. Economa. Derecho. Administracin pblica. Arte y ciencia militares. Asistencia social.
11

Seguros. Educacin. Etnologa

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

42

(11)

Tabla 3 Ciencias sociales. Sociologa. Estadstica. Poltica.


Economa. Derecho. Administracin pblica. Arte y ciencia
militares. Asistencia social. Seguros.
Educacin. Etnologa
30 Teora, metodologa y mtodos en las ciencias sociales
31 Estadstica. Demografa. Sociologa
32 Poltica
33 Economa. Economa poltica. Ciencia econmica
34 Derecho. Jurisprudencia
35 Administracin pblica. Gobierno. Asuntos militares
36 Proteccin de las necesidades materiales y espirituales
Consumismo. Seguros
37 Educacin. Enseanza. Usos o costumbres. Vida social
38
39 Etnologa. Etnografa. Usos y costumbres. Vida social.
Folclore. Tiempo libre

Tabla 4 sin ocupar de momento12


(12)

Tabla 4 sin ocupar por el momento

13

Tabla 5 Ciencias puras. Ciencias exactas y naturales


(13)

Tabla 5 Ciencias puras. Ciencias exactas y naturales


502 Estudio de la naturaleza y su conservacin.
Ciencias naturales
504 Ciencias del medio ambiente. Ambientologa
51 Matemticas
52 Astronoma. Astrofsica. Investigacin espacial. Geodesia
53 Fsica
54 Qumica. Cristalografa. Ciencias mineralgicas
55 Ciencias de la Tierra. Geologa. Meteorologa, etc.
56 Paleontologa
57 Ciencias biolgicas
58 Botnica
59 Zoologa

Tabla 6 Ciencias aplicadas. Medicina. Tcnica14

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

43

(14)

Tabla 6 Ciencias aplicadas. Medicina. Tcnica


60 Cuestiones generales
61 Medicina
62 Ingeniera
620 Ensayo de materiales. Materiales comerciales
621 Ingeniera mecnica en general. Tecnologa nuclear.
Ingeniera elctrica. Maquinaria
622 Minera
623 Ingeniera militar
624 Ingeniera civil y estructural
625 Ingeniera del transporte terrestre
625.7/.8 Ingeniera de carreteras
626 Ingeniera hidrulica
627 Ingeniera de puertos y costas
628 Ingeniera de la salud pblica. Agua. Sanidad.
Ingeniera de la eliminacin
629 Ingeniera de los vehculos de transporte
63 Ciencias agrcolas
64 Economa domstica
65 Direccin y organizacin de la industria, comercio y
comunicacin
66 Tecnologa qumica
67 Industrias, oficios y profesiones
68 Industrias, oficios y comercio de artculos acabados
69 Construccin

Tabla 7 Bellas Artes. Juegos. Espectculos. Deportes15


(15)

Tabla 7 Bellas Artes. Juegos. Espectculos. Deportes


71 Urbanismo. Planificacin fsica. Ordenacin del territorio.
Planificacin regional, urbana y rural.
Arquitectura de jardines. Configuracin del paisaje
72 Arquitectura
73 Artes plsticas
74 Dibujo. Diseo. Artes aplicadas y artesana
75 Pintura
76 Artes grficas
77 Fotografa y procesos similares
78 Msica
79 Diversin. Entretenimiento. Juegos. Deportes

Tabla 8 Lenguaje. Lingstica. Literatura16


(16)

Tabla 8 Lenguaje. Lingstica. Literatura


80 Cuestiones generales relativas a la lingstica y literatura.
Filologa
81 Lingstica y lenguas
82 Literatura

Tabla 9 Arqueologa. Geografa. Biografa. Historia17

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

44

Sistemas de clasificacin documentales

(17)

Tabla 9 Arqueologa. Geografa. Biografa. Historia


902 Arqueologa
903 Prehistoria. Restos prehistricos. Utensilios prehistricos
904 Restos culturales de tiempos histricos
908 Descripcin geogrfica e histrica de un territorio
91 Geografa. Exploracin de la Tierra y pases concretos.
Viajes. Geografa regional
929 Estudios biogrficos y relacionados
93 Historia
94 Historia general

Son diez tablas, nueve ocupadas y una vacante. Recordemos que tener una
clase principal vaca es un excelente mtodo para incluir nuevos conceptos
sin alterar el esquema inicial.
El sumario de las tablas y clases pertenece a la edicin CDU de bolsillo 2004; las
ediciones abreviada y entera son ms amplias. Reproducimos las clases hasta
el segundo nivel de clasificacin, de dos dgitos, y en algunos casos, como la
tabla 6, hasta tres dgitos, igual que en la edicin original de la CDU de bolsillo.
Notaciones con la misma raz
Ved el ejemplo siguiente, en el que se muestra que la notacin tiene la misma raz, pero
es ms especfica en un caso que en el otro.
Edicin abreviada 2000 o programa CDU del aula
671.1 Joyera
671.15 Trabajo de las piedras preciosas
671.152 Talla del diamante

Edicin de bolsillo 2004


671.1 Joyera

A continuacin, se explica brevemente el contenido de cada tabla y se detallan


las disciplinas enumeradas en cada clase. No se pretende hacer un anlisis detallado de las tablas, sino introducir al estudiante en su estructura. Finalmente,
cada tabla va acompaada de diversos ejercicios con soluciones incluidas.
Ms informacin
Todos los ejercicios se pueden resolver con la edicin de bolsillo 2004, pero en determinadas soluciones, y en beneficio de una mejor comprensin, se ha escogido la notacin
ms extensa y especfica procedente de la edicin abreviada 2000 (o del programa CDU
que tenis en el aula). Por regla general, si no encontris la notacin en la edicin de
bolsillo, la encontraris en el programa CDU.
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M.Benito. (1999). El sistema de clasificacin decimal universal: manual de aprendizaje. Madrid: Taranco.
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Classificaci decimal: adaptaci per a les biblioteques catalanes (1982) (4. ed. preparada por
Jordi Rubi Lois). Barcelona: Teide.

Reflexin
Muchos de los ejercicios son
nuevos, pero no queremos dejar de hacer constar que hemos incluido ejercicios extrados de la propia CDU o bien
de la gua oficial de AENOR, de
McIlwaine.

CC-BY-NC-ND PID_00143962

45

Sistemas de clasificacin documentales

Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal). Gijn: Trea (Biblioteconoma y administracin cultural, 26).
T.Guardans(1989, enero-junio). Les altres religions a la classificaci decimal universal.
Revista tem (nm. 4).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.

Tabla 0 Generalidades
0 Generalidades
00 Prolegmenos. Fundamentos ms generales de la ciencia y la cultura
004 Informtica
01 Bibliografa y bibliografas. Catlogos. Listas de libros
02 Biblioteconoma. Bibliotecologa
030 Obras de referencia general. Enciclopedias. Diccionarios.
Manuales, etc.
050 Publicaciones peridicas de informacin general y publicaciones seriadas
06 Organizaciones y colectividades de cualquier tipo. Asociaciones.
Congresos. Exposiciones. Museos
070 Diarios. Prensa. Periodismo
08 poligrafas. Colecciones. Series
09 Manuscritos. Libros preciosos y raros

A primera vista, el nombre de la tabla no resulta muy claro, ya que Generalidades no aclara su contenido, pero en realidad agrupa temas comunes a todas
las disciplinas: los principios bsicos de la ciencia y las materias que son comunes a la actividad intelectual (conocimiento, informtica, documentacin,
organizaciones...).
A grandes rasgos, podemos encontrar las siguientes reas:

Fundamentos de la ciencia y el conocimiento (incluye la organizacin del


trabajo, escritura, informtica, normativas...). Recordemos que 004 Informtica es una clase de reciente aparicin (ao 2000).

Fuentes de informacin: bibliografas, catlogos, obras de referencia, publicaciones peridicas, poligrafas, manuscritos...

Biblioteconoma y Documentacin: para la CDU las cuestiones referidas a


las bibliotecas se clasifican aqu, mientras que las referentes a archivstica
se clasifican en el 930, dentro de Historia.

CC-BY-NC-ND PID_00143962

46

Sistemas de clasificacin documentales

Organizaciones, asociaciones, congresos, exposiciones, museos.


Actividad
1.Clasificad los siguientes documentos:
Documento sobre Thesaurus.
Documento sobre enciclopedias.
Documento sobre anuarios.
Documento sobre museos.
Hallaris la solucin en el solucionario.

Tabla 1 Filosofa. Psicologa


1 Filosofa
101 Naturaleza, esencia y mtodo de la filosofa
11 Metafsica
122 Metafsica especial
13 Filosofa de la mente y del espritu. Metafsica de la vida espiritual
14 Posiciones doctrinales. Sistemas. Puntos de vista metafsicos y ontolgicos
159.9 Psicologa
16 Lgica. Epistemologa. Teora del conocimiento. Metodologa lgica
17 Moral. tica. Filosofa prctica

Esta tabla sigue la tradicional divisin de la filosofa en metafsica, lgica y


tica. E incluye la psicologa, como una parte de la filosofa. Tambin aspectos
de la tica y la moral. Es una tabla bastante corta (las clases 15, 18 y 19 estn
vacas) y de comprensin sencilla.
Como dice Lpez-Huertas (1997):
el contenido de esta clase denota la marcada orientacin occidental aqu puesta de manifiesto por el poco protagonismo concedido a la filosofa no occidental.
Psicologa
Las clases de psicologa 159.9 acostumbran a combinarse con -05... (tabla Ik) auxiliares
de personas. Por ejemplo:
159.922.7-053.4 Psicologa infantil de la edad preescolar

Actividad
2.Clasificad los siguientes documentos:
Documento sobre el neoplatonismo.
Documento sobre las profecas.
Documento sobre la naturaleza del conocimiento.
Hallaris la solucin en el solucionario.

Tabla 2 Religin. Teologa


Hasta la edicin de 2004, esta clase era bsicamente de religin cristiana. El
resto de religiones (todas) se haban de clasificar en una sola clase, la 29. Este
hecho nos ilustra a la perfeccin dos caractersticas de los sistemas de clasifi-

CC-BY-NC-ND PID_00143962

47

cacin en general y de la CDU en particular: la traduccin del mundo segn


el prisma propio de una sociedad y de un tiempo (perspectiva cristiana occidental en la CDU) y la lenta actualizacin.
En la edicin de 2000:
2 Religin. Teologa

21 Teologa natural. Teodicea. De Dios. Teologa nacional.


Filosofa religiosa
22 La Biblia. Escrituras bblicas.
Organizaciones y colectividades de cualquier tipo.
Asociaciones. Congresos. Exposiciones. Museos
23 Teologa dogmtica
24 Teologa prctica
25 Teologa pastoral
26 Iglesia cristiana
27 Historia general de la Iglesia cristiana
28 Iglesias cristianas. Comunidades y sectas
29 Religiones no cristianas. Mitologa. Cultos. Religin comparada
Religin en la CDU
Para ms informacin sobre el tema de la religin en la CDU, ved Guardans (1989). Este
artculo analiza la dificultad de indexar un fondo religioso con la CDU del momento,
por dos motivos: a) la enorme variedad del fenmeno religioso, y b) la perspectiva cristiano-occidental que rega la CDU.
La CDU, en aquellos momentos, juntaba temas muy diversos bajo una misma clase, en
palabras de la autora del artculo:
Para hacerlo un poco ms grfico: si un clasificador chino hiciera con el cristianismo lo
que aqu se hace con el zen, recogera bajo un mismo nmero un estudio sobre el Palmar
de Troya, el Evangelio de san Mateo, Marcelino, pan y vino de Snchez Silva, el Cntico de
san Juan y los documentos del Vaticano II.
Guardans (1989, pg. 22-23).

En cambio, en la revisin del 2004, se empezaron a equiparar las grandes religiones. El cambio es notorio.
2 Religin. Teologa

21/29 Sistemas religiosos. Religiones y creencias


21 Religiones primitivas y prehistricas
22 Religiones de lejano Oriente
23 Religiones del subcontinente indio. Religiones hindes
24 Budismo
25 Religiones de la Antigedad. Religiones precolombinas
26 Judasmo
27 Cristianismo
28 Islam

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

48

29 Movimientos espirituales modernos

Actividad
3.Clasificad los siguientes documentos:
Documento sobre el judasmo sefard.
Documento sobre el budismo.
Documento sobre la cienciologa.
Documento sobre la religin de los sumerios.
Hallaris la solucin en el solucionario.

Tabla 3 Ciencias sociales


3 Ciencias sociales. Sociologa. Estadstica. Poltica. Economa. Derecho.
Administracin pblica. Arte y ciencia militares. Asistencia social.
Seguros. Educacin. Etnologa
30 Teora, metodologa y mtodos en las Ciencias sociales en general.
Sociografa.
31 Estadstica. Demografa. Sociologa
32 Poltica
33 Economa. Economa poltica. Ciencia econmica
34 Derecho. Jurisprudencia
35 Administracin pblica. Gobierno. Asuntos militares
36 Proteccin de las necesidades materiales y espirituales de la vida.
Trabajo social. Vivienda. Consumismo. Seguros
37 Educacin. Formacin. Enseanza. Usos o costumbres. Vida social.
38
39 Etnologa. Etnografa. Usos y costumbres. Vida social. Folclore.
Tiempo libre

Recordemos que las ciencias sociales son las que estudian la estructura y organizacin de la sociedad y que son: estadstica, demografa, sociologa, poltica,
economa, derecho, administracin y gobierno, educacin, etnologa. En definitiva, las ciencias que estudian al hombre en relacin con su comunidad.
Como se puede apreciar, son muchas disciplinas bajo una misma clase; en
consecuencia, es una de las tablas ms subdivididas y en que las notaciones
de temas importantes son ms largas.
Otra caracterstica de esta clase es la abundancia:

de referencias de una clase a otra, por ejemplo de economa a poltica, ya


que hay muchos temas que pueden ser tratados desde las dos perspectivas.
De hecho, las ciencias sociales estn muy interrelacionadas.

de elementos facetados, sobre todo de las tablas de tiempo, lugar y persona, necesarias para representar el momento histrico de la sociedad, su
ubicacin geogrfica...

Sistemas de clasificacin documentales

49

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

Ejemplos de elementos facetados


Tiempo: para diferenciar la sociedad de 1800 de la actual
Lugar: para diferenciar la sociedad francesa de la rusa
Persona: para determinar que el objeto es una categora concreta de la sociedad: adultos,
empresarios...

Las disciplinas ms extensas son economa y derecho.


Algunas particularidades son:
a)Demografa,sociologa,estadstica: la estadstica sirve para clasificar documentos que tratan sobre estadstica, pero no estadsticas concretas, que se
clasificarn con la materia principal y la auxiliar de forma (083.41).
b)Poltica: formas de gobierno, poltica interior y exterior, elecciones, parlamentos, migraciones, partidos polticos. Es una clase que remite a otras clases
que estn relacionadas, como la sociologa, economa, derecho. Por ejemplo,
hay un paralelismo entre esta clase y la de derecho, por temas como elecciones
y parlamentos, que se pueden clasificar desde los dos puntos de vista.

32 Poltica
324 Elecciones

34 Derecho
342.8 Sistemas electorales

c)Derecho: sigue la divisin tradicional de derecho internacional, constitucional, penal, civil, eclesistico y otras ramas (del trabajo, social, urbanstico,
del medio ambiente, nuclear).
Actividad
4.Clasificad los siguientes documentos:
Documento sobre la estadstica como ciencia.
Documento sobre las finanzas pblicas.
Documento sobre el derecho constitucional.
Documento sobre las facultades universitarias.
Documento sobre la etiqueta y el protocolo.
Hallaris la solucin en el solucionario.

Tabla 4 sin ocupar de momento


Est vacante desde 1964, momento en que el comit de la FID decidi agrupar
las clases 4 y en 8 en la actual clase 8 de Lengua y literatura. Desde 1964 hasta
ahora, no se ha encontrado un uso adecuado. Recordemos que en Catalua,
adems de la CDU, existe la adaptacin al cataln de Jordi Rubi Balaguer, que
mantiene la clase 4 de Llenges.
Tabla 5 Ciencias puras. Ciencias exactas y naturales
5 Ciencias puras. Ciencias exactas y naturales
502 Estudio de la naturaleza y su conservacin. Ciencias naturales
504 Ciencias del medio ambiente. Ambientologa

Ved tambin
Ved el apartado dedicado a la
historia de las clasificaciones
documentales en Espaa y Catalua.

50

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

51 Matemticas
52 Astronoma. Astrofsica. Investigacin espacial. Geodesia
53 Fsica
54 Qumica. Cristalografa. Ciencias mineralgicas
55 Ciencias de la Tierra. Geologa. Meteorologa, etc.
56 Paleontologa
57 Ciencias biolgicas
58 Botnica
59 Zoologa

La clase 5 representa las ciencias inanimadas o fsicas, mientras que la clase


siguiente, la 6, representa las ciencias animadas o de la vida.
Aqu encontramos las matemticas y las ciencias naturales (astronoma, fsica,
qumica, ciencias de la tierra, paleontologa, biologa, botnica y zoologa).
Son materias fciles de identificar ya que son lo bastante disjuntas, pero requieren un cierto conocimiento de la materia a la hora de clasificar los documentos. Si no se tienen conocimientos previos en estas materias, se recomienda la consulta de obras de referencia, tipos diccionarios y enciclopedias, que
ayuden a diferenciar, por ejemplo, el lgebra de la geometra, la qumica orgnica de la inorgnica, la geomorfologa de la petrologa, etc. Esta recomendacin tambin es vlida para las clases de la tabla 6.
Una particularidad de esta tabla es que se encuentra en paralelo a la tabla 6,
ya que algunas ciencias de la clase 5 tienen sus aplicaciones prcticas en la 6.
Ejemplo
Los diamantes se encuentran clasificados en la clase 5, como qumica inorgnica 546 o
como piedra preciosa 553, mientras que en la clase 6 aparecen en sus diversas aplicaciones:

En ingeniera mecnica como un abrasivo en el 621.


En minera como taladradoras de punta de diamante en el 622.23.
En joyera como joyas en el 671.

Clase 5
546.26 Derivados orgnicos del carbono
553.8 Yacimentos de diamantes

Actividad
5.Clasificad los siguientes documentos:
Documento sobre aritmtica.
Documento sobre la galaxia.
Documento sobre climatologa.
Documento sobre anmonitas (fsiles cefalpodos).
Hallaris la solucin en el solucionario.

Clase 6
621.921.34 Diamantes como abrasivos
y productos para pulir
622.23 Taladros de diamantes
671.152 Talla del diamante

CC-BY-NC-ND PID_00143962

51

Sistemas de clasificacin documentales

Tabla 6 Ciencias aplicadas. Medicina. Tcnica


6 Ciencias aplicadas. Medicina. Tecnologa
60 Cuestiones generales
61 Medicina
62 Ingeniera
620 Ensayo de materiales. Materiales comerciales
621 Ingeniera mecnica en general.
Tecnologa nuclear. Ingeniera elctrica. Maquinaria
622 Minera
623 Ingeniera militar
624 Ingeniera civil y estructural
625 Ingeniera del transporte terrestre
625.7/.8 Ingeniera de carreteras
626 Ingeniera hidrulica
627 Ingeniera de puertos y costas
628 Ingeniera de la salud pblica. Agua. Sanidad.
Ingeniera de la eliminacin
629 Ingeniera de los vehculos de transporte
63 Ciencias agrcolas
64 Economa domstica
65 Direccin y organizacin de la industria, comercio y
comunicacin
66 Tecnologa qumica
67 Industrias, oficios y profesiones
68 Industrias, oficios y comercio de artculos acabados
69 Construccin

Es otra tabla con muchas materias de peso que acaban teniendo notaciones
de cuatro o ms cifras. Y tiene el honor de tener la clase ms extensa, la 62,
de Ingenieros y tecnologa. La causa es que es el campo cientfico que ms se
ha desarrollado en los ltimos aos. De hecho, el desarrollo de las clases en
la CDU es desigual.
En la clase 6 entran todas las ciencias aplicadas, como por ejemplo, ciencias
agrcolas, economa domstica, oficios y profesiones, industria del libro (editoriales, libreras).
Actividad
6.Clasificad los siguientes documentos:
Documento sobre otorrinolaringologa.
Documento sobre la forma de preparar comidas rpidas para llevarse.
Documento sobre editoriales (de libros).
Documento sobre acabados especiales del cuero.
Hallaris la solucin en el solucionario.

Observacin
Miguel Benito (1999, pg. 20)
pone de manifiesto que, como
la clase 62 es tan larga, es posible que dos notaciones con
el mismo nmero de dgitos
representen dos niveles muy
diferentes con respecto a la especificidad del tema. Y pone
de ejemplos como que la notacin de 4 cifras 621.3 de Ingeniera electrnica sea igual a
la 637.4, que es Huevos y productos a base de huevos. Si
hacemos la prueba, veremos
que la clase 621.3 se abre a
muchas clases, mientras que la
637.4 no lo hace.

CC-BY-NC-ND PID_00143962

52

Sistemas de clasificacin documentales

Tabla 7 Bellas artes. Artes aplicadas. Diversiones. Juegos. Deportes


7 art. Artes industriales. Fotografa. Msica. Juegos. Deportes
71 Urbanismo. Planificacin fsica. Ordenacin del territorio.
Planificacin regional, urbana y rural. Arquitectura de jardines.
Configuracin del paisaje
72 Arquitectura
73 Artes plsticas
74 Dibujo. Diseo. Artes aplicadas y artesana
75 Pintura
76 Artes grficas
77 Fotografa y procesos similares
78 Msica
79 Diversin. Entretenimiento. Juegos. Deportes

Esta clase, aunque contiene diversas disciplinas, es de las ms fciles de entender para un profano, ya que todas las disciplinas son bastantes conocidas. Recordemos que es la clase que engloba todo tipo de artes, diversiones y deportes.
Si un artista es polifactico, se le clasifica directamente en el 7. Si, en cambio,
queremos clasificar un arte concreto, vamos a la clase correspondiente.
En el inicio de la tabla 7 encontramos unos extensos auxiliares especiales que
nos ayudarn a clasificar los aspectos de tcnica artstica (herramientas, materiales, copias, restauraciones...), periodos artsticos (prehistoria, culturas de la
Antigedad, romnico, gtico... hasta el postmodernismo), temas representa-

Extrado de Carmen Dez


(1999, pg. 108)
Documento sobre la obra de
Leonardo da Vinci:
7 Leonardo da Vinci
Documento sobre la pintura
de Leonardo da Vinci:
75 Leonardo da Vinci

dos (figura humana, fauna, pasajes histricos, paisajes...), etc.


Actividad
7.Clasificad los siguientes documentos:
Documento sobre parques privados.
Documento sobre catedrales.
Documento sobre ptica de las cmaras fotogrficas.
Documento sobre msica para orquesta sinfnica.
Documento sobre carreras de karts.
Hallaris la solucin en el solucionario.

Tabla 8 Lenguaje. Lingstica. Literatura


8 Lenguas. Lingstica. Literatura
80 Cuestiones generales relativas a la lingstica y literatura. Filologa
81 Lingstica y lenguas
82 Literatura

Hay dos grandes reas, la 80 y 81 para Lingstica, y la 82 para Literatura.


Aparentemente es una clase corta, pero es rica en auxiliares especiales y en
divisiones paralelas.

CC-BY-NC-ND PID_00143962

53

Sistemas de clasificacin documentales

Hay algunos ejemplos resueltos de lenguas y literatura de diversos pases, pero


no estn representadas todas las posibilidades. La CDU nos indica que podemos construir todas las clases que necesitamos uniendo el 811 de lengua o el
821 de literatura a un auxiliardelengua, sacando el signo igual y cambindolo por un punto.
Ejemplo: 821.111
El 821 es la clase para literatura
El 111 proviene de: =111 aux. de lengua para el idioma ingls, cuando se combina para
crear literatura inglesa pierde el signo inicial (=) y se cambia por un punto.

Para las obras de autores individuales, usaremos las especificaciones del 82....A/
Z, que consisten en poner en primer lugar la literatura que escribe el autor;
por eso tendremos que buscar el idioma original en que escribe, y si se trata
de ingls, francs o castellano se indicar tambin la nacionalidad del escritor.
Finalmente, el nombre del autor.
Ejemplo: 821.134.2(82)BORG
821 es Literatura en las distintas lenguas
134.2 proviene de: =134.2 aux. de lengua para el idioma espaol; cuando se combina para
crear literatura espaola pierde el signo inicial del igual (=) y se cambia por un punto.
(82) es el auxiliar de lugar para Argentina, que aadimos a la literatura en espaol para
diferenciar que se trata de literatura argentina en espaol.
BORG para el apellido del autor

Actividad
8.Clasificad los siguientes documentos:
Documento sobre cuentos de hadas
Documento sobre literatura hebrea
Hallaris la solucin en el solucionario.

Tabla 9 Arqueologa. Geografa. Biografa. Historia


9 Geografa. Biografa. Historia
902 Arqueologa
903 Prehistoria. Restos prehistricos. Utensilios prehistricos
904 Restos culturales de tiempos histricos
908 Descripcin geogrfica e histrica de un territorio
91 Geografa. Exploracin de la Tierra y pases concretos.
Viajes. Geografa regional
929 Estudios biogrficos y relacionados
93 Historia
94 Historia general

Recordatorio importante
Como los auxiliares comunes
de lengua no se explicarn
hasta ms adelante, recomendamos volver a este punto,
una vez se hayan entendido
estos auxiliares para resolver
los ejercicios que se plantean a
continuacin.

CC-BY-NC-ND PID_00143962

54

Sistemas de clasificacin documentales

En esta tabla, encontramos el mismo caso que en la clase anterior: no hay una
clase para la geografa de cada pas ni para la historia. Tenemos que combinar
la notacin de la clase 913 o 94 con los auxiliaresdelugarylosauxiliares
detiempo.
Ejemplo
Para representar historia de Irlanda se har con el 94 de historia y con el auxiliar de lugar
para Irlanda, que es (415).
Resultado:
94(415) Historia de Irlanda

Actividad
9.Clasificad los siguientes documentos:
Documento sobre la geografa de frica.
Documento sobre datacin con carbono.
Documento sobre banderas nacionales.
Documento sobre paleografa.
Documento sobre historia de Australia.
Hallaris la solucin en el solucionario.

3.3. Tablas auxiliares de la clasificacin decimal universal (CDU)


Cuando uno piensa en un cuadro de clasificacin, se imagina pginas y pginas de cdigos y conceptos. Cree que slo ha de ir leyendo hasta que encuentre la clase ms apropiada. Es cierto, pero todava hay ms cosas... La CDU
incorpora elementos de tipo facetado, que son clases diseadas para ser combinadas con otras clases.
Cuando estas facetas se pueden combinar con todas las nueve tablas, se conocen como auxiliares comunes. Para poner un ejemplo sencillo: los nombres
de lugares geogrficos, o los nombres de lenguas, slo salen una vez en la CDU,
pero se pueden combinar con cualquier clase de las nueve tablas, con lo cual
las combinaciones son infinitas.
Cuando estas facetas slo se aplican a una materia determinada, se conocen
como auxiliares especiales. Hay algunos casos, por ejemplo la clase 53 de Fsica,
que tienen auxiliares especiales, los cuales permiten precisar aspectos del tipo
teora y naturaleza de los fenmenos, efectos de los fenmenos, observacin y
registro, aparatos para su estudio..., que se pueden combinar con las materias
propias de esta clase, la mecnica, la ptica, la termodinmica, la electricidad...
Y eso slo con la clase 53.
Funcindelosauxiliares

La funcin de los auxiliares es la de matizar y precisar el significado de


las clases.

Recordatorio importante
Como los auxiliares comunes
de lengua no se explicarn
hasta ms adelante, recomendamos volver a este punto,
una vez se hayan entendido
estos auxiliares para resolver
los ejercicios que se plantean a
continuacin.

55

CC-BY-NC-ND PID_00143962

Concepto solo

Sistemas de clasificacin documentales

Matizado

666.5 Porcelana

666.5(510)14 Porcelana china del siglo XV

Tipodeauxiliares
La CDU tiene dos tipos de auxiliares:

Auxiliares comunes (se abren en independientes y dependientes): se encuentran en las tablas auxiliares.

Auxiliares especiales: no se encuentran reunidos en ninguna tabla, sino


que se encuentran repartidos a lo largo de todas las tablas, tanto de las
auxiliares como de las principales. Son un tipo de auxiliares previstos slo
para precisar el contenido de ciertas materias, no de todas.

Aunque la clasificacin Dewey ya tena auxiliares, la CDU los ha ampliado


mucho.
Cuadrogua
En la tabla siguiente, anotamos las caractersticas principales que se irn explicando a lo largo de este apartado dedicado a la estructura de los auxiliares
de la CDU:
Gua de los auxiliares comunes y especiales

Culesson

Auxiliares comunes
Independientes
Ic Lengua
Id Forma
Ie Lugar
If Razas, pueblos y nacionalidades
Ig Tiempo

Combinables Pueden ir solos o


con
combinarse con todas las clases

Auxiliares especiales
Dependientes

Ih Notaciones ajenas a la CDU


Ik Caractersticas generales

Dependen de la materia que precisan.


Un ejemplo: Periodos artsticos 7.03
dentro de la clase principal 7

Tienen que combinarse con las clases


forzosamente.

Slo con las clases para las cuales han


estado previstos

Seencuentrana

Tablas propias llamadas Tablas de auxi- Tablas propias llamadas Tablas de auxi- Repartidos en todas las clases que los
necesitan: clases principales y tablas de
liares comunes independientes
liares comunes dependientes
auxiliares comunes como los de lugar y
forma.

Losreconocemospor

Lengua =
Forma (0..)
Lugar (1/9)
Razas, pueblos y nacionalidades (= ...)
Tiempo ...

Notaciones ajenas a la CDU A/Z


Caractersticas generales de:
Propiedades-02
Materiales-03
Persones-05

A modo de conclusin
La funcin de los auxiliares es matizar y precisar el significado de las clases.
Hay dos tipos de auxiliares:

Por qu empiezan por.0/.9 0/-9 -00/


-009, porque tienen una lnea negra
vertical o porque estn encabezados
con el nombre de auxiliares especiales.

56

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

Auxiliares comunes (se abren en independientes y dependientes): se encuentran en


las tablas auxiliares.

Auxiliares especiales: no se encuentran reunidos en ninguna tabla, sino que se encuentran repartidos a lo largo de todas las tablas, tanto de las auxiliares como de
las principales. Son un tipo de auxiliares previstos slo para precisar el contenido de
ciertas materias, no de todas.

3.3.1. Tablas de auxiliares comunes


Independientes

Dependientes

TabladeauxiliarescomunesdeLengua

Tabladeauxiliarescomunes.NotacionesajenasalaCDU

=00 /03 Multilinge


=1/=2 Lenguas indoeuropeas
=3... Lenguas caucsicas (vasco...)
=4... Lenguas afroasiticas
=5... Lenguas uroaltaicas (japons, coreano...)
=6... Lenguas austroasiticas
=7... Lenguas indopacficas, australianas
=8... Lenguas indias americanas
=9... Lenguas artificiales

* Nmeros y cdigos
A/Z Nombres en orden alfabtico

Tabladeauxiliarescomunesdeforma

Tabladeauxiliarescomunesdecaractersticasgenerales

(0.0...) Caractersticas fsicas


(01) Bibliografa
(02) Libros en general
(03) Obras de referencia
(04) Separatas
(05) Publicaciones en serie
(06) Publicaciones de entidades
(07) Documentos para enseanza
(08) Poligrafas
(09) Presentacin en forma histrica

De propiedades:
-021 Propiedades de existencia
-022 Propiedades de magnitud. Cantidad
-023 Propiedades de forma. Dimensiones
-024 Propiedades de estructura
-025 Propiedades de disposicin
-026 Propiedades de accin y movimiento
-027 Propiedades operacionales
-028 Propiedades de estilo y presentacin
-029 Propiedades derivadas de otras clases principales
De materiales:
-032 Materiales minerales
-033 Materiales manufacturados
-034 Metales
-035 Materiales orgnicos
-036 Materiales macromoleculares
-037 Textiles, fibras.
-039 Otros materiales
De Personas:
-051 Personas como agentes, sujetos activos.
-052 Personas como objeto, sujetos pasivos
-053 Personas segn la edad
-054 Personas segn etnia, nacionalidad...
-055 Personas segn sexo y parentesco
-057 Personas segn ocupacin, trabajo
-058 Personas segn clase social y estado civil

Tabladeauxiliarescomunesdelugar
(1) Lugar y espacio en general. Localizacin.
(2) Designacin fisiogrfica
(3) Lugares del mundo antiguo
(4) Europa
(5) Asia
(6) frica
(7) Amrica del Norte y central
(8) Amrica del Sur
(9) Australia. rtico. Antrtico
Tabladeauxiliarescomunesderazas,pueblosynacionalidades
(=081/=088) Razas y pueblos primitivos. Razas mixtas
(=1.2/.9) Pueblos de regiones naturales
(paralela a la tabla de lugar)
(=11/=8) Pueblos y grupos lingsticos y culturales diversos
(paralela a la tabla de lengua)
Tabladeauxiliarescomunesdetiempo
0/2 Fechas y periodo de tiempo
3 Divisiones y subdivisiones del tiempo convencional
4 Periodos, edades
5 Frecuencia
6 Divisiones del tiempo geolgicas, arqueolgicas, culturales
7 Fenomenologa del tiempo

CC-BY-NC-ND PID_00143962

57

Tablas de auxiliares comunes independientes


Los auxiliares independientes son: lengua, forma, lugar, razas, pueblos y nacionalidades, tiempo. Como tienen un smbolo de inicio y uno de final pueden ir en cualquier lugar de la notacin (la excepcin es el de lengua, que slo
tiene smbolo en el inicio, pero la CDU permite aadirle detrs dos puntos).
Si en un mismo documento hay que representar ms de un concepto con
auxiliares independientes, la CDU recomienda el orden siguiente:
Clase + lugar + tiempo + forma + lengua + raza
A continuacin, explicamos el campo de aplicacin y los smbolos de cada
auxiliar. Se proporcionan ejemplos en que slo cambia el auxiliar para una
rpida comprensin y aparecen ordenados segn la lgica decimal de la CDU.
Cada bloque tiene ejercicios, con la solucin incluida, para practicar.
a)Tabladeauxiliarescomunesdelengua
=00 /03 Multilinge
=1/=2 Lenguas indoeuropeas
=3... Lenguas caucsicas (vasco...)
=4... Lenguas afroasiticas
=5... Lenguas uroaltaicas (japons, coreano...)
=6... Lenguas austroasiticas
=7... Lenguas indopacficas, australianas
=8... Lenguas indias americanas
=9... Lenguas artificiales

La lengua del documento se indica con el smbolo =1 / =9, igual a igual uno
a 9. En teora se puede aplicar a cualquier documento, indicando el idioma
en que est escrito, pero en la prctica slo es til cuando hay que distinguir
la lengua de los documentos. Ejemplo: ordenando todos los documentos en
francs, otro conjunto en ingls, etc.
Documento sobre setas comestibles
635.8=133.1 Setas comestibles , escrito en francs
635.8=134.1 Setas comestibles , escrito en cataln
635.8=134.2 Setas comestibles , escrito en castellano

Tambin se usan para crear las clases de Lengua y literaturas combinndolos


con las clases de la tabla 8. Se combinan con el 811 para representar la lengua
y con el 821 para representar literatura. Cuando se combinan, pierden el signo
inicial del igual = por un punto.

Sistemas de clasificacin documentales

58

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

Ejemplo

Recordatorio importante

821.111 Literatura inglesa


El 821 es la clase para la literatura
Y el 111 proviene de: =111 auxiliar de lengua para el idioma ingls, cuando se combina
para crear literatura inglesa, pierde el signo inicial del igual = por un punto.

Ahora estis en disposicin de


resolver los ejercicios planteados en el apartado anterior sobre las clases principales > clase 8 de Lengua y literatura.

Ejemplosdeusoparacrearclasesdelenguayliteratura:
811.133.1 Lengua francesa
811.134.1 Lengua catalana
811.134.2 Lengua castellana
821.133.1 Literatura francesa
821.134.1 Literatura catalana
821.134.2 Literatura castellana

b)Tabladeauxiliarescomunesdeforma
(0.0...) Caractersticas fsicas
(01) Bibliografa
(02) Libros en general
(03) Obras de referencia
(04) Separatas
(05) Publicaciones en serie
(06) Publicaciones de entidades
(07) Documentos para enseanza
(08) Poligrafas
(09) Presentacin en forma histrica

Indican la forma o presentacin del documento (no la materia). Su smbolo


es el (0...) parntesis cero.
Hay que recordar que hay un paralelismo entre la tabla principal 0 y estos
auxiliares de forma, ya que un concepto como el de diccionarios puede ser:
Una materia en s misma el estudio de los diccionarios y se representara
con la clase 030.
Una forma diccionario de francs y se representara con un auxiliar de forma
(038)=133.1
Paralelismo con la tabla de auxiliares de forma
Paralelismo con la tabla de auxiliares de forma, con respecto a ciertas disciplinas como las
enciclopedias, el diarios, el anuarios... que pueden ser traducidos al lenguaje documental
como materia o como forma.
Concepto

Como materia, por lo tanto,


clasificaremos con la tabla 0

Como forma, por lo tanto, clasificaremos con la tabla de auxiliares de forma

Enciclopedias

030(460.23)

Las enciclopedias catalanas

(031)GEC

La Gran Enciclopdia Catalana

Diarios

070

Los diarios

(054)EL PAIS

Diario El Pas

CC-BY-NC-ND PID_00143962

59

Sistemas de clasificacin documentales

Ejemplo
77(031) Enciclopedia de fotografa
77(035) Manual de fotografa
77(051) Revistas de fotografa

Los auxiliares de forma se pueden colocar en cualquier lugar de la notacin. A


efectos prcticos, puede ser conveniente agrupar los documentos por forma, y
as ordenar, por ejemplo, todos los diccionarios o todos los diarios juntos, etc.
Ejemplo
(038)=111 Diccionarios de ingls
(038)= 12402 Diccionarios de latn clsico
(038)=133.1 Diccionarios de francs

Esta tabla tiene tambin auxiliares especiales para expresar caractersticas fsicas, de produccin etc.
c)Tabladeauxiliarescomunesdelugar
(1) Lugar y espacio en general. Localizacin
(2) Designacin fisiogrfica
(3) Lugares del mundo antiguo
(4) Europa
(5) Asia
(6) frica
(7) Amrica del norte y central
(8) Amrica del sur
(9) Australia. rtico. Antrtico

Indican el espacio geogrfico, ya sea continente, pas, nacin, localidad u otras


referencias de espacio (lugares fsicos, lugares del mundo antiguo...). Se introducen entre parntesis (1/9).
Ejemplo
599.742.71(355) Leones de la antigua Persia
599.742.71(540) Leones de la India
599.742.71(6) Leones africanos

El Estado espaol est representado por las comunidades autnomas y, dentro


de cada una de ellas, por provincias.
(4) Europa
(46) Pennsula Ibrica
(460) Espaa
(460.23) Comunidad Autnoma de Catalua
(460.231) Provincia de Lleida
(460.232) Provincia de Girona
(460.233) Provincia de Barcelona

Ved tambin
Ved el subapartado siguiente,
dedicado a los auxiliares especiales, concretamente Los auxiliares especiales de los auxiliares comunes.

CC-BY-NC-ND PID_00143962

60

Sistemas de clasificacin documentales

(460.234) Provincia de Tarragona


(...)
(460.27) Comunidad Autnoma de Madrid
(...)
(460.35) Comunidad Autnoma de Andaluca
(460.351) Provincia de Crdoba
(460.352) Provincia de Jan
(460.354) Provincia de Sevilla
(460.355) Provincia de Huelva
(460.356) Provincia de Cdiz
(460.357) Provincia de Mlaga
(460.358) Provincia de Granada
(460.359) Provincia de Almera

Tambin se usan para crear las clases de Geografa e Historia, combinndolos


con las clases de la tabla 9.
Por ejemplo, se combinan con el 913/919 para representar la geografa y con
el 94 para representar la historia. Cuando se combinan, no pierden el signo ().
Ejemplos
Ejemploenqueel(71)eselauxiliardelugarparaCanad
913(71)
94(71)

Geografa de Canad
Historia de Canad

EjemplosdeusoparacrearclasesdeGeografaeHistoria
913(460.32) Geografa de las Islas Baleares
913(599) Geografa de Filipinas
913(82) Geografa de Argentina
94(460.32) Historia de las Islas Baleares
94(599) Historia de Filipinas
94(82) Historia de Argentina

Esta tabla tiene tambin auxiliares especiales para expresar caractersticas especficas de los lugares geogrficos, como zonas, puntos cardinales, unidades
polticas, etc.
d)Tabladeauxiliarescomunesderazas,pueblosynacionalidades
(=081/=088) Razas y pueblos primitivos. Razas mixtas
(=1.2/.9) Pueblos de regiones naturales
(paralela a la tabla de lugar)
(=11/=8) Pueblos y grupos lingsticos y culturales diversos
(paralela a la tabla de lengua)

Ved tambin
Ved el subapartado siguiente
dedicado a los auxiliares especiales, concretamente Los auxiliares especiales de los auxiliares comunes.

CC-BY-NC-ND PID_00143962

61

Indican la nacionalidad o los aspectos tnicos de una materia. Su signo es el


parntesis igual (= ...), de hecho derivan principalmente de los auxiliares de
lengua.
Ejemplos de construccin de auxiliares de raza desde los auxiliares de
lengua
=214.58
(=214.58)

Lengua roman (gitana)


Pueblo o nacionalidad gitana

=411.21
(=411.21)

Lengua rabe
Pueblo o nacionalidad rabe

=411.16
(=411.16)

Lengua hebrea o juda


Pueblo o nacionalidad juda

Sistemas de clasificacin documentales

Recordatorio importante
Ahora estis en disposicin de
resolver los ejercicios planteados en el captulo 7.2 de las
Clases principales > Clase 9 de
Geografa e Historia.

Estos auxiliares de razas, pueblos y nacionalidades son tiles para expresar


grupos de pases con algn rasgo comn de raza o nacionalidad (por ejemplo,
pases de habla inglesa) o pases que no se encuentran delimitados geogrficamente (como el caso de los gitanos y los hebreos).
Ejemplo
Ved la diferencia de representacin entre lo que sera el pas Israel y los pueblos judos:

(569.4) Israel es un auxiliar de lugar.


(=411.16) Judos de cualquier pas del mundo, no slo Israel
es un auxiliar de razas.

Ved la diferencia de representacin entre lo que sera el pas y el conjunto de pases que
hablan la misma lengua:
(41) Gran Bretaa es un auxiliar de lugar.
(=111) Pases de habla inglesa de cualquier pas del mundo,
no slo de Gran Bretaa es un auxiliar de razas.

e)Tabladeauxiliarescomunesdetiempo
0/2 Fechas y periodo de tiempo
3 Divisiones y subdivisiones del tiempo convencional
4 Periodos, edades
5 Frecuencia
6 Divisiones del tiempo geolgicas, arqueolgicas, culturales
7 Fenomenologa del tiempo

Indican la fecha, punto en el tiempo o intervalo de tiempo de una materia.


Su signo son las comillas dobles ... no sirven para indicar la fecha de publicacin del documento, que es tarea del anlisis documental y no del anlisis
de contenido.

Las fechas: se indican en la secuencia ao.mes.da, con 4 dgitos para el ao


y dos para el mes y el da.

Ved tambin
Ved la diferencia entre el anlisis documental y el anlisis de
contenido en el mdulo 1 de
esta asignatura.

62

CC-BY-NC-ND PID_00143962

Los siglos: se indican con dos dgitos.

Los intervalos de tiempo: se indican poniendo entre la fecha inicial y la


final una /
A modo de conclusin
Los auxiliares independientes son: lengua, forma, lugar, razas, pueblos y nacionalidades,
tiempo:

Lengua: indican la lengua del documento, con el smbolo =1 / =9, igual a uno igual
a 9. Tambin se usan para crear las clases de lengua y literatura combinndolos con
las clases de la tabla 8.

Forma: indican la forma o presentacin del documento (no la materia). Su smbolo


es el parntesis cero (0...).

Lugar: indican el espacio geogrfico, ya sea continente, pas, nacin, localidad o bien
otras referencias de espacio (lugares fsicos, lugares del mundo antiguo...). Se introducen por (1/9) parntesis uno a nueve. Tambin se usan para crear las clases de Geografa e Historia combinndolos con las clases de la tabla 9.

Razasypueblos: indican la nacionalidad o los aspectos tnicos de una materia. Su


signo es el parntesis igual (=...); de hecho, derivan principalmente de los auxiliares
de lengua.

Tiempo: indican la fecha, punto en el tiempo o intervalo de tiempo de una materia.


Su signo son las comillas ....

Como tienen un smbolo de inicio y uno de final, pueden ir a cualquier sitio de la notacin.
Si en un mismo documento hay que representar ms de un concepto con auxiliares independientes, la CDU recomienda el orden siguiente:
Clase + lugar + tiempo + forma + lengua + raza
Bibliografa
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M.Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje. Madrid: [en lnea].
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco [en lnea]. [Fecha de
consulta: 10 de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera. (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea. (Biblioteconoma y Administracin Cultural, 26).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la clasificacin decimal universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.

Sistemas de clasificacin documentales

Fechas
2000.01.01 es el uno de
enero de 2000.
Si la fecha es anterior a Cristo, se indica con un guin en
frente:
-0350 es el ao 350 antes
de Cristo.

Siglos
Fijaos en que la numeracin se
corresponde a la centuria y no
a la expresin habitual en nmeros romanos.
06 siglo VII, es decir, los aos
600 14 siglo XV, es decir los aos
1400 19 siglo XX, es decir los aos
1900 -

Ejemplo de intervalos de
tiempo
1910/1970: del ao 1910 a
1970
11/18: del siglo XII al XIX

CC-BY-NC-ND PID_00143962

63

Sistemas de clasificacin documentales

Tablas de auxiliares comunes dependientes


Los auxiliares dependientes son dos tablas: notaciones ajenas a la CDU y caractersticas generales (de propiedades, materiales y personas). Como su nombre indica, son auxiliares que slo se pueden usar como sufijos; no se han
de usar independientemente ni en el primer lugar de la notacin. Han de ir
siempre al final.
a)TabladeauxiliarescomunesdenotacionesajenasalaCDU
* Nmeros y cdigos
A/Z Nombres en orden alfabtico

El asterisco (*) marca el cdigo que no es propio de la CDU, pero que se utiliza en su notacin. Suelen ser temas que la CDU no trata y que aparecen, en
cambio, en otras clasificaciones o listas. Hay que anotar en el fichero de autoridades cules son estas otras fuentes.
Ejemplo
(460*17491) Peralada Font: cdigo postal correos.
La localidad de Peralada, en el Alto Ampurdn, tiene por cdigo postal el 17491.

El A/Z nos permite poner nombres propios y geogrficos, siglas y abreviaturas


a nmeros de la CDU. Cuando acompaan auxiliares de lugar, van entre parntesis.
Ejemplo
(460.233 San Cugat) Ciudad de San Cugat en la provincia de
Barcelona
821.133.1 Verne Literatura francesa de Jules Verne
929:791.44 Newman Biografa de Paul Newman la notacin
expresa biografas + cine + Paul Newman

b)Tabladeauxiliarescomunesdecaractersticasgenerales:propiedades,
materialesypersonas

Depropiedades:
-021 Propiedades de existencia
-022 Propiedades de magnitud. Cantidad
-023 Propiedades de forma. Dimensiones
-024 Propiedades de estructura
-025 Propiedades de disposicin
-026 Propiedades de accin y movimiento
-027 Propiedades operacionales
-028 Propiedades de estilo y presentacin
-029 Propiedades derivadas de otras clases principales

Observacin
Los nombres se pueden abreviar con las tres o cuatro primeras letras, tipo BARC / VERN
/ NEWM.

64

CC-BY-NC-ND PID_00143962

Los auxiliares de propiedades: derivan de la antigua tabla de auxiliares de punto de vista (cancelada en 1998) y denotan las propiedades generales o atributos.
Ejemplo
656.23.03-027.567 Precios subvencionados de ferrocarriles.

Demateriales:
-032 Materiales minerales
-033 Materiales manufacturados
-034 Metales
-035 Materiales orgnicos
-036 Materiales macromoleculares
-037 Textiles, fibras.
-039 Otros materiales

Los auxiliares de materiales sealan los materiales o componentes de los objetos.


Ejemplo
A partir de -035. 3 madera y 685.341.3 zapatos, segn el material de fabricacin, construimos zapatos de madera: 685.341.353 Zuecos

La fabricacin y procesamiento de los materiales se encuentra en la clase principal 6, clases 66/67.

Depersonas:
-051 Personas como agentes, sujetos activos
-052 Personas como objetos, sujetos pasivos
-053 Personas segn la edad
-054 Personas segn etnia, nacionalidad...
-055 Personas segn gnero y parentesco
-057 Personas segn ocupacin, trabajo
-058 Personas segn clase social y estado civil

Los auxiliares de personas denotan a las personas a las cuales hace referencia
el tema clasificado.
Roles y combinaciones de auxiliares
Observad el rol activo (clase -051) o pasivo (clase -052) de la persona, y la combinacin
de dos auxiliares de persona en la misma notacin (-055. 2 sexo femenino). Ejemplo de
McIlwaine (2003, pg. 103):
75.041.5
75.041.5-051
75.041.5-052
75.041.5-052-055.2

Retrato
Retratista
Persona que ha sido retratada
Mujeres retratadas

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

65

A modo de conclusin
Los auxiliares dependientes son:

Notacionesajenas: * nmeros y cdigos y A/Z Nombres en orden alfabtico. El asterisco * marca el cdigo que no es propio de la CDU, pero que se utiliza en la notacin. Suelen ser temas que la CDU no trata y que aparecen, en cambio, en otras
clasificaciones o listas. Nos permite poner nombres propios y geogrficos, siglas y
abreviaturas a nmeros de la CDU.

Caractersticas generales: pueden ser caractersticas de propiedades, materiales o


personas. Como su nombre indica, son auxiliares que slo se pueden usar como sufijos; no se han de usar independientemente ni en primer lugar, y van siempre al
final de la notacin.

Ms informacin
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M. Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje.
Madrid: Taranco.
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y administracin cultural, 26).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.

3.3.2. Tablas de auxiliares especiales

Los auxiliares especiales ayudan a precisar el contenido de algunas materias, pero no de todas.

Al contrario que los auxiliares comunes, que se encuentran reunidos en una


sola tabla, los auxiliares especiales se encuentran extendidos, repartidos por
todas las clases principales y algunas tablas de auxiliares.
A continuacin, mencionamos algunas observaciones que hay que tener en
cuenta con respecto a los auxiliares especiales.
a)Todaslasclasestienenauxiliaresespeciales?

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

66

No, no todas las clases tienen auxiliares especiales, ya que no todas las temticas son susceptibles de tener elementos de matizacin comunes.
b)Cmoselocalizan?
La manera en que podemos localizar a los auxiliares especiales depender de
si consultamos una edicin en papel (como la edicin de bolsillo de la CDU)
o una edicin digital (como la que tenis en el aula). Sin embargo, los reconoceris porque siempre empiezan por las secuencias siguientes:

Punto cero a punto nuevo .0/.9: sirven para crear conjuntos y subconjuntos de conceptos.

Guin cero a guin nuevo -0/-9: tienen una funcin analtica.

Apstrofo cero a apstrofo nueve >0/9: son ms especficas que las de


guin cero y tienen una funcin sintetizadora.

En las edicionesenpapel, estos auxiliares especiales se marcan con una lnea


negra vertical.
Auxiliares especiales en ediciones en papel
La clase 02 Tcnica teatral se ve claramente que es un auxiliar especial porque tiene la
lnea negra y empieza por punto cero.

En las versiones digitales, los auxiliares especiales se reconocen porque habremos hecho clic en un enlace que dice auxiliares especiales, o bien porque
empiezan de una de estas maneras:
.0/.9 punto cero a punto 9
-0/-9 guin cero a guin 9
0/9 apstrofo cero a apstrofo nueve

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

67

Auxiliares especiales en versiones digitales


Si vemos el mismo caso en la versin digital: primero hacemos clic donde dice auxiliares
especiales, y una vez dentro, vemos que se introducen por punto cero.

c)Mismanumeracin,mismosignificado?
Los auxiliares especiales representan las facetas particulares de las materias y
slo tienen sentido de aplicacin en su mbito temtico. En la CDU, un mismo
auxiliar como -4 significa conceptos bien diferentes segn la clase en la que
se aplique:
54-4 Productos qumicos, reactivos
62-4 Estado de los materiales en ingeniera
82-4 Ensayos, literatura

d)Cmosecombinan?
Tenemos que ver en qu clase estn adscritos los auxiliares, ya que slo se podrn combinar con esta o con otras clases que empiecen de la misma manera.

Sistemas de clasificacin documentales

68

CC-BY-NC-ND PID_00143962

Ejemplos de auxiliares especiales


Auxiliarespecialintroducidoporunguin:
Notacinfinal:

244.82-23
Libros sagrados del budismo zen

Construidaapartirde

24-23 Libros sagrados


244.82 Budismo zen

Explicacin

En primer lugar, ponemos la clase para el budismo zen y aadimos el auxiliar especial.
Prestamos atencin al hecho de que, cuando se combinan,
desaparece el 24 del auxiliar.
Otras combinaciones: siempre que la clase empiece por 24
242-23: Libros sagrados del budismo Mahayana

El 24, que desaparece cuando se combina, nos indica que esta posicin puede ser ocupada
por cualquier clase que empiece por 24 (como la 244 de Budismo zen o la 242 de Budismo
Mahayana), pero no por una clase como la 28 del Islam (28 no es 24).
Auxiliarespecialintroducidoporpunto:
Notacinfinal:

749.035.93
Mobiliario modernista

Construidaapartirde:

7.035.93 Modernismo
749 Mobiliario artstico

Explicacin:

Ponemos en primer lugar la clase para mobiliario (punto de


vista de las artes aplicadas) y le aadimos el auxiliar especial
que hace referencia al periodo artstico.
Vemos que, cuando se combinan, desaparece el 7 del auxiliar.
Otras combinaciones: siempre que la clase empiece por 7.

Los auxiliares especiales de la clase 7 son extensos y se aplican a todas las clases que
empiecen por 7, a excepcin de la clase 77, es decir, las clases 71, 72, 73, 74, 75, 76, 78,
79, lo cual los convierte en uno de los auxiliares ms combinables de las tablas.
7.035.93
72.035.93
73.035.93
74.035.93
75.035.93
76.035.93
(...)

Arte modernista
Arquitectura modernista
Escultura modernista
Dibujo modernista
Pintura modernista
Grabado modernista

e)Losauxiliaresespecialesdelosauxiliarescomunes
La CDU es rica y potente y ha previsto que incluso algunos auxiliares comunes como los de lengua, forma y lugar puedan tener sus propios elementos
facetados. Haciendo un juego de palabras, podramos decir que son facetas
de facetas.
Con un ejemplo se entender rpidamente. Para representar el concepto sur
de Italia, la notacin es la siguiente, donde la (450) es Italia y el (1-13) es sur
(este es el auxiliar especial, concretamente de la tabla de lugar):

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

69

(450-13) Sur de Italia

Una vez combinados el 1 ha desaparecido, porque si no fuera as, habra significado en Italia y en el sur en general.
(450-13) Sur de Italia
(450)(1-13) Italia y el sur

Los auxiliares especiales que tienen las tablas de auxiliares comunes son:

En la tabla de lengua: por orgenes y periodos del tipo (antiguo, clsico,


medieval, moderno...). Por ejemplo:
=1404 Griego medieval o bizantino

En este ejemplo, =14 es Griego > y el auxiliar especial es =...04 (hay que llenar
los puntos sucesivos con la clase de la lengua que estamos caracterizando).

En la tabla de forma: por caractersticas fsicas o de produccin, del tipo


miniatura, de bolsillo, en soportes magnticos... Por ejemplo:
025.45.027.5 CDU edicin bolsillo

Donde 025.45 es clasificaciones decimales y el auxiliar especial es (0.027.5)


para ediciones de bolsillo el primer cero desaparece cuando se combina con
la clase 025.45.

En la tabla de lugar: para fronteras, puntos cardinales (norte, sur, este, oeste y combinaciones), unidades polticas o administrativas (municipios, comunidades, capitales, imperios, colonias, grupos de Estados...). Por ejemplo:
(4-662) Pases capitalistas europeos

Donde (4) es Europa y el auxiliar especial es (1-662) para pases capitalistas el


primer uno desaparece cuando se combina con la clase 4.
A modo de conclusin
Los auxiliares especiales ayudan a precisar el contenido de algunas materias, pero no de
todas.
No hay una tabla de auxiliares especiales, sino que se encuentran repartidos por todas las
clases principales y las tablas auxiliares que disponen. Los reconocemos porque empiezan
por:

Punto cero a punto nueve .0/.9 sirven para crear conjuntos y subconjuntos de conceptos.
Guin cero a guin nueve -0/-9 tienen una funcin analtica.
Apstrofo cero a apstrofo nueve 0/9 son ms especficas que las de guin cero y
tienen una funcin sintetizadora.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

70

Sistemas de clasificacin documentales

Ms informacin
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M. Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje.
Madrid: Taranco.
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera. (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y Administracin Cultura, 26).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.

3.4. Signos con funcin combinatoria y signos con funcin


instructiva
Las clases se pueden combinar entre s, siguiendo la sintaxis que marca la misma CDU, y por este motivo son necesarios los signos clasificatorios. O pueden
remitir unas a otras, en beneficio de una mejor clasificacin, y por este motivo
necesitaremos saber interpretar los signos no clasificatorios que acompaan
las rbricas.
En la CDU hay dos tipos de signos:
1) Los que tienen una funcin combinatoria.
2) Los que tienen una funcin puramente instructiva.
3.4.1. La importancia de los signos

Los signos son importantes porque forman parte de la sintaxis de la


notacin: los signos permiten diferenciar elementos y ordenar los documentos.

Por ejemplo:
=581 lengua china es un auxiliar de lengua
(581) Afganistn es un auxiliar de lugar
0581 Ao 581 dC es un auxiliar de tiempo
-058. 1 Personas segn clase social es una auxiliar de caractersticas personales

71

CC-BY-NC-ND PID_00143962

Sistemas de clasificacin documentales

581 Botnica es una clase de las tablas principales

Como se puede apreciar, son conceptos bien diferentes. Y la diferencia radica


en los smbolos que los caracterizan: el igual, el parntesis, las comillas, el
guin o la ausencia de smbolos (como en las tablas principales).
Para una mejor comprensin, y vista la diversidad de signos, funciones y localizaciones dentro de las tablas, hemos decidido agrupar todos los signos de
la CDU en este subapartado.
Funcin

Combinatoria

Signo

Se lee

Funcin

Dnde se encuentran?

Ms

Suma

Tabla aux. comunes Ia

Barra

Extensin

Tabla aux. comunes Ia

Dos puntos o Colon

Relacin

Tabla aux. comunes Ib

::

Doble Colon

Nexo indisoluble de
relacin

Tabla aux. comunes Ib

[...]

Corchetes

Agrupa notaciones

Tabla aux. comunes Ib

=...

Igual

Lengua

Tabla aux. comunes Ic

(0...)

Parntesis cero

Forma

Tabla aux. comunes Id

(...)

Parntesis

Lugar

Tabla aux. comunes Ie

(=...)

Parntesis igual

Razas y pueblos

Tabla aux. comunes If

Comillas

Tiempo

Tabla aux. comunes Ig

Asterisco

Combinacin con otros


sistemas externos a la CDU

Tabla aux. comunes Ih

A/Z

A a la Z

Ordenacin alfabtica

Tabla aux. comunes Ih

-0...

Guin cero

Caractersticas generales

Tabla aux. comunes Ik

-...

Guin

Aux. especial, analtico

Repartido por las tablas

.0...

Punto cero

Aux. especial, conjuntos

Repartido por las tablas

e...

apstrofo

Aux. especial, sintetizador

Repartido por las tablas

Punto

Separar grupos de tres cifras

Repartido por las tablas

...

Puntos suspensivos

Sustitucin de posibles cifras

Repartido por las tablas

Ved

Indica que hay otros nmeros


a consultar

Repartido por las tablas

Subdividid como

Subdivisin paralela

Repartido por las tablas

Puramente .
instructiva

CC-BY-NC-ND PID_00143962

72

Sistemas de clasificacin documentales

3.4.2. Los signos con funcin combinatoria

Los signos con funcin combinatoria son los signos que permiten unir
dos o ms clases de la CDU para formar un concepto que no estaba
recogido previamente.

Los signos con funcin combinatoria tienen una funcin sintetizadora; permiten la expresin de frases documentales compuestas.
Son los signos siguientes:

+ Se usa para representar un concepto compuesto para el cual no existe


un nmero simple previsto. Une dos o ms clases no consecutivas de las
tablas.
(450 + 494) Italia y Suiza

/ Se usa para representar un concepto que no aparece en una nica clase


en el sistema, sino que aparece en diferentes clases consecutivas.
73/75 documento sobre artes plsticas, dibujo y pintura que equivale a las clases
73, 74 y 75

: Se usa para representar dos conceptos relacionados. Las relaciones pueden ser diversas: de relacin en general, de comparacin, de diferencia, de
influencia.
91:93 Relacin entre Geografa e Historia

:: Si cuando se colocan los nmeros de las dos clases relacionadas cambia el


significado, entonces se usa el doble Colon. Se considera el primer nmero
como el tema principal y el segundo como dependiente. Slo se entra en
el catlogo una vez.
070::32 Periodismo poltico

[...]Se usa para agrupar nmeros y clarificar las relaciones entre las partes
de la notacin resultante.
[72+75](450) Arquitectura y pintura italianas
Colon o doble Colon
Si utilizramos el Colon 070:32 significara relacin entre periodismo y poltica; en cambio, nos interesa remarcar que es periodismo poltico y no otra combinacin, como por
ejemplo, la poltica del periodismo.

CC-BY-NC-ND PID_00143962

73

El resto de signos van asociados a los auxiliares comunes y especiales de la


CDU, explicados en los subapartados anteriores.
3.4.3. Los signos puramente instructivos

Los signos puramente instructivos son los signos sin valor clasificatorio.

Los signos puramente instructivos son los siguientes:

. (punto). El punto separa las cifras de la notacin de tres en tres, para


facilitar la lectura, pero no tiene valor clasificatorio.

(dividircomo). Encontramos este signo cuando una parte de las tablas


se subdivide igual que otra. Por ejemplo: 675.025675.055 significa que la
primera clase se subdivide como la segunda. As: 675.025.35 Pulir el cuero
proviene de:
675.025675.055
675.025 Tratamiento del cuero
675.055.35 Mquinas para pulir el cuero
Esta prctica se va abandonando poco a poco, tal como dice McIlwaine y,
en cambio, se introducen los dos puntos.
Esto se debe al hecho de que estas notaciones no tienen la apariencia de haber sido
construidas por la combinacin de dos nmeros separados y, en consecuencia, el ordenador es incapaz de detectar en qu casos se trata de un concepto compuesto y de recuperar la informacin requerida.
McIlwaine (pg. 61)

Este signo puede indicar que una clase se subdivide como otra clase o que
se subdivide como una tabla de auxiliares. Por ejemplo, 616-05-05 tabla Ik
significa que los auxiliares especiales de la clase 616-05 de patologa se abren
igual que los auxiliares de la tabla de caractersticas de personas:
616-056.25 Enfermedades de personas desnutridas,
donde -056. 25 es el estado de nutrimento de las personas.

(Vedtambin). Este signo llama la atencin sobre mbitos temticos


parecidos o afines con respecto a un tema en particular. As, 027.7 Bibliotecas universitarias 378.16 significa que si estamos consultando la clase
027.7 sobre bibliotecas universitarias tambin nos puede interesar consultar la clase 378.16, de campus, edificios e instalaciones universitarias.

3.4.4. Conclusiones
En la CDU, hay dos tipos de signos:

Sistemas de clasificacin documentales

Observacin
Mientras que los signos + y /
unen conceptos que aparecen
separados o de manera consecutiva en las tablas, los signos :
y :: unen conceptos y denotan
claramente la relacin que hay
entre ellos.

CC-BY-NC-ND PID_00143962

74

Los que tienen una funcincombinatoria. Son los signos que permiten unir
dos o ms clases de la CDU para formar un concepto de lo que estaba recogido previamente. Tienen una funcin sintetizadora; permiten la expresin de
frases documentales compuestas. Son los signos: + /::: []
Los que tienen una funcinpuramenteinstructiva. Son los signos sin valor
clasificatorio, pero que tienen una funcin instructiva. Son los signos . (punto), (dividir como) y (ved tambin).
Ms informacin
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M. Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje.
Madrid: Taranco.
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y Administracin Cultural, 26).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

75

4. Empezamos a clasificar

Para empezar a clasificar, se trata de seguir la estrategia siguiente:


1)Analizar el contenido del documento y decidir la clase o las clases. Es especialmente importante cuando el tema tiene diversos enfoques o el contenido
es mltiple.
2)Consultar la tabla o las tablas principales, prestando atencin a si tiene auxiliares especiales. Hay que consultar los auxiliares comunes si son necesarios.
3)Comprobar la clase en el ndice alfabtico o el buscador del programa CDU.
Es muy importante que el estudiante sea consciente de que los ndices y buscadores son ayudas adicionales y no el medio principal para localizar la clase.
Si la materia es polismica o tiene diversos enfoques, el ndice o buscador nos
puede llevar a error.
Algunos ejemplos
Ejemplo de trmino con polisemia: documento sobre los caballitos de feria

595.7 cidos dicarboxlicos de ciclohexanos


597.5 Telesteos
688.774 Juguetes. Artculos de diversin e ilusionismo

Nos interesa la ltima clase, la 688.774; las otras dos seran un error (la primera hace
referencia a los insectos caballitos del diablo, la de telesteos hace referencia a los caballitos de mar).
Ejemplodetrminocondiversosenfoques:documentosobrelapoligamia

173.2 Poligamia (desde el punto de vista de la tica familiar)


314.545.4 Poligamia (desde el punto de vista de la demografa,
estudios de poblacin segn nupcialidad)
392.544 Poligamia (desde el punto de vista de la etnologa,
usos y costumbres de la vida privada)
613.89 Poligamia (desde el punto de vista de la higiene en
general y la sexual en particular)

Si nuestro documento tuviera un carcter antropolgico, lo clasificaramos en 392.544.

Una vez tenemos el documento enfrente, nos podemos encontrar en las situaciones siguientes:
1.Encontramosunaclasealaprimeraydemaneraunvoca
El documento tiene una materia que se corresponde con un solo ndice.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

76

61 Medicina

2.Eldocumentotienemsdeunamateria,perolaCDUlasrecogejuntas
332.8 Economa de la vivienda

3.Tenemosquecombinardosomsclasesdelastablasprincipalesporque
elconceptonoexisteapriori
3.1. Cuando queramos unir dos materias independientes, pero que estn relacionadas (para formar un nuevo concepto o para precisarlo), utilizaremos
el signo:
17:61
61:17 Medicina y tica como materias relacionadas

En este caso, la CDU permite introducir la notacin dos veces en el catlogo


para poder recuperarlo tanto si se hace la busca por tica como por medicina.
3.2. Cuando queramos unir dos materias dependientes y relacionadas en un
orden fijo, utilizaremos el signo :: (en este caso, para diferenciarlo de la economa de las asociaciones):
061::33 Asociaciones econmicas

3.3. Cuando queramos unir dos materias, con una relacin simple de adiccin,
utilizaremos el signo +.
77 + 791 Fotografa y cine

3.4. Cuando queramos unir dos materias, expresadas consecutivamente en las


tablas, utilizaremos el signo /.
58/59 Botnica y zoologa

4.Tenemosquematizarunaclasedelastablasprincipalesconalgntipo
deauxiliarporqueelconceptonoexisteapriori.
4.1. Cuando la faceta sea de tipo universal en todas las tablas como la de lengua, forma, lugar, de razas y de tiempo.
En primer lugar, el nmero de la clase que representa el contenido mayoritario del documento y, acto seguido, el auxiliar comn. Si hubiera ms de un
auxiliar comn, la CDU recomienda el orden siguiente:
Clase + lugar + tiempo + forma + lengua + raza.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

77

Ejemplo
398.332.34(495.2)17 Fiestas de la vendimia en el Peloponeso en el siglo XVIII.
Como estos auxiliares son independientes, tambin podemos ponerlos en el inicio de la
notacin por tal de agrupar todos los documentos por forma, idioma...
(495.2)398.332.3417 Fiestas de la vendimia en el Peloponeso en el siglo XVIII, teniendo
en cuenta que ordenamos todos los documentos del Peloponeso juntos.

4.2. Cuando queramos expresar una faceta de tipo particular, de las que slo
afectan a una materia, pondremos en primer lugar el nmero de la clase que
representa el contenido mayoritario del documento y, acto seguido, el auxiliar
especial.
611.3.01 Anatoma del aparato digestivo

4.3. Si el documento tuviera al mismo tiempo un auxiliar especial y uno comn, el orden sera:
Clase + auxiliar especial + auxiliar comn.
Ejemplo
28-57(532) Documento sobre la peregrinacin musulmana a La Meca
28 es Islam, 2-57 es el auxiliar especial para el concepto peregrinacin y (532) es el auxiliar
de lugar para la Arabia Saud.
A modo de conclusin
Cuando empezamos a clasificar un documento hemos de analizar el tema o los temas,
consultar las tablas principales y las de auxiliares comunes y comprobar si disponen de
auxiliares especiales.
No se recomienda usar el ndice alfabtico o el buscador del programa CDU, porque si la
materia es polismica o tiene diversos enfoques nos puede llevar a error.
Si hay que construir una notacin, puede ser el resultado de las siguientes combinaciones:

Una clase principal + clase principal (unidas con + /::).


Una clase principal + auxiliar comn (lugar o tiempo o forma o lengua o raza).
Una clase principal + auxiliar especial.
Una clase principal + auxiliar especial + auxiliar comn.

Ms informacin
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
DezCarrera,C. (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y Administracin Cultural, 26).

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

78

Sistemas de clasificacin documentales

5. Prcticas con la CDU

A continuacin, se propone una serie de ejercicios ordenados segn el grado


de dificultad para un estudiante que se introduce en este lenguaje documental.
No se presentan todas las casusticas que ofrece este lenguaje documental, pero
s algunas de las ms habituales.
Ms informacin
M.Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje. Madrid: Taranco.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y Administracin Cultural, 26).
I.C.McIlwaine(2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.

5.1. Ejercicios de nivel bajo


Clasificad los documentos siguientes:
Clase0

Documento sobre bibliografas de autor:

Documento sobre catlogos por materias:

Documento sobre las cartas al director de un diario:

Documento sobre ex-libris:

Clase1

Documento sobre mtodos de filosofar:

Documento sobre estados emocionales:

Documento sobre lgica proposicional:

Documento sobre tica profesional:

Clase2

Documento sobre la Iglesia catlica romana:

Documento sobre el Islam chita:

Documento sobre el agnosticismo:

Documento sobre el confucionismo (religin china):

Objetivos
Estos ejercicios os tienen que
permitir alcanzar los objetivos
siguientes:
Aprender a ubicar conceptos en las tablas principales.
Suelen ser conceptos que
tienen entrada propia en la
CDU (no hay que construir
la notacin). Para facilitar la
tarea, se presentan ordenados por tablas.
Aprender a situar un concepto segn el enfoque
adecuado.

CC-BY-NC-ND PID_00143962

79

Clase3

Documento sobre teoras de la poblacin:

Documento sobre campaas electorales:

Documento sobre el Ministerio de Hacienda:

Documento sobre el poder adquisitivo del consumidor:

Clase4
Clase5

Documento sobre ciencias del medio ambiente:

Documento sobre la capacidad calorfica de los lquidos:

Documento sobre hidrocarburos saturados:

Documento sobre silicatos bsicos:

Documento sobre biologa:

Documento sobre botnica - las magnolias:

Documento sobre la ballena azul:

Clase6

Documento sobre psicoterapia:

Documento sobre drenaje de minas:

Documento sobre enfermedades por hongos de las plantas:

Documento sobre instalaciones de agua potable (en las viviendas):

Documento sobre produccin de sosa y potasa:

Clase7

Documento sobre escultura:

Documento sobre dibujo anatmico:

Documento sobre diseo de carteles:

Clase8

Documento sobre la lengua coreana:

Documento sobre literatura griega:

Clase9

Documento sobre pinturas rupestres:

Documento sobre viajes de descubrimientos geogrficos:

Documento sobre rdenes de caballera:

Documento sobre la tercera guerra carlista:

Diversosenfoquesdelasmaterias:

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

80

Documento sobre el atesmo, desde el punto de vista filosfico:

Documento sobre el atesmo, desde el punto de vista religioso:

Documento sobre las elecciones polticas, desde el punto de vista poltico:

Documento sobre las elecciones polticas, desde el punto de vista del de-

Sistemas de clasificacin documentales

recho:

Documento sobre los delitos contra los derechos humanos, desde el punto
de vista del derecho penal:

Documento sobre los delitos contra los derechos humanos, desde el punto
de vista del derecho internacional:

Documento sobre los delitos contra los derechos humanos, desde el punto
de vista del derecho constitucional:

5.2. Ejercicios de nivel medio


Clasificad los siguientes documentos
Clase0

Documento sobre las piezas prehistricas de un museo:

Documento sobre la clasificacin decimal Dewey:

Documento sobre bibliografa nacional francesa:

Documento sobre thesaurus de psicologa:

Clase1

Documento sobre la filosofa de Arthur Schopenhauer:

Documento sobre el esnobismo ingls:

Clase2

Documento sobre los santos de la religin cristiana:

Documento sobre el chamanismo en las religiones de los indios de Amrica


del Norte:

Documento sobre teologa postmoderna:

Documento sobre el culto a la luna:

Clase3

Documento sobre las escuelas privadas:

Documento sobre los partidos conservadores franceses:

Documento sobre la mujer en la poltica:

Documento sobre los impuestos municipales:

Documento sobre las funciones del Parlamento cataln:

Clase5

Objetivos
Estos ejercicios os tienen que
permitir alcanzar los objetivos
siguientes:
Construir notaciones combinando tablas principales
con tablas de auxiliares comunes y auxiliares especiales.
Construir notaciones utilizando los signos clasificatorios de la CDU, es decir, expresando la relacin entre
las materias unidas.

CC-BY-NC-ND PID_00143962

81

Sistemas de clasificacin documentales

Documento sobre los crteres y mares de la Luna:

Clase6

Documento sobre la otitis:

Documento sobre los libros de cocina:

Clase7

Documento sobre la pintura de Velzquez:

Documento sobre los artistas alemanes postimpresionistas:

Documento sobre las mujeres glamourosas en el cine de suspense:

Documento sobre las competiciones de judo:

Documento sobre el himno nacional de Estados Unidos de Amrica del


Norte:

Clase8

Documento sobre literatura hebrea:

Documento sobre la poesa de Antonio Machado:

Documento sobre las novelas de Harry Potter:

Clase9

Documento sobre la geografa de la India:

Documento sobre la historia de la casa de los Borbones en Espaa:

Documento sobre geografa poltica:

Documento sobre geografa de la Polinesia Francesa:

5.3. Ejercicios de nivel alto


Clasificad los documentos siguientes:

Documento sobre Barcelona ciudad como fondo argumental de pelculas


de cine:

Documento sobre el psicoanlisis como terapia mdica:

Documento sobre el turismo como elemento del tiempo libre:

Documento sobre el turismo como factor econmico:

Documento sobre los diarios franceses:

Documento sobre los ritos y ceremonias budistas:

Documento sobre las unidades calorimtricas como medida de cantidad


de calor:

Documento sobre la bibliografa de las publicaciones peridicas de zoologa:

Documento sobre las catedrales gticas francesas:

Documento sobre herramientas para hacer esculturas:

Documento sobre los hroes en las pelculas de ciencia-ficcin:

Objetivos
Estos ejercicios os tienen que
permitir alcanzar los objetivos
siguientes:
Construir notaciones combinando todos los elementos antes descritos, sin
mencionar expresamente
las partes que no integran
la notacin ni la clase a la
cual pertenecen.

CC-BY-NC-ND PID_00143962

82

Documento sobre historia de Espaa bajo los romanos:

Documento sobre la Biblia por los testimonios de Jehov:

Documento sobre la Gran Enciclopedia Catalana, en CD-ROM:

Documento sobre los suelos de arenisca:

Documento sobre rdenes religiosas femeninas catlicas:

Documento sobre el psicoanlisis como proceso psicolgico:

Documento sobre los cuentos fantsticos de Julio Cortzar:

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

83

Sistemas de clasificacin documentales

6. Creacin de un sistema de clasificacin propio

Hay circunstancias en las cuales el documentalista se ve impulsado a crear su


propio sistema de clasificacin: colecciones muy especializadas, fondos documentales histricos... son casos en los que es difcil, si no imposible, encontrar
un sistema de clasificacin ya existente. Lo ms comn es que el documentalista pueda aprovechar partes, pero no la totalidad.
Del conocimiento que se ha ido desprendiendo de la historia de las clasificaciones y de la estructura y funcionamiento de modelos clasificaciones, como
la CDU, podemos extraer las lneas bsicas para crear un sistema de clasificacin nuevo.
Premisas
Lo primero que el documentalista tendra que sopesar es si realmente un sistema de clasificacin es el lenguaje documental apropiado para su fondo.
Recordemos que hay otros lenguajes: la lista de palabras clave (o indexacin automtica),
la lista de descriptores libres, la lista de autoridades, las listas de encabezamientos de
materia y los thesaurus, todos ellos estudiados en los mdulos de esta asignatura.

A continuacin, exponemos las fases de creacin de un sistema de clasificacin


nuevo, segn Jacques Maniez, convenientemente sintetizadas:

Estudio previo: de usuarios, clasificaciones anteriores, estructura, lengua


y otros

Metodologa

Proceso de creacin

Mantenimiento

6.1. Estudio previo


La fase de estudio previo presenta las posibilidades siguientes, segn la orientacin que se quiera dar al lenguaje documental de creacin nueva:
1)Deusuarios: si los usuarios tienen libre acceso a las estanteras, hace falta
una cuidada ordenacin por materias; si los usuarios buscan la referencia en
el catlogo en lnea, la ordenacin por materias no es tan definitoria.
Tipo de ordenaciones
Recordemos que podemos distinguir entre tres tipos de ordenaciones (Maniez, 1993, pg.
21):
1) Ordenaciones no significativas, sin ninguna relacin con el contenido de los documentos, por ejemplo, ordenaciones numricas a partir del nmero de registro.
2) Ordenaciones con significado limitado: por lengua, pas, autor, disciplina, etc.

Lectura complementaria
El proceso de creacin de un
lenguaje documental que
se seguir en los subapartados siguientes sigue el punto
de vista que se expone en la
obra siguiente:
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin
y utilizacin en los sistemas documentales. Madrid: Pirmide
/ Fundacin Germn Snchez
Ruiprez.

CC-BY-NC-ND PID_00143962

84

Sistemas de clasificacin documentales

3) Ordenaciones altamente significativas: ordenacin por materias, de manera que los


documentos que traten de contenidos afines se coloquen unos cerca de otros.

2)Declasificacionesanteriores: hace falta optimizar recursos y consultar cuadros previos para inspirarse o adoptarlos directamente. Ejemplo: CDU, DDC,
clasificaciones sectoriales, recopilaciones de thesaurus.
3)Deestructura: podemos escoger entre tres tipos (jerrquica, facetada o mixta).
4)Delenguayniveldeespecificidad.
5)Otros:gastos,calendario,funciones.
6.2. Metodologa
La metodologadetrabajo consiste en una combinacin de dos mtodos, el
inductivo y el deductivo. El primero se basa en la realizacin de un cuadro
segn las materias que tengamos en nuestro SID, el segundo se basa en el
dominio conceptual y su subdivisin siguiendo las reglas de divisin lgica.
Metodologas inductivas y deductivas
En una metodologa inductiva, reunimos todos los documentos sobre derecho de manera
intuitiva, agrupndolos por afinidad de contenido. Despus, relacionamos las diversas
clases que hayan salido en una ms general, y as sucesivamente.
En una metodologa deductiva, estructuramos el dominio derecho en derecho civil, derecho constitucional, derecho penal, derecho internacional... (divisin tradicional acadmica).

Con respecto a los instrumentosdetrabajo, hay diversos tipos de programas


de gestin documental, pero el documentalista tambin necesitar procesadores de textos y algn tipo de base de datos que le permita relacionar rbricas
con sinnimos y otras anotaciones de uso, como las propias del fichero de
autoridades.
6.3. Proceso de creacin
En el proceso de creacin de un lenguaje documental se distinguen las etapas
siguientes:
1)Eleccindelaformaglobaldelaarborescencia. El quid reside en decidir
cuntas clases pondremos en el primer nivel, qu intervalo de rango usaremos
y hasta qu nivel consideramos que la notacin ser comprensible.
Tal como se puede ver en el esquema siguiente, si un cuadro de clasificacin
parte de una clase principal y rango dos, en el tercer nivel se consiguen 15
clases y la notacin tendr cuatro dgitos (por ejemplo, 111.1).

Ved tambin
Los thesaurus tienen diversas
presentaciones, entre las cuales la jerrquica, que se corresponde a un cuadro de clasificacin. Se estudiar ms detenidamente en el mdulo Listas de encabezamientos de
materia de la asignatura.

CC-BY-NC-ND PID_00143962

85

Decimos que hay 15 clases, y no slo las 8 del nivel inferior, porque todas
son clases susceptibles de ser utilizadas para clasificar. Por ejemplo, en la clase
marcada como nmero 2, podemos clasificar obras sobre Religin catlica; en
la clase 4 clasificar obras sobre la Biblia; en la clase 8, obras sobre el Antiguo
Testamento.
Como se puede comprobar, haran falta muchas subdivisiones para llegar, por
ejemplo, a 200 clases. Cmo se soluciona? Aumentando el nmero de clases
principales y/o aumentando el rango hasta encontrar el equilibrio que se necesita.
Podemos conseguir un cuadro de 200 clases con diversas opciones:

5 clases principales, a rango 3, en el tercer nivel tendra 200 clases.

10 clases principales a rango 4, en el segundo nivel tendra 210 clases y la


notacin sera ms corta.
La recomendacin de J. Maniez (pg. 160) a la hora de ampliar el nmero de clases es
la siguiente:
Por nuestra parte, aconsejamos forzar el nmero de clases principales, sin dudar ante
la necesidad de superar la decena (lo que no permite una notacin decimal en el primer
nivel) [...] Por consiguiente, es razonable una media de 4 clases por rango.
J. Maniez, Los lenguajes documentales y de clasificacin: concepcin, construccin y utilizacin
en los sistemas documentales (pg. 160)

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

86

2)Listayordenacindelasclasesprincipales. Las clases principales tienen


que ser disjuntas. Conviene reservar una clase para Diversos. Conviene reservar otra para generalidades. Y conviene crear una para auxiliares de tipo facetado (forma, lugar, tiempo). Recordemos que las clases se pueden ordenar de
diversas maneras:
a)de general a particular.
b)de la disciplina inicial en la que depende.
c)segn el nivel de complejidad (de simple en complejo).
d)por orden cronolgico.
e)por orden topogrfico.
3)Eleccindelanotacin. Se trata de traducir el lenguaje natural a un cdigo
artificial, que puede ser numrico, alfabtico o alfanumrico. Si adems hemos
previsto facetas, har falta prever una sintaxis (fijar el orden de las partes de
la notacin).
4)Edicinexperimental. Se pone en prctica una prueba experimental del
nuevo lenguaje.
5)Formacindelosclasificadoresytestdevalidez. A continuacin, se forman los clasificadores y se hace la prueba sobre un conjunto limitado de documentos. Despus, se comentan las dificultades o facilidades del sistema y se
toman las medidas correctivas necesarias.
6)Revisinyprimeraedicin. Finalmente, se hace la revisin completa y
se publica la primera edicin de este nuevo lenguaje documental de creacin
nueva.
6.4. Mantenimiento
Hace falta un mantenimiento regular. Si el sistema est automatizado, podemos hacer el seguimiento de las notaciones y saber la frecuencia de utilizacin
de las rbricas y cdigos, y as se pueden tomar decisiones (ampliar, modificar
o suprimir clases).
A modo de conclusin
Las fases de creacin de un cuadro de clasificacin, segn Jacques Maniez, son:

Estudioprevio: de usuarios, clasificaciones anteriores, estructura, lengua y otros.


Metodologa: combinacin de dos mtodos: el inductivo y el deductivo.
Procesodecreacin: eleccin de la forma global de la arborescencia y ordenacin
de las clases.
Mantenimiento.

Actividad
Cread un cuadro de clasificacin para vuestra biblioteca personal.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

87

Solucionario
1.

Documento sobre Thesaurus: 025.43


Documento sobre enciclopedias: 030
Documento sobre anuarios: 050.8
Documento sobre museos: 069

Documento sobre el neoplatonismo: 141.131


Documento sobre las profecas: 159.961.3
Documento sobre la naturaleza del conocimiento: 165.2

Documento sobre el judasmo sefard: 264


Documento sobre el budismo: 24
Documento sobre la cienciologa: 299.93
Documento sobre la religin de los sumerios: 252.1

Documento sobre la estadstica como ciencia: 311


Documento sobre las finanzas pblicas: 336.1
Documento sobre el derecho constitucional: 342
Documento sobre las facultades universitarias: 378.096
Documento sobre la etiqueta y el protocolo: 395.6

Documento sobre aritmtica:511.1


Documento sobre la galaxia: 524.6
Documento sobre climatologa: 551.58
Documento sobre anmonitas (fsiles cefalpodos): 564.53

Documento sobre otorrinolaringologa: 616.21


Documento sobre la forma de preparar comidas rpidas para llevar: 641.557
Documento sobre editoriales (de libros): 655.41
Documento sobre acabados especiales del cuero: 675.26

Documento sobre parques privados: 712.26


Documento sobre catedrales: 726.6
Documento sobre ptica de las cmaras fotogrficas: 771.35
Documento sobre msica para orquesta sinfnica: 785.11
Documento sobre carreras de karts: 796.714

Documento sobre cuentos de hadas: 82-343


Documento sobre literatura hebrea: 821.411.16

Documento sobre la geografa de frica: 913(6)


Documento sobre datacin con carbono: 902.65
Documento sobre banderas nacionales: 929.921
Documento sobre paleografa: 930.272
Documento sobre historia de Australia: 94(94)

2.

3.

4.

5.

6.

7.

8.
9.

Solucionesdelosejerciciosdenivelbajo
Clase0
Documento sobre bibliografas de autor: 012
Documento sobre catlogos por materias: 017
Documento sobre las cartas al director de un diario: 070.45
Documento sobre ex-libris: 097
Clase1
Documento sobre mtodos de filosofar: 101.8
Documento sobre estados emocionales: 159.942.5
Documento sobre lgica proposicional: 164.1
Documento sobre tica profesional: 174
Clase2
Documento sobre la Iglesia catlica romana: 272
Documento sobre el Islam chita: 284
Documento sobre el agnosticismo: 299.3
Documento sobre el confucionismo (religin china): 221.7
Clase3
Documento sobre teoras de la poblacin: 314.12
Documento sobre campaas electorales: 324
Documento sobre el Ministerio de Hacienda: 354.21
Documento sobre el poder adquisitivo del consumidor: 366.2

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

88

Clase4
Clase5
Documento sobre ciencias del medio ambiente: 502
Documento sobre la capacidad calorfica de los lquidos: 536.632
Documento sobre hidrocarburos saturados: 547.21
Documento sobre silicatos bsicos: 549.614
Documento sobre biologa: 57
Documento sobre botnica - las magnolias: 582.677.1
Documento sobre la ballena azul: 599.511
Clase6
Documento sobre psicoterapia: 615.851
Documento sobre drenaje de minas: 622.5
Documento sobre enfermedades por hongos de las plantas: 632.4
Documento sobre instalaciones de agua potable (en las viviendas): 696.11
Documento sobre produccin de sosa y potasa: 661.33
Clase7
Documento sobre escultura: 730
Documento sobre dibujo anatmico: 743
Documento sobre diseo de carteles: 766
Clase8
Documento sobre la lengua coreana: 811.531
Documento sobre literatura griega: 821.14
Clase9
Documento sobre pinturas rupestres: 903.27
Documento sobre viajes de descubrimientos geogrficos: 910.4
Documento sobre rdenes de caballera: 929.71
Documento sobre la tercera guerra carlista: 94(460).073.1
Diversosenfoquesdelasmaterias:
Documento sobre el atesmo, desde el punto de vista filosfico: 141.45
Documento sobre el atesmo, desde el punto de vista religioso: 299.2
Documento sobre las elecciones polticas, desde el punto de vista poltico: 324
Documento sobre las elecciones polticas, desde el punto de vista del derecho: 342.8
Documento sobre los delitos contra los derechos humanos, desde el punto de vista del
derecho penal: 343.4
Documento sobre los delitos contra los derechos humanos, desde el punto de vista del
derecho internacional: 341.231.14
Documento sobre los delitos contra los derechos humanos, desde el punto de vista del
derecho constitucional: 342.72/.73
Solucionesdelosejerciciosdenivelmedio
Clase0
Documento sobre las piezas prehistricas de un museo: 069.51:903
Documento sobre la clasificacin decimal Dewey: 025.45CD
Documento sobre bibliografa nacional francesa: 015(44)
Documento sobre thesaurus de psicologa: 025.43:159.9
Clase1
Documento sobre la filosofa de Arthur Schopenhauer 1(091) SCHOPENHAUER o
1(430)18SCHOPENHAUER
Documento sobre el esnobismo ingls: 177.5(410)
Clase2
Documento sobre el santos de la religin cristiana: 27-36
Documento sobre el chamanismo en las religiones de los indios de Amrica del Norte:
259.2-38
Documento sobre teologa postmoderna: 2-11:141.78
Documento sobre el culto a la Luna: 2-137:523.3
Clase3
Documento sobre las escuelas privadas: 37.058
Documento sobre los partidos conservadores franceses: 329.11(44)
Documento sobre la mujer en la poltica: 32-055.2
Documento sobre los impuestos municipales: 336.22:352
Documento sobre las funciones del Parlamento cataln: 328.3(460.23)
Clase5
Documento sobre los crteres y mares de la Luna: 523.3-8
Clase6
Documento sobre la otitis: 616.284-002
Documento sobre los libros de cocina: 641.55(083.12)
Clase7
Documento sobre la pintura de Velzquez: 75Velzquez
Documento sobre los artistas alemanes postimpresionistas: 7.036.4(430)
Documento sobre las mujeres glamourosas en el cine de suspense: 791.221.5-56
Documento sobre las competiciones de judo: 796.853.23.09

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

89

Documento sobre el himno nacional de Estados Unidos de Amrica del Norte: 784.71(73)
Clase8
Documento sobre la literatura hebrea: 821.411.16
Documento sobre la poesa de Antonio Machado: 821.134.2-1MACHADO
Documento sobre las novelas de Harry Potter: 821.111-312.9ROWLING
Clase9
Documento sobre la geografa de la India: 913(540)
Documento sobre la historia de la casa de los Borbones en Espaa: 94(460).05
Documento sobre geografa poltica: 911.3:32
Documento sobre geografa de la Polinesia Francesa: 913(963)
Solucionesdelosejerciciosdenivelalto
Documento sobre Barcelona ciudad como fondo argumental de pelculas de cine:
791.237.6(460.235-25)
Documento sobre el psicoanlisis como terapia mdica: 615.851
Documento sobre el turismo como elemento del tiempo libre:379.85
Documento sobre el turismo como factor econmico: 338.48
Documento sobre los diarios franceses: 070(44)
Documento sobre los ritos y ceremonias budistas: 24-5
Documento sobre las unidades calorimtricas como medida de cantidad de calor:
536.6.081
Documento sobre la bibliografa de las publicaciones peridicas de zoologa: 016:59(05)
Documento sobre las catedrales gticas francesas: 726.6.033.5(44)
Documento sobre herramientas para hacer esculturas: 730.022
Documento sobre los hroes en las pelculas de ciencia-ficcin: 791.221.8-51
Documento sobre historia de Espaa bajo los romanos: 94(460).013
Documento sobre la Biblia por los testimonios de Jehov: 279.17-23
Documento sobre la Gran Enciclopdia Catalana, en CD-ROM: (031.034)GEC
Documento sobre los suelos de arenisca: 645.1-033.6
Documento sobre rdenes religiosas femeninas catlicas: 27-788-055.2
Documento sobre el psicoanlisis como proceso psicolgico: 159.964.2
Documento sobre cuentos fantsticos de Julio Cortzar: 821.134.2-32(82)

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

90

Glosario

Los trminos del glosario de este mdulo estn en orden alfabtico. Remiten unos a otros, y
muestran las relaciones semnticas, como un lenguaje controlado.

Si hay dos conceptos sinnimos, los trminos no aceptados se remiten al aceptado con
un ved. Ejemplo: cdigo numrico, ved notacin.
Significa que el trmino por lo comn aceptado es notacin. En el glosario, se mantienen
las dos entradas porque, a veces, hay poco consenso terminolgico en la bibliografa.

Si el trmino tiene relacin conceptual (genrica, especfica o de asociacin) con otros


trminos de este glosario, se indica con un ved tambin. Ejemplo: Signatura topogrfica,
ved tambin ordenacin.
Significa que el trmino Signatura topogrfica est relacionado con el de ordenacin.

Los ejemplos de este glosario hacen referencia a la clase 52 de astronoma de la CDU, edicin
de bolsillo 2004; hay que recordar que otras ediciones, como la abreviada o el fichero bsico
de referencia, tienen ms clases.

auxiliarcomndependiente(tabla) m Las tablas son dos: notaciones ajenas a la CDU y caractersticas generales (de propiedades, materiales y personas). Como su nombre indica, son
auxiliares que slo se pueden usar como sufijos; no se han de utilizar independientemente
ni en primer lugar en la notacin.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

91

auxiliarcomnindependiente(tabla) m Las tablas son: lengua, forma, lugar, razas, pueblos y nacionalidades, tiempo. Ya que tienen un smbolo de inicio y uno final pueden ir en
cualquier lugar de la notacin, a excepcin del de la lengua, que slo tiene smbolo en el
inicio, aunque la CDU permite aadirle detrs dos puntos.
Si en un mismo documento hay que representar ms de un concepto con auxiliares independientes, la CDU recomienda el orden siguiente: Clase + lugar + tiempo + forma + lengua
+ raza.
auxiliarespecial(tabla) m Los auxiliares especiales ayudan a precisar el contenido de algunas materias, no de todas, ya sea de alguna de las nueve clases principales, como de algunos
auxiliares comunes.
Ya que hay auxiliares especiales repartidos por todas las clases principales, no los encontramos reunidos en una sola tabla como pasa con los auxiliares comunes. En el ejemplo de
astronoma, vemos que las clases marcadas con la lnea vertical negra son las auxiliares especiales previstas para la clase 52 (y slo la clase 52).
cadena f Clases subordinadas sucesivamente (en contraposicin a las clases coordinadas
que se llaman series). En cada nivel, se escoge una caracterstica para ir subdividiendo. En el
ejemplo: de todas las ciencias naturales (fsica, qumica, botnica...) escogemos astronoma.
De todas las materias estudiadas en astronoma (teora astronmica, estrellas, universo), escogemos el sistema solar. De todos los elementos que forman el sistema solar (propiedades
y leyes, lunas, meteoritos...), escogemos los planetas. De todos los planetas, escogemos Mercurio. (Ved tambin: jerarqua.). Por ejemplo:
5 Ciencias Naturales
52 Astronoma. Astrofsica. Investigacin espacial. Geodesia
523 Sistema Solar
523. 4 Planetas
524.41 Mercurio
clase f Concepto, materia o disciplina de una clasificacin. Las clases se basan en caractersticas, atributos, propiedades o cualidades comunes. Encontramos clases en todos los niveles
de la cadena jerrquica. Las clases de primer nivel son las clases principales. Cada clase se
divide en subclases, y as sucesivamente.
Ejemplo: desde la clase 5 hasta la ltima clase, todas son clases. Las dos primeras, la 5 y la
52, se consideran clases principales; el resto, clases.
Ved tambin clases principales.
clase principal f Las clases principales son las que ocupan el primer nivel en la cadena
jerrquica. Se equiparan a las disciplinas. Por ejemplo: 52 Astronoma.
Ved tambindisciplinas.
clasificacinbibliogrfica f Ved clasificacin documental.
clasificacindocumental f Lenguaje documental que divide el conocimiento enciclopdico, o el de un rea, en una serie ordenada de clases y subclases basadas en las similitudes y
diferencias. Se utiliza para clasificar la materia de los documentos y ordenar fsicamente los
documentos originales. Son lenguajes sintticos, precoordinados, codificados, controlados y
de estructura jerrquica o hbrida con posibilidad de expresar facetas. Se llama documental
para diferenciarlo de las clasificaciones filosficas, cientficas y de las clasificaciones o taxonomas biolgicas. Por ejemplo: la clasificacin Dewey, la clasificacin decimal universal,
la clasificacin Colon, La clasificacin de la Library of Congress. Ved tambin: clasificacin
filosficaycientfica; taxonoma.
clasificacinenumerativa f Ved clasificacin monojerrquica.
clasificacinfilosficaycientfica f Sistema filosfico y de clasificacin del conocimiento. A diferencia de las clasificaciones documentales, se interesa por todo el conocimiento
humano, y no slo por el conocimiento depositado en la coleccin del SID. Por ejemplo:
la clasificacin filosfica que ms trascendencia ha tenido, desde la Edad Moderna, es la de
Francis Bacon.
clasificacinjerrquica f Estructura que enumera las clases de arriba abajo y de izquierda a
derecha. Cada tema se encuentra en un solo lugar de la cadena. Son las ms numerosas por
su facilidad de construccin y uso. Se adecuan muy bien en entornos enciclopdicos.
Ejemplos: la clasificacin de la Biblioteca del Congreso (LC).
clasificacinporfacetas f Estructura que agrupa los conceptos segn las caractersticas y los
atributos. La materia no se encuentra representada en el cuadro de clasificacin, sino que el

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

92

analista la ha de crear combinando las facetas. La clasificacin parte de dominios principales


(en el estilo de las disciplinas) que no se estructuran jerrquicamente, sino de forma facetada.
Dentro de cada faceta, la clasificacin vuelve a ser jerrquica. Por ejemplo: la clasificacin
Colon, la clasificacin Bliss.
clasificar v tr Proceso de divisin de objetos o conceptos en clases que, a la vez, se dividen
en subclases. Cada divisin se basa en las caractersticas comunes que permiten agrupar los
conceptos y en los elementos que las distinguen, de manera que se creen clases disjuntas.
Como ejemplo de caracterstica comn y diferencial: la clase 52 agrupa los conceptos que
tienen en comn el tema astronoma y se subdivide, por ejemplo, en las clases 523.3 lunas
y 523.4 planetas para crear estas dos clases disjuntas, de manera que no haya duda a la hora
de clasificar un documento (o es una luna o es un planeta).
cdigo m Ved notacin.
ConsorciodelaCDU(UDCConsortium) m Organismo responsable de la gestin de la CDU,
con sede en la Biblioteca Real de La Haya. Se cre en 1992, absorbiendo las responsabilidades
que hasta entonces tena la FID en materia de CDU. En el Consorcio, participan diversas
agencias de normalizacin y editores como la espaola AENOR, la rusa VINITI o la inglesa
BSI. El Consorcio es el responsable de los cambios y cada agencia los publica en el idioma
propio.
decimal(nmero) m Las diez clases principales se pueden subdividir en diez clases ms y as
sucesivamente. Los nmeros decimales de la CDU tienen el valor de las fracciones decimales
situadas detrs de un 0, (cero coma) que se presupone. Este sistema permite subdividir las
clases de manera casi indefinida. Por ejemplo: la clase 3 y la clase 33, seran la 0,3 y la 0,33.
dicotoma f Mtodo de clasificacin en el que las divisiones y las subdivisiones son binarias.
disciplina f mbitos temticos. Son campos de estudio que tienen existencia independiente, identificable y coherente. Ejemplos: filosofa, matemtica, ciencias sociales, historia, religin... En la CDU, se corresponderan las clases principales. En las clases principales que
agrupan ms de una materia, como la 3,5, 6 y la 7, tambin llamamos disciplinas a las clases
de 2 dgitos, como 52 astronoma (ved tambin clases principales.). Por ejemplo:
5 Ciencias Naturales
52 Astronoma
edicionesdelaCDU f pl La CDU espaola tiene diversas ediciones: entera, abreviada, bolsillo, en formato papel o digital. Desde la creacin del Consorcio de la CDU, UDC Consortium,
se impulsa el Master Reference File, o fichero bsico de referencia, de 62.000 entradas como
nica edicin autorizada a partir de la cual se pueden hacer diversas ediciones.
extensionesycorreccionesdelaCDU f pl Publicacin anual del Consorcio de la CDU en
que se publican las nuevas tablas revisadas y aprobadas. Es la base sobre la cual el fichero
bsico de referencia es revisado cada ao (las extensiones y correcciones se publican cada
mes de noviembre y el MRF sale el uno de enero). (Ved tambin fichero bsico de referencia
y Consorcio de la CDU.)
enextensions and corrections UDC
faceta f Caractersticas o atributos de los objetos y conceptos que permite agruparlos. Hay
facetas universales y facetas particulares. Por ejemplo:
Facetas universales: la frmula PMEST de la clasificacin Colon: personalidad, materia,
energa, espacio, tiempo.
Facetas particulares: en el ejemplo de astronoma, son los auxiliares especiales: investigacin, propiedades, procesos, partes...
ficherobsicodereferencia(masterreferencefileoMRF) m Base de datos que contiene la
versin oficial de la CDU; tiene unas 62.000 entradas. La mantiene el Consorcio de la CDU
con software de la UNESCO CD-ISIS.
hbrido-a adj Dicho del tipo de estructura de clasificacin documental que combina la estructura monojerrquica con la posibilidad de expresar facetas. Por ejemplo: la clasificacin
decimal universal (CDU). En este ejemplo, son elementos facetados los auxiliares especiales
marcados con la lnea vertical.
ndice m Los cdigos que preceden la rbrica en las tablas. Una vez introducida en el catlogo,
se llama notacin. Por ejemplo: 52
Ved cdigo y notacin.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

93

jerarqua f La subordinacin de las clases, dividindolas en sus componentes lgicos. Se


aplican sucesivamente principios de divisin genricos y principios de todo-parte.
Ved tambin cadena.
mixto-a adj Ved hbrido -a.
notacin f Es el trmino de indexacin propio de los sistemas de clasificacin. Es un cdigo
artificial, no un lenguaje natural, hecho con nmeros, letras y smbolos que acompaan las
rbricas. Representa la materia del documento; tambin se usa para la ordenacin fsica de
los documentos.
La longitud de la notacin puede representar el grado de especificidad de la materia de un
documento (cuanto ms larga, ms especfica), pero tambin puede estar traduciendo una
arborescencia a partir de pocas clases principales. Maniez calcula que una notacin de hasta
7 dgitos es comprensible, ms no. Por ejemplo: 524.42 es una notacin.
Ved tambin signatura topogrfica y rbrica.
ordenacin f En documentacin, es la operacin de colocar los libros de forma ordenada en
los estantes, siguiendo la signatura topogrfica. Segn Maniez, hay tres tipos de ordenaciones:
1) Ordenaciones no significativas, sin ninguna relacin con el contenido de los documentos,
por ejemplo, ordenaciones numricas a partir del nmero de registro.
2) Ordenaciones con significado limitado: por lengua, pas, autor, disciplina, etc.
3) Ordenaciones altamente significativas: ordenacin por materias, de manera que los documentos que traten de contenidos afines se coloquen unos cerca de otros.
orden de las partes de una notacin m En primer lugar, la clase de la materia principal
del documento + auxiliares especiales (si los hay) + auxiliares comunes. A continuacin, el
orden dentro de los auxiliares comunes (tambin conocido como orden de secuencia) no
est fijo, pero la CDU recomienda ir de general a particular, y propone el orden siguiente:
lugar + tiempo + forma + idioma.
rbrica f Nombre de la materia expresado en lenguaje natural. Por ejemplo: Venus.
serie f Serie de clases coordinadas (en contraposicin a clases subordinadas, que seran cadena o jerarqua). Es un grupo de clases mutuamente excluyentes, derivadas de la aplicacin
de una caracterstica.
Ved tambin faceta.
signaturatopogrfica f Conjunto de nmeros, letras y smbolos que localizan y ordenan,
fsicamente, el documento en la estantera. A diferencia de la notacin, que indica la materia
y puede estar repetida (2 o ms obras de la misma temtica), la signatura topogrfica indica
su ubicacin fsica y tiene que ser nica.
signoscombinatoriosoclasificatorios m pl Son : :: + / [ ]. Estos signos tienen una funcin
sinttica (de unir), ya que permiten expresar conceptos compuestos que no se encuentran
previstos en el cuadro de clasificacin. Por ejemplo: documento sobre el sistema solar (desde
las propiedades, a las lunas y planetas) 523.2/.4
signosinstructivosonoclasificatorios m pl Son . (punto)(dividir como) y (ved tambin). No se usan para clasificar, sino para instruir sobre los usos del cuadro de clasificacin.
Por ejemplo:
520.1 Observatorios
727.912
Significa que, si estamos consultando la clase 520.1 Observatorios nos puede interesar tambin
consultar o clasificar el documento bajo la clase 727.912 que es Arquitectura > Edificios con
finalidades educativas y cientficas > Observatorios. Daos cuenta de la diferencia entre clasificar
el documento bajo la clase 52 astronoma o bajo la clase 727 arquitectura.
tablaprincipal f Ved clase principal.
taxonoma f Sistemas que clasifican organismos vivos o inertes en una jerarqua. Actualmente, el trmino taxonoma se aplica tambin en el mundo de la informacin y las fuentes
disponibles en la WWW.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

94

Bibliografa
Maniez, J. (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez Ruiprez.
McIlwaine, I. C. (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
Reitz, Joan. Odlis Online dictionary of library and information science [en lnea]. Western Connecticut State University. [Fecha de consulta: 10 de octubre de 2008].
Referencias bibliogrficas
025.431: The Dewey blog [en lnea]. [Fecha de consulta: 10 de octubre de 2008].
lvarez Garca, F. J. (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y Documentacin).
AENOR. Asociacin espaola de normalizacin y certificacin [en lnea]. [Fecha de consulta: 10
de octubre de 2008].
Arnau Riverd, Pilar (2005). Documentacin: hitos histricos, precedentes - Dewey - Otlet - FID
(pg. 96-105 y 248-255). Madrid: Mundarnau.
Benito, M. (1999). El sistema de clasificacin decimal universal: manual de aprendizaje. Madrid:
Taranco.
Benito, Miguel. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta:
10 de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Burguillos Martnez, Ferran. Tutorial de la Clasificacin decimal universal [en lnea]. [Fecha
de consulta: 10 de octubre de 2008].
CDU: Clasificacin decimal universal: norma UNE 50 001:2000 (2000) (3 vols.). Madrid: AENOR.
Classificaci decimal: adaptaci per a les biblioteques catalanes (1982) (4. ed. preparada por
Jordi Rubi i Lois). Barcelona: Teide.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000 (2001)
(adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000; (incluye
las modificaciones de la Norma UNE 50001:2004/1M. Trad. del Master Reference File realizada por
el Centro de Informacin y Documentacin Cientfica (CINDOC) (2004) (adaptada por Rosa San
Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Dez Carrera, C. (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal)
(pg. 134). Gijn: Trea. (Biblioteconoma y Administracin Cultural, 26).
Esteban, M. A. (1997). Fundamentos epistemolgicos de la clasificacin documental. En:
M. Pinto (ed.). Manual de clasificacin documental (pg. 19-32). Madrid: Sntesis (Biblioteconoma y Documentacin).
Gil Urdiciain, B. Los lenguajes de clasificacin documental. En: M. Pinto (ed.) (1997).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y Documentacin).
Gili Martnez, M. D.; Vives i Grcia, J. (1996, julio-diciembre). La nova edici espanyola
de la CDU: arriscar-se al canvi?. tem: Revista de Biblioteconomia i Documentaci (nm. 19,
pg. 94-121).
Glazier, Jack (2003). Las races culturales de la clasificacin moderna. En: IV Coloquio
Internacional de Ciencias de la Documentacin. Salamanca.
Glazier, Jack (2003). VI Congreso del Captulo Espaol de ISKO. Salamanca.

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

95

Gran enciclopdia catalana [en lnea]. [Fecha de consulta: 10 de octubre de 2008].


Granados, M.; Nicolau, Anna. La recuperaci de la informaci als catlegs en lnia: :
ls de la Classificaci decimal universal i la seva implicaci en la indexaci [en lnea]. 7
Congrs del Captol Espanyol dISKO. Barcelona, 6-8 de julio de 2005. Barcelona: Universitat
de Barcelona, Departament de Biblioteconomia i Documentaci [Consulta: 1 de octubre de
2008].
Grolier, E. (1976, noviembre-diciembre). La clasificacin cien aos despes de Dewey.
Boletn Unesco (vol. XXX, nm. 6, pg. 342-350).
Guardans, T. (1989, enero-junio). Les altres religions a la Classificaci decimal universal.
Revista tem (nm. 4).
La Clasificacin Decimal Universal en los currculos escolares: instrucciones para la organizacin
temtica de los fondos bibliogrficos de las bibliotecas educativas no universitarias [en lnea]. Pamplona: Gobierno de Navarra, Departamento de Educacin y Cultura. [Consulta: 1 de octubre
de 2008].
Library of Congres Classification outline [en lnea]. [Fecha de consulta: 1 de octubre de 2008].
Lpez-Huertas, M. J. (1997). Estructura de la clasificacin decimal universal. En: M. Pinto (ed.). Manual de clasificacin documental (pg. 177-217). Madrid: Sntesis (Biblioteconoma y Documentacin).
Lpez Yepes, Jos (1995). La documentacin como disciplina: teora e historia (2. ed., pg.
90-106). Pamplona: Eunsa.
McIlwaine, I. C. (1998, 16-21 de agosto). The UDC at the present time [en lnea]. 64th
IFLA General Conference. Amsterdam. [Consulta: 1 de octubre de 2008: 1 de octubre de 2004].
Mestre i Ribera, Enric. Classificaci decimal universal [en lnea]. [Fecha de consulta: 10 de
octubre de 2008].
Moreno Fernndez, L. M.; Borgos Martnez, M. D. (2002). Teora y prctica de la
Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.
Online Computer Library Center. Dewey services, Dewey decimal classification for use with
OCLCs online cataloging services [en lnea]. [Consulta: 10 de octubre de 2008].
Otlet, P. (1996). El tratado de documentacin: el libro sobre el libro, teora y prctica (trad. de M.
Dolores Ayuso). Murcia: Universidad de Murcia.
Perpiny i Morera, R. (1995). Los lenguajes documentales. En: M. E. Fuentes i Pujol
(ed.). Manual de documentacin periodstica (pg. 111-132). Madrid: Sntesis.
Pinto Molina, M. (ed.) (1997). Manual de clasificacin documental. Madrid: Sntesis (Biblioteconoma y Documentacin).
Public libraries using Spanish. Spanish version of the Dewey Decimal Classification System
based on the 18th edition of DDC [en lnea]. [Consulta: 10 de octubre de 2008].
Riesthuis, Gerhard J. A. (1998, agosto) The UDC Master Reference File [en lnea]. 64th
IFLA General Conference. Amsterdam. [Consulta: 1 de octubre de 2008].
Rosati, Luca (2005). Clasificacin facetada para los servicios comunitarios mediante el
uso de las categoras estndares del Classification Research Group. VII Congreso del Captulo
Espaol de ISKO: La dimensin del conocimiento. Barcelona.
Rovira, T. (1989, enero-junio). Jordi Rubi i Lois: la seva influencia en el mon bibliotecari
de Catalunya. En: Revista tem (nm. 4).
Sagredo, Flix (2001). Tras las huellas euro-norteamericanas del movimiento documental
contemporneo I [en lnea]. Madrid: Revista Documentacin de las Ciencias de la Informacin
(nm. 24, pg. 35-43). [Fecha de consulta: 1 de octubre de 2008].
San Segundo Manuel, R. (1997). Principales sistemas de clasificacin. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 67-89). Madrid: Sntesis (Biblioteconoma y Documentacin).

Sistemas de clasificacin documentales

CC-BY-NC-ND PID_00143962

96

San Segundo Manuel, R. (2001). Teora e historia de la clasificacin bibliotecaria en Espaa,


siglos XIX y XX. Madrid: Universidad Complutense.
San Segundo Manuel, R. (1999). Futura implantacin de los distintos sistemas de clasificacin en las bibliotecas del estado espaol [en lnea]. 7es Jornades Catalanes de Documentaci. Barcelona: Collegi Oficial de Bibliotecaris-Documentalistes de Catalunya. [Consulta:
1 de octubre de 2008].
San Segundo, R. Use of UDC classification system in Spain: implementation, applicatiom, teaching and research [en lnea]. (Presentacin) Madrid: Universidad Carlos III. [Consulta: 1 de
octubre de 2008].
Soria, C. (2000, noviembre). Cambios introducidos en la ltima edicin (nov. 2000) de la CLASIFICACIN DECIMAL UNIVERSAL [en lnea]. [Consulta: 1 de octubre de 2008].
Tabla de Materias CDU [en lnea]. Agencia Espaola del ISBN. [Consulta: 1 de octubre de 2008].
Turiel, J. (2001, junio). Recursos web per a la classificaci [en lnea]. BiD: textos universitaris
de biblioteconomia i documentaci (nm. 6). [Consulta: 1 de octubre de 2008].
Universal Decimal Classification Blog [en lnea]. UDC Consortium. [Consulta: 10 de octubre
de 2008].
Universal Decimal Classification Consortium Homepage (2002, 1 de agosto). [En lnea]. La Haya:
UDC Consortium. Act. 2002-08-01. [Consulta: 10 de octubre de 2008].

Sistemas de clasificacin documentales

Listas de
encabezamientos
de materia y listas
de autoridades
Manela Junc Campdepadrs
PID_00143965

CC-BY-NC-ND PID_00143965

Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es

Listas de encabezamientos de materia y listas de autoridades

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

ndice

Introduccin...............................................................................................

Objetivos.......................................................................................................

1.

Las autoridades en el anlisis de contenido...............................

2.

Qu es una lista de encabezamientos de materia?...................

3.

Origen y evolucin de las listas de encabezamientos...............

12

4.

Tipologas de las listas de encabezamientos...............................

16

5.

Principios de las listas de encabezamientos...............................

19

6.

Encabezamientos y subencabezamientos.....................................

23

6.1.

Encabezamientos .........................................................................

23

6.2.

Subencabezamientos ...................................................................

23

7.

Reglas de vocabulario y signos de puntuacin de las LEM......

28

8.

Trminos simples y compuestos.....................................................

30

8.1.

Encabezamientos simples ............................................................

30

8.2.

Encabezamientos compuestos .....................................................

30

8.3.

Orden de los encabezamientos ...................................................

32

Las relaciones semnticas................................................................

34

9.1.

Relacin de equivalencia ............................................................

34

9.2.

Relacin de jerarqua ..................................................................

36

9.3.

Relacin asociativa ......................................................................

37

9.4.

Smbolos utilizados para designar los tres tipos de relaciones ....

38

10. Aprendiendo a indizar con una lista de encabezamientos.....

40

11. La lista de autoridades.....................................................................

44

11.1. Las listas de autoridades en Catalua y Espaa ..........................

44

11.2. Tipologa ......................................................................................

47

11.3. Indizar con una lista de autoridades ..........................................

49

Actividades..................................................................................................

51

Glosario........................................................................................................

52

9.

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Bibliografa.................................................................................................

56

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Introduccin

Este mdulo os introduce en el uso de las autoridades en la indizacin por


materias. Comprende dos lenguajes: las listas de encabezamientos de materia
y los listados de autoridades.
Itinerariodeestudio
El mdulo empieza con la definicin de las autoridades y su uso en el anlisis
de contenido. A continuacin se describen las listas de encabezamientos de
materia y los elementos comunes a cualquier lista de encabezamientos, sea
cual sea el idioma. El ltimo apartado se dedica al resto de autoridades.
Conceptos ms importantes
Concepto

Ved

Autoridad

1. Las autoridades en el anlisis de contenido

Encabezamiento y subencabezamiento de materia

5. Principios de las listas de encabezamientos


6. Encabezamientos y subencabezamientos
7. Reglas de vocabulario y signos de puntuacin en las LEM
8. Trminos simples y compuestos

Relaciones semnticas: de equivalencia, jerarqua y asociacin

9. Las relaciones semnticas

Principio de especificidad
Principio de economa

10. Aprendiendo a indizar con una lista de encabezamientos

Nombre, ttulo, ttulo uniforme, nombre geogrfico

11. Listas de autoridades

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Objetivos

Con el estudio de los materiales asociados a este mdulo alcanzaris los siguientes objetivos generales:
En cuanto a las listasdeencabezamientosdemateria:

1. Saber definir las listas de encabezamientos de materia y su tipologa.


2. Ser capaz de presentar la evolucin histrica de este lenguaje documental.
3. Conocer las principales listas de encabezamientos.
4. Conocer los elementos, relaciones y sintaxis de las listas de encabezamientos.
5. Adquirir una cierta habilidad en la indizacin de documentos con las listas
LEMAC (Lista de encabezamientos de materia en cataln) y AM BNE (Autoridades de materia del catlogo de autoridades de la Biblioteca Nacional
de Espaa) y AM CSIC (Autoridades de materia de la red de bibliotecas del
CSIC).
En cuanto a los listadosdeautoridades:

1. Conocer el uso de las autoridades en el anlisis de contenido.


2. Aprender a indizar materias que incluyan algn tipo de autoridad.

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

1. Las autoridades en el anlisis de contenido

Este mdulo est dedicado a los dos lenguajes documentales que tratan las
autoridades: los listados de encabezamientos de materia y los listados de autoridades.

Las autoridades son las formas normalizadas de las entradas de un catlogo bibliogrfico o inventario de archivo.

Concretamente estamos hablando de las formas normalizadas para:

Nombres propios

Ttulos

Nombres propios y ttulos

Materias

Entidades

Nombres geogrficos

Para evitar problemas en la recuperacin (de ruido y silencio documental) debidos a la ambigedad del lenguaje natural hay que establecer formas normalizadas en cada caso de acuerdo con las reglas internacionales de descripcin:
reglas norteamericanas de catalogacin (para las bibliotecas) y de las Normas
Internacionales sobre los Registros de Autoridad de Archivos relativos a Instituciones, Personas y Familias (ISAAR[CPF]1) (para archivos).
Estas formas normalizadas se registran en el fichero de autoridades, que anota
la forma aceptada, los trminos no seleccionados, notas de aplicacin, relaciones semnticas si es oportuno y la fuente en la que se ha basado. Este fichero
de autoridades es el listado que el analista tiene que consultar antes de indizar
para comprobar la forma aceptada.
Para analizar el contenido de un documento, el analista tiene que saber consultar las listas de encabezamientos de materia, pero tambin tiene que saber
consultar el resto de autoridades, ya que la materia de un documento tambin
puede ser:

Un nombre propio: documento sobre la vida de Doris Lessing.

Un nombre de institucin presente o histrica: documento sobre el consejo de guerra.

Un ttulo uniforme: interpretaciones de la obra El retrato de Dorian Gray.

Un lugar geogrfico: documento sobre la India.

(1)

ISAAR(CPF) es la sigla de International Standard Archival Autorithy Records for Corporate Bodies, Persons and Families, Norma Internacional sobre los Registros de Autoridad de Archivos relativos a Instituciones, Personas y Familias.

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Un nombre de empresa, entidad, etc.: documento sobre la cooperativa


Eroski.

Estos trminos (Doris Lessing, consejo de guerra, retrato de Dorian Gray, India, Eroski) no aparecen en las listas de encabezamientos de materia porque
tienen entrada como nombres personales, de ttulo, geogrficos, etc. En consecuencia, el analista tiene que saber consultar todo tipo de autoridades.
Entre todas las autoridades, las de materia destacan por su singularidad, por
este motivo este mdulo se divide en dos grandes bloques:

Las autoridades por materia: listados de encabezamientos de materia.

El resto de autoridades: listado de autoridades.


Ejemplo de nombre propio que acta tambin como materia
Este ejemplo muestra cmo la misma autoridad introducida como nombre propio Dal,
Salvador,1904-1989 puede ser Autor o Materia en cada caso:

Documento a): Salvador Dal autor de la obra El mito trgico del Angelus de Millet.
Documento b): Ignasi Puig escribe una obra titulada El Dal esotrico.
Documento c): Salvador Dal escribe Vida secreta (es su autobiografa).
Autor

Materia

a)

Dal,Salvador,1904-1989

Millet,Jean-Franois.ngelus

b)

PuigAlemn,Ignasi

Dal,Salvador,1904-1989

c)

Dal,Salvador,1904-1989

Dal,Salvador,1904-1989

Soluciones extradas del catlogo de la Biblioteca de Catalunya

Como se puede observar, autor y materia coinciden en el caso de las autobiografas.

Ttulos uniformes
Un ttulo uniforme es un ttulo
ficticio dado por el analista para agrupar todas las entradas
en un catlogo de una obra.
El ttulo uniforme se crea para controlar las diferentes ediciones, traducciones, etc. Un
ejemplo extrado del listado
LENOTI: el Pjaro de fuego de
Igor Stravinski tiene como ttulo uniforme Stravinski, Igor.
Jar ptitsa, ttulo que engloba
cualquier otra traduccin tipo
El pjaro de fuego, Loiseau de
feu, etc.

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

2. Qu es una lista de encabezamientos de materia?

(2)

Las listas de encabezamientos de


materia tambin se conocen como
autoridades de materia.

Una listadeencabezamientosdemateria es un lenguaje documental


controlado que recoge ordenadas alfabticamente todas las materias o
temas susceptibles de representar el contenido de un fondo documental. Es una lista, un lxico de palabras y frases uniformes que se usan
para indizar la materia del documento.

Cada una de las entradas de esta lista se conoce como encabezamiento.


Las funciones de las listas de encabezamientos son:
a) En la indizacin:

Describen el contenido de los documentos.

Agrupan en el catlogo todos los documentos de temticas afines.

Normalizan la terminologa. Cada concepto se expresa en un trmino y


slo en este, evitando la ambigedad del lenguaje natural.

b) En la recuperacin:

Permiten recuperar los documentos por el campo materia.

Ayudan a localizar otros documentos a partir de las relaciones semnticas


entre trminos.

Las listas de encabezamientos se pueden clasificar por idioma, por tema y por
tipo de biblioteca donde se aplican:
1)Poridioma
Hay listas de encabezamientos en diversos idiomas: cataln, ingls, francs,
castellano, italiano, portugus, etc.
Listas de encabezamientos en cataln, castellano, ingls y francs
Lengua

Acrnimo

Nombre de la Lista

Cataln

LEMAC

Lista de encabezamientos de materia en cataln

Castellano

AM BNE

Autoridades de materia del catlogo de autoridades de la


Biblioteca Nacional de Espaa

10

CC-BY-NC-ND PID_00143965

Lengua

Ingls

Francs

Listas de encabezamientos de materia y listas de autoridades

Acrnimo

Nombre de la Lista

ME BUS

Encabezamientos de materia de la Biblioteca Universitaria


de Sevilla

AM CSIC

Autoridades de materia de la red de bibliotecas del CSIC

LEM BP

Lista de encabezamientos de materia para bibliotecas pblicas

LCSH por materias

Library of Congress Subject Headings

SEARS

Lista Sears (proviene del nombre de Minnie Earl Sears)

BILINDEX

BILINDEX (ingls - castellano)

LAVAL

Lista Laval de la Universidad Laval (Canad)

RAMEAU

Rpertoire dautorit matire encyclopdique et alphabtique unifi

2)Portema
Hay listas de mbito enciclopdico (todas las ejemplarizadas en la tabla anterior) y listas especializadas en un tema.
3)Portipodebiblioteca
Podemos distinguir las listas especializadas de aplicacin en bibliotecas nacionales (AM BNE, LEMAC), en bibliotecas universitarias (ME BUS, LEMAC), en
bibliotecas pblicas (LEM BP) y en bibliotecas o centros especializados (AM
CSIC). Algunos ejemplos son:

Lista especializada en medicina: Medical Subject Headings (MESH)

Lista especializada en msica: Universidad de Yale.

A partir de ahora:
AM BNE = Autoridades de materia del catlogo de autoridades de la Biblioteca Nacional
de Espaa.
LEMAC = Lista de encabezamientos de materia en cataln.
ME BUS = Encabezamientos de
materia de la Biblioteca Universitaria de Sevilla.
LEM BP = Lista de encabezamientos de materia para bibliotecas pblicas.
AM CSIC = Autoridades de
materia de la red de bibliotecas del CSIC.

Nosotros, en esta asignatura, trabajaremos con las listas siguientes:

El Catlogo de autoridades de materia de la Biblioteca Nacional de Espaa.

El Catlogo de autoridades de materia de la red de bibliotecas del CSIC.

La Lista de encabezamientos de materia en cataln.

Y consultaremos la Library of Congress Subject Headings (LCSH).

Los criterios para escoger estas listas sobre el resto son:

El conocimiento del idioma: para indizar es necesario un cierto conocimiento de la lengua de cada lista, por lo que en este mdulo trabajaremos
bsicamente las listas en cataln (LEMAC) y en castellano (AM BNE y AM

(3)

A partir de ahora denotamos


Library of Congress Subject Headings con la sigla LCSH.

CC-BY-NC-ND PID_00143965

11

Listas de encabezamientos de materia y listas de autoridades

CSIC). Tambin se facilitarn ejemplos de la LCSH , para facilitar la desenvoltura en su consulta y contribuir a la competencia lingstica.

El alcance conceptual: las listas se adaptan a la realidad de la biblioteca,


por eso escogemos dos listas de alcance enciclopdico (como las de la AM
BNE y la LEMAC) y una especializada (como la del AM CSIC).

La facilidad en el acceso: las listas estn disponibles en red y de forma

Listas en red

gratuita.

AM BNE [accesible en lnea].


AM CSIC [accesible en lnea].
LEMAC [accesible en lnea].
LCSH [accesible en lnea]
(tiene algunas restricciones,
por ejemplo que no se visualizan los trminos genricos).
La lista de encabezamientos
de materia para bibliotecas
pblicas del Ministerio de
Cultura tambin se encuentra en la web, en formato
listado.

Utilizaremos el acrnimo LEM4 (Listas de encabezamientos de materia) cuando nos refiramos a principios comunes a todas las listas, sea cua sea su nacionalidad e idioma. Cuando se haga referencia a una lista concreta, se usarn
sus acrnimos respectivos.

(4)

LEM es el acrnimo de listas de


encabezamientos de materia.

CC-BY-NC-ND PID_00143965

12

Listas de encabezamientos de materia y listas de autoridades

3. Origen y evolucin de las listas de encabezamientos

El origen de este tipo de lenguaje documental lo encontramos en Estados Unidos de Amrica. Aparece por primera vez en 1876 de manos de Charles A.
Cutter.
Charles A. Cutter era el bibliotecario en jefe del Ateneo de Boston cuando el
gobierno de Estados unidos le encarg un estudio sobre la catalogacin en las
bibliotecas del pas. El informe tena cuatro volmenes, el ltimo de los cuales
contena las Rules for a printed dictionary catalogue, donde expone las reglas para
encontrar e indizar un documento segn su materia. Aparece ya el nombre de
headings (encabezamientos) para designar los trminos de indizacin.
Lecturas complementarias
Para ms informacin sobre el origen y la evolucin de las listas de encabezamientos ved
las obras siguientes:
I.GilLeiva (2008). Manual de indizacin. Teora y prctica. Gijn: Trea.

Charles Ammi Cutter. Recordemos que Cutter


fue el creador de la Clasificacin expansiva de
Cutter (Boston, 1891).

B.GilUrdiciain (2004). Manual de lenguajes documentales. Gijn: Trea.

Charles A. Cutter elabor los principios que rigen las LEM, como el principio

Ved tambin

de especificidad y el de entrada directa; todos ellos continan vigentes en la

Estos principios se explican en


el apartado 5 de este mdulo
didctico.

actualidad. Tambin formul el principio de economa, las referencias entre


trminos aceptados y no aceptados, ya sean sinnimos u homnimos, los encabezamientos simples y compuestos, los signos de puntuacin, la sintaxis a
la hora de construir encabezamientos compuestos, etc.
Charles A. Cutter era miembro de la American Library Association (ALA5). En
el ao 1895, nueve aos despus de la primera edicin de Cutter, la asociacin
public la List of Subject Headings for use in a dictionary catalog como lista de
encabezamientos para indizar en colecciones medias y pequeas. Tres aos
ms tarde (1898) la lista fue ampliada por el departamento de catalogacin de
la Library of Congress o Biblioteca del Congreso.
1)Listasdeencabezamientosdemateriaeningls
En la tabla siguiente se recogen las listas ms importantes de encabezamientos
de materia en ingls:

(5)

ALA es la sigla de American Library Association.

13

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

LibraryofCongressSubjectHeadings1909-hastalaactualidad En el ao 1909 aparece la primera edicin de la Subject headings


used in the dictionary catalogs of the Library of Congress. Fue redactada para hacer frente a las necesidades reales de la biblioteca. Poco despus la lista ya se utilizaba en bibliotecas pblicas y acadmicas y la Biblioteca del Congreso editaba manuales y guas explicativas. En 1975, coincidiendo con la octava edicin, pas a
llamarse Library of Congress Subject Headings (LCSH) que es el
nombre y acrnimo que ha conservado hasta hoy en da.
La versin entera tiene unos treinta mil trminos y la reducida
unos cuatro mil. Se actualiza cada ao (se calculan unos siete mil
cambios anuales entre incorporaciones y modificaciones) y los
cambios se publican en el Cataloguing Service Bulletin. Los manuales para los usuarios se titulan Subject cataloguing Manual: subject headings, son normas para la correcta aplicacin de encabezamientos, subencabezamientos y relaciones semnticas.
Est implementada por todo el mundo. Isidoro Gil (2008, pg.
403) hace una recopilacin de las bibliotecas nacionales del mundo que la usan o han adaptado y recoge aproximadamente treinta
repartidas por los cinco continentes.
En 1986 cambi las siglas que utilizaba (sa, xx, x, see) por las siglas
6

de los tesauros , contribuyendo a la normalizacin en la descripcin de las relaciones semnticas de los trminos.
Actualmente la mayora de las listas de encabezamientos de materia del mundo se basan en ella o son directamente traducciones
7

de ella. Por ejemplo, si tomamos el concepto Mar y miramos


cmo est introducido en las diversas listas, podemos constatar el
hecho de que unas se basan en las otras y que el rol predominante
lo juega la LCSH, que est presente como fuente original en todo
el resto.
Bilindex

Bilindex es una lista basada en la LCSH, en la LEM de la Organizacin de Estados Americanos (OEA) y en la LEM de la Universidad
Autnoma de Mxico (UNAM). Es una lista bilinge, ingls-castellano. Se cre para ayudar a los analistas que no dominaban el castellano para indizar documentos en esta lengua. Se aplica en bibliotecas pblicas de ciudades de menos de 100.000 habitantes y
escolares, pero su grado de especializacin y la cobertura que da a
las publicaciones hispanas la hicieron tambin til en centros especializados y bibliotecas tcnicas.

Sears1923

Es una LEM creada en Estados Unidos como versin abreviada de


la LCSH, para bibliotecas pequeas y escolares. La cre Minnie Earl
Sears el ao 1923 con el ttulo List of Subject headings for small libraries basndose en la experiencia de nueve pequeas bibliotecas
y siguiendo las directrices de la Library of Congress. Actualmente
se usa en este tipo de bibliotecas norteamericanas y tambin en
las de Gran Bretaa y Australia.

OEA es la sigla de Organizacin de Estados Americanos.


UNAM es la sigla de Universidad Autnoma de Mxico.
Las listas Bilindex y Sears no estn en abierto en la red pero podemos consultar ejemplos en: B. Gil Urdiciain (2004), Manual de lenguajes documentales (pgs. 44 a 63).
(6)

Siglas que utiliza la LCSH


LCSH hasta 1986

A partir de 1986

Equivalencia

UF

Ved

See

Use

Genrico

xx

Bt broader term

Especfico

s.a

Nt narrow term

Trminosrelacinasociativa

Va

Rt related term

(7)

14

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

El concepto Mar
AM BNE
Maresyocanos
Fuentes:
LCSH (Ocean)
CSIC (Mares y
ocanos)
ME BUS (Ocano)

AM CSIC
Maresyocanos
Fuente LCSH (Ocean)
Trm.mat. LCSH/BNF
Ocean

LEMAC

LCSH

Mar
Fuente
LCSH: (enc.:
Ocean)

Ocean.

RAMEAU
Mer
Equiv.
LCSH:
Ocean

2)Listasdeencabezamientosdemateriaenfrancs
En la tabla siguiente se recogen las listas ms importantes de encabezamientos
de materia en francs:
LavalRpertoiredevedettes-matire(RVM)delaUniversidad
Laval

El Rpertoire de vedettes-matire es una lista de encabezamientos


de materia en francs, parcialmente bilinge francs-ingls. Contiene materias y nombres geogrficos. Sus autores son de la Universidad canadiense de Laval. Es una adaptacin de diversas listas,
como la LCSH, la Canadian Subject Headings (CSH*) y la lista de la
Biblioteca Nacional de Canad. Es una lista desarrollada en el respeto por la lengua francesa y conceptos propios de Canad que
no estaban recogidos en la LCSH. Actualmente tambin incorpora
trminos provenientes del Medical Subject Headings de la Biblioteca Nacional de Medicina de EE.UU. (MESH**) y del tesauro AAT***
(Art, Architecture Thesaurus) de la fundacin J. Paul Getty.

RAMEAU

RAMEAU son las siglas de Rpertoire dAutorit Matire Encyclopdique et Alphabtique Unifi, la lista de encabezamientos usada
en Francia. Est basada en el Rpertoire de vedettes-matire de la
Universidad de Laval. RAMEAU se usa en la red de bibliotecas pblicas francesas y en la Biblioteca Nacional Francesa (BNF) cubriendo de esta manera la mayora de la red bibliotecaria del pas. Desde 1987 se gestiona desde la BNF.

* CSH es la sigla de Canadian Subject Headings.


** MESH es la sigla de Medical Subject Headings.
*** AAT es la sigla de Art, Architecture Thesaurus.

3)Listasdeencabezamientosdemateriaencastellano
a)EnAmrica:
En la tabla siguiente se recogen las listas ms importantes de encabezamientos
de materia en castellano en Amrica:
ListadeencabezamientosdelaOrganizacindeEstadosAme- La lista de encabezamientos de la OEA es la ampliacin de la lista
ricanos(OEA)
elaborada por Carmen Rovira y Jorge Aguayo para bibliotecas nacionales, universitarias, especializadas y pblicas de Latinoamrica.
Est basada en parte en la LCSH. Es una lista que incluye todas las
ramas del conocimiento y abarca desde trminos generales a trminos muy especficos de un mbito temtico.

b)EnelEstadoespaol:
En Espaa la primera noticia que tenemos de una lista de encabezamientos es
de 1935, de Juan Vicens Lavalle, pero no lleg a ser utilizada. La siguiente noticia es del ao 1939, cuando Lasso de la Vega y Cesreo Goicoechea publican

15

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Reglas para la redaccin y ordenacin de los catlogos diccionarios, seguidas de una


Lista de encabezamientos de materia y nmeros apndices. Diez aos ms tarde,
en 1949, Concepci Guarro publica una lista de encabezamientos para el trmino Cervantes (para bibliotecas que tienen colecciones cervantinas, como la
BC) y otra ms amplia en 1952.
En el ao 1965 aparecen, de manos del CSIC, los Encabezamientos de materia
para bibliotecas y en 1986 la lista de encabezamientos de materia para bibliotecas pblicas, del Ministerio de Cultura. Con respecto a las bibliotecas universitarias, las de Sevilla y la Complutense fueron las primeras en redactar una
lista de materias para sus fondos.
En la tabla siguiente se recogen las listas ms importantes:
AMBNE

Los encabezamientos de materia se empiezan a utilizar en la Biblioteca Nacional de Espaa en el ao 1958, cuando
se establece la ficha nica para todas las bibliotecas pblicas del Estado y se crea un primer fichero de autoridades
de materia con los elementos bsicos de los registros de autoridad.
Este fichero de materias sirvi de base para la futura Lista de encabezamientos de materia para bibliotecas pblicas,
editada por primera vez por la Direccin General del Libro del Ministerio de Cultura en el ao 1986.

MEBUS

La Universidad de Sevilla se inspir en la LCSH y en la Laval. Es una lista de encabezamientos de tipo enciclopdico,
ya que tiene que dar cobertura a todas las bibliotecas universitarias de la ciudad. En un volumen aparte se facilitan
las traducciones de los epgrafes al ingls y francs.

AMCSIC

La primera lista data de 1965, pero la primera editada es de 1987. Actualmente contiene aproximadamente treinta y ocho mil trminos y en la versin impresa cada encabezamiento viene acompaado de su traduccin al ingls.
Es la lista que sirve para indizar las bases de datos del CSIC. Dada la temtica de estas bases de datos, la lista recoge
trminos especializados.

LEMBP

En el ao 1981 se cre una comisin de bibliotecarios para redactar una LEM especial para los fondos de una biblioteca pblica, es decir, para colecciones generales de unos treinta mil ejemplares.
En el ao 1986 el Ministerio de Cultura la edit por primera vez. Es una lista muy implementada en el Estado espaol.
En 1991, el Ministerio, junto con la Biblioteca Nacional de Espaa, redact unas normas para su aplicacin y redaccin de nuevos epgrafes.

4)Listadeencabezamientosdemateriaencataln
En la tabla siguiente se recoge la lista de referencia ms utilizada en la legua
catalana:
LEMAC

La primera lista en cataln fue elaborada en el ao 1983 por el Institut Catal de Bibliografia. Se decidi traducir
y adaptar la Lista de encabezamientos de materias para bibliotecas de 1967 de C. Rovira y J. Aguayo y en paralelo
se iba comprobando con el original de la LCSH. La tarea actualmente corre a cargo del Servei de Normalitzaci de
la Biblioteca de Catalunya y las fuentes se han ampliado con las adaptaciones de la Laval y el Rameau. Se actualiza
constantemente, en teora el periodo es semanal. La LEMAC se usa en la Biblioteca de Catalunya y en el Consorci de
8

Biblioteques Universitries de Catalunya (CBUC ).

(8)

CBUC es la sigla de Consorci de Biblioteques Universitries de Catalunya.

CC-BY-NC-ND PID_00143965

16

Listas de encabezamientos de materia y listas de autoridades

4. Tipologas de las listas de encabezamientos

Las listas de encabezamientos de materia son un lenguaje documental que


tiene las siguientes caractersticas:
a)Sinttico. Se trata de un lenguaje documental sinttico porque tiene por
objetivo sintetizar el contenido de los documentos en un nico trmino de
indizacin o encabezamiento.
Ejemplo
La obra siguiente contiene muchos temas, pero las LEM lo sintetizan en un solo encabezamiento.
BALAGUER, Vctor. LosFrailesysusconventos:suhistoria,sudescripcin,sustradiciones, sus costumbres, su importancia / por Victor Balaguer; obra acompaada de
hermosaslminasgrabadassobreaceroporAntonioRoca,dibujadasporJ.Puiggar.
Barcelona [etc.]: Llorens Hermanos, -1851.
Materia con AM CSIC: Vida religiosa y monstica
Materia con LEMAC: Vida religiosa i monstica

b)Natural. Es un lenguaje natural porque la indizacin se basa en el uso de


palabras y/o expresiones que pertenecen al lenguaje o discurso comn y que
se encuentran en los mismos documentos (ttulo, resumen, texto, etc.) o son
propias de la misma disciplina.
Ejemplo
En una LEM el encabezamiento es Pintura, mientras que en un sistema de clasificacin
como la CDU, que es codificado, es 75.

c)Controlado. Es un lenguaje controlado porque tiene como objetivo la representacin unvoca del contenido de los documentos y de las consultas: un
nico concepto por trmino y un nico trmino por concepto (eliminando la
sinonimia y homonimia). En la indizacin y en la recuperacin slo se pueden
utilizar los trminos o encabezamientos que figuran en el vocabulario finito
que es la lista de encabezamientos.

Ved tambin
Recordad que estas caractersticas se trataron en el mdulo
Anlisis de contenidos: resumen e indizacin.

17

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Ejemplo de control de la sinonimia


Un documento sobre los chicos escoltas podra ser indizado de todas las formas siguientes, pero una LEM slo valida un trmino como trmino aceptado.
Sinnimos

Trminoaceptado(LEMAC)

Boy Scouts
Escoltes
Escoltas
Exploradores (Boy
Scouts)
Minyons de Muntanya
Noies guies
Nois guies

O un documento sobre el hambre en el mundo:


Sinnimos
Escasez de alimentos
Hambre colectiva
Hambre en el mundo
Hambruna

Trminoaceptado(AMCSIC)
Hambre

Ejemplo de control de polismicos


Un documento trata de la masa de harina. El trmino Masa es polismico, es decir,
tiene el mismo origen etimolgico y se escribe y pronuncia igual que otro trmino con
significado diferente. Las LEM diferencian los polismicos y los homnimos de diversas
formas, por ejemplo poniendo entre parntesis el mbito temtico.
Polismicos
Masa

Trminoaceptado(AMCSIC)
Masa (Cocina)
Masa (Fsica)

d)Precoordinado. Es un lenguaje precoordinado porque la coordinacin de


los diferentes conceptos que conforman una materia se produce en el momento de la indizacin, es decir, antes de almacenarlo o de incorporarlo a un catlogo segn unas reglas y principios propios.

18

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Ejemplo de lenguaje precoordinado


Una gua sobre los palafitos construidos a lo largo del ro Mekong se indiza:
Incorrecto
Obras de referencia - Derecho

Correcto
Derecho - Obras de referencia

Obras de referencia lleva una nota de aplicacin que dice:


Vase adems el subencabezamiento Obras de referencia bajo determinadas materias Arte-Obras de referencia
Por ello, en primer lugar debemos poner la materia, en este caso Derecho y en segundo
lugar Obras de referencia.
Breveexplicacin:
Cuando consultamos palafitos vemos que nos remite al trmino aceptado que es Viviendas lacustres, que puede llevar subdivisin geogrfica, por lo tanto podemos aadir el
nombre del ro Mekong. Finalmente las listas de encabezamientos tienen subdivisiones
de forma, como es el caso de las guas, que se pueden aadir en ltima posicin. Por lo
tanto el orden del encabezamiento es el propuesto y no ninguno de los incorrectos. La
precoordinacin asegura que todos los indizadores indizan de la misma manera y forma.

e)Estructuracombinatoriaoasociativa. Es un lenguaje de estructura combinatoria en que los trminos de indizacin se organizan alfabticamente y
se combinan entre s (encabezamientos y subdivisiones) en el momento de la
indizacin.
Ejemplo de combinacin de un encabezamiento + un subencabezamiento
AM CSIC: Vidrio - Propiedades elctricas

19

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

5. Principios de las listas de encabezamientos

En 1990, la Seccin de Clasificacin e Indizacin de la International Federation


9

of Library Associations (IFLA ) encarg un proyecto para estudiar las diferentes


listas de encabezamientos usadas en las bibliotecas nacionales del mundo. Los
pases participantes fueron Canad, Alemania, Irn, Portugal, EE.UU., Francia,
Noruega, Polonia y Espaa.
El panorama era poco homogneo entre las diferentes listas, en contraposicin
a los sistemas de clasificacin cuya implementacin era superior, quiz por
tradicin y por la inexistencia de barreras idiomticas (recordamos que los
sistemas de clasificacin son codificados).
El grupo de trabajo edit un documento llamado Principles underlying subject
headings languages o Principios fundamentales en los lenguajes de encabezamientos de materia, donde exponan los principios primordiales de toda lista de encabezamientos fuera cual fuera su lengua. Dividan los principios en:
principios de construccin y principios de aplicacin.
Principios fundamentales en los lenguajes de encabezamientos de materia
Principios de construccin
Principio de encabezamiento uniforme
Principio de sinonimia y principio de homonimia
Principio de semntica
Principio de sintaxis
Principio de consistencia
Principio de denominacin
Principio lingstico
Principio del usuario

Principios de aplicacin
Principio de especificidad
Principio de economa

En este apartado trataremos los principios de construccin y en el captulo titulado Aprendiendo a indexar con una lista de encabezamientos trataremos
los dos principios de aplicacin.
a)Principiodeencabezamientouniforme: cada materia tiene que ser representada siempre con un nico encabezamiento y cada encabezamiento ha de
representar una nica materia. Para conseguir este principio hay que aplicar
el control sobre el vocabulario.
Ejemplo AM BNC
Trminos afines como Sinopsis y Conferencias siempre se indizarn como Congresos y
asambleas.

(9)

IFLA es la sigla de la International


Federation of Library Associations.

20

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

b)Principiodesinonimiayprincipiodehomonimia: las LEM tienen que


controlar la sinonimia y las posibles variantes de polisemia, como la homonimia.
Los sinnimos son las palabras o expresiones que tienen el mismo significado y
que dentro de un sistema documental pueden comportar silencio documental.
Las LEM controlan los sinnimos mediante la referencia de Usad o Use.
Ejemplos de sinonimia
Trminos

AN BNE

Conceptos semejantes

Edificacin USE Construccin

Variantes ortogrficas

Kimbanda USE Quimbanda

Variedades lingsticas

Ananas comosus USE Pias

Trminos obsoletos

Aeronaves USE Aviones

En cuanto a los polismicos, decimos que dos palabras son polismicas cuando el mismo signo lingstico, palabra o sonido tiene ms de un significado
pero proviene de un mismo origen etimolgico, guardando una cierta relacin
conceptual a pesar de los diferentes usos. Los homnimos son un tipo de polisemia caracterizada por tener dos o ms orgenes etimolgicos diferentes.
Tanto los polismicos como los homnimos comportan ruido documental
dentro de un sistema documental.
Generalmente, el contexto en el que est insertada la palabra ya evita los problemas de ambigedad en la comunicacin habitual de conversacin o lectura, pero un polismico introducido en un sistema documental, sin el contexto,
puede dar lugar a ruido documental. Las LEM controlan los polismicos y homnimos de diversas maneras: adjetivando, poniendo parntesis con el nombre de la disciplina, haciendo frases, jugando con el singular y el plural, etc.
Ejemplos de indizacin de polismicos y homnimos
Polismicos
Matriz:ginecologa
Matriz:matemticas
Homnimos
Metro:transporte
Metro:medida

AM CSIC
Matriz
Matrices (Matemticas)
AM CSIC
Ferrocarriles metropolitanos
Metro (Unidad de longitud)

Nota
En cataln el trmino Metro slo tiene un significado, el del transporte, ya que la unidad
de medida es Metre.

LEMAC
ter
Matrius (lgebra)
LEMAC
Metro
Metre (Unitat de longitud)

CC-BY-NC-ND PID_00143965

21

Listas de encabezamientos de materia y listas de autoridades

c)Principiodesemntica: las LEM organizan los encabezamientos en una


estructura semntica, es decir, en relaciones de equivalencia, jerarqua y asociacin.
Ejemplo de un registro de autoridad de la AM BNE
Aviones
Vase adems los nombres de los distintos aviones y clases de aviones
Mirage (Avin) Aviones militares
Usadopor:
Aeronaves
Aeroplanos
Trminoespecfico:
Autogiros
Aviones a reaccin
Aviones de entrenamiento
Aviones de transporte
Aviones militares
Helicpteros
Hidroaviones
Ultraligeros
Trminorelacionado:
Aeronutica
Aviones
Modelos
Industria aeronutica
Transportes areos
Accidentes areos
Aviacin
Secuestro de aviones
Fuentes:
LCSH (Airplanes)
LEM (Aviones)
NRegistro:
BNE19900956268

d)Principiodesintaxis: las LEM tienen que establecer las reglas de combinacin de los encabezamientos con los subencabezamientos.
Ejemplo
Encabezamiento aceptado
Atlas
Nota de alcance
Este encabezamiento, que sirve para agrupar los atlas geogrficos
mundiales, se puede utilizar nicamente seguido de subdivisin o del
adjetivo que designa el pas de publicacin, ex.: Atles catalans para
los atlas geogrficos mundiales publicados en Catalua. Las obras
que tratan de los atlas se encuentran bajo el encabezamiento Atlas
- Historia

e)Principiodeconsistencia: los encabezamientos nuevos que se incorporen


a una LEM tienen que mantener la coherencia con los existentes: de forma y
estructura sintctica.
Ejemplo
Supongamos que tenemos que incorporar un encabezamiento para la materia Matemticas. Como las dems materias acadmicas se han introducido en singular, tenemos que
escribir Matemtica.

CC-BY-NC-ND PID_00143965

22

Listas de encabezamientos de materia y listas de autoridades

f)Principiodedenominacin: los nombres propios, de persona y de lugar


tienen que mantener tambin la coherencia con los ya existentes.
Ejemplo
Si hay que introducir un nombre y no existe, tiene que seguir las normas de las reglas
angloamericanas de catalogacin (AACR2r).

g)Principiolingstico: los trminos de la lista tienen que estar en el idioma


del catlogo.
Se tiene que respetar el orden natural de las expresiones (lo que Cutter llamaba principio de entrada directa). Las listas espaola y catalana slo permiten
invertir el orden natural de la expresin cuando la palabra significativa no es
la primera.
Ejemplo de excepcin
Juegos, Teora de los

h)Principiodelusuario: el vocabulario de las LEM se tiene que adecuar al


usuario al cual va destinada la lista. El lenguaje utilizado en los encabezamientos tiene que reflejar las caractersticas de los usuarios.
Las expresiones especficas o muy acadmicas se reservan para listas especializadas.
Ejemplos
En una lista enciclopdica, tipo la de la AM BNE y LEMAC:
Quercus ilex USE Encina
Biocatalizadores USE Enzimas
Si un mismo concepto se puede expresar de dos formas, se escoge la menos vulgar:
Tripas USE Intestinos

CC-BY-NC-ND PID_00143965

23

Listas de encabezamientos de materia y listas de autoridades

6. Encabezamientos y subencabezamientos

Los elementos que componen una lista de encabezamientos son los encabezamientos y los subencabezamientos
6.1. Encabezamientos
Son una o diversas palabras que representan conceptos.
Blanca Gil (2004, pg. 30).

Los encabezamientos son palabras o frases especficas que describen


la materia. Estn redactados en lenguaje natural pero han sido controlados, es decir, son trminos unvocos que han controlado la ambigedad derivada de la sinonimia y homonimia. Son puntos de acceso por
materias.

Ejemplos de encabezamientos
AMBNE

Periodismo
Ajedrez

AMCSIC

Macromolculas
Teora crtica

LEMAC

Fotografia
Disseny decoratiu

LCSH

Magic and poetry


Trees

6.2. Subencabezamientos

Los subencabezamientos son los epgrafes o palabras que van detrs de


un encabezamiento a efectos de matizar y precisar el significado. Son
encabezamientos situados detrs de otro encabezamiento.

Ejemplo segn AM CSIC


En el ejemplo siguiente, Bacterias es el encabezamiento y Crecimiento es el subencabezamiento.
AM CSIC: Bacterias - Crecimiento

El signo que separa los encabezamientos de los subencabezamientos es el


guin, pero tambin hay LEM que utilizan los dos puntos (como LAVAL) y
la coma.

CC-BY-NC-ND PID_00143965

24

Listas de encabezamientos de materia y listas de autoridades

Algunas listas ponen los subencabezamientos en listas anexas (LEM de bibliotecas pblicas) y otras los listan alfabticamente en el cuerpo central (LEMAC).
Hay subencabezamientos de aplicacin general (como los de forma) y otros
que hay que combinar bajo un tipo concreto de encabezamiento. En este ltimo caso la lista nos informa con una nota explicativa.
Ejemplo segn AM BNE
ImpuestosVase adems los nombres de los distintos impuestos y clases
de impuestos Sisa (Impuesto) Impuesto sobre el valor aadido Impuestos municipales y el subencabezamiento Impuestos bajo determinadas
materias Automoviles-Impuestos
Significa que podemos aadir Impuestos detrs de un encabezamiento de tipo Tabaco y
hacer:
Tabaco Impuestos

Hay cuatro tipos de subencabezamientos: los de materia, los geogrficos, los


cronolgicos y los de forma.
1)Subencabezamientosdemateria
Se usan para precisar el contenido del encabezamiento principal.
Ejemplos
Acero
Acero
Acero
Acero
Acero

Aleaciones
Electrometalurgia
Fundicin
Metalografa
Metalurgia

Tambin se usan para representar la forma en que se presenta el contenido,


o el punto de vista.
Ejemplo
Arte - Historiografa

Muchos encabezamientos + subencabezamiento de materia ya vienen construidos en la lista; otros los tenemos que combinar nosotros siguiendo una
nota de aplicacin que dice que:
a) El encabezamiento x tambin puede funcionar como subencabezamiento
o subdivisin.
Ejemplo
El encabezamiento Argot tambin puede funcionar como subencabezamiento, segn
dice la nota.

CC-BY-NC-ND PID_00143965

25

Listas de encabezamientos de materia y listas de autoridades

Ejemplo de encabezamiento (izquierda) y de encabezamiento que funciona como subencabezamiento o subdivisin (derecha)

b) Subencabezamientos creados nicamente para ir detrs de algn trmino.


La nota de aplicacin nos dir si hace falta que vayan bajo nombre de persona,
tema, guerra, sustancia, nombre geogrfico, lengua etc.
Ejemplo
La AM BNE dice en la nota de alcance que el trmino Prisioneros puede funcionar
como subdivisin, pero con la condicin de ir detrs de un nombre de guerra u organizacin militar. De manera que podemos hacer Guerra Mundial, 1939 - 1945.
Prisioneros de guerraVase adems el encabezamiento Prisioneros de
guerra seguido de adjetivo que indique nacionalidad Prisioneros de
guerra alemanes y el subencabezamiento Prisioneros bajo los nombres
de las distintas guerras Guerra mundial, 1939-1945-Prisioneros
La precoordinacin evita que algn analista pueda hacer un encabezamiento como:
Prisioneros Guerra Mundial, 1939 - 1945

2)Subencabezamientosdelugarotopogrficos
Son nombres de lugares geogrficos que precisan el encabezamiento principal.
Se usan en todo tipo de temas (Economa, Arte, Legislacin, Historia, etc.).
Algunas LEM indican qu encabezamientos pueden llevar subencabezamientos de lugar:

en la LEMAC sale como Subd. Geog.;

26

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

en la LCSH sale (may subdivisions geographical) y tambin su contrario (Not


Subd. Geog.);

en la LAVAL: nom de lieu.

Otros LEM no especifican nada.


Ejemplos de subencabezamientos de lugar

(10)

AMCSIC Fiestas religiosas -[lugar]

Fiestas religiosas - Galicia

LEMAC

Pintura10 (Subd. Geog.)

Pintura - Frana

LCSH

Balinese drama (May Subdv. Geog) Balinese drama - Denpasar

Hay encabezamientos que permiten adjetivar el nombre del pas en lugar de


hacer la forma compuesta.
Ejemplo segn AM BNE
Escultura
sase tanto para obras tericas como para colecciones, exposiciones,
concursos, etc. Vase adems el encabezamiento Escultura seguido de
adjetivo que indique estilo, poca o nacionalidad Escultura renacentista Escultura espaola
De esta manera, en lugar de hacer Escultura - Francia, nos permite hacer Escultura
francesa.
Y como comenta Blanca Gil (2004, pg. 36), los constructores de la lista tienen que procurar que el significado no cambie: Pintura - Espaa (pintura que se encuentra en
Espaa) no es Pintura espaola (slo de pintores espaoles).

3)Subencabezamientosdetiempoocronolgicos
Son periodos, fechas concretas, siglos. Cada lista nos indica la manera de introducir este tipo de subencabezamientos.
Ejemplo
El siglo XIX puede introducirse de diversas maneras: 1800-1899 o 19.

Los periodos se separan por barra: 1939/1975.


4)Subencabezamientosdeforma
Son la forma en que se presenta el documento, son formas del tipo: enciclopedias, estadsticas, anuarios, biografas, etc. Algunas listas, como la del LEM
BP, incluyen un anexo con estos encabezamientos de forma.
Ejemplo
Medicina - Enciclopedias
Medicina - Estadsticas
Medicina - Revistas

Nota: Los parntesis son informativos, la subdivisin debe separarse con un guin.

CC-BY-NC-ND PID_00143965

27

Listas de encabezamientos de materia y listas de autoridades

Ejemplo

Ved tambin

En el mdulo La cadena documental se pone un ejemplo sobre la obra Vocabulario


bsico de la historia medieval de Pierre Bonnassie y su referencia documental. Pues bien,
en este caso el encabezamiento lleva un subencabezamiento de forma:
Historia medieval - Terminologa

5)Ordendelossubencabezamientos
Si la LEM no indica lo contrario, el orden es el siguiente:

Ejemplo
Dientes Cuidado e higiene - Espaa - S. XIX - Estadsticas

Si el primer lugar lo ocupa un nombre geogrfico, entonces el orden es:


Lugar + materia + tiempo + forma
Ejemplo
Barcelona - Poltica y gobierno - 1939/1975 - Revistas

Podis encontrar el ejemplo


sobre la obra Vocabulario bsico de la historia medieval de
Pierre Bonnassie y su referencia
documental al apartado 3 del
mdulo La cadena documental.

28

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

7. Reglas de vocabulario y signos de puntuacin de las


LEM

Las reglas forman parte del control del vocabulario que todo lenguaje documental controlado debe tener presente. Son convenciones propias de cada lista. Aunque nunca tengamos que construir una LEM entera, s que nos podemos encontrar en la situacin de tener que incorporar un encabezamiento
nuevo y hay que saber las reglas:
1)Regladelsingular/plural
Culturalmente, las listas inglesas y espaolas prefieren el plural, mientras que
las francesas y las italianas se decantan por el singular, si bien siempre hay
excepciones debidas a particularidades de la lengua, costumbres, etc.
No hay una normativa clara para el uso del singular/plural. Algunos autores
como Blanca Gil apuntan que el plural se usa para temas concretos y conta-

Los sustantivos no
contables
En castellano y cataln usamos
el singular para los sustantivos
no contables, como arroz y caf, pero hacemos excepciones
con garbanzos y judas.

bles (enciclopedias, museos) y el singular para temas abstractos e incontables


(belleza, positivismo, etc.) Blanca Gil (1996, pg. 337).
En Espaa, la Biblioteca Nacional redact en el ao 1991 unas normas de aplicacin del singular/plural. A modo de ejemplo, stas son algunas de las reglas
redactadas por la Biblioteca Nacional:
Ejemplos de reglas singular/plural
En singular
Conceptos abstractos: caridad
Fenmenos de la naturaleza: nieve
Propiedades: transparencia
Procesos biolgicos: respiracin
Sistemas de creencias: budismo
reas temticas, disciplinas: fsica
Objetos no cuantificables: arena
rganos nicos: corazn

En plural
Grupos: museos, delfines, italianos
rganos mltiples: huesos, pelos
Epgrafes de forma: portales, diccionarios

Si la palabra es polismica, algunas listas utilizan el singular y el plural a la


vez para diferenciar.
Ejemplo
En la lista del AM CSIC se usa Teatro (obra) y Teatros (lugar).

2)Regladelassiglas
Se prefiere la expresin completa a las siglas o acrnimos.

Lectura complementaria
Podis encontrar las observaciones de Gil en:
B.GilUrdiciain, (1996) (artculo)

29

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Ejemplo de la regla de las siglas (AM CSIC)


Correcto
Descripcin Bibliogrfica
Normalizada Internacional

Incorrecto
ISBD

3)Reglademaysculas/minsculas
Se recomienda que la primera palabra del encabezamiento, del subencabezamiento, del encabezamiento cambiado y la que va dentro de parntesis comience con mayscula.
Ejemplo con la AM CSIC
Lmparas
Gnero de punto - Industrias
Montecarlo, Mtodo de
Intervalo de energa (Fsica)

4)Regladelossignosdepuntuacin
Las LEM utilizan diversos signos y entre ellas no hay una unidad de criterio,
por lo tanto se hace necesario consultar las introducciones y manuales adjuntos a cada lista.
Los signos utilizados y sus usos ms habituales son los siguientes:
Signos poco habituales
Signo

Utilidad

Ejemplos

Guin

Separa encabezamientos de los subencabezamientos

Alimentos - Caloras
frica - Historia - 1884/
1918

Coma

Para expresiones inversas

Gaita, Msica para

Parntesis

Mercurio (Divinidad romana)


Mercurio (Planeta)
Capitolio (Italia)

Diferencia homnimos
Expresa el contexto, la situacin geogrfica, el mbito temtico

Hay otros signos que no son de uso comn en las listas de encabezamientos
que estamos utilizando a lo largo de esta asignatura, pero que es bueno que
sepis que existen. Mostramos algunos ejemplos de los mismos extrados de
la obra de Gil (2008).
Signo

Lectura complementaria
I.GilLeiva (2008). Manual
de indexacin (pg. 136). Teora y prctica. Gijn: Trea.

Utilidad

Ejemplos

Dospuntos

Separa encabezamientos de los subencabezamientos.

Emploi: Paris

Comillas

Para obras literarias y personajes de ficcin

Cervantes, Miguel de,Sancho Panza

Doblebarra

Expresa dos materias relacionadas (al estilo del sistema Colon de la


CDU), hay que hacer la inversa

Art//Economia
Economia//Art

30

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

8. Trminos simples y compuestos

Los encabezamientos y subencabezamientos pueden ser simples o compuestos.


8.1. Encabezamientos simples
En los encabezamientossimples el tema se expresa en una sola palabra, generalmente un sustantivo, pero tambin pueden ser adjetivos, verbos sustantivados o nombres geogrficos. Tanto pueden ser trminos en singular como
en plural.
Ejemplos de encabezamientos simples
Singular

Plural

AMBNE

tica

AMCSIC

Carnitina Animales

LEMAC

Grcia

Cireres

LCSH

Toponymy

Museums

Extremeos

8.2. Encabezamientos compuestos


En los encabezamientoscompuestos la materia se expresa con ms de una
palabra.
Ejemplo
rboles frutales
Topographical surveying

Los encabezamientos compuestos pueden estar formados por:


1)Dossustantivosunidosporunapreposicin
AMBNE

Cantos de pjaros
Msica para acorden

AMCSIC

Lseres en ciruga
Riego por aspersin

LEMAC

Gneres de punt
Animaci per ordinador

LCSH

Packing for shipment

Ved tambin
Recordad que el uso del singular/plural se explica en el apartado 7 de este mdulo didctico.

CC-BY-NC-ND PID_00143965

31

Listas de encabezamientos de materia y listas de autoridades

2)Dossustantivosunidosporconjuncin: los temas acostumbran a ser correlativos o bien contrarios.


Industria y Comercio
Industria y Universidades
En estos casos (como en el sistema Colon de la CDU) es conveniente entrar
dos veces el encabezamiento en el catlogo.
Industria y Comercio
Comercio e Industria

AMBNE

Mximas y aforismos
Cine y poltica

AMCSIC

Emigracin e inmigracin
Pintura e ilustracin de animales

LEMAC

Germans i germanes
Internet i adolescents

LCSH

Rites and ceremonies

3)Dosomssustantivosseparadosporcomayacabadosenetc.
AMCSIC

Tratados, manuales, etc.


Restaurantes, cafeteras, etc.

LEMAC

Acadmies, societats culturals, etc.


Situaci legal, lleis, etc.

4)Unsustantivocalificadoconunparntesis
AMBNE

Vela (Deporte)

AMCSIC

Cambio
Cambio
Cambio
Cambio

LEMAC

Radi (Metall)
Radi (Os)

LCSH

Canarias (Ship)
Canarias (Islands)

(Economa)
(Filosofa)
(Psicologa)
(Sociologa)

5)Unsustantivoadjetivado
AMBNE

Industria forestal
Escultura italiana

AMCSIC

Medicina tropical
Matemticas difusas

CC-BY-NC-ND PID_00143965

LEMAC

Febre groga
Cuina francesa

LCSH

Modern Jazz Giants

32

Listas de encabezamientos de materia y listas de autoridades

6)Fraseshechas
AMBNE

Viajes alrededor del mundo

AMCSIC

Pueblos indgenas - Primer contacto con los occidentales

LEMAC

Amor platnic en la literatura

LCSH

Out of the blue series

7)Frasesdondeseresaltaelconceptoaliniciodelepgrafeseparadocon
comas: consiste en alterar el orden de la expresin natural, colocando en primer lugar el trmino con ms carga significativa y separado del resto por una
coma.
Ejemplo
ngeles, Nuestra Seora de los

No se usan mucho porque se prefiere el principio de entrada directa. Son de


aplicacin para conceptos del tipo Teora de, Ley de, Mar de, Tests de, Nuestra
Seora de.
AMBNE

Bender, Test de

AMCSIC

Addison, Enfermedad de

LEMAC

Acci, Teoria de l
Albera, Serra de l

LCSH

Absolute, The
Art, Romanesque

8.3. Orden de los encabezamientos

Las listas estn ordenadas alfabticamente por los trminos aceptados


y no aceptados.

CC-BY-NC-ND PID_00143965

33

Listas de encabezamientos de materia y listas de autoridades

Ejemplo de la letra B
AM CSIC
Baal (Personaje mitolgico)
Baamarani
Babel, Torre de
Babesiasis
Babesiasis bovina
Babesiosis
Babes
Babilonio
Babismo
Bable

LEMAC
Babel, Torre de
Babilonia - Civilizacin
Babilonia (Ciudad antigua)
Babismo
Bable
Bacalao
Bacalao - Industria y comercio
Bacalao - Pesca comercial
Bacalao - Industria del
Bacanales

Mayoritariamente siguen el orden iniciado por la LCSH:

Encabezamiento simple/compuesto.

Encabezamiento simple/compuesto - Subencabezamiento.

Encabezamiento compuesto cambiado Acci, Teora de la.

Encabezamiento con calificador Efecto invernadero (Meteorologa).

Encabezamiento formando una frase.

CC-BY-NC-ND PID_00143965

34

Listas de encabezamientos de materia y listas de autoridades

9. Las relaciones semnticas

Cada encabezamiento forma un registro de autoridad. En este registro observamos en primer lugar el encabezamiento aceptado y toda una serie de trminos conceptualmente equivalentes, ms genricos, ms especficos y trminos
que evocan una relacin.
Este apartado trata los temas siguientes:
a) Relacin de equivalencia.
b) Relacin de jerarqua:

Genrica.

Especfica.

c) Relacin de asociacin.
d) Smbolos utilizados para designar los tres tipos de relaciones.
Ejemplo de registro de autoridad extrado de la AM CSIC

9.1. Relacin de equivalencia


En la lista hay trminos aceptados y trminos no aceptados.

Los trminosaceptados son los encabezamientos que se pueden utilizar para indizar.

Nota
Estas tres relaciones tambin
se dan en tesauros.

35

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Acostumbran a ir en negrita. En los ejemplos, es el trmino Cartas.

Los trminosnoaceptados son sinnimos, siglas, trminos demasiado


especializados, barbarismos, formas incorrectas, etc.

Estos trminos se encuentran recogidos en la lista pero no estn admitidos


para indizar documentos. Su funcin es controlar todas las posibles variantes
y ofrecer una forma de encabezamiento nica para indizar.
Ejemplo
Los trminos no aceptados de Cartas son:
Cartas literarias
Correspondencia
La relacin de equivalencia une los dos trminos. Si el analista est buscando el concepto
Correspondencia, se encontrar en la lista con una referencia de USE que le indicar
que tiene que indizar Cartas. De esta manera los analistas siempre indizarn Cartas y
se evitarn entradas dobles por el mismo concepto.

La funcin de estas relaciones de equivalencia es hacer de puente entre las


palabras utilizadas en lenguaje natural y las utilizadas en un lenguaje controlado, tanto en la indizacin como en la recuperacin. En la indizacin este
puente permite mantener la coherencia y la univocidad en los indizadores y
en la recuperacin permite a los usuarios recuperar mejor los documentos, ya
que no se produce silencio ni ruido documental. No es posible recuperar un
trmino no aceptado, ya que el mismo programa que mantiene la lista har
la remisin al trmino aceptado.
Ejemplo

Ved tambin

Si un usuario busca en las bases de datos del CSIC documentos sobre los Genios, el
mismo programa lo remitir a Superdotados. Si busca en un catlogo indizado con la
LEMAC por el trmino Infncia, lo remitir a Infants.

Las siglas utilizadas para expresar la relacin de equivalencia entre ambos trminos son:
Cataln

Castellano

Angls

Empreu

EM empreu

USE

USE

Emprat per

EP emprat per

UP usado por

UF use for

Ms ejemplos de un trmino no aceptado en el trmino aceptado:


AMBNE

Formacin del carcter USE Desarrollo de la personalidad


Inversores USE Capitalistas y financieros
Biologa animal USE Zoologa

Para ms informacin sobre sinnimos, ved el apartado 3 del


mdulo Anlisis de contenidos: resumen e indizacin de
esta asignatura.

CC-BY-NC-ND PID_00143965

36

AMCSIC

Genios USE Superdotados


Fortuna USE Patrimonio
Casualidad USE Azar

LEMAC

Albins EM Albinisme
Vegetals EM Plantes
Llibres doracions EM Devocionaris

LCSH

IFLA USE International Federation of Library Associations

Listas de encabezamientos de materia y listas de autoridades

Los trminos aceptados nos informan acerca de cules han sido los trminos
no escogidos para indizar el mismo concepto.
Ejemplos de trminos aceptados y no aceptados
AMBNE

Fotografa USADO POR Fotos

AMCSIC

Sermones fnebres USADO POR Oraciones fnebres

LEMAC

Hellenisme EMPRAT PER Civilitzaci hellnica

LCSH

Island animals USE FOR Insular animals

9.2. Relacin de jerarqua


Las relaciones de jerarqua son de dos tipos: genricas y especficas. Los encabezamientos pueden tener trminos genricos y trminos especficos.

Los trminos genricos son aquellos que conceptualmente son ms


amplios que el encabezamiento aceptado.

Ejemplo
Cartas vemos que tiene como trminos genricos:
Ejemplo de trminos genrics
Cartas

Biografa
Literatura

En cambio, los trminosespecficos, como su nombre indica, tienen


un alcance conceptual ms concreto que el del encabezamiento aceptado.

Ejemplo
Ejemplo de trminos especficos
Cartas

Novela espistolar

37

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Los encabezamientos tienen encabezamientos genricos y especficos en funcin de su materia. Hay temas que por propio significado no tienen algunas
de estas relaciones.
Ejemplo
El encabezamiento Nquel de la LEMAC tiene un solo trmino genrico, ninguno equivalente y ninguno especfico.
NquelTrmino genrico:
Metales de transicin Fuentes:
LCSH (Nickel)
CSIC (Nquel)
TEI (Nquel)
N Registro: BNE19913257085

Habitualmente cada LEM marca los trminos con el nombre completo de genrico o especfico, pero a veces se utilizan siglas (las mismas que en los
tesauros):
Trminos genricos, especficos y sus siglas
AMBNE

TG / TE

Trmino genrico / Trmino especfico

AMCSIC

TG / TE

Trm. genrico / Trm. especfico

LEMAC

TG / TE

Termes genrics / Termes especfics

LCSH

BT / NT

Broader terms / Narrower terms

Las relaciones de jerarqua son tiles en la indizacin porque muestran otras


trminos por encima y por debajo del encabezamiento que estamos consultando, ayudando al analista a indizar con el trmino ms especfico que convenga. En la recuperacin son tiles porque los trminos genricos y especficos enriquecen la bsqueda.
Ejemplos

En la indizacin: el analista tiene que indizar un documento sobre cartas noveladas


y cree que el encabezamiento adecuado es Cartas, pero al consultar la LEM del CSIC
se da cuenta de que el trmino Novela epistolar es ms exacto.

En la recuperacin: el usuario busca informacin sobre Cartas escritas por personajes


famosos y ve que tambin puede buscar por el nombre del personaje seguido de Correspondencia.

9.3. Relacin asociativa


La estructura jerrquica que acabamos de ver es ideal para situar un concepto
en su contexto de significado, la jerarqua lo sita de forma vertical (ms grande que, menor que). Ahora bien, en la realidad los conceptos tambin se relacionan de manera horizontal, es por eso que existen las relaciones asociativas.

38

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Lo que hacen las relaciones asociativas es poner en contacto dos trminos o ms que por cuestiones de significado se evocan uno a otro.
No pertenecen a la misma secuencia jerrquica pero estn relacionados. Mentalmente los asociamos. La relacin es simtrica y consiguientemente recproca.

Ejemplo
Los trminos relacionados de Cartas son:
Cartas

Cartas - Redaccin

La manera de indicar el tipo de relacin es:


AMBNE

Trmino relacionado

AMCSIC

Vase adems

LEMAC

Termes relacionats

LCSH

Related term / See also

Las funciones de las relaciones de asociacin son sobre todo de ayuda en la


recuperacin, ya que asocian otros conceptos al encabezamiento de partida
que pueden ser muy interesantes en la bsqueda.
Ejemplo
El encabezamiento Maquillaje tiene como dos trminos relacionados Belleza personal y Cosmticos, ya que de alguna manera estn relacionados con l aunque no
pertenezcan a la misma cadena jerrquica.

9.4. Smbolos utilizados para designar los tres tipos de relaciones


Actualmente la mayora de LEM que estn en lnea inscriben cada trmino
dentro de la categora que le corresponde y sta es expresada en lenguaje natural siguiendo la terminologa propia de los tesauros, adoptada por la LCSH
en 1986. Pero no siempre ha sido as, antes se usaban unas siglas muy caractersticas que acto seguido reproducimos.
Smbolos utilizados para designar los tres tipos de relaciones
Relacionesdeequivalencia

Antesde1986

Despusde1986

a) De un trmino aceptado a uno no aceptado

EP (emprat per)
UP (usado por)
UF (use for)

b) De un trmino no aceptado a uno aceptado

ME (empreu)
USE (usar)
USE (use)

39

CC-BY-NC-ND PID_00143965

Relacionesdejerarqua

Antesde1986

Listas de encabezamientos de materia y listas de autoridades

Despusde1986

a) Generales

xx

TA (terme ampli)
TG (trmino general)
BT (broader term)

b) Especficas

vt

T (terme especfic)
T (trmino especfico)
NT (narrower term)

Antesde1986

Despusde1986

Relacionesdeasociacin

Repetidos en xx y vt TR (terme relacionat)


TR (trmino relacionado)
RT (related term)

40

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

10. Aprendiendo a indizar con una lista de


encabezamientos

Como en todos los lenguajes, el primer proceso es el deanlisisdeltexto para


determinar la/las materias que trata, as como otros elementos decisivos como
el periodo cronolgico, el alcance geogrfico y la forma bibliogrfica en la que
se presenta el documento.

Ved tambin
Podis consultar el proceso de
anlisis del texto en el apartado 3 del mdulo Anlisis de
contenidos: resumen e indizacin de esta asignatura.

Para indizar correctamente con una LEM hay que tener presente:

Los principios de especificidad y economa.

El orden de los subencabezamientos o subdivisiones.

Las notas de alcance.

Las obras de referencia: no todos los conceptos estn representados en las


listas, algunos hay que incorporarlos de alguna fuente reputada.

Las reglas de construccin, que hemos visto anteriormente, sobre el uso


del singular/plural, siglas, maysculas y minsculas por si tenemos que
introducir un trmino nuevo.

1)Principiosdeespecificidadyeconoma
a)Principiodeespecificidad. Hay que indizar el encabezamiento ms especfico que encontremos. La especificidad est relacionada con la exactitud con
que el encabezamiento describe el contenido. Si nos quedamos por encima
(indizando con un trmino genrico) o por debajo (con un trmino especfico)
no estaremos siendo exactos.
Ejemplos del principio de especificidad
Materia

Correcto

Incorrectopor
Genrico

Demasiadoespecfico

AMBNE

Medicinas

Medicamentos

Productos sanitarios

Analgsicos

AMCSIC

Energas fsiles

Combustibles fsiles

Combustibles

Petrleo

LEMAC

El latn como lengua

Llat

Lenguas clsicas

Manuscritos latinos

No podemos indizar con el trmino genrico y el especfico al mismo tiempo.

41

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Ejemplo
Combustibles fsiles / Petrleo
Llenges clssiques / Llat

Una buena manera de ser especficos es jugar con los subencabezamientos o


subdivisiones.
Bibliotecas pblicas - Libros seleccionados
Este principio de especificidad se puede adaptar a la situacin del servicio de
11

informacin y documentacin (SID ): si tiene pocos documentos sobre un


tema, se recomienda indizar genricamente; en cambio, si tiene muchos documentos, se recomienda indizar especficamente.
b)Principiodeeconoma: el encabezamiento tiene que sintetizar el contenido del documento. Un documento = Uno a tres encabezamientos.
El motivo de esta economa en las descripciones de la materia radica en los orgenes histricos del lenguaje. Tenemos que recordar que las listas de encabezamientos, como los sistemas de clasificacin, nacieron en entornos manuales
(no informatizados), donde cada documento se describa en fichas de cartulina
a mano o con la mquina de escribir. Un documento tena un mnimo de tres
fichas de cartulina: una para el catlogo de autores, una para el de ttulos y una
para el de materias. Evidentemente, si el documento tena ms de una materia, haba que hacer una cuarta ficha de cartulina. Para economizar esfuerzos,
incluso, no se indizaba la materia de las novelas, ya que se acostumbraba a
recuperar por el autor y ttulo. De esta poca manual, que dur hasta la dcada de 1980, se desprendi una poltica de actuacin que para las bibliotecas
pblicas recomendaba entre una y tres entradas por materia como mucho.
Actualmente, y gracias a la informatizacin de los catlogos, el criterio predominante es la obra que se est indizando y cmo es de relevante para la bsqueda indizar uno, dos o ms encabezamientos.
Si el documento trata un tema, no hay que indizar subtema por subtema.
Ejemplo
En una obra sobre cocina, no hay que indizar Bocadillos, Entremeses, Salsas, etc.; indizaremos Cocina, que es el epgrafe que lo engloba todo.

Si el documento trata temas mltiples que la LEM no recoge juntos, podemos


indizar varios encabezamientos.

(11)

SID es la sigla de servicio de informacin y documentacin.

CC-BY-NC-ND PID_00143965

42

Listas de encabezamientos de materia y listas de autoridades

Ejemplo
Un documento sobre la monarqua hispnica en tiempos del Quijote se puede indizar
con tres encabezamientos como los siguientes:
Cervantes Saavedra, Miguel de, 1547-1616. Don Quijote de la Mancha
Derecho - En la literatura
Derecho laboral

Si indizamos ms de un encabezamiento, hay que ponerlos por orden de importancia en el documento.


2)Ordendelossubencabezamientososubdivisiones
Recordemos que muchos encabezamientos con subencabezamientos se encuentran construidos en la misma lista, pero en caso de que haya que combinar alguna subdivisin, el orden es el siguiente:

Si el primer lugar es un nombre geogrfico, entonces el orden es:


Lugar + materia + tiempo + forma
3)Lasnotasdealcance
Cuando el sentido de un encabezamiento no est suficientemente claro, las
listas aaden una explicacin asociada que puede ser de diversos tipos:
a) Nota histrica
Explicacin del CSIC para el encabezamiento Yugoslavia
sese para las obras que tratan sobre los territorios que formaban
la Yugoslavia entre 1918 y 1992 (entre 1946 y 1991 compuesta por
las repblicas federadas de Bosnia-Herzegovina, Croacia, Macedonia,
Eslovenia, Montenegro y Serbia), o los de la Repblica Federal de
Yugoslavia, reducida a Serbia y a Montenegro entre 1992 y 2003.

b) Definicin
Nota de la AM CSIC para la definicin de Waqf
Waqf
sese para las obras tanto las que que tratan del waqf, institucin
del derechos islmico con fondos inmovilizados dedicados a una obra
piadosa o de inters general, como para las realizaciones urbansticas, artsticas o sociales debidas a estas fundaciones.

c) Nota de aplicacin

Nota
Si el servicio de informacin y
documentacin (SID) necesitara una indizacin ms profunda, se recomienda indizar con
un tesauro, que es otro lenguaje documental natural pero postcoordinado y que tiene
ms prestaciones para hacer
anlisis que las LEM.

CC-BY-NC-ND PID_00143965

43

Listas de encabezamientos de materia y listas de autoridades

Nota del CSIC para explicar en qu casos se puede indizar con el


encabezamiento Recursos energticos
sese para las obras sobre todas las formas posibles de energa
mecnica. Para los estudios sobre la energa desde los puntos de vista
fsico o de la ingeniera sese: Energa mecnica.

d) Nota informando otros trminos y subdivisiones.


Nota de la AM CSIC explicando otros encabezamientos ms especficos a
partir de Filosofia
Pueden usarse adems los nombres de las distintas partes de la
filosofa, as como los nombres de las escuelas, movimientos, etc.
sese adems como subencabezamiento detrs de nombres de personas,
excepto filsofos, y de materias a propsito de la teora fundamental
de estas materias

4)Lasobrasdereferencia
No todos los conceptos estn representados en las listas. Algunos hay que incorporarlos de alguna fuente reputada:

Otras listas de encabezamientos, como la LCSH o RAMEAU.

Diccionarios y enciclopedias considerados como autoridad dentro del dominio en cuestin. La LEMAC considera autoridades la Enciclopdia y el
Atlas del grupo Enciclopdia Catalana, el Diccionari de la llengua catalana
de lInstitut dEstudis Catalans y el Wordreference como traductor.

Organismos normalizadores como el Termcat.

Tesauros, particularmente los construidos conforme la norma ISO 2788


Directrices para el establecimiento y desarrollo de tesauros monolinges e
ISO 5964 Directrices para el establecimiento y desarrollo de tesauros multilinges.

Sistema de clasificacin. El que se use en el mismo SID: CDU o LCC.

Especialistas en el tema.

5)Lasreglasdeconstruccin
Las reglas que hemos visto anteriormente sobre el uso del singular/plural, siglas, maysculas y minsculas por si tenemos que introducir un trmino nuevo.
Ejemplo
Supongamos que tenemos que indizar OCDE y no existe en la LEM. Como sabemos que
se prefiere el nombre entero a las siglas, indizaremos Organizacin de Cooperacin
y Desarrollo Econmico y lo haremos en la lengua del catlogo.

CC-BY-NC-ND PID_00143965

44

Listas de encabezamientos de materia y listas de autoridades

11. La lista de autoridades

Una listadeautoridades es un lenguaje documental controlado que recoge ordenados alfabticamente todos los registros de autoridades presentes en el catlogo o en la base de datos bibliogrfica de la unidad de
informacin.

Las autoridades recogidas en este apartado son:

Nombres propios

Congresos

Ttulos

Nombres propios y ttulos

Entidades

Nombres geogrficos

La descripcin de cada autoridad, con los trminos descartados, referencias,


las notas de aplicacin y la fuente se conoce como registrodeautoridad. La
suma de todos los registros se llama ficherodeautoridades o listadeautoridades. Si este fichero se encuentra vinculado al catlogo bibliogrfico, se conoce como catlogodeautoridades. Las autoridades tambin son conocidas
como encabezamientos e identificadores.
La principal funcin de las listas de autoridades es conseguir la univocidad
de los nombres propios, ttulos y dems autoridades y garantizar una buena
recuperacin documental. Las listas de autoridades cuidan de los ndices que
se usan en los catlogos bibliogrficos. Concretamente:

Garantizan la normalizacin y la univocidad de los puntos de acceso.

Facilitan la consistencia en su aplicacin en el catlogo bibliogrfico.

Generan la red de relaciones de ved y ved tambin.

Asisten al usuario en las bsquedas.

Permiten el intercambio entre los registros bibliogrficos de los diversos


catlogos.

11.1. Las listas de autoridades en Catalua y Espaa


Todas las bibliotecasycentrosdedocumentacin indizan con un catlogo
de autoridades para controlar los nombres propios, geogrficos, ttulos, etc.
Forma parte del compromiso de representar los documentos de manera unvoca.

Ved tambin
Las reglas de construccin de
cada registro de autoridad se
estudian en la asignatura Anlisis documental.

45

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Al igual que los encabezamientos de materia vistos anteriormente, estas autoridades se encuentran en la misma direccin. Slo hay que cambiar en el
desplegable la opcin Materia por las otras autoridades.
Listas de autoridades
Cataln

LENOTI

Lista de encabezamientos de nombres y ttulos de la Biblioteca Nacional de Catalunya

Castellano

CA BNE
CA CSIC

Catlogo de autoridades de la Biblioteca Nacional de Espaa


Autoridades de la red de bibliotecas del CSIC

Ingls

LC Authorities

Library of Congress Authorities

Francs

LAVAL
RAMEAU

Lista Laval de la Universidad Laval (Canad)


Autorits RAMEAU

Las autoridades en documentacinarchivstica, en cambio, hacen referencia


a entidades: instituciones, personas y familias.
La norma utilizada para elaborar los registros de autoridades es la ISAAR(CPF)
Norma internacional sobre los registros de autoridad de archivos relativos a instituciones, personas y familias del Consejo Internacional de Archivos. Esta norma

(12)

ISAD(G) es la sigla de General


International Standard Archival Description, Norma Internacional General de Descripcin Archivstica.

ISAAR(CPF) es complementaria a la norma ISAD(G)12 Norma Internacional General de Descripcin Archivstica.


Las autoridades en archivos son especficas, ya que son nombres que no se
encuentran fcilmente en otros catlogos de autoridades.
El control de las autoridades en archivos permite relacionar los fondos de un
mismo productor (persona o entidad) que se encuentre en diversos archivos

Autoridades especficas
Son ejemplos de autoridades
especficas la familia de los
Marqueses de Castelldosrius
(cuyo fondo histrico est en
el Archivo Nacional de Catalua), instituciones histricas o
el nombre del director general
de la empresa X.

y tambin vincular estos nombres con otros recursos bibliogrficos o museogrficos.


Los registros de autoridad de archivos son semejantes a las autoridades de bibliotecas, ya que los dos permiten la creacin de puntos de acceso normalizados en la descripcin. Pero los de archivos tienen que responder a unos requisitos adicionales consistentes en documentar toda la informacin disponible
sobre el productor y el contexto de produccin del documento. Los registros
de autoridad archivsticos acostumbran a tener ms informacin que los bibliotecarios.
En esta asignatura trabajaremos con ficheros de autoridades ya construidos,
no con normas para construirlos.
Al igual que en las listas de encabezamientos de materia, trabajaremos con
las listas de autoridades que por idioma nos son ms prximas: LENOTI, el
catlogo de autoridades de la Biblioteca Nacional de Espaa (CA BNE) y el
catlogo de las bases de datos del CSIC (CA CSIC).

Los archivos de los


registros de autoridad
Ved el registro de autoridad
para la institucin Consejo de
guerra, ejemplo disponible en
la norma ISAAR pg. 45-52.

46

CC-BY-NC-ND PID_00143965

Listas de encabezamientos de materia y listas de autoridades

Las autoridades que ofrecen en cada desplegable son:


1)BibliotecadeCatalua
Listas de autoridades de la BC
13

CANTIC

LENOTI

LEMAC

14

(13)

Nombres de personas y de familias


Nombres de entidad
Nombres de congreso
Ttulos uniformes
Combinaciones de nombre-ttulo
Seexcluyen:
Encabezamientos temticos
Nombres geogrficos
Trminos de gnero/forma
Nombres con subdivisin de materia

Como se puede observar faltan las autoridades para nombres geogrficos. Los
nombres geogrficos jurisdiccionales se construyen segn el captulo 23 de
las AACR2R. Los no jurisdiccionales se sacan de algna lista de autoridades
reputada15 por el SID.
2)BibliotecaNacionaldeEspaa
Listas de autoridades de la BNE
Persona
Ttulo / Ttulo mapa
Congreso
Entidades
Materias
Geogrficos
Subencabezamientos
de materia

3)BibliotecasdelCSIC
Listas de autoridades del CSIC
Autor personal
Institucin
Congreso
Materia
Trmino geogrfico
Ttulo uniforme
Subencabezamiento

4)Autoridadeseninglsyfrancs
Consultaremos tambin autoridades en otras lenguas, como la inglesa o francesa, para facilitar la bsqueda en catlogos internacionales.

LC Authorities.

Lista de encabezamientos de
nombres y ttulos de la Biblioteca
de Catalua (LENOTI).
En Catalua las obras de
referencia son de la editorial
Enciclopdia Catalana: la Gran
Enciclopdia Catalana y el Atles.

Materia

CatlogoCSICAutoridades

(14)

(15)

Nombre
Nombre-ttulo
Ttulo

Catlogodeautoridades

CANTIC es un catlogo de autoridades cooperativo iniciado en


2007 que se realiza en el Catlogo
Colectivo de las Universidades de
Catalua (CCUC) y est liderado
por la Biblioteca de Catalua.

CC-BY-NC-ND PID_00143965

47

Lista Laval de la Universidad Laval, Canad (LAVAL)

Autorits RAMEAU

Listas de encabezamientos de materia y listas de autoridades

11.2. Tipologa
Las listas de autoridades son un lenguaje documental que tiene las siguientes
caractersticas: es analtico, natural, controlado y postcoordinado.
1)Analtico. Se trata de un lenguaje documental analtico porque permite, en
la indizacin y tambin en la recuperacin, el uso de ms de una autoridad
(o identificador).
El contenido de un documento se puede representar por tantos descriptores
controlados como sean pertinentes y necesarios para establecer un buen dilogo documental con el sistema.
Ejemplo con LENOTI
Un documento del tipo Gironins illustres que tratase de Salvador Dal, Narcs Monturiol, Pep Ventura, Josep Pla y Xavier Cugat se podria indizar con las autoridades de estos
cinco personajes.
Dal, Salvador, 1904-1989
Monturiol, Narcs
Ventura, Pep
Pla, Josep, 1897-1981
Cugat, Xavier

2)Natural. Se trata de un lenguaje documental natural porque la indizacin


se basa en el uso de palabras y/o expresiones libres que pertenecen al lenguaje
o discurso comn y que se encuentran en los mismos documentos (ttulo, resumen, texto, etc.) y en los conceptos de la consulta del usuario (nombres de
personajes, poblaciones, territorios, entidades, etc.). Los nombres no se traducen en ningn cdigo.
3)Controlado. Se trata de un lenguaje controlado porque los trminos que
lo componen han sido depurados de las ambigedades del lenguaje natural
y estn destinados a representar de manera unvoca el contenido de un documento y de las consultas dentro de un sistema documental.
Es un lenguaje documental con voluntad de univocidad, que busca eliminar
los fenmenos de sinonimia, polisemia y homonimia; por eso exige establecer
el control sobre todos los trminos que rene.
Ejemplo en LENOTI
Hay dos Josep Pla con las dos autoridades corresponendientes; una corresponde al escritor
y la otra al compositor. La polisemia del nombre se evita con las fechas de nacimiento
y muerte del personaje:
Pla, Josep, 1728-1762: obosta y compositor cataln.
Pla, Josep, 1897-1981: el escritor y periodista ampurdans.

Ved tambin
Estas caractersticas estn basadas en las tipologas que vimos
en el apartado 5 del mdulo
Anlisis de contenidos: resumen e indizacin.

CC-BY-NC-ND PID_00143965

48

Listas de encabezamientos de materia y listas de autoridades

En el caso de los sinnimos, las autoridades de nombre, nombre geogrfico


y ttulo siguen las mismas pautas que los encabezamientos de materia vistos
anteriormente, ya que el punto de partida son les Reglas angloamericanas de
catalogacin.
Ejemplo
Si buscamos URSS en LENOTI, encontraremos que la autoridad aceptada es:
Encapalament acceptat
Uni de Repbliques Socialistes Sovitiques
Emprat per
URSS

4)Postcoordinado. Se trata de un lenguaje documental postcoordinado ya


que permite la coordinacin de conceptos en el momento de la recuperacin
y la utilitzacin de un gran nmero de trminos de indizacin o puntos de
acceso. La combinacin precisa de estos diferentes descriptores en la recuperacin es la que nos remite al documento buscado.
Ejemplo
Siguiendo con el ejemplo anterior, Gerundenses ilustres, la coordinacin de trminos
se producira en el momento de la recuperacin, integrando en la busca 2 o ms de estas
autoridades (en este caso, personajes):
Ir a Cerca avanada y pedir:
Matria: Monturiol, Narcs
And
Matria: Ventura, Pep

5)Combinatorio. Se trata de un tipo de lenguaje de estructura combinatoria


o asociativa, donde los conceptos o descriptores se organizan de manera independiente y slo se produce la combinacin o interseccin en las operaciones
de indizacin y recuperacin.
Se trata de un lenguaje en el que los trmino que lo componen se organizan
en una lista por orden alfabtico sin ningn otro tipo de estructura que site
a cada descriptor, identificador o autoridad en una cadena lgica, jerrquica
y estructurada de conceptos.

CC-BY-NC-ND PID_00143965

49

Listas de encabezamientos de materia y listas de autoridades

Ejemplo de autoridades de la CA BNE, letra A


Aaberg, Nils 1888-1957
Aaker, David A.
Aaliyah 1979-2001
Aalto, Alvar 1898-1976
Aalto, Hugo Alvar Henrik 1898-1976
Aapro, M.
Aapro, Matti
A. A. P. y G. 1745-1792
Aarnio, Aulis
Aaron 1964Aaron, Bob
Aaron, Jack
Aaron, Jane
Aaron, Javier
Aaron, Lee 1962-

11.3. Indizar con una lista de autoridades


Indizar con una lista de autoridades es parecido a indizar con una lista de encabezamientos de materia: hay que consultar las listas y saber usar las referencias que nos vinculan un trmino no aceptado con el aceptado.
Pero a diferencia de las LEM, al ser un lenguaje analtico y postcoordinado,
nos permite indizar ms de una autoridad por documento.
Cuando la autoridad se combina con un encabezamiento de materia, tenemos
que leer las notas de aplicacin que nos indicarn si podemos hacer el encabezamiento.
Ejemplo
Supongamos un documento sobre las diversas pelculas que se han hecho sobre El retrato
de Dorian Gray, la obra de Oscar Wilde. Para indizar este documento consultaremos dos
listados:
1) Uno de encabezamientos de materias para el concepto pelculas sobre obras literarias.
En LEMAC sera el encabezamiento Adaptaciones cinematogrficas.
2) Uno de ttulos uniformes para la obra Retrato de Dorian Gray. En CA BNE es The
picture of Dorian Gray.
Dado que Adaptacions cinematogrfiques lleva una nota de alcance que dice que hay que
combinarlo detrs del nombre de un autor u obra, haremos el siguiente encabezamiento:
The picture of Dorian Gray - Adaptaciones cinematogrficas

Como lenguaje controlado, las listas de autoridades tienen ventajas e inconvenientes en la indizacin y en la recuperacin.
1)Enlaindizacin
a)Ventajas:

CC-BY-NC-ND PID_00143965

50

Listas de encabezamientos de materia y listas de autoridades

Son listados finitos, controlados y elaborados a priori. En principio, cada


nombre se expresa con un nico descriptor; se bsqueda eliminar la ambigedad presente en el lenguaje natural. Es unvoco.

Se trata de un lenguaje natural, no codificado, de dominio comn y constituido por elementos lxicos del lenguaje usual.

Permite un elevado grado de especializacin y, por lo tanto, de especificidad en la indizacin.

b)Inconvenientes:

El analista tiene que traducir del lenguaje natural al lenguaje documental.

Ms caro econmica y humanamente de construccin y mantenimiento


que un listado de palabras clave y que un listado de descriptores libres.

Limitado al vocabulario recogido en el lenguaje.

Hace falta haber creado este lenguaje antes de empezar la indizacin.

2)Enlarecuperacin
a)Ventajas:

La postcoordinacin permite utilizar ms de un trmino de acceso al documento, facilitando as esa tarea.

Es unvoco.

Las estrategias de bsqueda suelen ser muy simples.

b)Inconvenientes:

Se pueden dar casos de falsa coordinacin.

El grado de actualizacin del vocabulario es limitado.

CC-BY-NC-ND PID_00143965

51

Listas de encabezamientos de materia y listas de autoridades

Actividades
Proponemos las siguientes actividades para practicar los conocimientos de este mdulo:
1. Crea el encabezamiento para los documentos siguientes con las listas de encabezamientos
de materia y autoridades de la Biblioteca de Catalua, de la Biblioteca Nacional de Espaa
o del CSIC.
a) Abecedario griego.
b) Aire acondicionado de los coches.
c) Antologa de poesa siciliana.
d) Argot ruso.
e) Becas de estudios para aprender italiano.
f) Bibliografa sobre judos sefardes.
g) Bibliografa sobre gobierno municipal.
h) Bosques de la URSS.
i) Ciclmenes.
j) Congresos sobre reas suburbanas.
k) Conservacin del papel.
l) Contaminacin ambiental por nquel.
m) Declinaciones latinas.
n) Documento sobre becas de investigacin sobre los efectos fisiolgicos del alcohol.
o) Documento sobre el Siglo de Oro de la literatura espaola.
p) Documento sobre la obra de Garca Lorca La casa de Bernarda Alba
q) Enseanza del latn en las universidades.
r) Ikebana.
s) Novelas de Paul Auster.
t) Prediccin de la suerte en el siglo XX.

Reflexin
Las soluciones de las actividades se tratarn en el tabln de
la asignatura.

CC-BY-NC-ND PID_00143965

52

Listas de encabezamientos de materia y listas de autoridades

Glosario
AM BNE f Acrnimo usado en este material para las Autoridades de materia de la Biblioteca
Nacional de Espaa.
AM CSIC f Acrnimo usado en este material para las Autoridades de materia de la red de
bibliotecas del CSIC.
autoridad de materia f Ved encabezamiento.
autoridades f Formas normalizadas de las entradas de un catlogo bibliogrfico o inventario de archivo para: nombres propios, ttulos, nombres propios y ttulos, materias, entidades, nombres geogrficos.
BT Ingls. Siglas de Broad term, usadas en LEM y tesauros, para designar los trminos genricos en la relacin de jerarqua. Equivalencias en otras lenguas: cataln TA, castellano TG.
Ved tambin relacin de jerarqua.
CA BNE m Acrnimo de Catlogo de autoridades de la Biblioteca Nacional de Espaa.
CA CSIC f Acrnimo de Catlogo de autoridades de la red de bibliotecas del CSIC.
CANTIC m Catlogo de autoridades cooperativo iniciado en el ao 2007 que se realiza en el
Catlogo Colectivo de las Universidades de Catalua (CCUC) y est liderado por la Biblioteca
de Catalua.
Cutter, Charles Ammi m Bibliotecario jefe del Ateneo de Boston. Autor de las Rules for
a printed dictionary catalogue donde se exponen por primera vez las reglas para encontrar e
indizar un documento segn su temtica usando encabezamientos de materia. Cutter elabor los principios que rigen las LEM como el principio de especificidad y el de entrada directa, todos ellos vigentes en la actualidad. Tambin formul el principio de economa, las
referencias entre trminos aceptados y no aceptados, ya sean sinnimos u homnimos, los
encabezamientos simples y compuestos, los signos de puntuacin, la sintaxis a la hora de
construir encabezamientos compuestos etc.
EM Cataln. Siglas de EMPREU usadas en LEM y tesauros para designar la relacin de equivalencia entre un trmino no aceptado y otro aceptado. Equivalencias en otras lenguas: castellano USE, ingls USE.
Ved tambin relacin de equivalencia.
EM BUS Acrnimo de Encabezamientos de materia de la Universidad de Sevilla.
encabezamiento m Cada una de las entradas o autoridades de una lista de encabezamientos de materia. Trmino de indizacin propio del lenguaje documental LEM. Palabras o frases
especficas que describen la materia y representan conceptos. Estn redactados en lenguaje
natural pero son trminos controlados, es decir, han controlado la ambigedad derivada de
la sinonimia y homonimia.
encabezamientos compuestos m Conceptos expresados con ms de una palabra.
encabezamientos simples m Conceptos expresados con una sola palabra, generalmente
un sustantivo, aunque tambin pueden ser adjetivos, verbos sustantivados o nombres geogrficos. Tanto pueden ser trminos en singular como en plural.
EP Cataln. Siglas de EMPRAT PER usadas en LEM y tesauros para designar la relacin de
equivalencia entre un trmino aceptado y otro no aceptado. Equivalencias en otras lenguas:
castellano USADO POR, ingls USE FOR.
Ved tambin relacin de equivalencia.
fichero de autoridades m Fichero que recoge todos los registros de autoridades. Si este
fichero se encuentra vinculado al catlogo bibliogrfico, se conoce como catlogo de autoridades.
ISAAR(CPF) f Norma para la elaboracin de autoridades en archivos. Norma internacional
sobre los registros de autoridad de archivos relativos a instituciones, personas y familias del Consejo
internacional de archivos.
LC Authorities f Acrnimo de Library of Congress Authorities.
LCSH Acrnimo de Library of Congress Subject Headings.

CC-BY-NC-ND PID_00143965

53

Listas de encabezamientos de materia y listas de autoridades

LEMAC f Acrnimo de Lista de encabezamientos de materia en cataln.


LEM BP f Acrnimo de la Lista de encabezamientos de materia para bibliotecas publicas.
LENOTI f Acrnimo de la Lista de encabezamientos de nombres y ttulos de la Biblioteca
Nacional de Catalua.
lista de autoridades m Lenguaje documental controlado que recoge ordenados alfabticamente todos los registros de autoridades presentes en el catlogo o base de datos bibliogrfica de la unidad de informacin. Es una lista de frases uniformes que se usan para indizar
el autor y el ttulo del documento. Es un lenguaje analtico, natural, controlado, postcoordinado y combinatorio.
lista de encabezamientos de materia f Lenguaje documental controlado que recoge
ordenadas alfabticamente todas las materias o temas susceptibles de representar el contenido de un fondo documental. Es una lista, un lxico de palabras y frases uniformes que se
usan para indizar la materia del documento. Es un lenguaje sinttico, natural, controlado,
precoordinado y combinatorio.
NT Ingls. Siglas de Narrow Term, usadas en LEM y tesauros para designar los trminos
especficos en la relacin de jerarqua. Equivalencias en otras lenguas: cataln TE, castellano
TE. Ved tambin relacin de jerarqua.
obras de referencia f Fuentes de informacin que se usan como material de consulta, para obtener una informacin breve, rpida y exacta. En el contexto de los lenguajes documentales se consultan cuando un concepto no est representado en la lista de encabezamientos
y hay que incorporarlo de nuevo. Son obras de referencia otras listas de encabezamientos,
diccionarios y enciclopedias (considerados como autoridad dentro del dominio en cuestin),
organismos normalizadores, tesauros, sistema de clasificacin y especialistas en el tema.
principio de consistencia m Principio de construccin por el cual los encabezamientos
nuevos que se incorporen a una LEM tienen que mantener la coherencia con los existentes,
en la forma y estructura sintctica.
principio de denominacin m Principio de construccin por el cual los nombres propios, de persona y de lugar tienen que mantener tambin la coherencia con los ya existentes.
principio de economa m Principio de aplicacin que recomienda sintetizar el contenido
del documento en uno, dos o tres encabezamientos.
principio de encabezamiento uniforme m Principio de construccin por el cual cada
materia tiene que ser representada siempre con un nico encabezamiento y cada encabezamiento tiene que representar una nica materia.
principio de especificidad m Principio de aplicacin que recomienda indizar con el
encabezamiento ms especfico que encontremos. La especificidad est relacionada con la
exactitud con que el encabezamiento describe el contenido.
principio del usuario m Principio de construccin por el cual el vocabulario de las LEM
se tiene que adecuar al usuario al que va destinada la lista. El lenguaje utilizado en los encabezamientos tiene que reflejar las caractersticas de los usuarios. Las expresiones especficas
o muy acadmicas se reservan para listas especializadas.
principio lingstico m Principio de construccin por el cual los trminos de la lista
tienen que estar en el idioma del catlogo.
principio de semntica m Principio de construccin por el cual los encabezamientos
se organizan en una estructura semntica, es decir, en relaciones de equivalencia, jerarqua
y asociacin.
principio de sinonimia y principio de homonimia m Principio de construccin por
el cual se controlan la sinonimia y la homonimia propias del lenguaje natural. Las LEM controlan los sinnimos mediante la referencia de Empreu o Use. Las LEM controlan los polismicos y homnimos de diversas maneras: adjetivando, poniendo parntesis con el nombre
de la disciplina, haciendo frases, jugando con el singular y el plural, etc.
principio de sintaxis m Principio de construccin por el cual las LEM establecen las
reglas de combinacin de los encabezamientos con los subencabezamientos.
RAMEAU m Acrnimo de Rpertoire dautorit matire encyclopdique et alphabtique
unifi.

CC-BY-NC-ND PID_00143965

54

Listas de encabezamientos de materia y listas de autoridades

registro de autoridad m Descripcin de cada autoridad. Registro que anota la forma


aceptada, los trminos no seleccionados, notas de aplicacin, relaciones semnticas si es
necesario y la fuente en la que se ha basado.
regla de las siglas f Regla de control del vocabulario por la cual se prefiere la expresin
completa a las siglas o acrnimos de un concepto o entidad.
regla del singular/plural f Regla de control del vocabulario. No hay una normativa
clara para el uso del singular/plural. Algunos autores apuntan que el plural se usa para temas
concretos y contables (enciclopedias, museos) y el singular para temas abstractos e incontables (belleza, positivismo, etc.).
regla de los signos de puntuacin f Regla de control del vocabulario. Las LEM utilizan
diversos signos y entre ellas no hay una unidad de criterio, por lo tanto se hace necesario
consultar las introducciones y manuales adjuntos a cada lista.
regla de maysculas/minsculas f Regla de control del vocabulario por la cual se recomienda que la primera palabra del encabezamiento, del subencabezamiento, del encabezamiento cambiado y la que va dentro de parntesis comience por mayscula.
relacin asociativa f Relacin semntica que pone en contacto dos trminos o ms que
por cuestiones de significado se evocan uno a otro. No pertenecen a la misma secuencia
jerrquica pero estn relacionados. Mentalmente los asociamos. La relacin es simtrica y
por consiguiente recproca. Las funciones de las relaciones de asociacin son sobre todo de
ayuda en la recuperacin, ya que asocian otros conceptos al encabezamiento de partida que
pueden ser muy interesantes en la bsqueda.
relacin de equivalencia f Relacin semntica que une los trminos aceptados con los
no aceptados. La funcin de estas relaciones es hacer de puente entre las palabras utilizadas
en lenguaje natural y las utilizadas en un lenguaje controlado, tanto en la indizacin como
en la recuperacin. En la indizacin este puente permite mantener la coherencia y la univocidad en los indizadores y en la recuperacin permite a los usuarios recuperar mejor los
documentos, ya que no se produce silencio ni ruido documental. No es posible recuperar por
un trmino no aceptado, ya que el mismo programa que mantiene la lista har la remisin
al trmino aceptado gracias a estas referencias. Toman la forma de EMPREU/USE.
relacin de jerarqua f Relacin semntica que dispone los encabezamientos en una
secuencia lgica de trminos genricos (ms grande que) y especficos (menor que). Las relaciones de jerarqua son tiles en la indizacin porque muestran otras trminos por encima y
por debajo del encabezamiento que estamos consultando, ayudando al analista a indizar con
el trmino ms especfico que convenga. En la recuperacin son tiles porque los trminos
genricos y especficos enriquecen la busca.
RT Ingls. Siglas de Related Term, usadas en LEM y tesauros para designar la relacin de
asociacin entre dos encabezamientos. Equivalencias en otras lenguas: cataln TR, castellano
TR. Ved tambin relacin de asociacin.
RVM m Acrnimo de Rpertoire de vedettes-matire de la Universidad de Laval.
subencabezamientos m pl Palabras que van detrs de un encabezamiento a efectos de
matizar y precisar el significado. Son encabezamientos situados detrs de otro encabezamiento. Hay 4 tipos de subencabezamientos: los de materia, los geogrficos, los cronolgicos y
los de forma.
subencabezamientos de forma m pl Subencabezamientos que se usan para representar
la forma en que se presenta el documento, son formas del tipo enciclopedias, estadsticas,
anuarios, biografas, etc.
subencabezamientos de lugar m pl Subencabezamientos que se usan para representar
nombres de lugares geogrficos y precisar el encabezamiento principal.
subencabezamientos de materia m pl Subencabezamientos que se usan para precisar
el contenido del encabezamiento principal y para representar la forma en que se presenta el
contenido o el punto de vista.
Subencabezamientos de tiempo m Subencabezamientos que se usan para representar
periodos, fechas concretas, siglos.
TA Cataln. Siglas de terme ampli, usadas en LEM y tesauros para designar los trminos
genricos en la relacin de jerarqua. Equivalencias en otras lenguas: castellano TG, ingls
BT. Ved tambin relacin de jerarqua.

CC-BY-NC-ND PID_00143965

55

Listas de encabezamientos de materia y listas de autoridades

TE Cataln y castellano. Siglas de terme especfic / trmino especfico, usadas en LEM y tesauros para designar los trminos especficos en la relacin de jerarqua. Equivalencias en otras
lenguas: ingls NT.
Ved tambin relacin de jerarqua.
trminos aceptados m pl Encabezamientos que se pueden utilizar para indizar. Acostumbran a ir en negrita.
trminos especficos m pl Encabezamientos que conceptualmente son ms concretos y
especficos que el encabezamiento aceptado que estamos consultando. En la cadena jerrquica se encuentran situados por debajo del encabezamiento.
trminos genricos m pl Encabezamientos que conceptualmente son ms amplios que el
encabezamiento aceptado que estamos consultando. En la cadena jerrquica se encuentran
situados por encima del encabezamiento.
trminos no aceptados m pl Trminos no admitidos para indizar. Son sinnimos, siglas,
trminos demasiado especializados, barbarismos, formas incorrectas, etc. Su funcin es controlar todas las posibles variantes y ofrecer una forma de encabezamiento nica para indizar
que ser el trmino aceptado.
TG Castellano. Siglas de Trmino genrico, usadas en LEM y tesauros para designar los trminos genricos en la relacin de jerarqua. Equivalencias en otras lenguas: cataln TA, ingls BT.
Ved tambin relacin de jerarqua.
ttulo uniforme m Ttulo ficticio dado por el analista para agrupar todas las entradas en
un catlogo de una obra. El ttulo uniforme se crea para controlar las diferentes ediciones,
traducciones, etc.
TR Cataln y castellano. Siglas de terme relacionat / trmino relacionado, usadas en LEM y
tesauros para designar la relacin de asociacin entre dos encabezamientos. Equivalencias
en otras lenguas: ingls RT.
Ved tambin relacin de asociacin.
UF Ingls. Siglas de USE FOR, usadas en LEM y tesauros para designar la relacin de equivalencia entre un trmino aceptado y otro no aceptado. Equivalencias en otras lenguas: cataln
EMPRAT PER, castellano USADO POR.
Ved tambin relacin de equivalencia
UP Castellano. Siglas de USADO POR, usadas en LEM y tesauros para designar la relacin de
equivalencia entre un trmino aceptado y otro no aceptado. Equivalencias en otras lenguas:
cataln EMPRAT PER, ingls USE FOR. Ved tambin relacin de equivalencia.
USE Castellano e Ingls. Instruccin USE (o sese) utilizadas en LEM y tesauros para designar
la relacin de equivalencia entre un trmino no aceptado y uno aceptado. Equivalencias en
otras lenguas: cataln EMPREU. Ved tambin relacin de equivalencia.
v Smbolo usado en las LEM, antes de la adopcin internacional de las siglas de tesauros, para
hacer la relacin de equivalencia entre un trmino no aceptado y otro aceptado. Actualmente
equivale a EMPREU/USE/USE. Ved tambin relacin de equivalencia.
Vt Smbolo usado en las LEM, antes de la adopcin internacional de las siglas de tesauros,
para designar los trminos especficos. Actualmente equivale a TE/TE/NT. Ved tambin relacin de jerarqua.
x Smbolo usado en las LEM, antes de la adopcin internacional de las siglas de tesauros,
para designar los trminos no aceptados. Actualmente equivale a EMPREU PER / USAR POR
/ USE FOR. Ved tambin relacin de equivalencia.
Xx Smbolo usado en las LEM, antes de la adopcin internacional de las siglas de tesauros,
para designar los trminos genricos. Actualmente equivale a TA/TG/BT. Ved tambin relacin de jerarqua.

CC-BY-NC-ND PID_00143965

56

Listas de encabezamientos de materia y listas de autoridades

Bibliografa
Biblioteca de Catalunya. Llista dencapalaments de matria en catal [disponible en lnea
(consulta 01-09-2009)].
http://www.bnc.cat/lemac/principis
Caro, C.; Travieso, C. Encabezamientos de materia en las bibliotecas espaolas: perspectiva histrica y situacin actual. En: Tendencias de investigacin en organizacin del conocimiento.
Concrecions a les AACR2 (Part II, encabezamientos, ttulos uniformes, referencies) (2002). Recopiladas por el Grup de Treball para las Concrecions a les AACR2 con la coordinacin del Servei de Normalitzaci Bibliogrfica. Barcelona: Biblioteca de Catalunya. (Actualizaci 2003.)
Chan, Louis Mai (1978). Library of Congress: Subject Headings: principles and application. Littleton, Colorado: Libraries Unlimited.
Gil Leiva, I. (2008). Manual de indizacin. Teora y prctica. Gijn: Trea.
Gil Urdiciain, B. (2004). Manual de lenguajes documentales. Gijn: Trea.
Informe per a la creaci de la llista dautoritats de Catalunya de noms i ttols: requeriments i funcionalitats (Octubre de 2003). Redactado por la Subcomissi Tcnica per a lElaboraci dels
Requeriments i Funcionalitats de la Llista dAutoritats de Catalunya per a la Comissi Assessora de Catalogaci.
MARC 21 concise authority format (2002). Washington, D.C.: Library of Congress.
Regles Angloamericanes de Catalogaci (1996). Barcelona, Biblioteca de Catalunya: Eumo.
Universidad de Laval (2005). Rpertoire des vedettes-matire. [S.L]: Universidad de Laval.
Biblioteca Universitaria.

Los tesauros
Damin Martnez Ferreras
PID_00143963

CC-BY-NC-ND PID_00143963

Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es

Los tesauros

Los tesauros

CC-BY-NC-ND PID_00143963

ndice

Objetivos.......................................................................................................

1.

El tesauro.............................................................................................

2.

Estructura del tesauro......................................................................

2.1.

Unidades lxicas ..........................................................................

2.2.

Relaciones semnticas .................................................................

10

2.3.

Notas y aclaraciones ...................................................................

13

Formas de presentacin del tesauro.............................................

15

3.1.

Presentacin alfabtica ................................................................

15

3.2.

Presentacin sistemtica .............................................................

16

3.3.

Presentacin grfica ....................................................................

17

3.4.

Presentacin con ndices permutados ........................................

19

Creacin y utilizacin de un tesauro...........................................

22

4.1.

Creacin de un tesauro ...............................................................

22

4.2.

Utilizacin de un tesauro ...........................................................

27

3.

4.

4.2.1.
4.2.2.
5.

Uso del tesauro en los procesos de indizacin y


recuperacin de la informacin ....................................

28

Revisin y actualizacin del tesauro .............................

29

Sistemas automatizados de gestin de tesauros. Tesauros


en lnea.................................................................................................

31

5.1.

Sistemas automatizados de gestin de tesauros ..........................

31

5.2.

Los tesauros en el mundo digital. Tesauros en lnea ..................

32

Tesauros y ontologas........................................................................

34

6.1.

Los tesauros .................................................................................

34

6.2.

Las ontologas .............................................................................

35

6.3.

Similitudes y diferencias entre tesauros y ontologas .................

37

Bibliografa.................................................................................................

39

6.

CC-BY-NC-ND PID_00143963

Objetivos

Con el estudio de los materiales asociados a este mdulo didctico alcanzaris


los siguientes objetivos:

1. Saber qu es un tesauro, conocer su estructura y los principales elementos que lo componen y definen: construccin, mantenimiento, tipologas,
formas de representacin y usos del tesauro.
2. Analizar el papel de los tesauros en el proceso de indizacin y recuperacin de la informacin y su importancia en los sistemas documentales especializados.
3. Conocer el proceso de creacin de un tesauro y elaborar un microtesauro.
4. Entender la funcin del tesauro como una herramienta especfica que hace
posible el objetivo final de la cadena documental, esto es, la recuperacin
y difusin de la informacin.

Los tesauros

CC-BY-NC-ND PID_00143963

1. El tesauro

Etimolgicamente, el trmino proviene del latn thesaurus, cuyo significado es


tesoro y que poco tiene que ver con el concepto que tiene hoy para el profesional de la informacin.
La norma ISO 2788-1986 define un tesauro como:
Un vocabulario controlado y dinmico, compuesto por trminos que tienen entre ellos
relaciones semnticas y genricas y que se aplica a un dominio particular del conocimiento.
Por su parte, van Slype (1991) define un tesauro como:
Una lista estructurada de conceptos destinados a representar de manera unvoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado y a ayudar al usuario en la indizacin de los documentos y de las consultas.

Podramos definir un tesauro como una lista de trminos empleados para representar los conceptos, temas o contenidos de los documentos y que guardan entre s relaciones semnticas y genricas. Se trata de un instrumento de
normalizacin y control del vocabulario cuyo objetivo reside en eliminar la
ambigedad del lenguaje, convirtiendo el lenguaje natural de los documentos
en un lenguaje controlado.

Estaramos hablando del tesauro como un vocabulariocontroladode


descriptores con un significado previamente establecido y cuyo fin ltimo sera el de definir de manera unvoca el contenido de un documento. El fin ltimo de este lenguaje es el de ser puente de conexin
entre los usuarios y las unidades de informacin, esto es, de servir tanto
para la indizacin como para la recuperacin documental.

A diferencia de otros lenguajes documentales, como las clasificaciones y las


listas de encabezamientos de materia, los tesauros suelen ser lenguajes especializados, hacen referencia a una temtica concreta y estn construidos para
servir a una institucin u organizacin determinada.
Frente a los lenguajes clasificatorios, cuya funcin es describir el tema de un
documento, los trminos contenidos en un tesauro responden al anlisis del
texto o a la materia del mismo. Un tesauro recoge todos los conceptos, y cada uno de ellos constituye un punto de acceso para la recuperacin del documento.

Los tesauros

CC-BY-NC-ND PID_00143963

Los tesauros

La potenciadeuntesauro radica, adems, en la posibilidad de combinar todos esos conceptos, llamados descriptores, lo que le convierte en un lenguaje
combinatorio mucho ms rico que los tradicionales encabezamientos de materias a la hora de realizar los procesos de anlisis y recuperacin de la informacin.
Las principalescaractersticas de un tesauro son las siguientes:
a) Nace por la necesidad de crear nuevos sistemas de indizacin ms flexibles
que los tradicionales.
b) Presenta mayor especificidad de los trminos relativos a campos disciplinares concretos, lo que permite un anlisis ms preciso de los documentos.
c) A partir de la ordenacin alfabtica y como complemento a la ordenacin
sistemtica de los descriptores (por temas y significado), el tesauro facilita la
consulta del analista y del usuario. Son precisamente estas relaciones semnticas que se establecen entre los descriptores (relaciones de equivalencia, de
jerarqua y de asociacin) las que definen un tesauro y proporcionan la ayuda
necesaria en los procesos de indizacin y recuperacin de informacin.
Los tesauros pueden ser de los siguientes tipos:

Generalesoespecializados, segn su campo de aplicacin.

Multidisciplinaresomonodisciplinares, segn el nmero de disciplinas

Ved tambin
Las relaciones semnticas se
estudian en el subapartado 2.2
de este mdulo didctico.

o temas que incluyen.

Macrotesauros o microtesauros, segn la naturaleza y compatibilidad


con otros tesauros. Los macrotesauros, aunque poseen las caractersticas
de un tesauro en cuanto a estructura y funcin, y al mismo tiempo, sus
diferentes campos semnticos o microdisciplinas, pueden funcionar como
si fueran tesauros independientes, con total autonoma. En este sentido, se
podra hablar de un conjunto de tesauros ms pequeos o microtesauros.

Monolingesomultilinges, segn las lenguas utilizadas.

Alfabticososistemticos, segn la presentacin utilizada para mostrar


los trminos y sus relaciones semnticas.

Ved tambin
Los tesauros alfabticos o sistemticos los trataremos en el
apartado 3 de este mdulo didctico.

CC-BY-NC-ND PID_00143963

2. Estructura del tesauro

La estructura conceptual de los tesauros no es arbitraria en ningn sentido,


puesto que existen tanto manuales de elaboracin de tesauros como normas
internacionales que recomiendan los elementos estructurales a tener en cuenta. La consulta tanto de manuales como de normas con relacin a la construccin de tesauros nos lleva a una estructura conceptual que implica relaciones
semnticas y en la que se tienen en cuenta los trminos como representaciones lxicas de los conceptos.
En consecuencia, podemos basar la estructura de un tesauro en los siguientes
elementos: unidades lxicas, relaciones semnticas y notas y aclaraciones.
2.1. Unidades lxicas

Las unidadeslxicas son grupos de descriptores que agrupan los trminos de indizacin bien por campos (temas), bien por clases de trminos
(facetas).

En los tesauros, los descriptores representan conceptos o nociones que pueden ser concretos, abstractos, entidades individuales o clases. Para expresar los
conceptos, los tesauros contienen unidades lxicas llamadas descriptores y no
descriptores.
1)Descriptores: trminos permitidos. Un descriptor es una palabra o conjunto
de palabras del lenguaje natural que responden a un concepto, expresado con
un nico trmino y ese trmino responde a un nico concepto. Esta univocidad se consigue seleccionando el descriptor entre sus sinnimos y estableciendo una red de relaciones semnticas con el resto de descriptores del tesauro.
Dicho trmino ser utilizado para el anlisis y la recuperacin del documento.
Los descriptores pueden ser:
a)Trminossimples: se emplean cuando el concepto es claro en s mismo,
sin necesidad de aadir ninguna otra palabra, o cuando se usa como genrico
de trminos ms concretos o especficos, como, por ejemplo, Coches.
b)Trminoscompuestos: la mayora de los trminos de un tesauro adquieren
su verdadero sentido cuando se convierten en trminos compuestos, ya que
as se logra una mayor especificidad. La estructura sintctica de los trminos
compuestos suele ser la siguiente:

Sustantivo + adjetivo: Coches deportivos.

Los tesauros

CC-BY-NC-ND PID_00143963

10

Sustantivo + sintagma preposicional: Coches de poca.

Sustantivo + sintagma aposicional: Coches F1.

2)Nodescriptores: trminos prohibidos. Palabras incluidas en el tesauro, que


pertenecen a una lista de sinnimos y trminos emparentados unidos a los
descriptores por una relacin de equivalencia semntica, que son susceptibles
de aparecer en los documentos o en las preguntas, pero que no son utilizados
para formular la interrogacin al sistema. La inclusin de estos en un tesauro
tiene como finalidad mejorar la coherencia de la representacin de los documentos o de una pregunta al enviarnos al trmino de indizacin.
Cuando un mismo concepto se puede expresar mediante dos o ms sinnimos,
uno de ellos tiene que seleccionarse como trmino preferente o descriptor. Los
dems pasan a ser no descriptores.
Ejemplo
"Coche" (no descriptor)
USE "Automvil" (descriptor)

Si buscamos informacin de ventas de coches, caeremos en lo que se denomina silenciodocumental, ya que habr documentos que hablen sobre este
tema pero que estn indizados utilizando la palabra Automvil. Asimismo,
si buscamos slo por la palabra Automvil, nos aparecern exclusivamente
documentos que contengan esta palabra, y no, la palabra Coche.
Este problema se hubiera evitado si en el tesauro hubiera figurado la relacin
arriba expresada y, en consecuencia, tanto a la hora de indicar un documento sobre ventas de coches como a la hora de buscar informacin sobre este
tema, no hubiramos tenido otra opcin que utilizar el trmino pertinente o
descriptor, esto es, el trmino Automvil.

En consecuencia, podemos decir que los no descriptores forman parte


del tesauro estableciendo una relacin de equivalencia con el descriptor
pertinente, pero no cuentan ni para la indizacin ni para la recuperacin documental. Gracias a los no descriptores, descartamos todo aquello que podemos denominar accidentes del lenguaje natural, con el fin
de no retener ms que un trmino referencial.

2.2. Relaciones semnticas


Los campos semnticos agrupan aquellos descriptores adscritos al mismo mbito de conocimiento del tesauro y esta agrupacin se realiza por medio de
una relacin de pertenencia a dichos campos o microdisciplinas. Estas no se

Los tesauros

11

CC-BY-NC-ND PID_00143963

pueden utilizar como descriptores, esto es, no intervienen en la indizacin y


recuperacin de los documentos, y slo sirven para agrupar a los descriptores
afines a su temtica.

En cuanto a las relacionessemnticas propiamente dichas, son todas


aquellas relaciones que se establecen entre los trminos de un tesauro y
tienen como objetivo principal especificar el significado de un descriptor asignndolo a un campo semntico o microdisciplina determinada.

Las relaciones semnticas establecidas en los tesauros son de cuatro tipos: de


pertenencia, de equivalencia, de jerarqua y de asociacin. A continuacin
veremos una descripcin de cada una de ellas y recomendamos recurrir a los
manuales y a las normas citadas en la bibliografa para una definicin ms
detallada:
1)Relacionesdepertenencia: se establecen entre un descriptor y el campo
semntico al que pertenece.

Notacin
No existen siglas o abreviaturas normalizadas para expresar la relacin
de pertenencia.

2)Relacionesdeequivalencia: la equivalencia semntica entre descriptores


se aplica a los sinnimos, trminos que poseen significados iguales en diferentes contextos, y a los cuasi-sinnimos, trminos considerados de significado
diferente en el uso comn pero tratados como si fueran sinnimos en materia
de indizacin.

Notacin
Las relaciones de equivalencia se suelen representar mediante el trmino USE (relacin entre el trmino no preferente y el trmino preferente, o trmino a usar ms aceptado) y las siglas UP (Usado por), que en
ingls son USE y UF.

Notacin usada en las relaciones de equivalencia


Cataln

Castellano

Ingls

Use

EM

USE

USE

Usadopor

EP

UP

UF

Los tesauros

12

CC-BY-NC-ND PID_00143963

Descriptor

Los tesauros

Nodescriptor

Automvil

coche

UP coche

USE Automvil

Se consigue as evitar la ambigedad terminolgica de la sinonimia del lenguaje natural expresada en varios trminos para referirse a un mismo concepto.
3)Relacionesdejerarqua: son las relaciones que se establecen entre los descriptores. En una relacin de jerarqua, un trmino es superior o genrico de
otro y este otro trmino es inferior o especfico del anterior. Esta estructura
clasificatoria distingue al tesauro de las listas alfabticas de materias o palabras
clave, as como de diccionarios y lxicos. De esta forma se crean campos conceptuales que clasifican los trminos y los agrupan en un campo delimitado
de significados o facetas que se van agrupando en disciplinas y sub-disciplinas.

Notacin
Para la presentacin de las relaciones jerrquicas se suelen utilizar determinadas siglas como TG (trmino genrico) y TE (trmino especfico); o
por su siglas en ingls, BT (broad term o trmino ms amplio), NT (narrow
term o trmino ms especfico).

Notacin usada en las relaciones de jerarqua


Castellano

Ingls

Cataln

Trminogenrico

TG

BT

TA (trmino amplio)

Trminoespecfico

TE

NT

TE

Descriptor

Descriptor

Productoslcteos

Yogur

TE yogur

TG Productos lcteos

Las relaciones de jerarqua constituyen el rasgo ms caracterstico de los tesauros y proporcionan una ayuda importantsima al usuario en los procesos de
indizacin y recuperacin documental.
4)Relacionesdeasociacin: son las relaciones asimtricas establecidas entre
descriptores de distintas familias, distintas a las jerrquicas o de equivalencia,
y que designan conceptos capaces de evocar mutuamente, por asociacin de
ideas, relaciones entre ellos.

13

CC-BY-NC-ND PID_00143963

Notacin
Este tipo de relacin se suele representar mediante las siglas TR (Trmino
Relacionado) o en ingls RT (Related Term).

Notacin usada en las relaciones de asociacin


Castellano

Ingls

Cataln

TR

RT

TR

Trminorelacionado

Descriptor

Descriptor

Cargosmunicipales

AdministracinCentral

TR Administracin Central

TR Cargos municipales

La mayora de las relaciones asociativas se establecen entre trminos que comparten alguna caracterstica comn pero que pertenecen a campos semnticos
diferentes.
Ayudan al usuario en las tareas de indizacin y recuperacin documental puesto que proporcionan nuevos descriptores relacionados que facilitan la formulacin de dichas tareas.
2.3. Notas y aclaraciones
Cuando el significado de un descriptor es difuso o no est bien precisado por
su contexto semntico o lxico, se puede aadir una explicacin adicional
relacionada con el descriptor, de forma que no se produzca ambigedad dentro
del tesauro.
Estas explicaciones pueden ser notas (explicativas, histricas o de aplicacin)
o modificadores:
1)Notas. Utilizan como notacin NA:
Ejemplo
INSTALACIONES DEPORTIVAS
NA sese este trmino para referirse a instalaciones de los distintos
deportes desde el punto de vista de sus caractersticas y descripcin.
Para referirse a aspectos econmicos y de gestin sese el EQUIPAMIENTOS DEPORTIVOS

2)Modificadores. Aaden la explicacin entre parntesis para evitar la ambigedad.

Los tesauros

CC-BY-NC-ND PID_00143963

Ejemplo
Juegos Olmpicos (Invierno).

14

Los tesauros

CC-BY-NC-ND PID_00143963

15

Los tesauros

3. Formas de presentacin del tesauro

Existen diferentes formas de presentar los trminos que componen un tesauro


y las relaciones que se establecen entre esos trminos dentro del tesauro. Los
principales tipos de presentaciones son los siguientes: alfabtica, sistemtica,
grfica y con ndices permutados.
3.1. Presentacin alfabtica
En la presentacin alfabtica todos los trminos del tesauro, descriptores y
no descriptores, se encuentran agrupados en una sola secuencia alfabtica,
acompaados de sus relaciones. Se utiliza principalmente en el momento de
la indizacin de los documentos ya que un simple vistazo al listado alfabtico
nos permite identificar los descriptores pertinentes.
En la presentacin alfabtica, las informaciones asociadas a cada descriptor
(informaciones que especifican las relaciones semnticas del tesauro) van precedidas de sus respectivas abreviaturas o notaciones de la siguiente manera:
Informacin asociada y descriptores usados en la presentacin alfabtica
Descriptor

Informacinasociada

DOM

Campo semntico o microdisciplina a la que pertenece el descriptor (relacin de pertenencia)

NA

Nota de aclaracin para evitar la ambigedad del trmino

UP

Usado por. El trmino preferente o descriptor hace una referencia al no descriptor o trmino no preferente (relacin de equivalencia)

USE

El trmino no preferente o no descriptor hace referencia al descriptor (relacin de equivalencia)

TC

Trmino cabecera. No es de uso obligatorio (relacin de jerarqua)

TG

Trmino genrico que hace referencia al trmino al cual pertenece el descriptor en cuestin (relacin de jerarqua)

TE

Trmino especfico que hace referencia al trmino que se incluye dentro del trmino en cuestin (relacin de jerarqua)

TR

Trmino relacionado que hace referencia al trmino que tiene relacin con el descriptor que nos ocupa, pero
que no pertenece al mismo grupo del descriptor analizado (relacin de asociacin)

16

CC-BY-NC-ND PID_00143963

Los tesauros

Ejemplo
Bebidas espirituosas
DOM Industrias
NA Se consideran bebidas espirituosas aquellas bebidas, exceptuando
los vinos tradicionales y la cerveza, con contenido alcohlico
procedentes de la destilacin de materias primas agrcolas.
UP Licores y aguardientes
TC Industria alimentaria
TG Industria vincola
TE Brandy
Ginebra
Ron
Vodka
Whisky
TR Alcoholismo

En cuanto a las otras lenguas, a continuacin se presenta una tabla con las
equivalencias de las notaciones:
Descriptor

Castellano

Ingls

Cataln

No es obligatorio

No es obligatorio

No es obligatorio

NA

SC

NA/NE

UP/USE

UF/USE

EP/EM

TC

TC

TT

TC

TG

TG

BT

TA

TE

TE

NT

TE

TR

TR

RT

TR

DOM
NA
UP/USE

3.2. Presentacin sistemtica


La presentacin sistemtica, tambin llamada jerrquica, muestra los descriptores agrupados por campos semnticos o microdisciplinas y, dentro de estos,
por cadenas jerrquicas, en funcin de las relaciones jerrquicas de los trminos (trmino genrico y/o especfico). En la presentacin sistemtica los ttulos de los campos semnticos encabezan la jerarqua y a continuacin aparecen por orden jerrquico el conjunto de trminos genricos y especficos.
La ordenacin de los descriptores que pertenecen al mismo campo semntico
se realiza por sangrados (una sangra a la derecha por cada nivel jerrquico)
y por una ordenacin alfabtica de los descriptores que pertenecen al mismo
nivel jerrquico y que, por tanto, pertenecen al mismo descriptor genrico.

CC-BY-NC-ND PID_00143963

17

Ejemplo
Ponemos en negrita los trminos empleados al tratar la representacin alfabtica:
Industrias
Industria alimentaria
Industria crnica
Industria conservera
Alimentos congelados
Industria del aceite
Aceite de girasol
Aceite de oliva
Industria vincola
Bebidas alcohlicas
Bebidas espirituosas
Brandy
Ginebra
Ron
Vodka
Whisky
Licores y aguardientes
Cava
Vino

3.3. Presentacin grfica


La representacin grfica permite visualizar las relaciones entre los trminos
y su estructura jerrquica de forma muy efectiva. Las relaciones se disponen
como una figura que permite al usuario asociar los trminos que se encuentran
relacionados.
Sin embargo, necesitan ir acompaadas de un ndice alfabtico, ya que es muy
difcil representar aquellas relaciones que no aparecen en el grfico, como pueden ser los no descriptores o las notas aclaratorias. Se da as la circunstancia
de que la seccin auxiliar del ndice contiene ms informacin que la parte
en teora principal, lo que convierte a esta parte grfica en una presentacin
de apoyo.
Existen dos tipos de representacin grfica: la estructura arborescente y el diagrama de flechas.
1)Estructuraarborescente
Esta representacin se caracteriza por la forma de rbol, y en ella el trmino
principal se sita en una posicin destacada del grfico. A continuacin los
trminos especficos se sitan en funcin de los diferentes grados de jerarqua
que poseen.
Este tipo de presentacin slo permite visualizar las relaciones jerrquicas siendo necesario el ndice alfabtico para entender el resto de relaciones que se
dan entre los trminos (de equivalencia, asociacin y notas de aplicacin).

Los tesauros

CC-BY-NC-ND PID_00143963

18

Ejemplo
Figura 1. Ejemplo de estructura arborescente

Fuente: Norma UNE 50-UNE-50-106-90 (pg. 44).

2)Diagramadeflechas
En esta presentacin cada campo semntico aparece por separado y tiene una
forma de presentacin rectangular:

En el centro del rectngulo se encuentra el campo semntico o trmino


principal y a su alrededor gravitan los descriptores que pertenecen a dicho
campo semntico, as como las relaciones jerrquicas y asociativas que se
establecen entre ellos. Las relaciones jerrquicas se indican por medio de
flechas que van de los trminos ms genricos hacia los ms especficos
y las relaciones asociativas se fijan a travs de lneas rectas que conectan
con los descriptores relacionados.

Fuera del rectngulo se encuentran los descriptores que pertenecen a otros


campos semnticos pero que estn relacionados con los descriptores situados en el interior del rectngulo. Al igual que en el caso anterior, se utilizan flechas o lneas rectas para enlazar con los descriptores de dentro del
rectngulo.

Como ocurre con la representacin arborescente, la representacin mediante


diagrama de flechas necesita el ndice alfabtico para entender el resto de relaciones (de equivalencia, asociacin y notas de aplicacin) que se dan entre
los trminos.

Los tesauros

CC-BY-NC-ND PID_00143963

19

Figura 2. Ejemplo de diagrama de flechas

Fuente: Norma UNE 50-UNE-50-106-90 (pg. 46).

3.4. Presentacin con ndices permutados


Un ndice es una serie ordenada de puntos de acceso que nos remiten de un
trmino conocido por el usuario a los conceptos contenidos en los documentos. Su objetivo se centra, por tanto, en la recuperacin documental. La automatizacin de los sistemas documentales ha posibilitado la realizacin de
ndices ms complejos, con permutaciones de los trminos.
Los ndices permutados muestran la relacin alfabtica de todos los trminos
significativos de un tesauro mediante la agrupacin de los descriptores afines
desde el punto de vista semntico, facilitando de esta forma la recuperacin
de los descriptores compuestos independientemente de su situacin dentro
del descriptor. En definitiva, se recurre a una agrupacin de descriptores afines
desde el punto de vista semntico que en otro tipo de representacin apareceran ms distanciados.
La aplicacin de estos tipos de ndices a los descriptores de un tesauro ha generado nuevos tipos de presentaciones de sus trminos. Entre estos tipos de
ndices producidos por el ordenador, destacan los ndices KWIC, los KWOC
y los KWAC.
1)ndicesKWIC
Los ndices KWIC (key words in context) muestran una relacin de descriptores
en la cual las palabras significativas se ordenan alfabticamente en una columna central. El resto del texto se cita antes y despus de dichas palabras.
El KWIC crea el ndice de tal manera que una columna central ordenada de
forma alfabtica muestra la palabra clave con una tipografa destacada (esta
representacin se hace para todas la palabras claves del documento, es decir,

Los tesauros

CC-BY-NC-ND PID_00143963

20

se produce una permutacin de trminos para dejar siempre en la columna


central el trmino significativo). Un mismo documento aparecer representado de este modo en el sistema tantas veces como trminos indizados posea en
el ndice KWIC. La notacin del ndice es numrica.
Ejemplo de ndice KWIC

2)ndicesKWOC
En los ndices KWOC (key word out context), los descriptores se enumeran poniendo todas las palabras importantes en orden alfabtico, seguidas por el
nombre entero del descriptor.
Ejemplo de ndice KWOC

3)ndicesKWAC
El ndice KWAC (key word and context) es una mezcla del KWIC y el KWOC.

Los tesauros

CC-BY-NC-ND PID_00143963

Ejemplo de ndice KWAC

21

Los tesauros

CC-BY-NC-ND PID_00143963

22

4. Creacin y utilizacin de un tesauro

Antes de iniciar la construccin de un nuevo tesauro debemos considerar las


siguientes cuestiones:
a) Comprobar si ya existe algn tesauro sobre la temtica que nos interesa y
si dicho tesauro puede servir para nuestro sistema documental.
b) Si decidimos iniciar la construccin de uno nuevo, deberemos establecer
las caractersticas que tendr, esto es, temas que tiene que tratar, tamao del
tesauro, si ser monolinge o multilinge, tipo de relaciones entre los descriptores y otra serie de cuestiones formales relativas a la tipografa de los trminos, longitud de los mismos, cuestiones relativas a su gnero, forma, etc.
4.1. Creacin de un tesauro
La construccin del tesauro comprende ocho o nueve etapas, dependiendo de
si es monolinge o multilinge (Normas UNE-50-106 y UNE 50-125):

Recoleccin del vocabulario en lenguaje natural dentro de los dominios


que cubra el tesauro.

Subdivisin del conjunto de los dominios que se van a cubrir en una serie
de microdisciplinas.

Transformacin del vocabulario libre en un lenguaje controlado, estableciendo las relaciones de pertenencia, de equivalencia semntica, de jerarqua, y redactando las notas explicativas.

Bsqueda de las equivalencias interlingsticas (si se trata de un tesauro


multilinge).

Enriquecimiento del tesauro por medio de relaciones asociativas.

Elaboracin del borrador del tesauro.

Formacin de los indicadores.

Test del tesauro.

Revisin final y primera edicin.

1)Recoleccindelostrminos

Los tesauros

CC-BY-NC-ND PID_00143963

23

Esta fase consiste en buscar y registrar todas las palabras y expresiones significativas que intervienen en la disciplina o disciplinas cubiertas por el tesauro.
Pueden utilizarse algunas fuentesterminolgicasalternativas o complementarias:

Un lenguaje documental ya existente en el servicio de documentacin:


sistemas de clasificacin, listados de palabras clave o de descriptores libres,
listas de autoridades.

Tesauros ajenos al servicio de documentacin, pero dedicados a los mismos dominios o a dominios prximos, descubiertos gracias a alguno de
los repertorios de tesauro disponibles en el mercado. Un tesauro ya existente resulta til porque aporta una coleccin organizada de conceptos de
la que se podr extraer lo que convenga, pero rara vez se adoptar en su
totalidad para organizar el propio patrimonio informativo. En Internet se
pueden localizar multitud de tesauros disponibles para su consulta.

Terminologa utilizada en los tratados, manuales, lxicos especializados,


reglamentaciones tcnicas publicadas o especficas del organismo. Esas
fuentes tienen la gran ventaja de ofrecer una terminologa generalmente
admitida y estructurada por sus autores.

Bases de datos terminolgicas.

Indizacin intelectual, en lenguaje natural, por medio de descriptores libres, de una muestra de varios cientos de documentos representativos para
cada uno de los grandes dominios que va a cubrir el tesauro. Se obtiene de
esta manera un inventario no ordenado de la terminologa efectivamente
utilizada por los autores para designar los conceptos que ellos manejan
habitualmente, puede que en varias lenguas, si se trata de una muestra
multilinge para crear un tesauro multilinge.

Indizacin automtica, en lenguaje natural, por medio de palabras clave,


de esos mismos documentos. Este mtodo es poco eficaz porque la lista
obtenida slo incluye palabras aisladas (unitrminos), que slo en algunos
casos, cuando estn esclarecidas por su contexto, sirven para encontrar los
conceptos. Adems, aunque se utilice una gran lista de palabras vacas, el
ordenador proporciona un porcentaje extremadamente elevado de trminos sin ningn inters discriminante.

Consulta a especialistas, vinculados con el organismo al que pertenece el


sistema documental. Esta fuente es indispensable para obtener la terminologa propia de las diversas prcticas profesionales dentro del organismo,
as como una explicitacin de la acepcin especfica de ciertos trminos
para estos especialistas.

Los tesauros

CC-BY-NC-ND PID_00143963

24

2)Creacindeloscampossemnticosomicrodisciplinas
Con todo el conjunto de trminos recogidos durante la fase anterior podemos establecer un listado provisional de microsdisciplinas que completarn el
cuerpo del tesauro.
La listadelasmicrodisciplinas tiene como nica finalidad preparar un sistema de agrupacin de los descriptores que sea aceptable para el usuario y cmodo de consultar. De esta forma la lista as dispuesta ser utilizada directamente durante la siguiente etapa y se revisar continuamente a lo largo de
todo el proceso de construccin del tesauro.
3)Reduccinaunlenguajedocumental
En esta fase se establecen las relaciones entre los descriptores definidos y se
introducen las notas aclaratorias precisas:
a)Relacionesdepertenencia: lo primero que debemos conseguir es la distribucin de todos los trminos del lenguaje natural recopilados durante la
primera fase en las diferentes microdisciplinas que hemos establecido en la
segunda. De esta manera, todos los trminos quedan adscritos de forma provisional a un campo semntico o una microdisciplina.
b)Relacionesdeequivalencia: una vez que tenemos todos los descriptores
distribuidos entre las diferentes microdisciplinas, debemos examinarlas una
por una con el fin de establecer entre sus conceptos el listado de trminos
sinnimos o cuasi-sinnimos. De esta manera, empezamos a seleccionar los
trminos que pasarn a ser descriptores y los que sern no descriptores, y que
tendremos que enlazar por medio de una relacin de equivalencia semntica.
Los criterios para elegir el trmino descriptor entre sus sinnimos se deben
fundamentar en la seleccin del menos ambiguo o del ms utilizado en la profesin o por los usuarios del sistema documental. Probablemente, deberemos
consultar obras terminolgicas para asegurar la correccin de la ortografa de
estas palabras.
c)Notasexplicativas: si el trmino seleccionado como descriptor todava puede provocar alguna ambigedad dentro del tesauro, tendremos que redactar
la nota explicativa correspondiente (de definicin, histrica o de aplicacin).
d)Relacionesjerrquicas: el paso siguiente consiste en establecer las cadenas
jerrquicas entre descriptores genricos y especficos dentro de cada campo
semntico o microdisciplina.

Los tesauros

CC-BY-NC-ND PID_00143963

25

Partimos del descriptor ms genrico (trmino cabecera), y desarrollamos en


forma arborescente las diferentes ramificaciones hasta llegar a los descriptores
ms especficos. La ordenacin de los trminos dentro de un mismo nivel jerrquico puede hacerse por facetas o temas.
4)Bsquedadeequivalenciasinterlingsticas
En el caso de los tesauros multilinges, una vez que se ha fijado el contenido
semntico de los descriptores (gracias a las relaciones de pertenencia, equivalencia y jerarqua y a las notas explicativas), podemos empezar a establecer las
equivalencias lingsticas del trmino en los diferentes idiomas definidos en
los tesauros.
5)Establecimientoderelacionesdeasociacin
El paso siguiente en el proceso de construccin del tesauro es el establecimiento de las relaciones de asociacin entre los descriptores de sus diferentes campos semnticos. Es sin duda la fase ms laboriosa, ya que se debe examinar cada uno de los descriptores del tesauro con el fin de encontrar trminos afines
temticamente entre el resto de los descriptores.
Tambin se debern revisar los descriptores localizados en otros campos semnticos con los que el descriptor que se est examinando pueda tener una
relacin de asociacin. Si esto se produce, las relaciones de asociacin podrn
ser creadas as mismo entre descriptores que pertenezcan a cadenas jerrquicas
diferentes dentro de la misma disciplina.
En ningn caso se crearn relaciones asociativas:

Descriptores de la misma cadena jerrquica.

Descriptores y no descriptores.

6)Elaboracindelborradordeltesauro
La elaboracin de todo el proceso anterior dar lugar a una edicin piloto o
experimental del tesauro. Se debe procurar hacer, por lo menos, una presentacin alfabtica y otra jerrquica.
Esta edicin, o edicin 0, est destinada a la formacin de los indizadores o
analistas y a la prueba de funcionamiento del tesauro.
El ejercicio dura varios das y consiste en:

Presentar el borrador del tesauro.

Hacer que los indizadores o analistas indicen los mismos documentos.

Los tesauros

CC-BY-NC-ND PID_00143963

26

Tras la indizacin de cada documento:

Se dialoga sobre los puntos de vista adoptados por cada indizador, con el
fin de hacer que progresivamente coincidan.

Se calcula la tasa de coherencia (ratio entre el nmero de descriptores comunes y el nmero total de descriptores distintos utilizados por dos personas o dos grupos para indizar el mismo documento); al principio del
ejercicio la tasa ser escasa (entre el 20 y el 30 % segn van Slype), pero al
terminar la formacin tender hacia su valor ideal (entre el 50 y el 80 %).

7)Testdeltesauro
El test del tesauro tiene como finalidad la identificacin y resolucin de los
problemas que presenta el tesauro como herramienta para la indizacin de
un sistema documental determinado. Todas las anomalas detectadas por los
indizadores durante la indizacin de una muestra significativa de documentos
se sealan en un informe en forma de propuestas para:

Aadir descriptores y no-descriptores olvidados durante la construccin.

Modificar las estructuras jerrquica y asociativa.

Explicitar por medio de notas explicativas descriptores todava ambiguos.

Para organizar este test:


a) Se seleccionan varios cientos de documentos y, si es posible, de consultas.
b) Se hace que los documentalistas los indicen usando el nuevo tesauro.
c) Se pide a los documentalistas que preparen un informe especial en el que
aparezcan identificados los tipos de propuestas descritos ms arriba.
d) Se realiza, por ltimo, una estadstica de estas propuestas, que sern valoradas por los responsables de elaborar el tesauro.
8)Revisinfinalyprimeraedicin
Una vez que se han aadido y revisado las propuestas de los indizadores, estamos en condiciones de preparar la edicin definitiva del tesauro.
La edicin de un tesauro tiene que incluir, en forma de prefacio o introduccin, las siguientes informaciones:

Nombres de los autores y del servicio o centro responsable de la edicin.

El objetivo que se quiere alcanzar con la creacin del tesauro.

Los tesauros

CC-BY-NC-ND PID_00143963

27

El listado de las microdisciplinas que contiene.

Las fuentes terminolgicas utilizadas.

El proceso de construccin del tesauro.

Las caractersticas del tesauro: lenguas, nmero de descriptores, de no descriptores, de microdisciplinas, de trminos especficos, de trminos relacionados, etc.

Algunos ejemplos de las presentaciones del tesauro: relaciones incluidas,


abreviaturas o signos utilizados.

Instrucciones para la indizacin y la formulacin de consultas.

Informacin sobre el mantenimiento del tesauro: futuras perspectivas, uso


de sistemas automatizados, etc.

Una vez redactado el prefacio con esta informacin, podemos iniciar la impresin o edicin del tesauro.
4.2. Utilizacin de un tesauro
El tesauro es una herramienta viva y dinmica que se nutre de nuevos descriptores, gracias a la indizacin de nuevos documentos y a los cambios cualitativos que el mismo proceso de construccin genera. Por consiguiente, el
mantenimiento y la actualizacin peridica del tesauro se convierten en una
necesidad.
Se debe actualizar peridicamente, tanto para corregir errores y omisiones como para adaptarlo a la evolucin cientfica de la disciplina que abarca. El proceso de control debe seguir los siguientes pasos:
1)Controldelafrecuenciadeusodelosdescriptores
Para llevar esto a cabo, se debe confeccionar peridicamente un listado de los
descriptores con el nmero de ocurrencias, es decir, la cantidad de veces que
han sido utilizados en la indizacin de los documentos.
La elaboracin de estos listados, normalmente facilitada por el software de gestin documental, permite detectar:

Los tesauros

CC-BY-NC-ND PID_00143963

28

Descriptores que se han utilizado muy poco, lo que indica que el descriptor
es problemtico.

Descriptores que se han utilizado mucho, lo que tambin puede indicar


problemas.

2)Deteccindeausenciadedescriptores
Con el uso del tesauro en el proceso de indizacin se pueden detectar nuevos
trminos que aparecen en los documentos, pero que no estn incluidos en el
tesauro.
Generalmente, la mayora de los sistemas documentales, especialmente las bases de datos documentales, ya han previsto esta incidencia con la inclusin de
un campo denominado descriptores candidatos en la base de datos. Todos los
conceptos que no estn en el tesauro se incluyen en este campo.
Peridicamente, los responsables del tesauro elaboran un listado de estos descriptores candidatos y estudian su posible inclusin en el tesauro.
3)Problemasdeusodeltesauro
Con el uso del tesauro tambin se empiezan a detectar diferentes problemticas:

Descriptores con un significado muy prximo y que, por tanto, provocan


la duda del indizador en el momento de seleccionarlos.

Relaciones semnticas cuya ausencia se note. Por ejemplo, la de un no


descriptor que ayudara a localizar el descriptor admitido.

Divergencias entre las diferentes presentaciones del tesauro: un trmino


aparece adscrito a un campo semntico determinado en la presentacin
jerrquica, y a otro en la alfabtica.

La deteccin de estos problemas se debe llevar a cabo con la colaboracin


estrecha de los analistas, que son las personas que los encuentran durante el
anlisis del documento.
4.2.1. Uso del tesauro en los procesos de indizacin y
recuperacin de la informacin
El uso del tesauro en el proceso de indizacin de un documento tiene que ver
fundamentalmente con la traduccin de los conceptos extrados del lenguaje
natural a un lenguaje controlado, es decir, con la conversin de los trminos
del lenguaje natural en descriptores del tesauro.

Los tesauros

Descriptores poco
utilizados
Esto puede suceder, por ejemplo, porque el descriptor es
demasiado especfico, no se
entiende su significado, etc.

Descriptores demasiado
utilizados
Esto puede suceder porque el
descriptor es demasiado genrico y en consecuencia hay
que crear descriptores ms especficos, etc.

CC-BY-NC-ND PID_00143963

29

Ahora bien, al tratarse de un lenguaje documental muy flexible, a la hora de


indizar con un tesauro tenemos que seleccionar los conceptos relevantes del
documento de la manera ms precisa posible, ya que la estructura semntica
del tesauro garantiza la coherencia del significado de todos los descriptores.
Esta circunstancia influir de forma definitiva en un eficaz proceso de recuperacin de la informacin.
En este ltimo proceso, esto es, en el momento de proceder a la consulta y la
recuperacin pertinente de la informacin, el tesauro dirige al usuario a la hora
de interrogar a la base datos o sistema documental concreto puesto que traduce
el lenguaje natural del usuario y le dirige de los conceptos o descriptores no
aceptados a los descriptores aptos para proceder a una interrogacin efectiva
del sistema.
La finalidad de su estructura (relaciones de pertenencia y jerarqua) y de su
red de relaciones (relaciones de equivalencia y asociacin) permite ayudar al
usuario a construir la mejor estrategia posible en funcin de sus necesidades
de informacin, lo que facilita una alta precisin y exhaustividad en la recuperacin.
4.2.2. Revisin y actualizacin del tesauro
Despus del seguimiento del uso del tesauro y la deteccin de sus principales
problemas, es preciso iniciar su revisin y actualizacin. Conviene que esta
revisin la lleven a cabo la persona o las personas administradoras del tesauro, ya que se trata de la nica forma de garantizar el mantenimiento de su
coherencia.
La periodicidad de esta revisin depende de las caractersticas del centro y del
tesauro; puede ser semestral, anual o bianual.
Tambin es importante mantener una nota histrica en los descriptores que
han sufrido modificaciones, que incluya la fecha de la introduccin del cambio
y el descriptor que se utilizaba antes de su incorporacin o modificacin. Parte
del software de gestin de tesauros incluye entre sus prestaciones la posibilidad
de mantener esta nota histrica o fichero LOG como una informacin interna
para los administradores.
Durante este proceso de revisin se deben tomar decisiones para solucionar
los problemas que pueda presentar el tesauro:
a) Con relacin a los descriptores que se han utilizado con mucha frecuencia,
se pueden mantener tal cual o crear otros descriptores ms especficos.
b) Con relacin a los descriptores que se han utilizado con muy poca frecuencia, se pueden mantener tal cual o suprimirlos del tesauro.

Los tesauros

CC-BY-NC-ND PID_00143963

30

c) Con relacin a los descriptores candidatos, se pueden tomar las siguientes


opciones:

Si slo se han requerido en muy pocas ocasiones, no sera necesario incluirlos ya que podemos utilizar el descriptor ms genrico. Otra solucin
es incluirlos como no descriptores.

Si la peticin de los descriptores es frecuente, podemos incluirlos, estableciendo previamente las correspondientes relaciones de pertenencia, jerarqua, equivalencia y asociacin.

d) Otro problema adicional se deriva de la eliminacin de descriptores que


hacen referencia a trminos obsoletos que ya no se usan. El problema de esta operacin consiste en que si ya tenemos documentos indizados con estos
descriptores, es necesario que los volvamos a indizar, con el fin de mantener
la coherencia entre el tesauro y el sistema de consulta.

Los tesauros

CC-BY-NC-ND PID_00143963

31

5. Sistemas automatizados de gestin de tesauros.


Tesauros en lnea

5.1. Sistemas automatizados de gestin de tesauros

Los sistemas automatizados de gestin de tesauros facilitan la gestin


y edicin de un tesauro de manera automatizada, permitiendo de esta
forma reducir el tiempo y los costes a la hora de su elaboracin.

Las prestaciones de dichos sistemas son variadas en funcin del software que
se utilice, pero en lneas generales su utilizacin permite:
a) Incluir trminos y registrar automticamente las relaciones invertidas con
otros trminos del tesauro.
b) Editar diferentes presentaciones del tesauro (alfabticas, sistemticas, ndices permutados) y seleccionar el tipo de relacin que queremos visualizar en
el listado (con trminos relacionados, notas explicativas, trminos genricos,
etc. o sin ellos).
c) Utilizarse directamente en la consulta. Si el software forma parte del sistema
de gestin de la base de datos documental, puede permitir la seleccin de los
trminos desde el tesauro, la ejecucin inmediata de la bsqueda y la recuperacin de los documentos pertinentes.
d) Contar con prestaciones para los administradores del tesauro como las siguientes:

Posibilidad de mantener un fichero histrico donde se reflejen las modificaciones y los cambios que se hacen en los diferentes descriptores.

Facilidades a la hora de eliminar un descriptor del tesauro (cuando este


desaparece, se eliminan todas las relaciones que tena con el resto de los
trminos).

Elaboracin automtica de estadsticas (de frecuencia de uso de los descriptores, del nmero de relaciones existentes en el tesauro, etc.).

Existen dos grandes tiposdesistemasdegestindetesauros:

Los tesauros

CC-BY-NC-ND PID_00143963

32

1) Los ms simples estn asociados a un sistema de gestin documental concreto. Aunque contienen las prestaciones bsicas para la gestin de tesauros,
presentan tambin carencias en cuanto a la identificacin correcta de las relaciones entre los descriptores.
2) Los ms complejos son programas especficos de gestin de tesauros. Incorporan funcionalidades diversas, como la de validar automticamente los trminos y las relaciones entre ellos, lo cual ahorra tiempo en la verificacin de
dichas relaciones y evita cometer errores.
Ejemplos de software de gestin de tesauros
Recomendamos consultar la bibliografa, pero por poner algn ejemplo podemos sealar
los siguientes segn usemos el idioma ingls o el espaol:

Multites (en ingls): permite la conversin y generacin de ficheros en lenguaje


HTML y por ende la inclusin del tesauro en la red Internet.

TemaTres (en espaol): es una aplicacin web para la gestin de lenguajes documentales. Se encuentra orientada especialmente al desarrollo de tesauros jerrquicos, pero tambin puede utilizarse para desarrollar estructuras de navegacin web, o como
complemento de un gestor de contenidos en bibliotecas digitales o en una biblioteca
tradicional.

5.2. Los tesauros en el mundo digital. Tesauros en lnea


En los ltimos tiempos, el mbito de la representacin y recuperacin de informacin ha tenido que asumir el impacto de Internet y sus tecnologas asociadas. Las consecuencias de estos cambios tecnolgicos estn conduciendo a
una progresiva digitalizacin del mbito de la representacin y recuperacin
de informacin que afecta por igual a los recursos de informacin, las herramientas de representacin y recuperacin, y los requerimientos de los usuarios.
En este sentido se pueden destacar los siguientes hechos:
1) Incremento del nmero de recursos de informacin que requieren descripcin, identificacin y elementos de localizacin, es decir, un anlisis formal
y de contenido.
2) Con relacin al anlisis de contenido, se hace necesario un replanteamiento
en cuanto a las herramientas de gestin y organizacin de informacin entre
las cuales se encuentran los vocabularios controlados.
3) Es cada vez ms importante proporcionar a los propios usuarios unas estructuras de conocimiento que les permitan un acceso rpido y amigable a la
informacin. En este sentido, el tesauro, como vocabulario controlado, puede ejercer un papel protagonista: los usuarios requieren herramientas concep-

Los tesauros

CC-BY-NC-ND PID_00143963

33

Los tesauros

tuales y semnticas destinadas a una efectiva organizacin de la informacin


digital, y los tesauros son una de las estructuras que pueden tener una participacin activa en este campo.
Por otra parte, los tesauros se ven significativamente beneficiados por el entorno digital dado que favorece el desarrollo de los siguientes aspectos:

Nuevas posibilidades en cuanto a las pautas de diseo, elaboracin, gestin


y uso de las herramientas utilizadas para la representacin y recuperacin
de informacin.

Desarrollo de una estructura hipertextual donde se establezcan hipervnculos entre todos los elementos estructurales (descriptores, no descriptores, notas de alcance, etc.), y tambin entre las distintas partes del tesauro.

Simplificacin de la estructura a travs de la hipertextualidad, facilitando


por tanto su manejo a partir de interfaces adecuadas.

Reduccin de los costes de actualizacin.

Potencia el desarrollo de tesauros multilinges y multidisciplinares fomentando la cooperacin internacional, y, por lo tanto, impulsando la reutilizacin e interoperabilidad de recursos.

Acceso universal a herramientas terminolgicas que favorecen la recuperacin de informacin.

Integracin del usuario en el proceso de creacin, gestin y optimizacin


de las herramientas conceptuales documentales.

Enlace de inters
Recomendamos visitar la pgina de Willpower, empresa
de consultora independiente especializada en todos los
temas relacionados con la
gestin de la informacin y
que proporciona exhaustiva
y abundante informacin relativa a la construccin, gestin, mantenimiento y utilizacin de tesauros, as como multitud de referencias a
tesauros de todo el mundo,
normativa, instituciones y
gestin de tesauros.

CC-BY-NC-ND PID_00143963

34

6. Tesauros y ontologas

En relacin con el proceso sealado en el apartado anterior, relativo a la creciente digitalizacin del mbito de la representacin y recuperacin de informacin segn Arano (2005), son varias las herramientas que han sido objeto
de estudio, al igual que lo han sido los campos de conocimiento donde estas
herramientas se han originado: la lingstica, la inteligencia artificial, la documentacin, la ingeniera lingstica, etc.
En relacin con nuestro objeto de estudio, esto es, la representacin y recuperacin de informacin, estas herramientas son, entre otras, las siguientes:

Sistemas de clasificacin.

Listas de encabezamiento.

Bases de datos lxicas.

Bases de conocimiento.

Taxonomas.

Tesauros.

Mapas conceptuales.

Ontologas.

Redes semnticas.

Dentro de este amplio espectro de herramientas de representacin y recuperacin de informacin, son los tesauros y las ontologas los que con mayor
frecuencia son objeto de vinculacin en la bibliografa aunque provengan de
mbitos disciplinarios distintos.
6.1. Los tesauros
Como ya hemos visto anteriormente, un tesauro es un tipo de lenguaje documental que representa la estructuracin conceptual de un determinado campo
del conocimiento y se convierte en una herramienta de control terminolgico, puesto que la estructuracin del tesauro se basa en conceptos.
Los conceptos son representados por trminos seleccionados que evidencian
ese control terminolgico, ya que con dicho control se busca mejorar la precisin de la indizacin y recuperacin de la informacin, ambas funciones bsicas de los tesauros.

Los tesauros

CC-BY-NC-ND PID_00143963

35

El uso de informacin conceptual y lingstica almacenada en otros tipos de


recursos (por ejemplo, en una ontologa) permite el enriquecimiento a nivel
estructural de los tesauros, y posibilita el incremento de la amigabilidad de
estas herramientas para su utilizacin por parte de un usuario final no especializado.
6.2. Las ontologas
Las ontologas han sido un mbito de inters de la inteligencia artificial. Una
ontologa est englobada dentro de la definicin de lo que es un lenguaje
controlado, ya que proporciona una representacin formal del conocimiento
donde los conceptos, las relaciones y las restricciones conceptuales son explicitadas mediante formalismos en un determinado dominio.
Son muchas las definiciones existentes en el mbito de la inteligencia artificial. La ms conocida es la de Gruber (1993), quien define ontologa como una
descripcin formal en el dominio de un discurso.
Arano (2005), a partir de las definiciones existentes, propone la siguiente.
Representacin explcita y formal de una conceptualizacin compartida que implica
una perspectiva sobre una cierta realidad y que se constituye en la estructura conceptual
de una base de conocimiento. Su objetivo final es compartir el conocimiento que representa.

Las ontologas definen conceptos y relaciones de algn dominio, de forma


compartida y consensuada, y esta conceptualizacin debe ser representada de
una manera formal, legible y utilizable por los ordenadores.
Las ontologas constan de trminos, sus definiciones y los axiomas que los
relacionan con otros trminos, que estn organizados en una taxonoma. El fin
ltimo de una taxonoma es presentar un sistema de clasificacin que agrupe
todos los conceptos en diferentes niveles jerrquicos.
A continuacin, vamos a analizar las caractersticas principales de las ontologas (Lozano, 2000; Gruber, 1993).
Las ontologas tienen los siguientes componentes:
a)Conceptos. Son las ideas bsicas que se intentan formalizar. Los conceptos
pueden ser clases de objetos, mtodos, planes, estrategias, procesos de razonamiento, etc.
b) Relaciones. Representan la interaccin y enlace entre los conceptos del
dominio. Suelen formar la taxonoma del dominio. Por ejemplo: subclase-de,
parte-de, etc.

Los tesauros

CC-BY-NC-ND PID_00143963

36

c) Funciones. Son un tipo concreto de relacin donde se identifica un elemento mediante el clculo de una funcin que considera varios elementos de
la ontologa. Por ejemplo, pueden aparecer funciones como categorizar-clase,
asignar-fecha, etc.
d)Instancias. Se utilizan para representar objetos determinados de un concepto.
e)Axiomas. Son teoremas que se declaran sobre relaciones que deben cumplir
los elementos de la ontologa. Por ejemplo: Si A y B son de la clase C, entonces
A no es subclase de B.
Las caractersticas ms representativas de las ontologas son las siguientes:

Pueden existir ontologas mltiples. El propsito de una ontologa es


hacer explcito algn punto de vista, por lo que a veces ser preciso combinar dos o ms ontologas.

Podemosidentificarnivelesdeabstraccindelasontologas. Estos niveles de generalizacin o abstraccin nos dan una tipologa de ontologas.
La idea es caracterizar una red de ontologas usando multiplicidad y abstraccin, y puesto que no podemos aspirar a tener una descripcin completa del mundo, podemos pensar en una estrategia de construccin gradual de abajo arriba.

Multiplicidaddelarepresentacin. Un concepto puede ser representado


de muchas formas, por lo que pueden coexistir mltiples representaciones
de un mismo concepto.

Mapeodeontologas. Establecer relaciones entre los elementos de una o


ms ontologas, para establecer conexiones, especializaciones, generalizaciones, etc.

En trminos prcticos, el desarrollodeunaontologa incluye:

Definir clases en la ontologa, esto es, los conceptos y sus relaciones (clases,
subclases).

Colocar las clases en una jerarqua de taxonomas (subclase-superclase).

Definir atributos y describir los valores permitidos para esos atributos.

Rellenar los valores de los atributos con ejemplos.

Los tesauros

CC-BY-NC-ND PID_00143963

37

Algunos ejemplos de desarrollos de ontologas


Figura 3. Ejemplo de ontologa (Mulholland, 1999)

Figura 4. Ejemplo de ontologa para laboratorios de investigacin y desarrollo

Fuente: Hurtado y Segnera (2006)

6.3. Similitudes y diferencias entre tesauros y ontologas


Antonio Garca Jimnez (2004) menciona algunas de las diferencias y similitudes entre tesauros y ontologas. stas se relatan a continuacin:
a)Similitudes

Se engloban dentro de los lenguajes controlados, ya que utilizan el vocabulario de un dominio especfico a partir de un nmero de trminos bsicos y de las relaciones que se establecen entre los mencionados trminos.

Los tesauros

CC-BY-NC-ND PID_00143963

38

Estn relacionados con la terminologa empleada para representar los conceptos de un dominio especfico.

Ambos utilizan jerarquas para agrupar trminos en categoras y subcategoras y pueden utilizarse para catalogar y organizar recursos de informacin.

b)Diferencias

Si bien los tesauros estn destinados a ser usados por humanos, las ontologas pueden ser usadas por humanos para compartir conocimiento y por
agentes de software para procesarlo.

En los tesauros, los descriptores se enlazan mediante tres tipos principales


de relaciones muy simples, relaciones enfocadas principalmente para la
recuperacin pertinente de informacin. En cambio, las ontologas tienen
una mayor variedad de relaciones entre conceptos. La descripcin de los
conceptos y sus relaciones pueden ser empleadas de un modo ms general
que en los actuales tesauros de manera que se pueden establecer un mayor
nmero de relaciones diferentes, y tener definidas cada una de ellas.

En los tesauros, la descripcin de los conceptos es limitada y no formalizada, mientras que en las ontologas es explcita y formalizada.

Los tesauros

CC-BY-NC-ND PID_00143963

39

Bibliografa
Bibliografa bsica
Aitchison, J.; Gilchrist, A.; Bawden, D. (2000). Thesaurus construction and use: a practical
manual (4.a ed.). Chicago: Fitzroy Dearborn.
Arano, S. (2005). Los tesauros y las ontologas en la Biblioteconoma y la Documentacin.
Hipertext.net (nm. 3, 2005). [Consultado en septiembre de 2009.]
Chaumier, J. (1986). Anlisis y lenguajes documentales: el tratamiento lingstico de la informacin documental. Barcelona: Mitre (Ciencias de la Comunicacin).
Craven, T. C. (1997). Introductory tutorial on thesaurus construction. Londres (Ontario, Canada). University of Western Ontario (actualitzado en 2008). [Consultado en septiembre de
2009.]
Currs, E. (1998). Ontologas, taxonoma y tesauros: manual de construccin y uso. Gijn: Ediciones Trea.
Garca Jimnez, A. (2004). Instrumentos de representacin del conocimiento: tesauros
versus ontologas. Anales de documentacin (nm. 7, 2004, pg. 79-95).
Gruber, T. R. (1993). A Translation Approach to Portable Ontology Specifications. Knowledge Acquisition (5(2), pg. 199-220). [Consultado en septiembre de 2009.]
Hurtado, D; Sequeda, J. (2006). Propuesta del Uso de Ontologas para la Bsqueda de
Semntica en Laboratorios de Investigacin y Desarrollo: OLID.
NISO Z39.19-2005. Guidelines for the Construction, Format, and Management of Monolingual
Controlled Vocabularies.
NISO Z39.19-2003. Guidelines for the Construction, Format, and Management of Monolingual
Thesauri.
Lancaster, F. W. (1995). El control del vocabulario en la recuperacin de la informacin.
Educacin. Materiales (nm. 12). Valencia: Universidad de Valencia.
Lozano Tello, A. (2000). Ontologas en la Web semntica. I.s Jornadas de Ingeniera
Web'01. [Consultado en septiembre de 2009.]
Mulholland, P. (1999). Introduction to Ontologies. Knowledge Media Institute, The Open
University (Walton Hall) Milton Keynes, UK
Slype, G. van (1991). Los lenguajes de indizacin. Concepcin, construccin y utilizacin en los
sistemas documentales. Madrid: Pirmide / Fundacin Snchez Ruiprez (Biblioteca del Libro).
Toms Lpez, M. (2004). Diseo de un tesauro conceptual de folklore de la Regin de
Murcia. Scire (vol. 10, nm. 1, pg. 65-76).
UNE-50-106 (ISO 2788-1986). Documentacin: Directrices para el establecimiento y desarrollo
de tesauros monolinges (1990). Asociacin Espaola de Normalizacin y Certificacin (AENOR).
UNE-50-125 (ISO 5964-1985). Documentacin: Directrices para la creacin y desarrollo de tesaurus multilinges (1997). Asociacin Espaola de Normalizacin y Certificacin (AENOR).
Willpower Information (1999). Thesaurus principles and practice. [Consultado en septiembre de 2009.]
Recopilacin de enlaces a recursos de informacin sobre tesauros en lnea
American Society of Indexers. Thesauri online. Wheat Ridge [Colorado]: American Society of Indexers. [Consultado en septiembre de 2009.]
Arano, S; Codina, L. (2004). La estructura conceptual de los tesauros en el entorno digital: nuevas esperanzas para viejos problemas?. 9.s Jornadas Catalanas de informacin y
Documentacin. Barcelona 24-26 Nov 2004. [Consultado en septiembre de 2009.]

Los tesauros

CC-BY-NC-ND PID_00143963

40

Centre for Digital Library Research. BUBL Link/5:15 Thesauri / BUBL Information Service. Glasgow: University of Strathclyde. [Consultado en septiembre de 2009.]
CINDOC. Tesauros y Glosarios IEDCYT en lnea. Madrid: Centro de Informacin y Documentacin Cientfica. [Consultado en septiembre de 2009.]
Koch, T. Controlled vocabularies, thesauri and classification systems available in the WWW.
Lund: Lund University. [Consultado en septiembre de 2009.]
Library of Congress Thesauri. Washington: Library of Congress. [Consultado en septiembre de 2009.]
McKiernan, G. (2001). Controlled vocabularies: Beyond bookmarks: schemes for organizing the web. Ames: Iowa State University. [Consultado en septiembre de 2009.]
Middleton, M. Thesaurus online sites. Controlled vocabularies: resource guide. Brisbane:
School of Information Systems, QUT. [Consultado en septiembre de 2009.]
Recopilacin de enlaces a recursos sobre software de gestin de tesauros
Jessica Milstead. Thesaurus management software. Wheat Ridge: American Society of
Indexers. [Consultado en septiembre de 2009.]
Michael Middleton. Thesaurus management software: Controlled vocabularies: resource
guide. Brisbane: School of Information Systems. [Consultado en septiembre de 2009.]
Willpower Information. Software for building and editing thesauri. [Consultado en
septiembre de 2009.]
Recopilacin de enlaces a recursos de informacin generales sobre ontologas
a) Pginas web
Ontologas (Juan Carlos Cmara, 2002) . Learning Metadata Standards. [Consultado en septiembre de 2009.]
Ontology (Tom Gruber). [Consultado en septiembre de 2009.]
Semanticweb. [Consultado en septiembre de 2009.]
Sites Relevant to Ontologies and Knowledge Sharing (Richard Fikes). [Consultado en septiembre de 2009.]
Gua Breve de la Web Semntica (Consorcio World Wide Web, W3C). [Consultado en septiembre de 2009.]
b) Artculos
Arano, Silvia (2005). Los tesauros y las ontologas en la Biblioteconoma y la Documentacin. Hipertext.net (nm. 3, 2005). [Consultado en septiembre de 2009.]
Arano, Silvia; Codina, Llus (2004). La estructura conceptual de los tesauros en el entorno digital: nuevas esperanzas para viejos problemas?. 9.s Jornadas Catalanas de Informacin y Documentacin. Barcelona 24-26, nov. 2004. [Consultado en septiembre de 2009.]
Caldera-Serrano, J.; Sanchez-Jimnez, R. (2008). Ontologa para el control y recuperacin de informacin onomstica en televisin. El Profesional de la Informacin (vol. 17,
nm. 1, enero-diciembre, pg. 86-91)
Garca Jimnez, A. (2004). Instrumentos de representacin del conocimiento: tesauros
versus ontologas. Anales de documentacin (nm. 7, 2004, pg. 79-95).
Hurtado Bustamante, D. P.; Sequeda Sanclemente, J. F. (2006). Propuesta del Uso
de Ontologas para la Bsqueda Semntica en Laboratorios de Investigacin y Desarrollo:
OLID. [Consultado en septiembre de 2009.]
Legg, C. (2007). Ontologies on the Semantic Web. Annual Review of Information Science
and Technology (vol. 41, nm. 1, 2007).
Lozano Tello, A. (2000). Ontologas en la Web semntica. I.s Jornadas de Ingeniera
Web'01. [Consultat a setembre de 2009.]

Los tesauros

CC-BY-NC-ND PID_00143963

41

Pedraza Jimnez, R.; Codina, L.; Rovira, C. (2007). Web semntica y ontologas en el
procesamiento de la informacin documental. El Profesional de la Informacin (vol. 16, nm.
6, noviembre-diciembre, pg. 569-578).
Sanchez Jimnez, R.; Gil-Urdiciain, B. (2007). Lenguajes Documentales y ontologas.
El Profesional de la Informacin (vol. 16, nm. 6, noviembre-diciembre, pg. 551-560).
Reiss, M.; Moal, M.; Barnard, Y.; Ramu, J. P.; Froger, A. (2006). Using Ontologies
to Conceptualize the Aeronautical Domain. A: Proceedings of the International Conference on
Human-Coputer Interaction in Aeronautics (pg. 56-63).

Los tesauros

Listado de
descriptores
libres y listado de
palabras clave
Manela Junc Campdepadrs
PID_00144350

CC-BY-NC-ND PID_00144350

Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es

Listado de descriptores libres y listado de palabras clave

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

ndice

Introduccin...............................................................................................

Objetivos.......................................................................................................

1.

Lenguajes documentales libres.......................................................

2.

Listado de descriptores libres.........................................................

2.1.

Tipologa ......................................................................................

2.2.

Listado de descriptores libres en la indizacin ...........................

10

2.2.1.

Creacin de un listado de descriptores libres ................

11

2.2.2.

Indizacin ......................................................................

11

2.2.3.

Aplicaciones del listado de descriptores libres ...............

14

Listado de descriptores libres en la recuperacin .......................

15

Listado de palabras clave................................................................

17

3.1.

La indizacin automtica ............................................................

17

3.1.1.

Ciencias implicadas en la indizacin automtica ..........

18

3.1.2.

Funcionamiento y evolucin de los programas de

2.3.
3.

indizacin automtica ...................................................

19

3.2.

El listado de palabras clave en la indizacin ..............................

30

3.3.

El listado de palabras clave en la recuperacin ..........................

31

Actividades..................................................................................................

35

Glosario........................................................................................................

37

Bibliografa.................................................................................................

39

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

Introduccin

Este mdulo os introduce en el uso de los lenguajes libres. Comprende dos


lenguajes: los listados de descriptores libres y los listados de palabras clave.
Itinerariodeestudio
El mdulo empieza con las caractersticas de los lenguajes libres, ya que los
dos ltimos lenguajes del curso comparten esta tipologa. A continuacin, se
describen las listas de descriptores libres, su creacin y el proceso de indizacin
y recuperacin. Finalmente, el curso acaba con las listas de palabras clave y la
indizacin automtica.
Tabla. Conceptos ms importantes
Concepto

Ved

Lenguaje libre

1. Lenguajes documentales libres

Descriptor libre

2. Listado de descriptores libres

Palabra clave

3. Listado de palabras clave

Palabra vaca

3.1.2. Funcionamiento y evolucin de los programas de indizacin


automtica

Clculo de frecuencia

3.1.2. Funcionamiento y evolucin de los programas de indizacin


automtica

Frecuencia inversa

3.1.2. Funcionamiento y evolucin de los programas de indizacin


automtica

Discriminacin

3.1.2. Funcionamiento y evolucin de los programas de indizacin


automtica

Anlisis morfolgico

3.1.2. Funcionamiento y evolucin de los programas de indizacin


automtica

Anlisis sintctico

3.1.2. Funcionamiento y evolucin de los programas de indizacin


automtica

Anlisis semntico

3.1.2. Funcionamiento y evolucin de los programas de indizacin


automtica

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

Objetivos

Con el estudio de los materiales asociados a este mdulo alcanzaris los objetivos siguientes:

1. Conocer la aplicacin de los lenguajes libres al anlisis de contenido.


2. Valorar las ventajas de los lenguajes libres en la indizacin.
3. Valorar los inconvenientes de los lenguajes libres en la recuperacin.
4. En cuanto a los listadosdedescriptoreslibres:

Definir los listados de descriptores libres y sus tipologas.

Conocer el proceso de creacin del lenguaje.

Adquirir una cierta habilidad en la indizacin de documentos.

5. Por lo que respecta a los listadosdepalabrasclave:

Introducirse en los mecanismos de la indizacin automtica.

Reconocer las aplicaciones estadsticas y lingsticas aplicadas a la indizacin automtica.

Saber simular/entender el proceso de seleccin y eleccin de palabras


clave.

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

1. Lenguajes documentales libres

Este ltimo mdulo est dedicado a los dos lenguajes documentales libres: los
listados de descriptores libres y los listados de palabras clave.

Tipologa segn el nivel


de control
Recordemos que la tipologa
segn el nivel de control clasifica los lenguajes documentales en libres o controlados,
en funcin de si los trminos
de indizacin corresponden a
un lenguaje natural o a un lenguaje artificial construido para
garantizar la indizacin y recuperacin.

A diferencia de los lenguajes controlados, que neutralizaban las carencias de


los lenguajes naturales y requeran conocimientos elevados para ser aplicados,
los lenguajes libres no ofrecen tantas garantas en la recuperacin, pero son
amigables. Son lenguajes muy usados, ya que son:

Baratos: los gastos de construccin son mnimos. Los elabora una persona
o un programa informtico.

Rpidos: tanto en la construccin, que es inmediata, como en la actualizacin de su vocabulario, que se va incorporando al listado a medida que
va ingresando en el fondo documental.

Terminolgicamentericos: de resultas de la actualizacin inmediata de


sus listas.

Fcilesdeusar: no necesitan conocimientos previos sobre lenguajes documentales, control de vocabulario, o precoordinacin, entre otros.

Coherentes: ofrecen coherencia mxima, de manera que dos servicios de


1

informacin y documentacin (SID ) con el mismo documento y software


de indizacin automtica llegarn a una indizacin idntica (esta caracterstica slo es aplicable al listado de palabras clave).
Sin embargo, los lenguajes libres presentan inconvenientes en la recuperacin,
ya que al trabajar con lenguaje natural libre arrastran todos los problemas derivados de la ambigedad (sinonimia, polisemia, homonimia), lo que provoca
silencio y ruido documentales y presentan un nmero excesivo de resultados
para cada peticin. Es el proceso inverso de los lenguajes controlados, en los
que la dificultad radicaba en el proceso de indizacin y aseguraba, en cambio,
una recuperacin unvoca.

(1)

SID es la sigla de servicio de informacin y documentacin.

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

Actualmente muchas bases de datos combinan la utilizacin de los lenguajes


controlados con los libres, de manera que podemos buscar y recuperar por
diversas vas. Es habitual que los catlogos bibliogrficos y otras bases de datos
ofrezcan la posibilidad de buscar la materia de dos maneras:
a) Por el campomateria: indizando con algn lenguaje controlado (tipo lista
de encabezamientos de materia, tesauros o una lista de autoridades).
b) Por el campo palabra clave: indizando con un programa de indizacin
automtica o lista de palabras clave.

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

2. Listado de descriptores libres

Un listado de descriptores libres es un vocabulario monolinge de


trminos de indizacin ordenados alfabticamente.

Estos trminos son escogidos por el analista, sin verificar si existen ni cmo
se introducen en una lista previamente establecida. Por lo tanto, no es un
lenguaje controlado, sino libre, y por eso recibe este nombre.
2.1. Tipologa
Las listas de descriptores libres son un lenguaje documental que tiene las ca-

Ved tambin

ractersticas siguientes:

Podis ver la tipologa de los


lenguajes documentales en el
apartado 5 del mdulo Anlisis de contenido: resumen e
indizacin de esta asignatura.

1) Se trata de un tipo de lenguajeanaltico (frente a los sintticos). En el proceso de indizacin se identifican los conceptos que conforman el contenido
del documento y se representan mediante una serie de descriptores. Por esta
razn, su aplicacin est ligada a la existencia de sistemas automatizados que
permiten la recuperacin de la informacin mediante la combinacin de estos
descriptores.
Ejemplo
Ponemos como ejemplo el resumen siguiente:
DalmauRibalta,A. (2002). Los ctaros. Editorial UOC (Biblioteca Lectus Universitaria).
El catarismo es un movimiento cristiano disidente de la Baja Edad Media. Se extendi
por diversos puntos de Europa, con una incidencia especial en el Languedoc. Esta obra
da a conocer qu fue exactamente el catarismo y su trayectoria.
La obra Los ctaros procura distinguir la llamada Iglesia de Dios de toda una literatura esotrica y legendaria que la ha deformado de manera significativa y que, al mismo tiempo,
se aleja de una concepcin historiogrfica tradicional, ya superada, que la consideraba
como una simple prolongacin del antiguo maniquesmo.
A lo largo de esta obra se explica en qu consista la liturgia, los ritos y la doctrina religiosa
de esta Iglesia, considerada hertica y perseguida por la Iglesia catlica. Resumid su trgica
historia con hechos tan relevantes como la llamada cruzada albigense y el nacimiento de
la Inquisicin.
El analista indiza ms de un trmino2:
Baja Edad Media
ctaros
cristianismo
disidencia religiosa
Europa
liturgia
Languedoc

(2)

En contraposicin al LEMAC,
que es un lenguaje sinttico y sera
un nico trmino:
LEMAC: Ctars-Histria

10

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

2) Se trata de un tipo de lenguajenatural porque la indizacin se basa en el


uso de palabras o expresiones libres que pertenecen al lenguaje o discurso comn y que se encuentran en los mismos documentos (como el ttulo, el resumen o el texto) y a los conceptos de la consulta del usuario. Es decir, en ningn momento se utiliza un cdigo (numrico, alfanumrico) que represente
este contenido. El lenguaje natural presenta el problema de la falta de univocidad, es ambiguo y posibilita los fenmenos de la sinonimia, la polisemia y
la homonimia.
Ejemplo

(3)
3

Listado de descriptores libres :


Ctars

3) Se trata de un lenguajelibre porque est formado por trminos de indizacin extrados del lenguaje natural y que se utilizan o se sugieren en el mismo
documento. El listado de descriptores resultante est constituido por una coleccin no ordenada de conceptos (slo por orden alfabtico). Estos conceptos
estn expresados por palabras o expresiones extradas de los documentos, o
propuestos por los mismos documentalistas, sin verificar si estn en una lista
establecida a priori (es tambin, por lo tanto, un lenguaje construido a posteriori).
4) Se trata de un tipo de lenguajepostcoordinado, ya que permite la coordinacin de conceptos en el momento de la recuperacin y la utilizacin de un
gran nmero de trminos de indizacin o puntos de acceso. La combinacin
precisa de estos diferentes descriptores, en la recuperacin, se tiene que remitir
al documento buscado.
5) Se trata de un tipo de lenguajedeestructuracombinatoriaoasociativa,
en el que los conceptos o descriptores se organizan de una manera independiente y slo se produce la combinacin o interseccin en las operaciones de
indizacin y recuperacin. Por lo tanto, se trata de un lenguaje en el que los
trminos que lo componen se organizan en una lista por orden alfabtico sin
respetar ningn otro tipo de estructura que site cada descriptor en una cadena lgica, jerrquica o estructurada de conceptos.
Ejemplo
En este caso, el indizador hace:
Ctars AND Europa

2.2. Listado de descriptores libres en la indizacin


La lista de descriptores libres es un lenguaje documental que da libertad total
al analista, por lo que lo convierte en muy amigable, rpido y fcil de usar.

En contraposicin, indizado con


un sistema de clasificacin como
la CDU, que es el nico lenguaje
documental codificado, sera:
CDU ao 2004 27-789.67.

CC-BY-NC-ND PID_00144350

11

Listado de descriptores libres y listado de palabras clave

Todos nosotros en algn momento de nuestra vida hemos ordenado fotos en


lbumes, hemos clasificado los libros de la biblioteca o hemos ordenado artculos y fotocopias bajo algn tema o subtema. No ramos conscientes de ello,
pero estbamos indizando con un listado de descriptores libres.
2.2.1. Creacin de un listado de descriptores libres

El procesodecreacin de una lista de descriptores libres es muy sencillo: el analista va leyendo los documentos que tiene que indizar y va
tomando nota de los trminos que son interesantes segn su parecer.
Los va anotando y los clasifica en orden alfabtico. Les da un mnimo
de forma y procura eliminar duplicidades de nmero y gnero (singular-plural, masculino-femenino), usa una nica lengua y elimina algunos sinnimos.

Los descriptores libres tienen un gasto de construccin casi nulo. Son inmediatos, permiten un vocabulario actualizado, y se adaptan a la realidad del SID.
En algunos casos el listado de descriptores libres suele ser el primer paso en la
tarea de crear un lenguaje documental. Los analistas empiezan por redactar un
listado de descriptores libres con la intencin de controlarlo y avanzar hacia
un lenguaje documental realmente controlado. Si el analista quiere ejercer un
poco de control sobre sus descriptores, sin llegar a trabajar con un vocabulario por completo controlado, como seran las listas de encabezamientos o los
tesauros, tiene que tomar algunas medidas, como por ejemplo:

Establecer una lengua o idioma de la lista.

Controlar las formas singular/plural.

Establecer los sintagmas nominales preferentes:

Sustantivo + adjetivo.

Sustantivo + preposicin + sustantivo.

Controlar los sinnimos.

Utilizar formas usuales frente a otras muy tcnicas.

2.2.2. Indizacin
El analista lee el documento, determina la materia del documento y acto seguido propone un descriptor. Representndolo verbalmente, el analista dira
este documento trata de tal tema. No consulta ninguna lista, no comprueba
si el trmino que piensa est aceptado o no, no tiene que seguir las reglas de
combinacin de ningn lenguaje; tiene libertad total a la hora de indizar.

Ved tambin
Las medidas de control de vocabulario detalladas en el apartado dedicado a las listas de
encabezamientos de materia
del mdulo Listas de encabezamientos de materia y listas
de autoridades son adecuadas tambin en este caso.

12

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

El hecho de no necesitar una traduccin del lenguaje natural a uno artificial


controlado tiene ventajas y comporta inconvenientes. El primero, y el ms
evidente es la disparidad de indizaciones: ante el mismo documento, tres analistas pueden llegar a tres resultados muy diferentes.
Disparidad de indizaciones
Siguiendo con el ejemplo sobre el libro de los ctaros, vemos el resultado de la indizacin
hecha por tres analistas diferentes:
Disparidad de indizaciones
Analista A

Analista B

Baja Edad Media


ctaros
Francia
movimientos cristianos disidentes

catarismo
herejas
rdenes monsticas
religin

Analista C
albigenses
cismas
historia medieval
Languedoc

Como consecuencia de esto, la tasa de coherencia es la ms baja de todos los


lenguajes documentales.
Ejemplo
En el ejemplo, el uso de sinnimos y trminos genricos ha alterado tanto el resultado
que no han coincidido en ningn descriptor (la tasa es del 0%).

Un segundo aspecto que hay que destacar es el grado de exhaustividad. Recordemos que el grado de exhaustividad puede ser alto, medio o bajo y que afecta
a los lenguajes postcoordinados como ste, en el que el analista puede escoger
el nmero de trminos para representar un documento.
De esta manera, con una lista de descriptores libres podemos indizar el libro
de los ctaros con tres grados diferentes:
Exhaustividad
profunda o alta
Baja Edad Media
catarismo
ctaros
ctaros, historia
cristianismo
cruzada albigense
disidencia religiosa
doctrina religiosa
Iglesia de Dios
Europa
Inquisicin
liturgia
Languedoc
ritos religiosos

Exhaustividad intermedia o media


Baja Edad Media
ctaros
cristianismo
disidencia religiosa
Europa
liturgia
Languedoc

Exhaustividad
genrica o baja
Baja Edad Media
ctaros
Languedoc

a) Las ventajas de este lenguaje en la indizacin giran en torno a la facilidad,


la simplicidad y la libertad de uso:

CC-BY-NC-ND PID_00144350

13

Listado de descriptores libres y listado de palabras clave

No necesita traduccin de los conceptos del lenguaje natural de los documentos a un lenguaje artificial.
Ejemplo
Si en el texto de los ctaros que estamos usando como ejemplo se hablaba de literatura
esotrica y legendaria, el analista puede indizar leyendas o literaturaesotrica sin comprobar la forma en ninguna lista, si es aceptado o no, si se prefiere la forma singular/plural, si se puede adjetivar o no, si tiene relaciones semnticas que ayuden a la indizacin.

Se trata de un tipo de lenguaje rpido y fcil de actualizar. Esta ventaja


es muy apreciada en entornos tecnolgicos en los que la terminologa va
ms adelantada que su normalizacin en listas controladas. Recordemos
que entidades como el Termcat son la fuente adecuada para consultar la
forma correcta de escribir el trmino.
Ejemplo
Si el texto que hay que indizar habla del Maniquesmo o de cualquier otro tema, no hay
problema; se aade a la lista alfabtica de descriptores Maniquesmo.

Se adapta perfectamente al nivel de usuarios y al tipo de SID, ya que es un


lenguaje hecho a la medida de su centro.
Ejemplo
Si un SID de tipo genrico recibe este documento lo indizar con algn trmino del tipo
Religin; en cambio, si es un SID especializado extraer trminos ms concretos como,
por ejemplo, Cruzadaalbigense.

No hace falta una formacin previa de los analistas. Precisamente la ausencia de reglas y principios hace innecesaria la formacin.

b) Los inconvenientes giran en torno a la eleccin del trmino de indizacin


entre todos los trminos posibles. Un segundo problema derivado es prever de
qu manera el usuario har la bsqueda y as coincidir.
Ejemplo
En el ejemplo de los ctaros, el analista puede decidir indizar:

Por el marco geogrfico: Languedoc, Francia, Europa.

Por el marco temporal: Baja Edad Media, Edad Media, historia medieval.

Por el concepto ctaros: ctaros, catarismo, albigense.

Por el concepto disidencia: disidencia, hereja, cisma.

Algunos analistas optan por indizar el trmino tal y como aparece en el documento (por
ejemplo, Languedoc) y otros realizan la accin de escoger trminos que creen que tienen
ms posibilidades de ser recuperados (por ejemplo, Francia).

CC-BY-NC-ND PID_00144350

14

Listado de descriptores libres y listado de palabras clave

2.2.3. Aplicaciones del listado de descriptores libres


Hemos comentado con anterioridad el uso generalizado de descriptores libres
en el mbito domstico y que tambin suele ser un primer paso en el camino
hacia la creacin de un lenguaje controlado, pero tambin encuentra aplicaciones en los mbitos siguientes:
1) En la indizacindeinformacintemporal: cuando los tems de informacin tienen una vida determinada ligada a un acontecimiento (poltico, deportivo o cultural) concreto que hace demasiado costoso invertir en un lenguaje controlado y su formacin posterior.
2) En la indizacindedocumentosaudiovisuales(imagenfijaoenmovimientoyaudio)delaweb: los sistemas de indizacin automtica de la web
no pueden indizar, de momento, documentos que no contengan texto, como
las fotografas o los vdeos de banda ancha, tan numerosos en la red. La solucin pasa por indizarlos manualmente con la colaboracin de los internautas.
3) En la indizacinsocial los internautas asignan etiquetas con descriptores

(4)

http://www.flickr.com/

a los recursos web. Mathes (2004) habla de metadatos generados por el usuario.
Pueden indizar fotografas4, webs5, blogs6 y compartir sus descriptores para colaborar en la indizacin de todo tipo de contenidos en el espacio web compar-

(5)

http://delicious.com/
http://www.mister-wong.es/users/
500000111/

tido y abierto. Cada recurso (por ejemplo, la web de la Wikipedia) es indizado


por un grupo de usuarios que pueden coincidir o no con las etiquetas: uno

(6)

http://technorati.com/

puede indizar wiki, otro enciclopedia, otro obra de referencia, por ejemplo.
Lectura complementaria

La asignacin de las etiquetas se hace sin nimo de lucro. Los internautas no


buscan un beneficio econmico, sino beneficiarse de bsquedas mejores. Los
descriptores escogidos no se supervisan ni tienen ninguna estructura semntica.
Sinnimos
Otros nombres que recibe el fenmeno de la indizacin social son tagging, etiquetado colaborativo, clasificacin social, etiquetado social o folksonomies. El origen del neologismo
folksonoma lo debemos a Thomas van der Wal, que fusion folk (gente, popular) y taxonoma (gestin de la clasificacin), lo que dio como resultado una indizacin gestionada
popularmente.

La indizacin social participa de las caractersticas de las listas de descriptores


libres en la filosofa de la indizacin, ya que cada participante indiza unos
descriptores libres seleccionados por un proceso intelectual a partir del examen
del recurso, sin verificar si los descriptores propuestos estn o no en una lista
establecida.
Los intentos por mejorar la recuperacin van en la lnea de aplicar algoritmos
de ponderacin y eliminacin de etiquetas vacas que no aportan significado
relevante para la comunidad. Estos mecanismos son totalmente invisibles para

Si queris ampliar la informacin sobre los metadatos generados por el usuario, podis consultar la pgina web
de Adam Mathes:
Folksonomies

CC-BY-NC-ND PID_00144350

15

Listado de descriptores libres y listado de palabras clave

el usuario. Algunos autores proponen alfabetizar al usuario dndole instrucciones para indizar, pero se duda de su eficacia, ya que una de las razones del
xito del tagging es la libertad que da al indizador internauta.
2.3. Listado de descriptores libres en la recuperacin
a) Las ventajas que tienen los listados de descriptores libres en la recuperacin
son las siguientes:

Como lenguaje analtico, permite la coordinacin de diversos trminos en


la consulta, lo que permite bsquedas precisas.

El lenguaje se actualiza continuamente.

Facilidad de uso en la realizacin de consultas, ya que no hay que dominar


previamente ningn lenguaje especializado, sofisticado ni artificial.

b) No obstante, tambin tienen inconvenientes. Si en la indizacin todo eran


facilidades, en la recuperacin encontramos todo tipo de problemas derivados
del silencio y del ruido documentales.
El principal problema de este lenguaje documental se encuentra precisamente
en este punto, la recuperacin, ya que la abundancia de sinnimos y homnimos hace difcil predecir con qu trmino buscar al usuario y si coincidir
con el escogido por el indizador.
Las dificultades ms notables se presentan a la hora de formular la peticin:

No elimina la polisemia del lenguaje natural, lo que provoca ruido documental.

Presencia de sinnimos, lo que genera silencio documental e imposibilita


recuperar los documentos que tratan sobre los conceptos de la consulta si
stos han sido indizados por los analistas con formas diferentes.
Ejemplo de sinnimos
Un ejemplo de bsqueda con todo tipo de sinnimos sera: CEE OR UE OR Unin Europea.

Variantes ortogrficas del mismo concepto (disco, disquete, diskete).

Variantes idiomticas (bafles y altavoces).

Falta de una estructura semntica que ayude a la localizacin de trminos.


Esta falta provoca vacos cuando pedimos un trmino genrico, con el cual
no ha sido indizado el documento.
Ejemplo de falta de estructura semntica
Buscamos, por ejemplo, sobre lenguajes documentales y no recuperamos un documento
sobre tesauro porque est indizado slo como tesauro, no con un trmino conceptual-

CC-BY-NC-ND PID_00144350

16

Listado de descriptores libres y listado de palabras clave

mente ms genrico como puede ser lenguaje documental. En un lenguaje controlado, esta
vinculacin se hara evidente (con siglas del tipo TG o TA) y ayudara a la recuperacin.

Coordinacin falsa. Entendemos por coordinacin falsa recuperaciones


inesperadas y errneas que, a pesar de contener los elementos de la bsqueda, corresponden a temas diferentes.
Ejemplo de coordinacin falsa
Buscamos, por ejemplo, sobre pintura catalana y pedimos Pintura AND Catalua y recuperamos:

Pintores catalanes (por ejemplo, M. Fortuny).


Catalua en la pintura (por ejemplo, la visin de J. Sorolla sobre el litoral cataln).
Pintura en Catalua (todos aquellos pintores que han pintado en Catalua).
Industriales de la pintura catalanes (pintores de paredes).

Las soluciones a estos inconvenientes pasan por recopilar toda la lista que seamos capaces de elaborar sobre el concepto: trminos genricos y especficos,
polismicos, sinnimos, siglas, variantes idiomticas, cambios de gnero y nmero. Las estrategias de bsqueda suelen ser complejas.

CC-BY-NC-ND PID_00144350

17

Listado de descriptores libres y listado de palabras clave

3. Listado de palabras clave

El listadodepalabrasclave es un vocabulario ordenado alfabticamente de los trminos con carga significativa extrados de un documento
mediante un programa informtico.

Una lista de palabras clave est constituida por una coleccin dispuesta en
orden alfabtico de las palabras significativas, llamadas tambin no vacas (es
decir, todas las palabras que no son artculos, conjunciones, pronombres, preposiciones, numerales y ciertos verbos y adverbios), extradas de una manera
automtica por el ordenador a partir del ttulo, del resumen y cada vez ms
a menudo del texto completo de los documentos (van Slype). Acostumbran
a ser listas monolinges.
Los listados de palabras clave tienen la misma tipologa que los listados de
descriptores libres. Los dos lenguajes son:

analticos,

naturales,

libres,

postcoordinados,

de estructura combinatoria.

Las diferencias entre ellos, que son diferencias grandes, residen en que:

Los listados de descriptores libres se basan en la indizacin humana y los


listados de palabras clave, en la indizacin automtica.

Los listados de descriptores libres indizan conceptos y los listados de palabras clave indizan en su mayora unitrminos.

3.1. La indizacin automtica

La indizacinautomtica es el mtodo por el que un ordenador aplica un algoritmo (o programa) al ttulo, resumen o texto completo del
documento para identificar los trminos que puedan representar la materia y ser usados como trminos de indizacin y recuperacin en un
ndice o lista.

Hay dos tipos de indizacin automtica:

Listados de palabras clave


Consideramos listados de palabras clave los listados resultantes de la indizacin automtica.

Lectura complementaria
Si queris ampliar vuestro conocimiento sobre la informacin dada por van Slype, podis leer la obra siguiente.
G.vanSlype (1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin
en los sistemas documentales
(pg. 23). Madrid: Pirmide /
Fundacin Germn Snchez
Ruiprez (Biblioteca del Libro).

CC-BY-NC-ND PID_00144350

18

Listado de descriptores libres y listado de palabras clave

a)Totalmenteautomatizada (en ingls, automatic indexing).


b)Semiautomtica (en ingls, machine-aided indexing): el programa selecciona
posibles descriptores procedentes de un tesauro o de una lista controlada y un
documentalista acepta o rechaza la propuesta.
Los factores que hacen posible la indizacin automtica son la elevada inversin de tiempo que conlleva la indizacin intelectual, el aumento de la documentacin electrnica y a texto completo, y la extensin de sistemas de gestin documental en las instituciones y empresas, as como la evolucin del
procesamiento del lenguaje natural o PLN7 (Mndez y Moreiro, 1999).
Aunque podemos encontrar aplicaciones dedicadas exclusivamente al resumen y a la indizacin automtica, lo ms habitual es que estos programas formen parte del mismo programa de gestin documental del centro.
3.1.1. Ciencias implicadas en la indizacin automtica

(7)

PLN es la sigla de procesamiento del lenguaje natural. A partir de


ahora, denotamos solamente PLN.

Lectura complementaria
Para ampliar la informacin
sobre la indizacin automtica, podis leer la obra siguiente:
E.Mndez;J.A.Moreiro
(1999). Lenguaje natural e
indizacin automatizada.
Ciencias de la Informacin
(pg. 11-24).

En la indizacin automtica intervienen diversas disciplinas cientficas, la informtica, la lingstica y la estadstica:


1) La informtica proporciona el algoritmo que representa, procesa, almacena
y recupera las palabras clave.
2) La lingstica asigna etiquetas de tipo morfolgico y lleva a cabo anlisis
sintcticos. Los programas de indizacin automtica ms evolucionados incorporan tambin anlisis de tipo semntico:

Morfologa: trabaja en el mbito de la palabra. Asigna la categora gramatical de las palabras y la raz comn (o lema). Recordemos que las categoras gramaticales son sustantivo, verbo, adjetivo, adverbio, entre otras, y
que morfolgicamente pueden ser de diversos gneros, nmeros, tiempo
y modo. La lematizacin permite contar todas las veces que un concepto
aparece en el texto aunque se exprese con formas diferentes.

Sintaxis: su campo de trabajo es la frase. Identifica los componentes de la


frase, que son el sujeto, el verbo y los objetos, y su concordancia. Gracias a
este anlisis puede desambiguar gramaticalmente los trminos no resueltos en la etapa morfolgica.

Semntica: se ocupa del texto. Desambigua trminos polismicos, ya que


el texto permite optar por un significado u otro.

3) La estadstica tiene diversas aplicaciones en documentacin, pero en indizacin automtica interviene especialmente en el clculo de la frecuencia
relativa de las palabras en un texto. Esta tcnica calcula cuntas veces aparece
una palabra en un texto y en funcin de unos baremos (ni las palabras ms

Ejemplo de
desambiguacin
Por ejemplo, columna en un
texto de arquitectura o columna en un texto de periodismo.

19

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

repetidas, ni las menos) se seleccionan las palabras clave del documento. Los
tericos de este mtodo son G. K. Zipf (1949), H. P. Luhn (1957), Sparck Jones
(1972) y G. Salton (1989).
Trataremos con ms detalle estos procesos en el prximo subapartado.
3.1.2. Funcionamiento y evolucin de los programas de
indizacin automtica
Los primeros estudios en indizacin automtica datan de las dcadas de 19501960. Se basaban en principios estadsticos y probabilsticos. En la dcada de
1970, G. Salton incorpora el modelo de valor de discriminacin y de relevancia de los trminos. En la dcada de 1980 aparecen los criterios lingsticos y
en la de 1990 se plantea la indizacin automtica de informacin multimedia
(imgenes y sonido). Desde la dcada de 1980 hasta la actualidad, los programas de indizacin automtica combinan el clculo estadstico con el etiquetado morfolgico y el anlisis sintctico.
Evolucin de los programas de indizacin automtica
1950-1960
Clculos estadsticos y probabilsticos

1970

1980

Relevancia de los trminos Anlisis lingstico

1980-actualidad
Modelo mixto: estadstico + lingstico

Los programas informticos de indizacin automtica buscan emular el proceso mental humano. La cuestin central que nos interesa es cmo pueden
detectar las palabras con ms carga semntica, con ms significado del texto?.
Con este objetivo, suelen seguir los siguiente pasos:
1)Lecturadelosdocumentos
El primer paso es leer el texto. Para hacerlo el documento se debe encontrar
en formato electrnico. Actualmente, muchos documentos ya se encuentran
en soporte electrnico. Tambin son fcilmente accesibles los ttulos, resmenes, sumarios o bien el texto completo en las bases de datos de publicaciones
peridicas y catlogos bibliogrficos. Si se trata de documentacin en soporte
papel, primero hay que escanearla y aplicar un programa de tipo OCR (reconocimiento ptico de caracteres) para transformar la imagen de la pgina escaneada en texto electrnico.
Cmo puede un programa detectar una palabra? El programa detecta la palabra porque la considera una cadena de caracteres entre espacio en blanco y
espacio en blanco.
2)Diseo
El equipo de documentalistas y programadores debe decidir:

Programas OCR
Estos programas OCR estn
implementados en la mayora
de escneres domsticos. Recomendamos hacer la prueba
de escanear una pgina y convertirla en texto.

CC-BY-NC-ND PID_00144350

20

Listado de descriptores libres y listado de palabras clave

Las partes del documento que sern indizables. Son obligatorios el ttulo
y el resumen y es deseable el texto entero, sobre todo en artculos.

El tratamiento que darn a las cifras, los signos de puntuacin, los guiones,
las maysculas/minsculas y los acentos. Habitualmente son caracteres
que no aportan significado, pero en determinados contextos pueden ser
determinantes.

Una vez tenemos el documento en formato electrnico y el programa ha ledo


las partes seleccionadas, el paso siguiente consiste en distinguir las palabras
que tienen significado de las que no lo tienen y, entre las que lo tienen, seleccionar las de ms relevancia en la indizacin y su recuperacin posterior. Este
paso se resuelve aplicando diversos mtodos estadsticos y lingsticos, ya sea
en un orden secuencial o bien alternando los mtodos.
3)Palabrasconcontenidoypalabrasvacas
En el lenguaje natural hay palabras que tienen mucho significado (como los
sustantivos y los adjetivos) y otras que no tanto (como los artculos o las conjunciones). Estas ltimas se conocen como palabras vacas.

Las palabrasvacas son palabras sin significado, como los artculos, los
pronombres, las preposiciones, las conjunciones o los adverbios, que
son filtradas antes o despus del procesamiento del texto.

Las palabras vacas son muy frecuentes pero aportan poco valor de contenido
semntico al texto y poca ayuda a la recuperacin, ya que el usuario no las
utiliza en la bsqueda y tampoco son recogidas en el fichero inverso de la base
de datos. Se conocen como listas de detencin en castellano y como stop word
list en ingls (Hans Peter Luhn fue el creador del trmino y del concepto stop
word).
Se elabora una lista de estas palabras vacas y se introducen en el programa,
que va leyendo el texto palabra por palabra y las contrasta con el fichero de
palabras vacas. Si el programa las encuentra en la lista, es que son vacas y no
las indiza. Si no aparecen en la lista, es que tienen significado.
Palabras vacas
Artculos

el, la, uno, una

Pronombres

mo, nuestro

Verbos

comer, ser, rer (en todas las formas verbales)

Adverbios

tranquilamente, eficazmente

Preposiciones

a, con, de, sin

Ejemplo
Hay veces que estos caracteres
s tienen importancia:
Cifras: TV3, 1492.
Puntos, guiones, signos:
www.uoc.edu, Canal+, email.
Acentos (tiles para diferenciar diacrticos): deu/Du
en cataln, te/t en castellano.

CC-BY-NC-ND PID_00144350

Numerales

cuarto, octavo

Adjetivos

alto, bajo, grande

Conjunciones

y, por lo tanto, pero, porque

21

Listado de descriptores libres y listado de palabras clave

Hay sistemas en los que la lista de palabras vacas:


a) Viene predeterminada: el sistema dispone, ya desde el principio, de la lista de palabras vacas de su idioma o idiomas. De hecho, su elaboracin es fcil, ya que slo hay que aadir las categoras vacas de una base de datos de
terminologa al idioma que se quiera. Los artculos siempre son los mismos,
las conjunciones tambin, incluso los verbos se pueden llegar a contabilizar y
flexionar en todos los tiempos verbales.
b) Se evitaexpresamente para permitir al sistema la bsqueda por frases y
sintagmas. Los sistemas que los evitan disponen de otras herramientas para
reducir significativamente el nmero de palabras indizadas, como tcnicas de
stemming o lematizacin que veremos ms adelante.
c) Est contextualizada (stop word context-dependent). Cada sistema elabora la
lista de palabras vacas segn su mbito temtico. Contextualizar el listado
permite evitar dos inconvenientes graves:

Palabras con significado que se convierten en palabras vacas.


Ejemplo
Si un usuario busca en el catlogo de una biblioteca especializada en astronoma, no
buscar por el concepto Astronoma, ya que toda la coleccin de la biblioteca har
referencia a este concepto. El concepto Astronoma deviene vaco en este contexto.

palabras vacas que se convierten en importantes en la indizacin.

Ejemplo
La lista de palabras vacas se
puede evitar, por ejemplo, para recuperar un concepto como el diario El Pas, en el que
el artculo tiene un papel importante.

22

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

Ejemplo
En un texto de historia los nmeros (como 1914, 1936), los numerales (Jaime I) y los
adjetivos pueden tener mucha carga significativa (Alta y Baja Edad Media; sobrenombres
adjetivados de personajes como Jaime I el Conquistador y acontecimientos como la guerra fra). En el ejemplo siguiente, las palabras subrayadas son palabras vacas:
Palabras castellanas que son vacas o que no dependen del mbito temtico
Palabra

En el texto

Economa

Derecho

Educacin

ESO

"Eso es lo importante..."
"La reforma de la ESO"

ESO

ESO

ESO

ESO

Cabo

"Se precisa llevar a cabo..."


"La composicin rocosa del cabo..."

cabo

cabo

cabo

cabo (geografa)

Tuya

"Yo traer la ma pero t trae la tuya."


"La tuya es un rbol perenne."

tuya

tuya

tuya

tuya (rbol)

Fuente: extracto de I. Gil Leiva (2008). Manual de indizacin. Teora y prctica (pg. 333). Gijn: Trea.

En el caso de la contextualizacin, las palabras vacas pueden ser introducidas


manualmente o bien ser el resultado de algn cmputo estadstico de frecuencia.

Multidisciplinario

23

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

Ejemplo
Supongamos el texto Osiris es el primero de todos los humanos y dioses que vive una
segunda vez.
Descompongamos ahora el texto como lo hara un programa de indizacin automtica.
Partimos del supuesto de que el programa tiene una lista de palabras vacas predeterminada que incluye preposiciones, conjunciones, numerales, verbos y artculos.
Texto

Comprobacin en la lista de palabras vacas

Resultado de
la indizacin

Osiris

no est

es un nombre propio

es

es una palabra vaca

es una forma verbal

el

es una palabra vaca

es un artculo

primero

es una palabra vaca

es un numeral

de

es una palabra vaca

es una preposicin

todos

es una palabra vaca

los

es una palabra vaca

es un artculo

humanos

no est

es un sustantivo

es una palabra vaca

es una conjuncin

dioses

no est

es un sustantivo

que

es una palabra vaca

es una conjuncin

vive

es una palabra vaca

es una forma verbal

una

es una palabra vaca

es un artculo

segunda

es una palabra vaca

es un numeral

vez

no est

es un sustantivo

Osiris

humanos
dioses

vez

El texto queda indizado con estas palabras clave:


Osiris
humanos
dioses
vez

Son muy numerosas las palabras vacas en un texto? La presencia de palabras


vacas no es en absoluto desdeable. Los estudios estadsticos calculan que el
50% de las palabras de un texto son vacas. As, un artculo de 8.000 palabras
tiene unas 4.000 palabras vacas y otras 4.000 con significado. En el ejemplo
de Osiris, las quince palabras de la frase han quedado reducidas a cuatro palabras clave (en este caso, el ejemplo buscaba pretendidamente muchas palabras
vacas para ilustrar este subapartado).
El procedimiento en PLN para distinguir las palabras vacas de las palabras con
significado consiste en la aplicacin de una lista previa de palabras vacas o de
una combinacin de mtodos estadsticos (frecuencia) y lingsticos (anlisis

24

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

morfolgico, sintctico y semntico). Desde que H. P. Hans Meter Luhn en


1957 elimin las palabras vacas, esta tcnica ha sido una constante en los
posteriores programas de indizacin automtica.
4)Mtodosestadsticos
Los mtodos estadsticos han sido la primera aproximacin a la indizacin
automtica y todava hoy en da son una parte consustancial. La teora de
fondo es el clculo del peso (ponderacin) de las palabras: ni las palabras ms
repetidas (por vacas) ni las menos repetidas (por especficas) son adecuadas
para ser seleccionadas.
Los mtodos estadsticos aplicados en PLN son de tres tipos: frecuencia, frecuencia inversa y discriminacin; y se pueden usar solos o en combinacin:
a)Frecuenciadeaparicin(leydeZipf): el psiclogo y psicolingista estadounidense George Kingsley Zipf (1949) propuso que el nmero de veces que
un trmino aparece en un texto (frecuencia) y la posicin que ocupa en una
lista de palabras ms o menos frecuentes (rango) es constante. Para Zipf los
escritores usan un abanico reducido de palabras, preferentemente cortas, y su
longitud es inversamente proporcional a la frecuencia.
Ejemplo
En la web hay disponible una copia de las palabras francesas y su frecuencia. En esta
lista vemos qu palabras de uso cotidiano tienen una frecuencia ms alta y qu palabras
menos cotidianas a la inversa.
Frecuencia de aparicin de las palabras francesas
aliments

13,97

grand

674,68

aller

234,58

laisse

120,97

ami

95,16

les

avec

3.019,71

16.011,00

neutre

11,52
0,03

collge

24,42

permutable

comit

73,71

pour

5.332,48

tre

1.986,23

translateur

0,06

got

98,77

vitamines

3,84

Fuente: extrado de http://www.lexique.org/listes/liste_mots.txt

Hans Meter Luhn (1957) aplica la ley de Zipf en el campo de la indizacin


automtica. Luhn ve que la frecuencia con la que se repite una palabra puede
ser un buen indicador para seleccionar las palabras clave con ms significado.
Las que tienen una frecuencia muy alta no acostumbran a tener carga significativa (en el ejemplo anterior serian avec, les y pour, pero recordemos que en

CC-BY-NC-ND PID_00144350

25

Listado de descriptores libres y listado de palabras clave

funcin del contexto tambin podra serlo aliments) y llevan a la recuperacin


de muchos documentos. Las que tienen una frecuencia baja suelen ser palabras muy especficas en el texto y, por lo tanto, con carga significativa, pero en
la recuperacin presentan pocos resultados. Para Luhn lo mejor para indizar
eran los trminos con una frecuencia media.
Luhn propone los pasos siguientes:

Calcular la frecuencia de todas las palabras del texto o coleccin.

Clasificarlas en orden decreciente.

Eliminar las de frecuencia ms alta.

Eliminar las de frecuencia ms baja.

Indizar con el resto de palabras.

Luhn aplica esta tcnica para eliminar las palabras vacas. A partir de l, todos
los sistemas utilizan esta tcnica para crear la lista de palabras vacas.
b)Frecuenciainversa: Sparck Jones (1972) puso de manifiesto la capacidad
de discriminacin de un trmino frente a otro. Esta discriminacin tiene que
ser vista en el conjunto de la coleccin, no en un solo documento. Hay que
comparar las palabras clave entre los documentos del fondo para detectar cules son realmente discriminatorias.

26

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

Ejemplo

Lectura recomendada

Imaginemos un fondo de cuatro documentos.

Para la resolucin del clculo


ved:

Documento 1: Visitad el Museo Picasso de Barcelona en el barrio del Borne.


Documento 2: En Figueres tambin podis visitar el Museo del Juguete.
Documento 3: El Museo de Figueres y el Museo Picasso son los ms famosos.
Documento 4: En Figueres no dejis de visitar el Museo Dal.

FranciscoJavierMartnez
Mndez. Recuperacin de informacin en la red.

Eliminemos las palabras vacas el, los, a, al, del, de, los, ms, no y todas las formas del verbo
visitar (visitad, visitar). Nos queda:
Doc.

Museo

Picasso

Barcelona

Barrio

Borne

Figueras

Juguete

Famosos

Dal

Siguiendo el ejemplo, la palabra museo que aparece en cada documento no tiene mucha
utilidad para discriminar el documento 1 del resto, en cambio Picasso, Barcelona y todas
las palabras que aparecen poco seran discriminatorias. Para medir este valor de discriminacin se propone la frecuencia inversa. El peso de una palabra aumenta si aparece pocas
veces en un documento y disminuye si aparece a menudo en el resto de documentos.
Pesos de cada palabra
Museo

Borne

0,602

Picasso

0,301

Juguete

0,602

Figueras

0,301

Famosos

0,602

Barcelona

0,602

Dal

0,602

Barrio

0,602

c)Valordediscriminacindeltrmino: G. Salton (1989), a partir de la idea


de que los vocablos de un texto se clasifican segn su capacidad para discriminar unos documentos de los dems en una coleccin, ide un sistema de indizacin, conocido como el modelodevalordediscriminacin, que atribuye
el peso o valor ms alto a aquellos trminos que causan la mxima separacin
posible entre los documentos de una coleccin. Es decir, el valor de un trmino depende de cmo vara la separacin media entre los documentos cuando
a un trmino se fija una identificacin de contenido. Por lo tanto, las mejores
palabras son aquellas que consiguen la distancia mayor. El anlisis del valorde
discriminacin consigna una funcin especfica en el anlisis de contenido a
las palabras simples, a las yuxtapuestas, a las frases y a los grupos de palabras.

CC-BY-NC-ND PID_00144350

27

Listado de descriptores libres y listado de palabras clave

El valor de discriminacin de un trmino se define como la medida de los


cambios en la separacin espacial, que se manifiesta cuando una palabra cualquiera es asignada a una coleccin como trmino de indizacin para representar mejor las diferencias que pueda haber entre los documentos. Precisamente
la asignacin reduce la densidad espacial y, por el contrario, un discriminador
pobre incrementa la densidad espacial. De este modo, si primero se calculan
las densidades espaciales y se atribuyen a cada trmino, es posible especificar
los trminos en orden decreciente segn sus valores de discriminacin (Gil y
Rodrguez, 1996).
5)Mtodoslingsticos
Los primeros analizadores lingsticos son de la dcada de 1960-1970. Su aportacin al anlisis del contenido es primordial, ya que permiten analizar el texto en tres niveles de profundidad: palabra, frase y texto.
Cada uno de estos niveles es analizado por mdulos del programa basados en
diferentes disciplinas:

Palabra: morfologa.

Palabra dentro de la frase: sintaxis.

Palabra dentro del texto: semntica.

a)Anlisismorfolgico: es la rama de la gramtica tradicional que estudia la


forma de las palabras, independientemente de sus relaciones o funciones dentro de la frase. La forma de las palabras se distribuye en diversas categoras llamadas partes de la oracin, por ejemplo nombres, adjetivos y verbos. Tambin
estudia las variaciones que pueden experimentar por motivo de los accidentes
gramaticales como el gnero, el nmero, la declinacin o la conjugacin.
El anlisis morfolgico en indizacin automtica se basa en reglas gramaticales
y diccionarios de sufijos y afijos.
Su intervencin en la indizacin automtica es muy relevante en la formacin
de la lista de palabras vacas y una primera agrupacin de las palabras, ya que:

Asigna la categora gramatical de cada una de las palabras del texto (como
nombre comn, verbo, adjetivo, adverbio o artculo), segn cul sea el
gnero, el nmero, el tiempo y el modo. Con ello se reduce el abanico de
palabras susceptibles de contener informacin, ya que detecta las palabras
vacas y las flexiones derivadas de los accidentes gramaticales (como el
gnero y el nmero). En la red hay aplicaciones gratuitas que analizan
morfolgicamente un texto; los ejemplos ms comunes son Daedalus en
castellano o Thera en castellano y cataln.

Lectura complementaria
Si queris ampliar la informacin sobre el sistema de indizacin ideado por Salton, podis leer la obra siguiente:
I.GilLeiva;J.V,Rodrguez
Muoz (1996). Tendencias
en los sistemas de indizacin
automtica. Estudio evolutivo. Revista Espaola de Documentacin Cientfica (vol. 19,
n. 3, pg. 273-291).

28

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

Ejemplo
Analizaremos un texto sobre fertilidad con Daedalus:

Asigna la raz comn de diversas palabras. El mismo anlisis morfolgico


procede a la lematizacin (stemming, en ingls), que consiste en localizar
la raz comn de un grupo de palabras (frtil, fertilidad, fertilizar, fertilizacin). La lematizacin permite contar todas las veces que un concepto
aparece en el texto, aunque se exprese con formas diferentes.
Ejemplo
En la recuperacin, cuando el usuario busque por frtil recuperar todos los dems conceptos, ya que se encuentran indizados conjuntamente.
Sin lematizador
frtil: un resultado
frtiles: un resultado
frtilmente: un resultado

Con lematizador
frtil: tres resultados

CC-BY-NC-ND PID_00144350

29

Listado de descriptores libres y listado de palabras clave

Gracias a este anlisis, los clculos estadsticos se pueden elaborar sobre un


conjunto ya seleccionado de trminos.
b) Anlisis sintctico: estudia la funcin o las asociaciones de las palabras
dentro de la frase, lo que se llama estructura sintctica. Identifica los componentes de la frase: sujeto, predicado, complementos u objetos y su concordancia. El programa de anlisis sintctico toma la frase e intenta reconocer la estructura con la que se ha construido dentro de un conjunto de anlisis posibles conocidos como gramtica.
Gracias a este anlisis, puede desambiguar gramaticalmente los trminos no
resueltos en la etapa morfolgica. Los analizadores sintcticos (parsing) se basan en analizadores morfolgicos de la etapa anterior, gramticas y diccionarios.
Ejemplo
Anlisis sintctico de la frase El Parque Nacional d'Aigestortes es un lugar paradisiaco
con Thera:

El anlisis sintctico es til para los polismicos o alguna palabra que por su
similitud podra ser considerada vaca por el programa.
Ejemplo
Analizamos la frase: Esta nota para maana8, en la que morfolgicamente cada palabra
tiene diversas opciones, pero que el anlisis sintctico puede aclarar. Por ejemplo, nota
puede ser un nombre comn femenino (la nota escrita) o una forma verbal (3. persona
del singular del presente de indicativo o 2. persona del singular del imperativo del verbo
notar), pero dentro de la frase, por su posicin, slo puede ser considerada como nombre
comn y, en consecuencia, sera una palabra que habra que indizar, no una palabra vaca.
Sin embargo, cabe decir que actualmente no todos los analizadores sintcticos pueden
llegar a estas prestaciones y cometen errores.

(8)

El ejemplo est extrado de I. Gil


(2008). Manual de indizacin. Teora y prctica. Gijn: Trea.

CC-BY-NC-ND PID_00144350

30

Listado de descriptores libres y listado de palabras clave

c)Anlisissemntico. La semntica es la rama de la lingstica que estudia


el significado de las palabras. Su utilidad reside en desambiguar sinnimos,
polismicos y vincular anforas con el trmino al que hacen referencia. Sin
embargo, esta parte del anlisis es la ms compleja para el software actual. Los
analizadores semnticos se basan en diccionarios lxicos, redes semnticas,

Las redes semnticas


Estas redes son bases de datos que representan el conocimiento de una lengua o mbito de una manera estructurada.

tesauros y ontologas.
Para la indizacin automtica son muy interesantes las bases de datos del tipo
WordNet, que dan informacin lxica y semntica de los trminos. Un algoritmo vinculado a la WordNet puede resolver casos de sinonimia o hiperonimia, ya que la base de datos proporciona relaciones bsicas de significado.
WordNet y Euro WordNet son bases de datos multilinges en diversos idiomas
(Euro WordNet comprende el neerlands, el italiano, el castellano, el alemn,
el francs, el checo y el estonio). Cada idioma disea su WordNet pero mantiene la misma estructura que la inicial de Princeton en cuanto a los trminos
sinnimos con relaciones semnticas de relacin de equivalencia entre ellos.
Las diferentes WordNet estn conectadas entre ellas y proporcionan acceso a
una ontologa compartida. En acceso gratuito slo se encuentra la Wordnet
de Princeton.
Los tesauros participan en el anlisis semntico en que aportan las relaciones
semnticas de equivalencia, jerarqua y asociacin de cada palabra clave seleccionada. Las ontologas aportan, adems, el detalle en cada tipo de relacin.
Un ejemplo es todo tipo de relaciones de asociacin entre dos descriptores.
3.2. El listado de palabras clave en la indizacin
El programa de indizacin automtica reconoce palabras, para ser ms exactos,
cadenas de caracteres entre un espacio y el siguiente. Por lo tanto, reconoce
palabras, no expresiones formadas por ms de una palabra. Decimos, pues,
que el listado de palabras clave indiza unitrminos.
Las ventajas que tienen las listas de palabras clave en la indizacin son las
siguientes:

Indizacin inmediata, en cuestin de segundos.

Coherencia de indizacin exacta entre diversos SID. Dos SID con el mismo
programa indizador llegarn al mismo resultado.

Indizacin exhaustiva y tan especfica como lo sea el contenido del documento indizado.

Actualizacin rpida de la base de datos.

Riqueza terminolgica extraordinaria: evolucin automtica de la terminologa, paralela a la misma evolucin del conocimiento y de la ciencia.

Costes mnimos de construccin y mantenimiento.

Unitrmino
Recordemos que los unitrminos son el elemento con significado ms pequeo de un trmino de indizacin. Lluvia es
un unitrmino. Lluvia de estrellas podra ser un descriptor de
un tesauro formado por dos
unitrminos: lluvia y estrellas.

CC-BY-NC-ND PID_00144350

31

Listado de descriptores libres y listado de palabras clave

Uno de los inconvenientes que tienen las listas de palabras clave en la indizacin es que las palabras con significado se indizarn tal como salgan en el
texto. Por lo tanto, puede indizar:

El mismo trmino en diferentes idiomas, por ejemplo: fuentes de informacin, fonts dinformaci, information resources, en funcin de la lengua del
texto. Y no tiene relaciones de equivalencia entre los trminos, como tienen los tesauros multilinges.

Los errores ortogrficos (tesauris, thesaurus).

Singular, plural, masculino, femenino, entre otros (encabezamiento/encabezamientos, lista/listado).

Siglas y conceptos sin distincin (SID/servicio de informacin y documentacin; UE/Unin Europea).

Sinnimos (lista de palabras vacas/stop word list).

Homnimos (Hierro, y no sabremos si hace referencia a la isla o al elemento


qumico).

Como no hay control sobre el vocabulario, no controla la ambigedad del


lenguaje natural.
3.3. El listado de palabras clave en la recuperacin
La indizacin automtica sustenta los buscadores; en consecuencia, los usuarios de Google y Yahoo conocen de una manera implcita las ventajas y los
inconvenientes de la recuperacin de documentos con este lenguaje. Tal como
dice Isidoro Gil (2008, pg. 108), el uso de Internet est convirtiendo a cada
usuario en un paradocumentalista en potencia. Los usuarios son conscientes
de que hay que escoger con cuidado las palabras clave, que deben ser cuanto
ms especficas mejor, poner el texto entre comillas, restringir la bsqueda con
operadores booleanos, especificar fechas o ir aadiendo trminos, entre otros,
si queremos evitar el ruido documental.
Las ventajas que tienen las listas de palabras clave en la recuperacin son las
siguientes:

Las bsquedas pueden ser muy precisas (todos los trminos significativos
estn presentes).

Son muy fciles de usar para el usuario.

Es el lenguaje ms actualizado, evoluciona automticamente al mismo


tiempo que la terminologa del documento. Podemos buscar iPhone, telfonos 3G, iPod, spam, spyware, entre otros, trminos que no constaran en
ningn otro lenguaje documental, dado que el proceso de actualizacin
es lento.

CC-BY-NC-ND PID_00144350

32

Listado de descriptores libres y listado de palabras clave

La inmediatez: el documento llega y, en cuestin de segundos, est indizado y disponible para la bsqueda.

En cuanto a los inconvenientes, la indizacin automtica se caracteriza por


la posibilidad de indizar, si se desea, el texto entero del documento, lo que
genera muchos puntos de acceso por materia, muchas palabras clave. Cuando
realizamos una bsqueda, el buscador nos puede devolver miles de registros,
lo que es un problema molesto (ruido documental). Sin embargo, esta caracterstica tambin minimiza problemas potencialmente peligrosos (el silencio
documental), como la prdida de conceptos y la sinonimia.
Los principales inconvenientes son los siguientes:

Prdida de conceptos. Como el programa indiza unitrminos, los conceptos expresados de una manera compuesta se separan en dos unidades y
pierden el sentido.

No reconoce la sinonimia. El programa no puede reconocer los sinnimos


del mismo concepto. Si en el texto aparecen todos estos sinnimos, el
programa no detectar ninguna semejanza entre ellos y los indizar todos:
cautivar, encantar, hipnotizar, sugestionar.

No reconoce la anfora y la elipsis.

No permite la univocidad.

Aparece ruido y silencio documentales producidos por la ambigedad pro-

Ejemplo de prdida de
conceptos
Universidad de Barcelona, por
ejemplo, se separa en universidad y Barcelona. Separar conceptos puede dar lugar a coordinacin falsa en la recuperacin como en este caso, en
el que recuperamos todas las
universidades de la ciudad de
Barcelona: UB (Universidad de
Barcelona), UPF (Universidad
Pompeu Fabra), URL (Universidad Ramon Llull), entre otras.

pia del lenguaje natural (fenmenos de sinonimia, polisemia y homonimia).

No aparece ningn tipo de control sobre variantes ortogrficas, sobre plurales, adjetivos, verbos, siglas, entre otros, ni se ejerce ningn control sobre los errores ortogrficos o de impresin que pueden aparecer en los documentos.

Hay complejidad en el momento de plantear la estrategia de bsqueda; se


necesita una agrupacin de sinnimos completa, el uso de truncamientos
y de operadores de proximidad.

Precisamente para minimizar los inconvenientes en la recuperacin, los SID


acostumbran a complementarse con otros lenguajes documentales preferentemente controlados, como un tesauro o una lista de encabezamientos de materia.
Actualmente la mayora de catlogos en lnea de bibliotecas universitarias nos
permiten realizar bsquedas por diversos campos, de los cuales destacamos
especialmente el de palabra clave de materia. Esta opcin descompone el texto

Ejemplo de estrategia de
bsqueda
Para buscar documentos sobre
la Unin Europea, por ejemplo, habra que pensar en todos sus sinnimos y siglas como UE / Unin Europea / European Union / CEE / Comunidad
Econmica Europea.

CC-BY-NC-ND PID_00144350

33

Listado de descriptores libres y listado de palabras clave

(incluso el encabezamiento construido con una lista de encabezamiento de


materia, es decir, con un lenguaje controlado y humano) en una sucesin de
palabras clave, es decir, en un lenguaje libre y automtico.

35

CC-BY-NC-ND PID_00144350

Listado de descriptores libres y listado de palabras clave

Actividades
Listadodedescriptoreslibres
1. Indizad con un listado de descriptores libres el resumen siguiente con los tres grados de
exhaustividad.
Lpez Alonso, C.; Sr, A. (eds.) (2003). Nuevos gneros discursivos: los textos electrnicos.
Madrid: Biblioteca Nueva.
Esta obra describe la transformacin de determinados discursos sociales ante la revolucin
de las nuevas tecnologas de la informacin y de la comunicacin (TIC). En efecto, Internet
forma parte de nuestra vida diaria y ya no es fcil prescindir de este medio tecnolgico. Esta
obra, que consta de tres partes, analiza estos nuevos gneros discursivos:
En la primera parte, se describen los distintos textos electrnicos el correo, los chats, los
foros y otros escritos en la red, como prensa, newsletters, E-zinc, etc.
En la segunda, se introduce al lector en la gnesis y evolucin de los lenguajes informticos
y sus diferentes tipos, especialmente los lenguajes de marcado y los modelos hipermedia.
La tercera, finalmente, se centra en los nuevos productos hipertextuales en el campo del
discurso de transmisin de conocimientos con muy variadas utilizaciones: la enseanza a
distancia o textos de consulta como los diccionarios.
2. Indizad el resumen anterior para dos bases de datos diferentes: una genrica y la otra
especializada en documentacin.
3. Analizad detenidamente el ejemplo de los tres analistas que indizan el documento sobre
los ctaros y decid por qu motivos son tan diversos los resultados.
Analista A
Baja Edad Media
ctaros
Francia
movimientos cristianos disidentes

Analista B
catarismo
herejas
rdenes monsticas
religin

Analista C
albigense
cismas
historia medieval
Languedoc

4. Elaborad una lista con las operaciones que hay que llevar a cabo sobre el lxico para transformar una lista de descriptores libres en un lenguaje controlado no codificado.
Listadodepalabrasclave
1. Indizad el texto siguiente simulando el funcionamiento de una lista de palabras clave:
Piero de Benedetto dei Franceschi (Sansepolcro, Toscana, 1416-1492) fue un pintor del quattrocento italiano conocido por su alias Piero della Francesca. Tambin fue gemetra y matemtico.
Es uno de los personajes principales y fundamentales del Renacimiento. Piero della Francesca
es un personaje itinerante: es una figura que encontraremos en Ferrara entre 1447 y 1448
trabajando con Lionello dEste; en Rimini para Sigismundo Malatesta en torno al 1450; en
Roma para el papa Po II entre 1458 y 1459, y en Urbino para Federico de Montefeltro en
diversas ocasiones. Su actitud itinerante se suele comparar con la de Leon Batista Alberti. El
autor nace en Borgo San Sepolcro (al norte de Florencia, en la zona de la Umbra) en 1416.
El autor proviene de una familia de mercaderes y, por eso, saba aritmtica, clculo, lgebra,
geometra y contar con el baco. Despus de la formacin que tuvo para llevar el negocio
familiar se form con un maestro local que se llamaba Antonio di Anghiari para ser pintor. En
aquellos momentos, haba muchos estilos: todava estaba vigente el linealismo y el lirismo de
Fra Angelizo, Panozzo Gonzolo o Filippo Lipi y, por otra parte, estaba el realismo geomtrico
de Paolo Uccelo.
Tiene un estilo pictrico muy particular y, por lo tanto, es fcil de identificar. Utiliza una luz
muy diurna y unos colores muy brillantes, que le provienen de su contacto con Domenico
de Venezziano. En su obra siempre est presente el peso de la geometra, que implica, por
una parte, utilizar la perspectiva lineal y, por la otra parte, reducir las figuras a la esencia. Las
figuras de Piero della Francesca son muy estticas, poco nerviosas, lo que va al revs que en el
resto de pinturas renacentistas de Florencia, que a medida que avanzamos en el tiempo cada
vez son ms dinmicas. Tambin vemos que sus figuras son poco expresivas y monolticas.
Longhi, cuando habla de Piero, dice que sus figuras son columnes.
"Piero della Francesca", Wikipedia

CC-BY-NC-ND PID_00144350

36

a) Disead las opciones del programa que simularis (partes del texto, signos y smbolos).
b) Cuntas palabras vacas habis localizado?
c) Qu inconvenientes plantear en la recuperacin?

Listado de descriptores libres y listado de palabras clave

CC-BY-NC-ND PID_00144350

37

Listado de descriptores libres y listado de palabras clave

Glosario
anlisis morfolgico m Rama de la gramtica tradicional que estudia la forma de las
palabras, independientemente de sus relaciones o funciones dentro de la frase. La forma de
las palabras se distribuye en diversas categoras llamadas partes de la oracin, que son, entre
otros, nombres, adjetivos y verbos. Tambin estudia las variaciones que pueden experimentar
por motivos de los accidentes gramaticales como el gnero, el nmero, la declinacin o la
conjugacin.
anlisis semntico m Rama de la lingstica que estudia el significado de las palabras. Su
utilidad reside en desambiguar sinnimos, polismicos y vincular anforas con el trmino
al que hacen referencia.
anlisis sintctico m Estudio de la funcin o de las asociaciones de las palabras dentro
de la frase, lo que se llama estructura sintctica. Identifica los componentes de la frase: sujeto,
predicado, complementos u objetos y su concordancia. El programa de anlisis sintctico
toma la frase e intenta hacer evidente la estructura con la que se ha construido dentro de un
conjunto de anlisis posibles conocidos como gramtica.
automatic indexing f Ved indizacin automtica.
clasificacin social f Ved indizacin social.
coordinacin falsa f Recuperacin inesperada (y errnea) que a pesar de contener los
elementos de la bsqueda corresponden a temas diferentes.
descriptor libre m Trmino de indizacin propio del lenguaje documental. Lista de descriptores libres.
etiquetaje colaborativo m Ved indizacin social.
etiquetaje social m Ved indizacin social.
folksonoma f Neologismo (Thomas van der Wal) resultado de la fusin de folk (gente,
popular) y taxonoma (gestin de la clasificacin), lo que da como resultado una indizacin
gestionada popularmente.
sin. indizacin social.
frecuencia de aparicin f Ley de Zipf. El psiclogo y psicolingista estadounidense George Kingsley Zipf (1949) propuso que el nmero de veces que un trmino aparece en un texto
(frecuencia) y la posicin que ocupa en una lista de palabras ms o menos frecuentes (rango)
es constante. Para Zipf los escritores usan un abanico reducido de palabras, preferentemente
cortas y su longitud es inversamente proporcional a la frecuencia.
frecuencia inversa f Sparck Jones (1972) puso de manifiesto la capacidad de discriminacin de un trmino frente a otro. Esta discriminacin tiene que ser vista en el conjunto de
la coleccin, no en un solo documento. Hay que comparar las palabras clave entre los documentos del fondo para detectar cules son realmente discriminatorias.
indizacin automtica f Mtodo por el que un ordenador aplica un algoritmo (o programa) al ttulo, resumen o texto completo del documento con el fin de identificar los trminos que puedan representar la materia y usar como trminos de indizacin y recuperacin
en un ndice o lista.
en automatic indexing.
indizacin social f Tipo de indizacin en red en el que los internautas asignan etiquetas
con descriptores a los recursos web. La asignacin de las etiquetas se hace sin nimo de lucro,
no se busca un beneficio econmico sino beneficiarse de bsquedas mejores. Los descriptores
escogidos no se supervisan ni tienen ninguna estructura semntica.
sin. clasificacin social, etiquetado colaborativo, etiquetado social, folksonoma
en tagging.
lematizacin f Localizacin de la raz comn de un grupo de palabras.
en stemming.
listado de descriptores libres f Lenguaje documental. Vocabulario monolinge de trminos de indizacin ordenados alfabticamente. Estos trminos son escogidos por el analista, sin verificar si existen o cmo se introducen en una lista previamente establecida.

CC-BY-NC-ND PID_00144350

38

Listado de descriptores libres y listado de palabras clave

listado de palabras clave f Lenguaje documental. Vocabulario ordenado alfabticamente de los trminos con carga significativa extrados de un documento mediante un programa
informtico.
machine-aided indexing m Ved mtodo de indizacin semiautomtica.
mtodo de indizacin semiautomtica m El programa selecciona posibles descriptores
procedentes de un tesauro o de una lista controlada y un documentalista acepta o deniega
la propuesta.
en machine-aided indexing.
mtodo estadstico m Primera aproximacin a la indizacin automtica. Calcula el peso
(ponderacin) de las palabras: ni las palabras ms repetidas (por vacas) ni las menos repetidas
(por especficas) son adecuadas para ser seleccionadas. Los mtodos estadsticos aplicados
son de tres tipos: frecuencia, frecuencia inversa y discriminacin. Se pueden usar solos o en
combinacin.
mtodo lingstico m Mtodo que permite analizar el texto en tres niveles de profundidad: palabra (anlisis morfolgico), frase (anlisis sintctico) y texto (anlisis semntico).
OCR m Ved reconocimiento ptico de caracteres.
palabra vaca f Palabra sin significado como, por ejemplo, artculos, pronombres, preposiciones o conjunciones, que es filtrada antes o despus del procesamiento del texto. Son
palabras muy frecuentes pero que aportan poco valor de contenido semntico al texto y
tambin poca ayuda en la recuperacin, ya que el usuario no las utiliza en la bsqueda y
tampoco son recogidas en el fichero inverso de la base de datos.
sin. lista de detencin
en stop word list.
palabra clave f Trmino de indizacin propio del lenguaje documental. Lista de palabras
clave.
reconocimiento ptico de caracteres m Programa que transforma la imagen de la pgina escaneada en texto electrnico (de la expresin inglesa optical character recognition, OCR).
stemming m Ved lematizacin.
stop word list f Ved palabra vaca.
tagging m Ved indizacin social.
valor de discriminacin del trmino m Mtodo estadstico aplicado a la indizacin
automtica, desarrollado por Salton (1985). La medida de los cambios en la separacin espacial que se manifiesta cuando una palabra cualquiera es asignada en una coleccin como
trmino de indizacin para representar mejor las diferencias que pueda haber entre los documentos. La asignacin reduce la densidad espacial y, por el contrario, un discriminador
pobre incrementa la densidad espacial. De este modo, si primero se calculan las densidades
espaciales y se atribuyen a cada trmino, es posible especificar los trminos en orden decreciente segn sus valores de discriminacin.

CC-BY-NC-ND PID_00144350

39

Listado de descriptores libres y listado de palabras clave

Bibliografa
Alonso Berrocal, J. L.; Figuerola, C. G.; Zazo Rodrguez, A. (2009). Recuperacin avanzada de la informacin. Salamanca. [Fecha de consulta: 31 de julio de 2009].
Cid, P.; Cuadrado, M.; Aguiriano, C. (1999). Fonaments de llenguatges documentals [documento electrnico]. Barcelona: UOC.
Gil Leiva, I. (2008). Manual de indizacin. Teora y prctica. Gijn: Trea.
Gil Leiva, I.; Rodrguez Muoz, J. V. (1996). Tendencias en los sistemas de indizacin
automtica. Estudio evolutivo. Revista Espaola de Documentacin Cientfica (vol. 19, n. 3,
pg. 273-291).
Hassan Montero, Y. (2006). Indizacin social y recuperacin de informacin. No Solo
Usabilidad (n. 5). ISSN 1886-8592.
Mndez, E.; Moreiro, J. A. (1999). Lenguaje natural e indizacin automatizada. Ciencias
de la Informacin (pg. 11-24).
Quintarelli, E. (2005). Folksonomies: power to the people. ISKO Italy-UniMIB meeting:
Miln. [Fecha de consulta: 31 de julio de 2009].
Salton, G. (1988). Automatic text processing: the transformation, analysis, and retrieval of information by computer. Reading: Addison-Wesley.
Slype, G. van (1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin en los
sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez Ruiprez (Biblioteca
del Libro).
Pginas web interesantes
Cibermetra
Cybermetrics. Recursos presentados por el departamento de CINDOC dentro del Consejo
Superior de Investigaciones Cientficas; artculos, seminarios, etc.
Blog spot. Acceso a algunos artculos sobre cibermetra.
Cybermetrics. Software disponible relativo a la cibermetra.
Webometrics and organizations. Enlaces hacia publicaciones y grupos de trabajo sobre cibermetra.
Applications of informetrics to information retrieval research. Artculo que relaciona la cibermetra con la recuperacin de informacin.
The diameter of the world wide web. Artculo sobre la medicin de la web realizada por los
autores.
Inteligencia artificial
World Scientific: Connecting great minds. Vnculos a varias publicaciones peridicas sobre
campos especializados como inteligencia artificial o sistemas neuronales.
AI international. Vnculos a entidades investigadoras sobre el tema como universidades y
laboratorios, as como vnculos a congresos que versen sobre el mismo como la AAAI o las
PRICAI.
Otras pginas web de inters
The Open Archives Initiative.
GOOGLE-WATCH. Pgina crtica sobre el sistema de recuperacin de Google (el aparente uso
comercial del orden de la recuperacin).
RDF: modelo de metadatos flexible. Pgina sobre metadatos, con recursos web relacionados.
DUBLINCORE: Metadata Initiative (DCMI). Iniciativa de metadatos para pginas web, conversin de formatos... Proyectos, software, grupos de trabajo.

CC-BY-NC-ND PID_00144350

40

Listado de descriptores libres y listado de palabras clave

Pew Internet & american life. Web dependiente del Pew Research Center, con acceso a publicaciones de actualidad sobre internet.
z39.50 International Standard Maintenance Agency. Pgina sobre el mantenimiento de este
protocolo de bsqueda e intercambio de informacin.

También podría gustarte