Lenguajes Documentales
Lenguajes Documentales
Lenguajes Documentales
documentales
Manela Junc Campdepadrs
Damin Martnez Ferreras
PID_00143955
Lenguajes documentales
CC-BY-NC-ND PID_00143955
Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es
CC-BY-NC-ND PID_00143955
Contenidos
Mdulo didctico1
La cadena documental
Manela Junc Campdepadrs
1.
Cadena documental
2.
Fase de entrada
3.
4.
Fase de salida
5.
6.
Mdulo didctico2
Anlisis de contenido: resumen e indizacin
Manela Junc Campdepadrs
1.
El anlisis de contenido
2.
El resumen
3.
La indizacin
4.
5.
Mdulo didctico3
Sistemas de clasificacin documentales
Manela Junc Campdepadrs
1.
2.
3.
4.
Empezamos a clasificar
5.
6.
Mdulo didctico4
Listas de encabezamientos de materia y listas de autoridades
Manela Junc Campdepadrs
1.
2.
3.
4.
5.
6.
Encabezamientos y subencabezamientos
7.
8.
9.
Lenguajes documentales
CC-BY-NC-ND PID_00143955
Mdulo didctico5
Los tesauros
Damin Martnez Ferreras
1.
El tesauro
2.
3.
4.
5.
6.
Tesauros y ontologas
Mdulo didctico6
Listado de descriptores libres y listado de palabras clave
Manela Junc Campdepadrs
1.
2.
3.
Lenguajes documentales
La cadena
documental
Manela Junc Campdepadrs
PID_00143966
CC-BY-NC-ND PID_00143966
Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es
La cadena documental
La cadena documental
CC-BY-NC-ND PID_00143966
ndice
Introduccin...............................................................................................
Objetivos.......................................................................................................
1.
Cadena documental...........................................................................
2.
Fase de entrada...................................................................................
2.1.
Seleccin ......................................................................................
2.1.1.
3.
archivstico .....................................................................
10
2.1.2.
11
2.1.3.
11
2.1.4.
12
2.2.
Adquisicin ..................................................................................
14
2.3.
Recepcin ....................................................................................
15
2.4.
Conclusiones ...............................................................................
16
17
3.1.
18
3.1.1.
18
3.1.2.
19
3.1.3.
20
3.1.4.
21
3.1.5.
22
3.1.6.
Conclusiones ..................................................................
22
23
3.2.1.
23
3.2.2.
Ordenacin ....................................................................
23
3.2.3.
25
3.2.4.
Conclusiones ..................................................................
26
Fase de salida......................................................................................
28
4.1.
28
3.2.
4.
5.
28
4.1.2.
29
4.1.3.
30
4.2.
31
4.3.
Conclusiones ...............................................................................
33
34
La cadena documental
CC-BY-NC-ND PID_00143966
6.
37
Actividades..................................................................................................
39
Glosario........................................................................................................
40
Bibliografa.................................................................................................
44
CC-BY-NC-ND PID_00143966
Introduccin
Ved
Seleccin
2.1. Seleccin
Adquisicin
2.2. Adquisicin
Recepcin
2.3. Recepcin
Anlisis documental
Anlisis formal
Anlisis de contenido
Procesamiento tcnico
Instrumentos de bsqueda
Servicios de difusin
La cadena documental
CC-BY-NC-ND PID_00143966
Objetivos
Con el estudio de los materiales asociados a este mdulo alcanzaris los objetivos siguientes:
La cadena documental
CC-BY-NC-ND PID_00143966
La cadena documental
1. Cadena documental
(1)
aplican a la coleccin o fondo documental de un servicio de informacin y documentacin (SID1) y que comprenden las fases de entrada,
anlisis-tratamiento y difusin.
Cuando un usuario consulta un catlogo o una base de datos encuentra perfectamente organizados todos los documentos. Cada uno de ellos ha sufrido
un proceso, conocido como cadena documental2, que lo ha llevado desde el
punto donde se ha generado el documento (editorial, despacho...) hasta las
estanteras a punto de ser consultado. El documentalista del SID, de acuerdo a
las diferentes polticas de adquisicin o de gestin documental definidas en la
organizacin, ha decidido que vala la pena seleccionarlos, los ha registrado,
ha analizado tanto los atributos formales como los de contenido de acuerdo
con las normativas nacionales e internacionales y finalmente los ha preparado
para ser difundidos entre los usuarios.
Los procesos de la cadena se aplican a todo tipo de SID (archivos, bibliotecas y
centros de documentacin) y de documentos (textos, audiovisuales, tanto en
papel como electrnicos). Los procesos no se aplican, sin embargo, de manera
uniforme en todos los casos, ya que la documentacin de archivo generada en
procesos internos se trata de manera diferente a la documentacin incluida en
la cadena bibliogrfica de una biblioteca o de un centro de documentacin,
ya que se utilizan normas de descripcin diferentes y se generan instrumentos
de bsqueda tambin diferentes.
Documentos de archivo y colecciones
Documentosdearchivo:
Documentos que se originan en el seno de un archivo, fruto de sus actividades y
procesos (memorias, balances, actos, facturas, albaranes, cartas, informes, catlogos
de productos, etc.), cuyo tratamiento se har a partir de las tcnicas archivsticas y
las polticas de gestin documental.
Colecciones:
Documentos que una biblioteca o un centro de documentacin adquieren para llevar a cabo su actividad principal de gestionar informacin (libros, revistas, bases
de datos, material audiovisual, etc.), cuyo tratamiento se har segn las normas desarrolladas por la biblioteconoma.
(2)
CC-BY-NC-ND PID_00143966
La cadena documental
CC-BY-NC-ND PID_00143966
La cadena documental
2. Fase de entrada
2.1. Seleccin
La imposibilidad de llevar a cabo el anlisis documental del total de documentos interesantes para el centro.
Todos los SID tienen una poltica de fondos de archivo y/o de desarrollo de
la coleccin que permite construir un til y equilibrado fondo bibliogrfico
o archivstico. Esta poltica incluye la seleccin como una de las fases ms
relevantes, adems de la planificacin de recursos a compartir, por ejemplo,
reemplazar obras perdidas o daadas, deseleccionar tems (no renovar suscripciones) y expurgar documentos.
Seleccin
CC-BY-NC-ND PID_00143966
10
La cadena documental
Ved tambin
Los factores que intervienen
en el proceso de seleccin son
objeto de estudio en las asignaturas Gestin integral de archivos y Gestin documental.
El recurso de la economa
de escala
Dado que la mayor parte del
presupuesto se dedica a la adquisicin de fondos, los consorcios bibliotecarios dedican
muchos esfuerzos a confeccionar economas de escala y
conseguir pactar mejores condiciones econmicas en los
contratos de paquetes documentales.
Decidir el tamao ptimo es una tarea compleja, ya que una coleccin grande
no es forzosamente la mejor, pero si no contiene un nmero adecuado de documentos, puede dejar algunas necesidades sin cubrir. Existen normas cuantitativas, editadas por organismos como las asociaciones y federaciones de bibliotecas, que dan pautas del tipo de 2 a X volmenes por habitante o estudiante, nmero de volmenes mnimos de una coleccin, incremento anual,
etc. Se aplican sobre todo en bibliotecas pblicas.
Actualmente las colecciones son muy diversas y no estn formadas slo por
un tipo de documento, como tiempo atrs. Los tipos de documentos a seleccionar son muy variados: obras de referencia, monografas, publicaciones peridicas, publicaciones oficiales, bases de datos de revistas, etc., tanto en formato impreso como electrnico. La documentacin no es original (excepto
algunos ejemplares antiguos y raros), lo que permite que sea reemplazado si se
deteriora o se pierde. Este hecho hace de la documentacin bibliotecaria una
documentacin estable y segura.
Obras de referencia:
Enciclopedias, diccionarios,
manuales, estadsticas, anuarios, directorios, guas, fuentes geogrficas, fuentes bibliogrficas, catlogos, repertorios,
boletines, ...
CC-BY-NC-ND PID_00143966
11
La cadena documental
Literatura gris:
Repertorios bibliogrficos como la base de datos del ISBN3 que recoge toda
la produccin editorial.
(3)
Lectura complementaria
Podis ampliar la informacin sobre la seleccin leyendo la obra siguiente:
M.A.LpezHernndez
(1996). La seleccin documental. Revista general de informacin y documentacin.
Madrid.
CC-BY-NC-ND PID_00143966
12
b)Aspectosdecontenido: ttulo suficientemente explcito, cobertura adecuada al SID (cobertura temtica, cronolgica y geogrfica). Los elementos ms
definitivos son los de contenido intelectual: la autora reconocida del organismo y autor, los elementos constitutivos de la obra (prlogo, introduccin,
etc.), la organizacin del contenido (sumarios, ndices, cuadros, imgenes, bibliografa, etc.), la exhaustividad y las posibilidades de actualizacin (suple-
La cadena documental
Lectura complementaria
Podis encontrar el trabajo
de Gloria Carrizo en:
G.CarrizoSaineroet al.
(2000). Manual de fuentes de
informacin. Madrid: CEGAL.
Ved tambin
Los parmetros establecidos
por Llus Codina se estudian en
la asignatura Fuentes de informacin.
Trminos sinnimos
Otros trminos sinnimos de
expurgar son: descartar, retirar, hacer una seleccin negativa. UNE-ISO 15489-1:2006.
Informacin y documentacin:
gestin de documentos parte 1 Generalidades. UNE-ISO
15489-2:2006. Informacin y
Documentacin. Gestin de documentos parte 2 directrices.
CC-BY-NC-ND PID_00143966
13
Favorecer un mejor manejo de la coleccin: los documentos en las estanteras son los ms pedidos y no hay que buscar entre toda la produccin.
La cadena documental
Lectura complementaria
Podis ampliar la informacin sobre el tema de la expurgacin en:
A.VallCasa (2006). Esporgar: per qu, com i quan.
BID Textos universitaris de biblioteconomia i documentaci
(n. 16, junio, pg. 2). Barcelona.
Lectura recomendada
Marc legal de lesporgament
en arxius; Comissi Nacional
dAccs, Avaluaci i Tria Documental (CNATD). Generalitat de Catalunya.
CC-BY-NC-ND PID_00143966
14
El destino de los documentos expurgados puede ser diverso. Algunos se quedan en la biblioteca, otros se retiran, se dan a otras bibliotecas, se hacen donaciones solidarias a ONG, van a la Central de Prstamo del gobierno correspondiente, se guardan en almacenes (como el proyecto GEPA del Consorcio
de Bibliotecas Universitarias de Catalua), se regalan, se venden (opcin muy
establecida en el mundo anglosajn y no tanto aqu), o se destruyen.
2.2. Adquisicin
La cadena documental
El CBUC
En Catalua, el Consorci de
Biblioteques Universitries de
Catalunya (CBUC) mantiene
el programa GEPA (Garanta
de Espacio para la Perpetuidad
del Acceso), que es un almacn cooperativo donde conservar y preservar los documentos
de bajo uso del consorcio.
Los SID adquieren o incorporan volmenes y documentos a travs de diferentes vas, algunas de ellas gratuitas y otras de pago:
1) Acceso gratuito (open acces): es toda aquella informacin dispuesta de
forma gratuita y universalmente accesible va Internet.
Open access es un nuevo modelo de distribucin de informacin acadmica desarrollado por investigadores y documentalistas para contrarrestar las limitaciones impuestas por los comerciales (suscripciones elevadas), particularmente en el campo de las ciencias de la salud y la tecnologa.
2)Compra: puede ser directa o por suscripcin al editor, la librera, el proveedor. Es la va ms habitual en bibliotecas y centros de documentacin. Implica
un conocimiento elevado de la produccin bibliogrfica, los canales de distribucin y venta.
3)Donacin: es la cesin gratuita de documentos. Puede venir por parte del
autor de la obra, por un particular o por la propia dinmica de la institucin.
Las donaciones pueden ser definitivas o temporales. Se da, sobre todo, en las
donaciones de las editoriales, de las administraciones pblicas y en los lotes
fundacionales que la administracin estatal o autonmica remite a las bibliotecas pblicas de su titularidad. Entre las donaciones podemos distinguir los
Adquisicin
Open Acces
Ejemplos de informacin gratuita son los repositorios institucionales, los depsitos de archivos abiertos o los recolectores.
Web recomendada
En esta direccin podis consultar todas las instituciones
espaolas que tienen archivos en abierto:
OpenDOAR (Directory
of Open Access Repositories).
Los legados son donaciones provenientes de testamentos y estn formados por colecciones particulares completas o parciales.
Los depsitos son donaciones en las que la propiedad contina siendo del
donante.
4)Intercambio: como su nombre indica, consiste en el intercambio de material duplicado (o poco solicitado) entre dos centros. El intercambio se acostumbra a dar ms fcilmente en las redes de SID. Se intercambian duplicados,
publicaciones propias o de las instituciones a las que estn vinculados y literatura gris.
Webs recomendadas
En la web de la Biblioteca de
Catalunya podemos consultar las condiciones y el listado de donantes.
En la web del Arxiu Nacional
de Catalunya, concretamente
en el apartado de descripcin
del fondo, podemos consultar la tipologa de fondos que
han llegado por donacin.
CC-BY-NC-ND PID_00143966
15
La cadena documental
Instituciones
tida.
(4)
Lectura complementaria
Sobre las transferencias podis consultar la obra siguiente:
R.AlberchiFugueras
(1999). El tractament tcnic
dels documents. Gesti integral darxius. Barcelona: Fundaci per a la Universitat
Oberta de Catalunya.
La recepcin es el ltimo proceso de la fase de entrada y consta de tareas administrativas, el registro y la preparacin del material.
Las tareas administrativas vinculadas a la adquisicin son diferentes segn la
documentacin haya llegado por compra, transferencia, donacin, etc.
Con respecto a las compras, las tareas son comprobar el estado del pedido,
aceptar la factura o, si es el caso, reclamar y gestionar los pagos. Con respecto
a los documentos procedentes de la actividad y el proceso de organizacin,
las tareas a realizar en el momento de la recepcin son la evaluacin y el registro, de acuerdo con los procedimientos definidos en el sistema de gestin
documental.
Recepcin
CC-BY-NC-ND PID_00143966
16
La cadena documental
Ved tambin
Todas estas operaciones ligadas a los documentos de archivo son objeto de estudio en las
asignaturas Gestin integral de
archivos y Gestin documental.
CC-BY-NC-ND PID_00143966
17
El anlisis documental transforma el documento original en un registro documental que se introduce en el catlogo o inventario. El procesamiento tcnico
se ocupa de ordenar y conservar los documentos en condiciones ptimas.
La cadena documental
CC-BY-NC-ND PID_00143966
18
La cadena documental
Anlisisdocumental
Los documentos tienen una serie de atributos formales (autor, ttulo, edicin,
extensin, etc.) y atributos de contenido (la materia, el resumen); los documentos de archivo tienen, adems, el contexto histrico y social en el que fueron generados. El analista vaca estos atributos de acuerdo con normas descriptivas y elabora otro producto documental nombrado referenciadocumental,
que contiene todos los datos identificativos y descriptivos del documento. Es-
Documentos de archivo
Dada la extensin de un registro archivstico, para ver
un ejemplo recomendamos
la consulta directa a la norma
ISAD(G), pg. 99, fondo del
organismo Consejo real de Espaa e Indias.
Bonnassie, Pierre
Ttulo
Vocabulariobsicodelahistoriamedieval/PierreBonnassie;trad.
cast.yadapt.deManuelSnchezMartnez
Descripcin
Edicin
4. ed.
ISBN
8474232015
Coleccin
Materia
Terminologa
No hay consenso terminolgico sobre el trmino referencia documental. Otros nombres
son resea, ficha catalogrfica, registro bibliogrfico (usado en catlogos), registro documental (usado en bases de
datos documentales).
Como se puede apreciar, la referencia documental es la representacin condensada del documento/fondo. Puede ir acompaada del sumario y el resumen de la obra.
Por qu necesitamos referencias documentales? Porque no es operativo trabajar con los documentos originales, ya que estos slo pueden estar en un lugar a la vez, y porque a veces no son unidades independientes sino que forman
parte de otra obra. Por ejemplo, el documento de un expediente, etc.
19
CC-BY-NC-ND PID_00143966
La cadena documental
(5)
descripcin normalizada acordada a nivel internacional: las ISAD(G) del International Council on Archives.
En Catalua, la Norma de Descripci Arxivstica de Catalunya (NODAC7) se
(6)
ISAD(G) es la sigla de General International Standard Archival Description (Norma Internacional General de Descripcin Archivstica).
(7)
graphic Description (ISBD ), publicadas por la International Federation of Library Associations and Institutions (IFLA9) y la primera parte de las AngloAmerican Cataloguing Rules (AACR2R10), que nos indican los elementos esenciales de la descripcin documental, de qu partes del documento se tienen
que sacar, en qu orden hay que ponerlas, y qu signos de puntuacin y caracteres grficos se tienen que usar. Hay una ISBD(G) que es el marco general
y abstracto y toda una serie de ISBD para los diferentes tipos de documentos.
Ejemplos de ISBD
(8)
Ved tambin
Las normas ISBD y AACR2R se
estudian en la asignatura Anlisis documental, y la norma
ISAD(G) en la asignatura Gestin integral de archivos.
CC-BY-NC-ND PID_00143966
20
La cadena documental
2) Establecer y normalizar los puntos de acceso bibliogrficos por autor y ttulo. Los puntos de acceso son nombres, cdigos o trminos que sirven para
localizar y buscar el documento. Los ms habituales en este anlisis formal son
el autor y el ttulo, pero en entornos automatizados cualquier elemento puede
ser recuperado (como el lugar y el ao de edicin, el ISBN).
Para alcanzar este objetivo con colecciones de biblioteca utilizaremos la segunda parte de las AACR2R; 2. edicin revisada: puntos de acceso por autor y
ttulo. En archivos, la norma para el control de autoridades es la Norma Inter-
(11)
Bonnassie, Pierre
Ttulo
Vocabulariobsicodelahistoriamedieval/PierreBonnassie;trad.cast.y
adapt.deManuelSnchezMartnez
Descripcin
Edicin
4. ed.
ISBN
8474232015
Coleccin
Ved tambin
El anlisis formal se estudia en
la asignatura Anlisis documental.
Reflexin
El material que tenis en las
manos trata precisamente del
anlisis de contenido de la cadena documental.
CC-BY-NC-ND PID_00143966
21
La cadena documental
Las normativas propias de cada lenguaje documental: vocabulario, combinaciones, mantenimiento, actualizacin.
Campos propios del anlisis de contenido en la referencia de Pierre
Bonnassie: materia y resumen
Campos propios del anlisis de contenido en la referencia de Pierre Bonnassie
Materia
Resumen
Este es un libro poco corriente. Ni diccionario ni manual, significa una nueva y eficaz forma de introduccin -a la
vez analtica y sinttica- a los problemas de la historia de la Edad Media. En efecto, a partir del anlisis de medio
centenar de conceptos fundamentales y de su evolucin semntica, el profesor Pierre Bonnassie, de la Universidad de Toulouse, consigue definir, con inslita precisin, las grandes cuestiones que hoy tiene planteadas la historia medieval. El resultado es un texto innovador, de uso obligado para profesores y estudiantes, que encontrarn en l un instrumento de trabajo insustituible.
Los lenguajes documentales usados tradicionalmente en los archivos son cuadros de clasificacin construidos a medida del fondo. El anlisis de contenido
es sinttico, no se analizan los documentos individualmente, sino el fondo
en su conjunto, dado que un documento forma parte de una cadena de documentos ordenados (cronolgicamente, orgnicamente, funcionalmente) y
Clasificacin orgnica
La clasificacin orgnica es el
retrato de la estructura orgnica de la entidad que haya generado la documentacin.
(12)
(13)
22
CC-BY-NC-ND PID_00143966
La cadena documental
Ved tambin
El formato MARC se estudia en
la asignatura Anlisis documental.
Para materiales publicados, la norma ISO 690 (traducida al castellano como UNE 50-104).
Ved tambin
Estas dos normativas se estudian en la asignatura Fuentes
de Informacin.
3.1.6. Conclusiones
A modo de resumen, a continuacin tenis una tabla que recoge los conceptos ms importantes de las operaciones y normativas que hacen referencia al
anlisis documental.
Resumen de operaciones y normativas del anlisis documental
Operacin
Anlisis formal
Normativaconlacualsealcanza
ISBD y la primera parte de las AACR2R con
respecto al material bibliogrfico.
ISAD(G) con respecto a la descripcin de documentos de archivo.
Elaborar los puntos de acceso bibliogrficos La segunda parte de las AACR2R. 2 edicin
por autor y ttulo.
revisada para material bibliogrfico.
Anlisis de contenido
Resumir
23
CC-BY-NC-ND PID_00143966
En conjunto
La cadena documental
Indizar
Este conjunto de tareas, ordenacin, almacn y medidas de conservacin, se conoce como procesamientotcnico.
Signatura topogrfica
Los libros, por ejemplo, llevan
la signatura topogrfica en el
extremo inferior del lomo.
CC-BY-NC-ND PID_00143966
24
La cadena documental
Combinacin de criterios
Estos criterios se pueden combinar en una misma biblioteca. Por ejemplo, una biblioteca pblica de una ciudad de 30.000 habitantes puede tener una sala infantil y el resto
del edificio para adultos; dentro de cada espacio, los documentos ordenados por temas,
y dentro de cada tema, por tipo (dentro de geografa, primero los atlas, despus monografas, dvd, etc.), y finalmente una sala o espacio para documentos con algn formato
especial.
Una vez los documentos estn en los compactos o las estanteras, hay tres tipos
de ordenaciones (Maniez, 1993):
a)Ordenacionesnosignificativas: son aquellas en las que no hay relacin
con el contenido del documento. Es una ordenacin til en SID que no den
acceso libre a las estanteras, y que la recuperacin la haga el documentalista.
Apropiado para SID que tengan su coleccin en el depsito y no en la sala de
lectura. Es el mtodo ms usado en Archivos.
Ordenaciones no significativas
Un ejemplo de ordenacin no significativa sera ordenar segn el nmero asignado a la
llegada.
Lectura complementaria
Podis encontrar ms informacin sobre estos tres tipos
de ordenacin en la obra siguiente:
J.Maniez(1992). Los lenguajes documentales y de clasificacin: concepcin, construccin
y utilizacin en los sistemas documentales. Madrid: Pirmide
/ Fundacin Germn Snchez
Ruiprez.
CC-BY-NC-ND PID_00143966
25
Combinacin de criterios
Estos criterios se pueden combinar en una misma biblioteca. Por ejemplo, una biblioteca
pblica puede ordenar de la siguiente manera:
Sea cual sea la ordenacin, cada documento tiene que tener un lugar nico
y el sistema tiene que ser susceptible de ampliacin (estanteras parcialmente
vacas). En los SID de libre acceso la ordenacin tiene que ser sencilla y comprensible para el usuario.
3.2.3. Almacenamiento y conservacin
El ao 1979 es un hito en la historia de la conservacin de las colecciones
bibliogrficas. En esta fecha, la IFLA, a travs de su Seccin de Conservacin,
present un documento que se edit el ao 1986 con el nombre de Principios
para la preservacin y conservacin de los materiales bibliogrficos.
Hasta entonces, la conservacin documental se relacionaba con dos operaciones: la encuadernacin y la restauracin de libros y manuscritos antiguos. Estas actividades se consideraban casi un lujo reservado slo a selectivas bibliotecas y archivos con fondo de extraordinario valor.
El documento de la IFLA ampli el concepto de conservacin documental en todo tipo de SID y de fondo. Distingue tres actividades: la preservacin, la conservacin y la restauracin.
Las causas que provocan la degradacin pueden ser internas o externas al documento (Cid 1999, basado en Borell y Bello 1995):
a)Causasinternas. La naturaleza orgnica del papel, los aditivos y las tintas
de los documentos los hacen susceptibles de deterioro.
b)Causasexternas. Pueden ser:
La cadena documental
La ordenacin de las
novelas
Por qu las novelas no se ordenan siguiendo la clasificacin CDU, es decir de manera altamente significativa? La
CDU clasifica las novelas por
el idioma original del texto, de
manera que una obra de Paul
Auster est clasificada como
novela norteamericana, y una
de Jorge Luis Borges como novela argentina, aunque el SID
la tenga en cataln o castellano. Buscar por el pas de origen del escritor puede resultar
complicado, as que se prefiere
un criterio alfabtico.
CC-BY-NC-ND PID_00143966
26
La cadena documental
Causas extraordinarias: incendios, inundaciones, robos. Se instalan sistemas de deteccin del fuego y puertas cortafuegos. Los documentos se alejan de los cuadros elctricos y depsitos de agua. Alarmas conectadas con
los sistemas de seguridad de la ciudad.
Las medidas de conservacin son muy importantes en la documentacin histrica de archivo: digitalizacin o microfichas de los documentos cuya con-
Precauciones especiales
Algunos tipos de documentos
necesitan unas precauciones
especiales, por ejemplo los vdeos, que se tienen que alejar
de los campos magnticos, o
los negativos de fotografas,
que se tienen que guardar con
papel de PH neutro.
servacin peligre o sea muy voluminosa, medidas contra los excesos de humedad, temperatura y luz, de control de plagas, talleres de restauracin de
documentos, etc.
Documentacin delicada
Ejemplos de documentacin que corre un peligro especial son la documentacin de los
primeros siglos, los documentos con una tinta poco estable, los documentos realmente
muy valiosos, las grandes colecciones, etc.
La preservacin de documentos electrnicos, y ms concretamente los especficos de archivo, que llevan incorporada la firma electrnica, es otro aspecto
que hay que tener en cuenta en esta parte de la cadena.
3.2.4. Conclusiones
La fase de anlisis y tratamiento incluye dos subfases:
1)Elanlisisdocumental. Esta etapa es la operacin intelectual de aplicar
tcnicas especficas y normalizadas a un colectivo de documentos con la finalidad de hacerlos controlables y recuperables. El anlisis documental transfor-
Ved tambin
La preservacin de documentos electrnicos se estudia de
manera ms detallada en la
asignatura Preservacin de documentos digitales y gestin documental.
CC-BY-NC-ND PID_00143966
27
El formato MARC permite intercambiar registros entre diferentes bases de datos y sus normas codifican, almacenan e intercambian datos bibliogrficos.
2)Elprocesamientotcnico. Esta subfase se ocupa de ordenar y conservar
los documentos en condiciones ptimas. Hay tres tipos de ordenaciones:
Las no significativas.
La preservacin.
La conservacin.
La restauracin.
Las causas que provocan la degradacin pueden ser internas o externas al documento.
La cadena documental
CC-BY-NC-ND PID_00143966
28
La cadena documental
4. Fase de salida
Instrumentosdebusca
CC-BY-NC-ND PID_00143966
29
La cadena documental
bibliotecas de la misma temtica o red institucional con la finalidad de compartir registros y tareas como la catalogacin colectiva y el prstamo interbibliotecario.
Catlogos
Consultad, por ejemplo, el catlogo de la Biblioteca de la UOC y el Catlogo Colectivo
de las Universidades de Catalunya, al cual pertenece.
Otro catlogo colectivo es el Catlogo de Bibliotecas Universitarias de Rebiun.
Lectura complementaria
Podis encontrar ms informacin sobre la cuestin de
los catlogos en:
R.AlberchiFugueras
(1999). Gesti integral
darxius. Barcelona: Fundaci
per a la Universitat Oberta de
Catalunya.
CC-BY-NC-ND PID_00143966
30
La cadena documental
de documentos referidos al mismo asunto. Por la exhaustividad y la minuciosidad de la informacin, el catlogo se considera el instrumento culminante
de toda tarea de descripcin archivstica (Alberch, 1999).
2)Inventarios: consiste en una descripcin global y sistemtica de las series
documentales, entendidas como un conjunto de documentos relacionados
desde el punto de vista de procesos, funcional u orgnico. Permite conocer las
series ms relevantes, su volumen y el alcance cronolgico (Alberch, 1999).
3)Basesdedatosdegestindocumental: especficos para gestionar los documentos asociados a los expedientes resultantes de la actividad y los procesos
especficos de la organizacin donde la base de datos est implementada.
4)Guas: la gua sirve para orientar al usuario sobre el conocimiento general
del contenido de un archivo o de un conjunto de archivos (Alberch, 1999).
4.1.3. Instrumentos de bsqueda para recursos en lnea
En cuanto a los instrumentos de bsqueda para recursos en lnea, tenemos los
siguientes:
1)Buscadores: son programas informticos con un robot que rastrea la red
de forma automtica. Su misin es ir de una pgina en otra usando los hiperenlaces y guardar la informacin en una base de datos. Actualmente hay dos
grandes buscadores: Google y Yahoo, ya que han ido absorbiendo el resto de
motores anteriores. Estn diseados para indizar y recuperar pginas HTML,
Trminos sinnimos
Otros sinnimos de buscadores son motores de bsqueda,
search engines, araas (spiders),
robots.
Trminos sinnimos
Otros sinnimos de directorios
son ndices temticos, guas temticas, Internet subject gateways.
CC-BY-NC-ND PID_00143966
31
La cadena documental
3)Portales: son pginas de entrada a un conjunto de recursos y servicios electrnicos organizados para permitir al usuario acceder a un gran volumen de
informacin. Un portal siempre es una pgina web, pero no a la inversa: no
todas las pginas web son portales. Hay dos tipos de portales: los genricos y
los especializados. Entre estos ltimos destacan los portales corporativos.
Portales
Algunos ejemplos de portales son:
Serviciosdedifusin
Ved tambin
En el subapartado 3.2.2 de este mdulo se tratan las diversas maneras de ordenar fsicamente un fondo en las estanteras: ordenaciones no significativas, con significado limitado y altamente significativas.
CC-BY-NC-ND PID_00143966
32
La cadena documental
Los servicios de informacin y de referencia son los servicios que prestan los
SID para orientar y ayudar al usuario en la consulta del fondo, en la bsqueda, localizacin, seleccin e identificacin de las fuentes de informacin y la
informacin final. Son servicios personalizados. Los servicios ms destacados
son:
Los servicios llamados de referencia o los iconos del tipo Pngase en contacto con nosotros, en los cuales podemos enviar un mensaje electrnico
o iniciar un chat pidiendo la informacin.
Trminos sinnimos
Otros trminos sinnimos de
servicios de referencia son servicio de referencia virtual (en ingls, virtual reference services;
vase la Biblioteca Virtual de
la UOC), servicio de referencia
digital (en ingls, digital reference services; vase la seccin
Preguntad al bibliotecario
de la Universidad de Barcelona), mostrador digital (Deskstop reference) y Pregunte: las
bibliotecas responden (Ask-AnExpert).
(14)
La biblioteca de la UOC, por ejemplo, en el apartado Servicios nos ofrece diversos servicios: servicio de referencia (La biblioteca respon), servicio de obtencin de documentos
(SOD), sumarios (Distribuci de sumaris) y difusin selectiva (Butlletins de biblioteca).
3)Prstamoyprstamointerbibliotecario
El prstamo es la entrega de un documento por un tiempo determinado y
bajo ciertas condiciones. Se presta todo tipo de documentos a excepcin de los
documentos valiosos (manuscritos), ejemplares nicos de los cuales es difcil
encontrar una copia, las obras de referencia y las publicaciones peridicas.
El prstamointerbibliotecario es la modalidad de prstamo que se da entre
bibliotecas. Junto con los catlogos colectivos, son las modalidades ms bsicas de cooperacin bibliotecaria.
4)Reprografa
La reprografa consiste bsicamente en un servicio de fotocopias.
5)Formacindeusuarios
Los SID elaboran guas de uso general, de consulta de su centro o sobre el
funcionamiento de sus bases de datos.
Obras de referencia
Ejemplos de obras de referencia son los anuarios, los atlas,
los diccionarios, las enciclopedias, las guas, las estadsticas,
los manuales, los tratados. Las
obras de referencia se usan como material de consulta para
obtener una informacin breve, rpida y exacta.
CC-BY-NC-ND PID_00143966
33
4.3. Conclusiones
La misin de la cadena documental es ofrecer el fondo documental de un SID
al usuario. Para hacerlo pone a su disposicin un conjunto de instrumentos
para la bsqueda y unos servicios de difusin. Los instrumentos de bsqueda
son:
Los inventarios.
Los catlogos.
Los buscadores.
Los directorios.
Los portales.
El acceso al fondo.
La reprografa.
La formacin de usuarios.
La cadena documental
Formacin de usuarios
La biblioteca de la UOC,
por ejemplo, elabora guas
de uso de los diversos programas y bases de datos
del centro, como el manual
sobre el programa Gestor
de referencias bibliogrficas
Refworks.
La Universidad de Barcelona elabora tutoriales sobre
biblioteconoma y documentacin.
La Universidad de Mlaga
tambin hace sus tutoriales.
34
CC-BY-NC-ND PID_00143966
La cadena documental
La cooperacin entre bibliotecas aparece a finales del siglo XIX en Estados Unidos y en los aos noventa en Espaa. Las bibliotecas cooperan entre ellas, pero
adems, como dice Miquel Trmens (2005, pg. 166) en una etapa ms adelantada tambin se coordinan y colaboran.
Lectura complementaria
Sobre el tema de la cooperacin de las bibliotecas podis
leer:
M.TrmensGraells(mayojunio, 2005). Los consorcios
una nueva etapa de la cooperacin bibliotecaria. El profesional de la informacin (vol.
14, n. 3, pgs. 166-173).
de Catalunya (CBUC ), fundado en 1995. Su misin era crear un catlogo colectivo y hacer catalogacin compartida. Ms adelante, con el proyecto de la
Biblioteca digital de Catalunya, tambin incorpor las adquisiciones de documentacin electrnica.
(15)
CC-BY-NC-ND PID_00143966
35
La cadena documental
(16)
La seleccin: la cooperacin evita duplicidades de esfuerzos en la localizacin de novedades, as como en el apoyo tcnico y en la compra de software de gestin. Cooperando se accede a fondos de financiacin, para adquirir fondos o para migrar hacia sistemas electrnicos y en red.
2)Enlafasedeanlisisytratamiento:
La catalogacin compartida slo se da en bibliotecas y centros de documentacin. La cooperacin entre bibliotecas permite que la catalogacin se pueda
llevar a cabo de forma centralizada y cooperativa:
Catalogacincentralizada: el proceso de catalogacin lo realiza una biblioteca que distribuye las referencias documentales al resto de bibliotecas
de la red. Implica que hay una autoridad central que asume la responsabilidad.
El ahorro es relativo
El ahorro es relativo; no es que
colaborando ahorren, sino que
un SID que acta en consorcio consigue mucho ms por
el mismo precio que actuando
en solitario.
CC-BY-NC-ND PID_00143966
36
Catalogacincooperativa: consiste en la aportacin de referencias documentales por parte de diferentes bibliotecas que juntas crean un catlogo
colectivo. En este caso, hay que corregir las desigualdades en la descripcin
bibliogrfica.
3)Enlafasedesalida:
Instrumentosdebsqueda: catlogos colectivos y repositorios institucionales, que multiplican exponencialmente el acceso a la documentacin de
otros SID. Permite pasar del concepto de documentacin en propiedad al
de acceso a la documentacin.
Serviciosdedifusin: prstamo interbibliotecario, ofrecer servicios de referencia en lnea (ask-an-expert), ms visibilidad social, llegan a ms ciudadanos, amplan la cobertura informativa en diversos apoyos y el mantenimiento de la coleccin es ms seguro.
La cadena documental
CC-BY-NC-ND PID_00143966
37
La cadena documental
Ved tambin
La indizacin se trata en los
mdulos Sistemas de clasificacin documental, Listas de
encabezamientos de materia
y listas de autoridades y Los
tesauros, mientras que el resumen se trata slo en el mdulo Anlisis de contenido:
resumen e indizacin.
Observacin
Estadsticamente este material
dedica un 25% de los contenidos al marco general de la
cadena y la fase de anlisis de
contenido; un 2% al resumen
y el 73% a la indizacin.
CC-BY-NC-ND PID_00143966
39
La cadena documental
Actividades
Proponemos las siguientes actividades para practicar los conocimientos de este mdulo:
1. Consultad la base de datos Temaria y localizad artculos donde se describa el proceso de
la cadena documental en cualquier tipo de SID.
2. Imaginad que tenis que redactar un artculo cientfico sobre el SID en el cual trabajis.
Redactad un esquema de la cadena documental como guin para describir las actividades
de vuestro SID.
3. Localizad datos sobre la poltica de seleccin en webs de los archivos y bibliotecas de
vuestro entorno.
4. Consultad las webs de la BC y la BNE y localizad informacin sobre los lenguajes documentales que usan en el anlisis documental.
5. Consultad la web de una biblioteca pblica o un archivo municipal. Observad los instrumentos de bsqueda disponibles y los servicios de difusin a vuestro alcance.
6. Consultad la base de datos CSIC-ISOC de Documentaci. Observad las posibilidades de
bsqueda.
Reflexin
Las soluciones de las actividades se tratarn en el tabln de
la asignatura.
CC-BY-NC-ND PID_00143966
40
Glosario
acceso directo m Modalidad de acceso al fondo de la coleccin de un SID. El usuario puede
pasear, hojear y leer los documentos de la sala. Pasear por las salas y estanteras es un derecho
adquirido en el mbito de las bibliotecas pblicas y universitarias.
acceso indirecto m Modalidad de acceso al fondo de la coleccin de un SID. EL usuario
no tiene acceso a los documentos, slo a la coleccin de referencia. Tiene que consultar el
catlogo o inventario y esperar en la sala de consulta a que le lleven la documentacin. Este
tipo de acceso se da en los archivos.
adquisicin f Accin de incorporar documentos nuevos al SID. Las vas de adquisicin
son: gratuidad (open access), compra, donacin, intercambio y depsito legal.
adquisicin compartida f Procedimiento de adquisicin en el que intervienen diversas
bibliotecas para comprar de forma coordinada. Las ventajas son mayor cobertura temtica de
las colecciones, reduccin de gastos y tareas tcnicas e intelectuales, mejor servicio al usuario.
almacenamiento y conservacin m Operaciones de la segunda fase de la cadena que
procuran un espacio y unas medidas de proteccin al documento. La IFLA distingue tres
actividades: la preservacin, la conservacin y la restauracin.
anlisis de contenido m Operaciones de anlisis que identifican y representan de manera precisa la materia de los documentos, con el objetivo de permitir la recuperacin. Las
operaciones son dos: el resumen y la indizacin. Esta parte del anlisis documental establece
los puntos de acceso por materias.
anlisis documental m Operacin que analiza los atributos formales y de contenido de
un documento, con tcnicas especificas y normalizadas con la finalidad de hacerlos controlables y recuperables.
anlisis formal m Descripcin de los atributos estructurales de los documentos (autor,
ttulo, edicin, coleccin, etc.), proporcionando una representacin del documento que lo
describa de manera nica, sin ambigedades. Esta parte del anlisis documental establece los
puntos de acceso por autor y por ttulo.
anlisis y tratamiento m Segunda fase de la cadena documental. Incluye dos operaciones: el anlisis documental y el procesamiento tcnico. Su funcin es organizar los documentos seleccionados en la primera fase y producir herramientas que faciliten la recuperacin.
araas f Ved Buscadores.
buscadores m Programas informticos con un robot que rastrea de forma automtica la
red. Su misin es ir de una pgina a otra usando los hiperenlaces y guardar la informacin
en una base de datos. Actualmente hay dos grandes buscadores, Google y Yahoo, ya que han
ido absorbiendo el resto de motores anteriores.
cadena documental f Conjunto de operaciones y tcnicas que comprenden las fases de
entrada, anlisis y tratamiento y difusin de los documentos, que se llevan a cabo en un
centro de documentacin o en una unidad administrativa o de trabajo.
catalogacin f Ved Anlisis formal.
catalogacin centralizada f Catalogacin realizada por una biblioteca que distribuye
las referencias documentales al resto de bibliotecas de la red. Implica que hay una autoridad
central que asume la responsabilidad.
catalogacin cooperativa f Catalogacin consistente en la aportacin de referencias
documentales por parte de diferentes bibliotecas que juntas crean un catlogo colectivo. En
este caso, hay que corregir las desigualdades en la descripcin bibliogrfica.
catlogos m Fuente de informacin o instrumento que recopila el fondo de una biblioteca, archivo o centro de documentacin. Su funcin no es tan slo identificar las obras,
sino tambin localizarlas. Los catlogos colectivos son la suma de los catlogos de diversas
bibliotecas de la misma temtica o red institucional con la finalidad de compartir registros y
tareas como la catalogacin colectiva y el prstamo interbibliotecario.
compra f Modalidad de adquisicin. La compra puede ser directa o por suscripcin al editor, la librera, el proveedor. Es la va ms habitual en bibliotecas y centros de documentacin.
Implica un conocimiento elevado de la produccin bibliogrfica, los canales de distribucin
y venta.
La cadena documental
CC-BY-NC-ND PID_00143966
41
La cadena documental
CC-BY-NC-ND PID_00143966
42
otro. Es apropiado para SID de libre acceso, como las bibliotecas pblicas y universitarias. Por
ejemplo, til para ordenar siguiendo las clases de la CDU (Clasificacin decimal universal).
ordenaciones con significado limitado f Criterio de ordenacin. Se ordenan, por
ejemplo, por la lengua del documento, el autor, o el tema. Es la ordenacin que encontramos
en libreras, bibliotecas personales o bibliotecas pequeas.
ordenaciones no significativas f Criterio de ordenacin. Son aquellas en las que no hay
relacin con el contenido del documento. Por ejemplo, ordenar segn el nmero asignado
a la llegada. Es una ordenacin til en SID que no den acceso libre a las estanteras, y donde
la recuperacin la haga el documentalista. Apropiado para SID que tengan su coleccin en
el depsito y no en la sala de lectura. Es el mtodo ms usado en archivos.
portales m Fuentes de informacin o instrumento. Los portales son pginas de entrada a
un conjunto de recursos y servicios electrnicos organizados para permitir al usuario acceder
a un gran volumen de informacin. Un portal siempre es una pgina web, pero no a la
inversa: no todas las pginas web son portales.
prstamo m Ved prstamo interbibliotecario.
prstamo interbibliotecario m Entrega de un documento por un tiempo determinado
y bajo ciertas condiciones. Se presta todo tipo de documentos a excepcin de los documentos
valiosos (manuscritos), ejemplares nicos de los cuales es difcil encontrar una copia, las
obras de referencia y las publicaciones peridicas.
procesamiento tcnico m Conjunto de tareas de ordenacin, almacenamiento y medidas
de conservacin.
proceso documental m Ved cadena documental.
recepcin f Proceso de la fase de entrada, que consta de tareas administrativas, el registro
y la preparacin del material.
referencia documental f Producto documental que contiene todos los datos identificativos y descriptivos del documento. La referencia documental es la representacin condensada del documento original. Esta referencia se introduce en el catlogo y se convierte en la
herramienta que representa el documento para futuras bsquedas.
referencias bibliogrficas f Descripcin del documento primario al que se remite al
lector. En trminos especializados es el documento que ha sido citado expresamente en un
trabajo de investigacin y es obligatorio, tica y textualmente, hacer alusin a l.
reprografa f Servicio de fotocopias.
robots m Ved buscadores.
search engine m Ved buscadores.
seleccin f Proceso en el que se decide qu documentos se aaden o eliminan de la coleccin. La seleccin es un proceso complejo en el que intervienen muchos factores: las necesidades del centro, las de sus usuarios, estadsticas de uso, recursos humanos y recursos
econmicos.
seleccin negativa f Ved expurgar.
servicios de difusin pl Servicios de la fase de salida puestos a disposicin de los usuarios
para hacer difusin de la coleccin, por ejemplo el acceso al fondo, servicios de referencia,
prstamo, reprografa y formacin de usuarios.
servicios de referencia m Servicios que prestan los SID para orientar y ayudar al usuario
en la consulta del fondo, en la bsqueda, la localizacin, la seleccin, la identificacin de las
fuentes de informacin y la informacin final.
SID m Servicio de informacin y documentacin.
signatura topogrfica f Cdigo que identifica cada material en las salas y estanteras
del SID. Es el conjunto de nmeros, letras y smbolos que localiza y ordena fsicamente el
documento en la estantera.
salida f ltima fase de la cadena que pone a disposicin de los usuarios un conjunto de
instrumentos para la bsqueda y unos servicios de difusin.
La cadena documental
CC-BY-NC-ND PID_00143966
43
La cadena documental
CC-BY-NC-ND PID_00143966
44
Bibliografa
Alberch i Fugueras, R. (1999). Gesti integral darxius. Barcelona: Fundaci per a la Universitat Oberta de Catalunya.
Allo Manero, A. (2002). Conservacin de la coleccin. En: Luisa Orera Orera (ed.). Manual
de Biblioteconoma. Madrid: Sntesis (pg. 181-200).
Asociacin Espaola de Normalizacin y Certificacin (1994). Referencias bibliogrficas. Contenido, forma y estructura. UNE 50-104:1994. Madrid: AENOR.
Ayuso Garca, M. D. y Martnez Navarro, V. (2006). Evaluacin de calidad de fuentes
y recursos digitales: gua de buenas prcticas. Anales de Documentacin, nm. 9, pg. 17-42.
Biblioteca UOC (2005). Criteris de selecci de recursos web gratuts. Document de treball. Barcelona (revisin marzo del 2006).
Borgos, M. D. (1999). Anlisis de redaccin de referencias y citas bibliogrficas en literatura
cientfica, a travs del estudio de la normalizacin bibliogrfica. Tesis doctoral. Directora Celia
Chan Navarro. Universidad de Murcia, Departamento de literatura espaola y teora de la
literatura.
Carrizo Sainero, G. et al. (2000). Manual de fuentes de informacin. Madrid: CEGAL.
Cid Leal, P. (1999). Fonaments de llenguatges documentals. Barcelona: Fundaci per la Universitat Oberta de Catalunya.
Codina, Ll. (2000). Evaluacin de recursos digitales en lnea: conceptos, indicadores y
mtodos. Revista Espaola de Documentacin Cientfica, vol. 23, pg. 9-44.
Fuentes, J. J. (2005). Bibliotecas nacionales y consorcios bibliotecarios. Jornadas sobre
bibliotecas nacionales. Las biblotecas nacionales del siglo XXI. Valencia.
Garca Gutirrez, A. L. (1984). Lingstica documental. Barcelona: Mitre.
Garca Rodrguez, A. (2002). Servicios de lectura en sala y prstamo. En: Luisa Orera
Orera (ed.). Manual de Biblioteconoma. Madrid: Sntesis (pg. 247-263).
Garca Valenzuela, H. (2002). El soporte de la biblioteca. En: Luisa Orera Orera (ed.).
Manual de Biblioteconoma. Madrid: Sntesis (pg. 201-214).
ISAD(G): Norma internacional general de descripci arxivstica: adoptada per la Comissi Ad Hoc
de Normes de Descripci, Sucia, 21-23 de gener de 1993: versi final aprovada pel CIA. Barcelona:
Associaci dArxivers de Catalunya: Departament de Cultura de la Generalitat de Catalunya,
1995. ed. orig.: Ottawa: CIA, 1994. ISBN 84-605-4625-X.
Lpez Hernndez, M. A. (1996). La seleccin documental. Revista general de informacin
y documentacin. Madrid.
Maniez, J. (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez Ruiprez.
Melero, R.; Abad, M. F. (2008). Revistes daccs obert: caracterstiques, models i
tendncies. BID Textos universitaris de biblioteconomia i documentaci (juny). Barcelona.
Orera Orera, L. (2002). La coleccin, formacin, desarrollo y mantenimiento En: Luisa
Orera Orera (ed.). Manual de Biblioteconoma. Madrid: Sntesis (pg. 92-112).
Pacios Lozano, R. (1995).El control de la gestin de las adquisiciones. Revista general de
informacin y documentacin, vol 5, Nm. 2. Madrid.
Termens Graells, M. (2005). Los consorcios una nueva etapa de la cooperacin bibliotecaria. El profesional de la informacin (mayo-junio), vol. 14, nm. 3, pg. 166-173.
Turiel, J. (2006). Recursos web per a les adquisicions. BID Textos universitaris de biblioteconomia i documentaci, nm. 16 (juny). Barcelona.
Vall Casa, A. (2006). Esporgar: per qu, com i quan. BID Textos universitaris de biblioteconomia i documentaci, nm. 16 (juny). Barcelona.
La cadena documental
CC-BY-NC-ND PID_00143966
45
Vilchez Pardo, J. (2002). Tratamiento y ubicacin de la coleccin En: Luisa Orera Orera
(ed.). Manual de Biblioteconoma. Madrid: Sntesis (pg. 113-135).
La cadena documental
Anlisis de
contenido:
resumen e
indizacin
Manela Junc Campdepadrs
PID_00143964
CC-BY-NC-ND PID_00143964
Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es
CC-BY-NC-ND PID_00143964
ndice
Introduccin...............................................................................................
Objetivos.......................................................................................................
1.
El anlisis de contenido...................................................................
2.
El resumen...........................................................................................
11
2.1.
14
2.2.
16
La indizacin.......................................................................................
20
3.1.
20
3.1.1.
21
3.1.2.
22
3.1.3.
22
3.1.4.
24
3.2.
26
3.3.
31
33
4.1.
33
4.2.
35
4.3.
39
4.4.
42
44
5.1.
44
5.2.
45
5.3.
46
5.4.
48
5.5.
50
5.6.
Conclusiones ...............................................................................
52
Actividades..................................................................................................
53
Glosario........................................................................................................
54
Bibliografa.................................................................................................
58
3.
4.
5.
CC-BY-NC-ND PID_00143964
Introduccin
Ved
Resumen informativo
Resumen indicativo
Resumen selectivo
Resumen automtico
1. El resumen
Ambigedad
Lenguaje natural
Exhaustividad
Especificidad
Traduccin
Univocidad
2. La indizacin
CC-BY-NC-ND PID_00143964
Concepto
Ved
Lenguaje documental
Sistemas de clasificacin
Listados de encabezamientos
de materia
Listados de autoridades
Tesauros
Listados de descriptores libres
Listados de palabras clave
Notacin
Encabezamiento
Descriptor
Identificador o autoridad
Palabra clave
Codificado
Natural
Libre
Controlado
Precoordinado
Postcoordinado
Jerrquico
Combinatorio
Materias
Conceptos
Palabras clave
CC-BY-NC-ND PID_00143964
Objetivos
Con el estudio de los materiales asociados a este mdulo alcanzaris los objetivos siguientes:
En cuanto al resumen:
1. Analizar los factores necesarios para que haya una buena comunicacin
documental: entender los problemas del lenguaje natural y la funcin de
los lenguajes documentales dentro de esta comunicacin.
2. Conocer los procesos de indizacin: examen del documento, seleccin y
traduccin.
En cuanto a los lenguajesdocumentales:
CC-BY-NC-ND PID_00143964
1. El anlisis de contenido
Automatizado
Resumen
Resumen informativo
Resumen indicativo
Resumen selectivo
Resumen automtico
Indizacin
Sistemas de clasificacin
Listas de encabezamientos de materia
Listados de autoridades
Tesauros
Listados de descriptores libres
CC-BY-NC-ND PID_00143964
10
Ved tambin
Trataremos el procesamiento
del lenguaje natural en el subapartado 2.4 y en el apartado
3.
El procesamiento en lenguaje natural (PLN1) es una rama de la inteligencia artificial y de la lingstica computacional que estudia los lenguajes que usan los humanos para interactuar con los ordenadores en
contextos escritos y orales.
A modo de conclusin
Para representar o describir el contenido de un documento el analista tiene que llevar
a cabo dos operaciones:
(1)
Lectura complementaria
I.GilLeiva;J.V.Rodrguez
Muoz (1996). El procesamiento del lenguaje natural
aplicado al anlisis del contenido de los documentos.
Revista general de informacin y documentacin (vol.
6, nm. 2, pg. 205-218).
CC-BY-NC-ND PID_00143964
11
2. El resumen
Ved tambin
Encontraris la norma UNO
50-103-90 en el espacio Materiales y fuentes de las aulas.
Cuando decimos documento nos estamos refiriendo a todo tipo de documento, sea cual sea su soporte material. Podemos resumir un texto, la imagen de
una fotografa, un vdeo, audios, informacin en lnea o hipertextos.
Los resmenes, como la indizacin, pueden ser de elaboracin humana o automtica. En el primer caso hay cuatro tipos de personas que pueden redactar
un resumen. En el caso de los resmenes automticos, se trata de un software.
1)Resumenhumano:
a) Elautor del documento. Los resmenes elaborados por los propios autores
son muy habituales en el mundo de las comunicaciones cientficas y tecnolgicas.
b) Un especialista en la materia de la que trata el documento.
Programas resumidores
de textos
Un ejemplo de programas resumidores de textos es Swesum, que hace un anlisis estadstico del texto y elabora
el resumen con los fragmentos que contienen las palabras
ms ponderadas (ms repetidas pero con significado).
CC-BY-NC-ND PID_00143964
12
Difundir la informacin
Cada vez ms bases de datos referenciales ofrecen el resumen de sus monografas y
revistas, como por ejemplo
Ebsco, Dialnet, Compludoc,
CBUC, Eric database o ISI current contents connect. Tambin lo hacen las bases de datos de novedades editoriales,
por ejemplo la editorial Trea
(recomendamos el acceso desde la biblioteca de la UOC).
CC-BY-NC-ND PID_00143964
13
Brevedad. Se tienen que omitir datos preliminares o temas del conocimiento comn.
Pertinencia. El resumen se tiene que adecuar al mensaje principal del documento, sin obviar o interpretar los datos.
Profundidad. Vara en funcin del tipo de resumen o de los diferentes niveles de detalle que se persigan.
Consistencia lingstica. Un resumen se tiene que adaptar a las pautas lingsticas en uso y tiene que tener en cuenta las reglas morfolgicas y sintcticas correspondientes.
El resumen es la presentacin abreviada y precisa de un documento, sin interpretacin ni crtica y sin mencin expresa del autor del resumen.
Los resmenes automatizados incorporados en los catlogos son muy tiles para extraer trminos de indizacin del texto, para hacer bsquedas de palabras clave que no
se encuentran en el ttulo, para servir de control bibliomtrico y ayudar a la difusin
a travs de los servicios de alerta.
Lectura complementaria
Podis ampliar la informacin sobre el resumen leyendo la obra siguiente:
M.PintoBatanea (1992). El
resumen documental: principios
y mtodos. Madrid: Pirmide/
Fundacin Germn Snchez
Ruiprez (Biblioteca del Libro, Y).
CC-BY-NC-ND PID_00143964
14
CC-BY-NC-ND PID_00143964
15
El tablero y las fichas parecen poseer un significado simblico. El tablero, con la alternancia de casillas blancas y negras, forma un mandala. El simbolismo de las fichas es
menos esotrico y ha ido cambiando segn los tiempos: obispos, elefantes, etc.
El autor concluye que el ajedrez, adems de un juego, es una herramienta educativa de
primer orden, casi una ciencia.
Como podis comprobar, este resumen tiene 237 palabras.
2)Resumenindicativo
Redactaremos slo las ideas centrales del documento. Su lectura no puede sustituir la lectura del original. Como su nombre sugiere, el resumen indicativo
presenta de forma abreviada y muy sinttica el contenido o la tipologa del
documento. Su extensin puede oscilar entre una frase o 4 lneas de texto.
Ejemplo de resumen indicativo
CONSUEGRA FERNNDEZ, Jess: El Ajedrez: evolucin y claves de un juego milenario.
En Mundo antiguo. Madrid: 2002. n 3-4, ao 1, p. 60-61.
Artculo divulgativo sobre el juego del ajedrez, trata de su origen hind, antigedad,
expansin histrica tanto en Oriente como en Occidente, variantes nacionales y simbolismo del tablero y las fichas.
3)Resumenselectivo
Redactaremos slo una parte concreta del documento. El ms habitual es el
resumen de conclusiones, pero tambin hay otros tipos, como la resea (review), que es un anlisis del documento con elementos crticos. Este tipo de
resumen se adapta muy bien a las necesidades de los usuarios, por ejemplo investigadores o tcnicos que necesitan un dato muy concreto sobre el objetivo
del documento o las conclusiones a las que llega.
Ejemplo de resumen selectivo
CONSUEGRA FERNNDEZ, Jess: El Ajedrez: evolucin y claves de un juego milenario.
En Mundo antiguo. Madrid: 2002. n 3-4, ao 1, p. 60-61.
El ajedrez, adems de un juego, es una herramienta educativa de primer orden, casi una
ciencia.
A modo de conclusin
Los resmenes ms habituales son el resumen informativo, el indicativo y el selectivo:
El resumenselectivo consigna slo una parte concreta del documento. El ms habitual es el resumen de conclusiones, pero tambin hay otros tipos, como la resea
(review).
CC-BY-NC-ND PID_00143964
16
Una de las necesidades ms perentorias ante el aumento de informacin digital debido al crecimiento exponencial de Internet es manejar y filtrar el gran
volumen de informacin. Una de las soluciones aportadas por el PLN han sido los programas de resumen automtico, que actan sobre textos, imgenes,
webs y correo electrnico.
Los primeros en trabajar en el campo de la automatizacin de los resmenes
fueron Hans Peter Luhn en el ao 1958 y Edmundson en 1969, que aplicaron
tcnicas como la frecuencia de las palabras, o la posicin de una frase dentro
de un documento para redactar resmenes sin intervencin humana.
A partir de estas primeras investigaciones se han perfeccionado muchas tcnicas diferentes basadas en conocimiento y recursos lingsticos (como las de
Lin y Hovy, 2002; Gotti et al., 2007) o basadas en mtodos estadsticos y de
aprendizaje automtico (Hirao et al., 2002; Svore, 2007) (autores citados en
Lloret et al., 2008; y Mateo et al., 2003).
ltimamente las investigaciones giran en torno al resumen multidocumento,
es decir, resumir ms de un documento (Goldstein et al., 2000; Qiu, 2007; Huo
y Chen, 2008) de contenidos afines o redundantes (autores citados en Lloret
et al., 2008; y Mateo et al., 2003).
Los resmenes automticos se conocen tambin como extracts. La terminologa anglosajona diferencia as los extracts y los abstracts. Los extracts son los
resmenes formados a partir de la extraccin de algunas frases del texto previamente seleccionadas por un programa, mientras que los abstracts son los
resmenes elaborados por una persona.
Hay diversas herramientas para hacer estos clculos, por ejemplo WVTool. Se
trata de contar cuntas veces sale una palabra no vaca en el texto.
Lecturas
complementarias
Podis consultar los resultados de las investigaciones de
estos autores en los artculos
siguientes:
E.Lloret;O.Ferrndez;R.
Muoz;M.Palomar (2008).
Integracin del reconocimiento de la impliacin textual en tareas automticas de
resmenes de textos. Procesamiento del lenguaje natural,
n. 41, pg. 183-190.
P.L.Mateo;J.C.Gonzlez;
J.Villena;J.L.Martnez
(2003). Un sistema para resumen automtico de textos en
castellano.
Ved tambin
Encontraris una explicacin
detallada sobre las palabras vacas en el mdulo Indizacin
automtica y descriptores libres.
CC-BY-NC-ND PID_00143964
17
Tropical (2) storm (6) Gilbert (7) formed (1) in (0) the (0) eastern (1) Caribbean (1) and (0) strengthened (1) into (0) a (0) hurricane (7) Saturday (4)
night (2).
Oracin 2:
There (0) were (0) no (0) reports (1) of (0) casualties (1).
Lo primero que vemos es que las palabras vacas, es decir, las palabras que no tienen
significado (preposiciones, artculos, verbos) no se computan.
Al lado de cada palabra con significado vemos el nmero de veces que sale en todo el texto. Se suman los valores, de manera que la oracin 1 tiene 3,2 puntos y la oracin 2, 0,2.
El programa seleccionar la frase 1 como ms representativa para el resumen automtico.
Este sistema de resumir a partir de las frases con las palabras ms significativas
en el texto parece simplista pero tiene cierta justificacin. Segn Kupiec et al.
(1995) aproximadamente el 80% de las frases en resmenes humanos estn
copiadas literalmente o con pequeas modificaciones del texto original.
A partir de esta base estadstica se incorporan otras tcnicas para dotar al programa de ms conocimiento y paliar la escasa coherencia del resultado, como
puede ser, por ejemplo, la resolucin de la anfora o aplicar programas (por
ejemplo, WordNet) que proporcionen relaciones como las de sinonimia o hiperonimia, o mecanismos para detectar y eliminar la redundancia.
Definimos brevemente qu son las anforas y la hiperonimia:
a) Las anforas son la relacin de referencia entre un elemento lingstico y
otro anterior en el discurso.
b) Decimos que una palabra es hipernima cuando tiene un campo significativo que incluye otro de menor extensin.
Los expertos consideran que la tecnologa actual no tiene problemas para detectar las frases con ms significado, pero s para ordenarlas segn su importancia.
Los programas funcionan a grandes rasgos de la siguiente manera: se copia
Anfora
El Saln del Hobby ha tenido
ms de 60.000 visitantes este
ao. Este saln se ha convertido en la feria de ocio familiar
ms visitada.
En este ejemplo, la anfora se
da en este saln, que hace
referencia al Saln del Hobby,
expresado en la frase anterior.
Como se puede comprobar, si
en el resumen automtico aparece slo la segunda frase, el
lector no sabr a qu saln hace referencia.
Hiperonimia
Color es un hipernimo. Su
contrario es hipnimo: amarillo, naranja, verde son hipnimos.
CC-BY-NC-ND PID_00143964
Connexor
Daedalus
Extractor
FociSum
Inxight Summarizer
IslandInText
K-Site de Daedalus
Pertinence Summarizer
Sinope Summarizer
Summarizer
SweSum2
System Q
TextAnalyst
Trestle
18
Mdulo1:Anlisismorfosintctico. En este mdulo se determina la categora lxica de cada palabra: sustantivo, verbo, adjetivo, artculo, preposicin, etc. Tambin se
determina el lema. Estas operaciones permiten distinguir las palabras con significado
(sustantivos, adjetivos, verbos) de las vacas (artculos, preposiciones, pronombres,
etc.). El lema permite agrupar todas las palabras que son flexiones de otra (info/informar/informacin/informador/informacional/etc.). El producto final es un listado
con las palabras puntuadas y un listado de frases candidatas.
Mdulo5:Postprocesadodelextracto. Su funcin es detectar expresiones que conectan partes del texto, ya sea para mostrar causalidad, contraposicin, etc. Son expresiones del tipo por lo tanto, en contra, etc. Como en el caso de las anforas, si forman parte de una frase seleccionada, se procura incluir en el resumen la frase con la
cual estn relacionadas.
CC-BY-NC-ND PID_00143964
19
Por ltimo, debemos recordar que algunos procesadores de textos, como Microsoft Word, tambin ofrecen esta opcin (Autosummarize o Auto-resumen).
A modo de conclusin
Los resmenes automticos (extracts) son una de las soluciones aportadas por el PLN
para hacer frente al manejo de grandes volmenes de informacin en lnea.
Las tcnicas han evolucionado de los primeros cmputos sobre la frecuencia de las
palabras, o la posicin de una frase dentro de un documento, a las tcnicas basadas
en conocimiento y recursos lingsticos o en mtodos estadsticos y de aprendizaje
automtico.
Los expertos consideran que la tecnologa actual no tiene problemas para detectar las
frases con ms significado, pero s para ordenarlas segn su importancia.
CC-BY-NC-ND PID_00143964
20
3. La indizacin
Indizar es el resultado de examinar el documento, seleccionar los conceptos y almacenarlos en una base de datos.
Ved tambin
La indizacin se estudia en los
mdulos Sistemas de clasificacin documentales, Listas
de encabezamientos y listados
de autoridades, Los tesauros y Listado de descriptores
libres y listado de palabras clave.
Ved tambin
La forma de indizar de los
equipos se trata en el apartado
5 del mdulo La cadena documental de esta asignatura.
Ved tambin
La indizacin automtica se estudia en el mdulo Listado de
descriptores libres y listado de
palabras clave.
CC-BY-NC-ND PID_00143964
21
Por lenguajenatural entendemos el lenguaje que usamos de forma cotidiana: cataln, castellano, vasco, gallego, francs, etc.
Por lenguajedocumental entendemos el listado o vocabulario de trminos que usamos para indizar y que puede estar en formato libre o
controlado.
Y por qu hay que controlar los trminos del lenguaje natural? Porque el lenguaje natural es ambiguo, los conceptos se pueden representar de formas diversas, dando lugar a problemas de recuperacin. El lenguaje natural es rico en
terminologa, en formas (plurales y singulares), tiempos verbales, acrnimos,
sinnimos, polisemias, etc.
La principal diferencia entre el lenguaje natural y el documental controlado es
precisamente el control terminolgico, que permite representar los conceptos
de forma unvoca, sin ambigedades.
Para ser ms concretos, las diferencias se dan en el nmero de trminos del
vocabulario, el control de las formas, el control del significado y las relaciones
Los lenguajes documentales son entrpicos (Blanca Gil, 2004, pg. 20),
es decir, tienden a la seleccin, a la restriccin del vocabulario. Es el
proceso contrario del lenguaje natural, que tiende a la abundancia, a la
reiteracin de conceptos, a la sinonimia en beneficio de una expresin
ms rica.
Los lenguajes documentales reducen considerablemente el nmero de trminos del lenguaje natural, ya que slo tienen en consideracin los sustantivos
y algunos sintagmas nominales, pero no adjetivos, preposiciones, conjunciones, adverbios, verbos, etc. Adems, entre todos los sustantivos, escogen uno
que representar al resto cuando el significado sea el mismo. Y entre diversas
formas aceptadas por el mismo trmino, slo una ser la aceptada, como es
el caso de las siglas.
Los lenguajes documentales son en esencia sencillos, su eficacia aumenta a
medida que las reiteraciones y la redundancia son controladas en una nica
forma que rene conceptos afines.
Univocidad
La univocidad consiste en representar un concepto con un
nico trmino.
22
CC-BY-NC-ND PID_00143964
Ejemplo
Modelo
Ejemplo
Sustantivo
Pintura
Sustantivo + adjetivo
Pintura medieval
Pintores de vitrales
Ved tambin
frases.
Se acostumbra a usar el singular para expresar conceptos abstractos. As, por ejemplo,
es solidaridad y no solidaridades.
lengua del servicio de informacin y documentacin (SID ). Por ejemplo, Organizacin del Tratado del Atlntico Norte.
(3)
CC-BY-NC-ND PID_00143964
23
Ejemplo
Una lista de encabezamientos de materia como la del Consejo Superior de Investigaciones
Cientficas (CSIC) recoge todos estos sinnimos:
Hispanoamericanos.
Iberoamericanos.
Latinoamericanos.
Sudamericanos.
Pero slo da como trmino aceptado Latinoamericanos. Si al SID4 llegara un documento titulado Los sudamericanos del siglo XX, el analista lo indizara como Latinoamericanos, ya que es el trmino aceptado.
b)Polisemia: decimos que dos palabras son polismicas cuando el mismo signo lingstico, palabra o sonido tiene ms de un significado. Habitualmente el
contexto de la conversacin o lectura donde est insertada la palabra deshace
los problemas de ambigedad, pero una palabra polismica introducida en un
sistema documental, sin el contexto, puede dar lugar a ruido documental.
Ejemplo
Un usuario puede estar buscando sobre columnas en arquitectura y recuperar datos sobre
columnas tipogrficas de diarios. Los lenguajes documentales controlan la polisemia diferenciando cada significado con parntesis, usando el plural o el singular, adjetivando,
etc.
Servicio, del latn servitium, que ha dado lugar a oficios religiosos, lavabos, misiones
militares, cubiertos para comer y, en deportes, poner la pelota en juego. Y en todos
ellos permanece la idea de ser til.
Crucero, del latn crux, significando cruz, interseccin entre las dos naves de una
iglesia, encargado de llevar la cruz a la cabeza de una procesin, viaje de placer por
el mar, etc. En estos significados la idea es la de la forma de cruz, el cruzar como ir
de un extremo a otro.
Columna, del latn columna, que usamos para referirnos a los pilares arquitectnicos,
las partes verticales de una pgina impresa de un diario, en fsica la forma que adoptan
CC-BY-NC-ND PID_00143964
24
Por relacionesdesignificado entendemos la relacin de genrico, especfico o relacionado que puede tener un trmino con respecto a otro.
En el lenguaje natural estas relaciones son implcitas. Por ejemplo, cuando hablamos de manzanas todos entendemos que se trata de una fruta fresca y que
las Fuji y las Golden son variedades concretas. Es decir, situamos el trmino
manzana dentro de una jerarqua de trminos conceptualmente ms genricos (fruta) y ms especficos (Golden, Fuji). Incluso podemos relacionar por
asociacin de ideas la manzana con otras frutas, como la naranja o el pltano.
Pero en un lenguaje documental hay que definir estas relaciones, agrupando
y relacionando los trminos afines.
La estructura que relaciona los trminos es implcita en el lenguaje natural,
pero en los lenguajes documentales hay que hacerla explcita. Eso se puede
hacer de dos maneras:
25
CC-BY-NC-ND PID_00143964
a) En una secuencia jerrquica, donde la propia posicin del concepto ya define sus trminos genricos y especficos. Tambin deshace problemas de significado.
Ejemplo de la pesca
Ved el ejemplo de la pesca extrado de la Clasificacin Decimal Universal (CDU). El concepto pesca puede ser la actividad econmica o la pesca como deporte. Si nos fijamos en
la cadena jerrquica vemos que cada uno cuelga de una clase diferente:
6 Ciencias aplicadas. Medicina. Tecnologa
63 Agricultura y ciencias relacionadas
639 Caza. Pesca
7 Bellas artes. Juegos. Deportes
79 Diversiones. Espectculos. Juegos
799 Caza deportiva. Pesca deportiva.
Dj vu
Interpretacin de los sueos
Sueo fisiolgico
Sueo REM
Trastornos de conciencia
Las siglas nos informan del tipo de relacin que establecen: TG significa trmino genrico (por encima de Sueos el tesauro tiene Dinmica de la personalidad), TE son los
trminos especficos (son trminos especficos de Sueos: Contenido del sueo, Pesadilla) y los TR son los trminos relacionados (se relacionan con Sueo, Dja vu, la
Interpretacin de los sueos, el Sueo REM, etc.).
Inconvenientes
Lenguajenatural
Amigable
Actualizado
Econmico
Lenguajedocumentalcontrolado
Unvoco
Caro
Facilita la bsqueda Poco actualizado
Dificulta la bsqueda
Poco preciso
A modo de conclusin
Indizar es la accin de describir o identificar un documento en relacin con su contenido.
CC-BY-NC-ND PID_00143964
26
La indizacin la puede realizar una persona (de forma centralizada o de forma coordinada) o un programa.
Por lenguaje natural entendemos el lenguaje que usamos de forma cotidiana (cataln,
castellano, vasco), y por lenguaje documental entendemos el listado o vocabulario de
trminos que usamos para indizar y que puede estar en formato libre o controlado. La
principal diferencia entre el lenguaje natural y el documental controlado es el control
terminolgico:
El control del nmero de trminos del vocabulario: los lenguajes documentales son
entrpicos, tienden a la seleccin, a la restriccin del vocabulario.
El control de las formas: los lenguajes controlados, controlan las formas plural/singular, el uso de acrnimos y siglas y la construccin de las frases.
El control del significado: los lenguajes controlados controlan la sinonimia y la polisemia. Decimos que las palabras son sinnimas cuando tienen el mismo significado.
Decimos que dos palabras son polismicas cuando el mismo signo lingstico tiene
ms de un significado. La sinonimia provoca silencio documental y la polisemia y
variantes provocan ruido documental. El control terminolgico del vocabulario garantiza el criterio de univocidad que tienen que tener los lenguajes documentales
controlados, segn el cual un concepto se representa con un trmino y un trmino
slo puede tener un significado.
Las relaciones de significado entre los trminos son las relaciones de genrico, especfico o relacionado que puede tener un trmino con respecto a otro. En el lenguaje
natural estas relaciones son implcitas pero en los lenguajes documentales hay que
hacerlas explcitas a travs de una secuencia jerrquica o una presentacin alfabtica.
Dos fases: anlisis del texto y traduccin (Chaumier, 1988; Fidel, 1994).
Cinco fases: registro de datos, anlisis del texto, identificacin de conceptos, traduccin y examen de la indizacin.
27
CC-BY-NC-ND PID_00143964
Ejemplo
Examinamos un libro titulado Mitos de antiguas civilizaciones. Leemos el ttulo, el resumen, el sumario, etc.
En una segunda etapa seleccionamos como conceptos principales: Mitos, Grecia, Roma,
India, Japn, Indios norteamericanos.
En la tercera etapa indizamos. Si indizamos con un lenguaje libre podemos escribir el
trmino como deseamos o como salga en el texto. Por ejemplo:
Mitologa india americana.
En cambio, si indizamos con un lenguaje controlado tendremos que traducir estos conceptos a una forma controlada. Pongamos por ejemplo que pensbamos indizar Mitologa india americana. Veamos cmo quedara en tres lenguajes documentales diferentes:
CDU
LEMAC
LEM del CSIC
259.2
Mitologia amerndia
Indios de Amrica - Religin y mitologa
CHESNEAUX, Jean. Hacemos tabla rasa del pasado? Mxico: Siglo XXI Editores 1981.
Su materia es Historia, historiadores, historiografa. En el catlogo de la Biblioteca Nacional de Espaa (BNE5) lo encontramos indizado como Historia.
Si recordamos el resumen del libro de Carl Sagan, Cosmos, nos daremos cuenta de que
no era suficiente para indizar el contenido de la obra. Por estos motivos se recomienda
una lectura gil del resto de partes significativas del documento.
2)Seleccindelostrminosdeindizacin
Tal como dice la norma UNE, el analista tiene que identificar las nociones que
son elementos esenciales de la descripcin del contenido. Si la indizacin es
compartida, la institucin que la patrocina tiene que establecer claramente los
factores que considera importantes.
(5)
Ved tambin
Recordad que el ejemplo del
resumen del libro de Carl Sagan, Cosmos, sala en el apartado 2 de este mdulo.
CC-BY-NC-ND PID_00143964
28
Para seleccionar los conceptos del documento, el analista tiene que ser consciente del nmero de conceptos (criterio de exhaustividad) y de la exactitud
de los mismos (criterio de especificidad).
a)Exhaustividad
A medida que el analista va leyendo, tiene que ir tomando nota de los conceptos interesantes del documento.
Una buena praxis es la que identifica los conceptos relevantes sobre:
El tema.
29
CC-BY-NC-ND PID_00143964
Anlisis y descripcin de los errores ms frecuentes que cometen los profesionales y aficionados a la fotografa astronmica mientras intentan descubrir nuevos objetos celestes
todava no identificados.
Estos errores son debidos a cuatro causas: errores en el proceso de positivado de la copia
como consecuencia de la presencia de partculas de polvo en los negativos o en las lentes
del equipo de laboratorio; errores en el negativo debidos a defectos de lavado, deficiencias en la emulsin, rayas y rasguos o por el uso de pelculas de color destinadas a ser
forzadas, y errores en las lentes de los objetivos, debidos a efectos de distorsin y a alteraciones en la refraccin. Finalmente se describen otras causas: reflejos de la luz del sol
sobre las antenas de satlites artificiales Iridum, retoques digitales o de fotocopiadoras y
duplicadoras, uso de objetivos sencillos y poco potentes para captar imgenes de cielo
profundo y, en ltimo trmino, oscilaciones del condensador de luz del microscopio.
Todos estos errores pueden dar lugar a imgenes falseadas: objetos inditos, dimetros
errneos, efectos de redondeo, alineaciones planetarias errneas, etc. El artculo facilita
imgenes de estos errores fotogrficos.
Los autores concluyen que hace falta ser cauteloso y hacer las oportunas comprobaciones
antes de dar a conocer el descubrimiento de un nuevo objeto celeste a las sociedades
astronmicas.
Ejemplo de los tres grados de exhaustividad
Exhaustividad baja
Exhaustividad media
Exhaustividad alta
Baremo1-3
Baremo4-6
Baremo7...
Ejemplo de uso: bases de datos de una bi- Ejemplo de uso: bases de datos de una biblioteca especializada en astronoma
blioteca especializada en astrofotografa
Errores fotogrficos
Fotografa astronmica
Astrofotografa
Errores fotogrficos
Descubrimientos
Identificacin de objetos celestes
Objetos errneos
b)Especificidad
La especificidad est relacionada con la exactitud en que un concepto particular que aparece en un documento est representado por un trmino de indizacin.
Alineaciones planetarias
Defectos de lavado
Deficiencias de la emulsin
Dimetros errneos
Efectos de redondeo
Errores en el negativo
Errores en el positivado
Errores en las lentes
Objetos inditos
Objetivos
Oscilaciones del microscopio
Partculas de polvo
Rayadas
Reflejos del sol
Retoques digitales
30
CC-BY-NC-ND PID_00143964
Ejemplo
Si en el texto que estamos indizando aparece el concepto Diplomacia, y este trmino aparece en el lenguaje documental controlado, tenemos que indizar Diplomacia. Si indizamos Relaciones internacionales o Embajadores no estaremos siendo especficos,
como podis ver en la tabla siguiente:
Ejemplo de especificidad
Materia Correcto,yporlo
tanto:
Diplomacia
Incorrectopor:
Especfico
Genrico
Demasiado
especfico
Diplomacia
Relaciones internacionales
Embajadores
3)Traduccinaunlenguajedocumentalcontrolado
Para traducir el concepto inicial escrito en lenguaje natural a un lenguaje documental, el indizador tiene que consultar las listas del lenguaje buscando la
forma correcta de introducir el concepto.
Ejemplos
Conceptotalcomosaleeneltexto
Traduccin
Lenguajedocumentalutilizado
Tragicomdia
791.221.28
Eoltic
Matriz
tero
Monarqua absoluta
Absolutismo
Cuando el analista procede a traducir el concepto del texto se puede encontrar en las
siguientes situaciones:
CC-BY-NC-ND PID_00143964
31
Un encabezamiento construido con la LEM del CSIC como Agua-Aspectos econmicos est formado por dos partes: Agua + Aspectos econmicos, que es un
encabezamiento y un subencabezamiento respectivamente y van en este orden.
Con los lenguajes tesauros y listado de autoridades no hay una sintaxis de combinacin.
b) No encuentra el concepto:
Hay lenguajes, como tesauros, donde el indizador tiene que proponer el trmino
nuevo como descriptor candidato y esperar a que la direccin del tesauro lo valide
como descriptor. Mientras tanto indiza con un trmino ms genrico.
Lectures
complementaries
Podis ampliar la informacin sobre la coherencia en
la indizacin leyendo las
obras siguientes:
G.vanSlype (1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin
en los sistemas documentales.
Madrid: Pirmide. Fundacin
Germn Snchez Ruiprez.
Biblioteca del Libro.
I.GilLeiva (2001).
CC-BY-NC-ND PID_00143964
32
Seleccionar los conceptos principales de los contenidos: el analista tiene que identificar las nociones que son elementos esenciales de la descripcin del contenido, tiene
que ser consciente del nmero de conceptos (criterio de exhaustividad) y la exactitud
de los mismos (criterio de especificidad).
Traducir a un lenguaje documental: para traducir el concepto inicial escrito en lenguaje natural a un lenguaje documental hay que consultar el listado del lenguaje
buscando la forma aceptada.
CC-BY-NC-ND PID_00143964
33
Sus funciones principales son indizar el contenido de los documentos y permitir la recuperacin a partir del campo materia.
Hay seis lenguajes documentales:
Los tesauros.
En teora todos los documentos se pueden indizar con cualquiera de estos seis
lenguajes, pero en la prctica la tipologa del SID (si es archivo, biblioteca o
centro de documentacin) y el tipo de usuario (general o especializado) condicionan que un SID indice y recupere con uno u otro lenguaje. En lneas generales:
las bibliotecas indizan con sistemas de clasificacin + listados de encabezamientos de materia + listados de autoridades;
Como podis observar, los SID pueden trabajar con un solo lenguaje o con
una combinacin de lenguajes.
4.1. Los trminos de indizacin
34
CC-BY-NC-ND PID_00143964
Ejemplo
Ejemplos de trminos de indizacin:
De una palabra: Bosques.
De ms de una palabra:
Fuente de informacin.
Ejemplo
El descriptor Fuente de informacin est formado por
dos unitrminos: Fuente e
Informacin. La preposicin
de no se indiza.
Sutrminodeindizacinseconocecomo
Sistemas de clasificacin
Encabezamiento
Listados de autoridades
Tesauros
Descriptor
Descriptor
Palabra clave
Lectura recomendada
Para cuestiones de terminologa recomendamos la consulta de la norma UNE 50-11392/1. Documentacin e informacin. Vocabulario. Parte 1.
Conceptos fundamentales. En:
Documentacin: Normas fundamentales. Madrid: AENOR,
1994.
CC-BY-NC-ND PID_00143964
35
Library of Congress
CC-BY-NC-ND PID_00143964
36
Lectura complementaria
Podis encontrar esta cronologa en la obra siguiente:
I.GilLeiva(2008). Manual
de indizacin. Teora y prctica.
Gijn: Ediciones Trea (Biblioteconoma y Administracin
cultural, 193), pg. 110-114.
37
CC-BY-NC-ND PID_00143964
Concepto
Breve explicacin
30.000
a.C.
Etiquetasdebarro
Losantiguosescribasmesopotmicosguardabanlastablillasdebarro(documentos)encestasdemimbre.Por
fuera,lacestallevabaotratablilladebarroconelcontenido.
Egipto
1876
CharlesA.CutterRulesforadictionarycatalog
1895
Publicada por la American Library Association (ALA) para bibliotecas medias y pequeas, con fondos no especializados.
1909
LibraryofCongressSubjectHeadings
NaceapartirdelalistadeALAylasreglasdeCutter.A
partirdeaquestalistaseconvierteenelreferentedetodaslaslistasdeencabezamientosdemateriadelmundo.
1923
1934
Guaparalosencabezamientosdemateria
JuanManriqueLarapublicalaprimeralistadeencabezamientosencastellanoenMxico.Eraunatraduccinde
laLibraryofCongressSubjectHeadings(LCSH),elALAy
laSEARS.
1946
1951
Descriptor
CalvinMooersacuaeltrmino.
1952
Unitrmino
1957
Indizacinautomtica
HansMeterLuhnempiezaatrabajarenindizacinautomticaaplicandoelmtododelafrecuencia.
1960
Compatibilidad
1961
SistemaSMART
GeraldStatondesarrollaelsistemaSMARTdeanlisisautomticodetextos.
1967
1967
Listadeencabezamientosdemateriaparabibliotecas
ListacompiladaporCarmenRovirayJorgeAguayoenespaolparalaUninPanamericana.
1974
1980
Rpertoiredautorit-matireencyclopdiqueetalphabtiqueunifiRAMEAU
PrimeralistadeencabezamientosdemateriadelaBibliotecaNacionaldeFrancia.SebasaronenlaRVMyla
LCSH.
1983
Bilindex
1985
NormaISO5963:1985Methodsforexaminatingdocumentos
NormaISOquenoseratraducidaanormaUNEhasta
1991conelnmeroUNE50-121-91.
38
CC-BY-NC-ND PID_00143964
Fechas
Concepto
Breve explicacin
1985
1986
Abandonodelossmbolostradicionalesdelaslistasde
encabezamientosporlospropiosdelosthesaurus
LaLCSH,ensu10edicin,abandonalossmbolosdex,
see,xx,v,aporlospropiosdelostesaurosUse,BT,NT,
RT.Lasdemslistasmundialestambinlosadoptan.
1986
El sistema unificado de lenguajes en medicina es un proyecto para integrar los diferentes vocabularios de ciencias de la
salud. Es un proyecto de la Biblioteca Nacional de Medicina
de EE.UU. (actualmente coordina el MESH, Medical Subject
Headings).
1995
UniversalizacindeInternet
Internethadifundidoypopularizadoconceptos,tcnicas
yprcticaspropiasdedocumentalistas.
1995
Metadatos
1997
ProyectoMACS
IniciativadelaConferenceofEuropeanNationalLibrariesCENLparahacercompatiblestreslistasdeencabezamientosdemateria,laalemanaSWD,laRAMEAUfrancesaylaLCSHusadaenGranBretaaySuiza.
A modo de conclusin
Para muchos autores la historia de los lenguajes documentales empieza en las bibliotecas
del siglo XIX con los sistemas de clasificacin, ya que fueron el primer intento serio de
controlar las materias de los documentos.
El siguiente paso en la evolucin de los lenguajes lo formul Charles Ammi Cutter en
1876, creando una lista de materias escritas en lenguaje natural.
A medida que la produccin cientfica iba generando cada vez ms volumen de informacin, surgi la necesidad de indizar de una forma ms analtica, con ms conceptos. Se
crean centros de documentacin con una vocacin ms especializada que las bibliotecas.
Nacen los lenguajes especializados por excelencia, los tesauros.
Desde mediados de los aos setenta el crecimiento de la industria de las bases de datos
posibilita la consulta en lnea de muchas publicaciones seriadas. Nace el ltimo lenguaje
documental, el listado de palabras clave o indizacin automtica.
La ltima gran etapa la marca Internet. La globalizacin de la red a partir de los aos 1990
impulsa el acceso a la informacin. La cooperacin impulsa a todos los lenguajes documentales a automatizarse y formar parte de proyectos colectivos (catlogos colectivos,
consorcios, redes). En el mismo sentido se buscan pasarelas entre los diferentes lenguajes
para solucionar problemas idiomticos entre pases.
Surge la necesidad de indizar la abundante produccin de recursos electrnicos, como
por ejemplo el uso de metadatos para definir e intercambiar datos entre sistemas informticos (etiquetas del tipo <subject>, <keywords>) y explotar la indizacin automtica
en los potentes robots de los buscadores. Tambin los usuarios pueden indizar los recursos gracias a iniciativas de indizacin social o tagging.
39
CC-BY-NC-ND PID_00143964
Enlaexpresindelusuario:
Traducidoaltesauro:
Instalaciones deportivas
Hockey hierba
Hockey (Hoquei)
Terrassa
Terrassa
Olimpiadas
CC-BY-NC-ND PID_00143964
40
G. van Slype (1991, pg. 161) considera que los lenguajes documentales pueden intervenir, como mximo, hasta en seis momentos diferentes en la recuperacin:
1) Seleccin de los sistemas documentales que se interrogarn: qu catlogos,
qu bases de datos, etc.
2) Seleccin de los conceptos expresados por el usuario en su enunciado.
3) Traduccin a un lenguaje documental controlado.
4) Formulacin de la ecuacin de bsqueda.
5) Extensin asistida por ordenador.
6) Evaluacin final de la pertinencia de los resultados obtenidos.
Hay una tercera funcin dentro de la cadena documental, pero slo afecta a
un lenguaje documental concreto, que son los sistemas de clasificacin:
Lectura complementaria
Podis ampliar la informacin sobre los lenguajes documentales en la obra siguiente:
G.vanSlype(1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin
en los sistemas documentales.
Madrid: Pirmide. Fundacin
Germn Snchez Ruiprez.
Biblioteca del Libro.
41
CC-BY-NC-ND PID_00143964
Listasdeencabezamientosdemateria:LEMAC
Tesauro:Tesaurus
dHistrialocalde
Catalunya(UAB)
Tabaco
Consumo
Historia
Impuesto de consumos
Cultivos
Monopolios
Siglo XVIII
Listadodeautoridades:
GranEnciclopdiaCatalana
Listadodedescriptoreslibres:Consultoresdelaasignatura
Canarias
Cultivo
Consumo
Espaa
Fiscalidad
Monopolio
Navarra
Siglo XVIII
Tabaco
Listadodepalabrasclave:programaSwesum
libro
tabaco
La lista de encabezamientos de materia ha indizado dos trminos en lenguaje natural, que estn formados por diversas palabras separadas con
guiones.
La lista de autoridades ha indizado slo nombres geogrficos y ha prescindido del resto de conceptos. Tambin ha usado el lenguaje natural.
CC-BY-NC-ND PID_00143964
42
El tesauro ha indizado unos cuantos descriptores en lenguaje natural, poniendo un trmino bajo el otro.
El listado de descriptores libres no se diferencia a simple vista de la indizacin con tesauro. En cambio, la diferencia es fundamental ya que el tesauro es controlado y los descriptores libres son libres.
La fase de anlisis y tratamiento > Anlisis documental > Anlisis de contenido >
Indizacin.
La fase de salida > Instrumentos de recuperacin.
Ved tambin
Todos estos temas sern desarrollados en los mdulos siguientes, dedicados a cada
uno de los lenguajes documentales.
CC-BY-NC-ND PID_00143964
43
A modo de conclusin
En teora todos los documento se podran indizar con cualquiera de los seis lenguajes. En
la prctica cada tipologa de SID tiende a utilizar un lenguaje o combinacin de lenguajes
concreta.
Indizar con ms de un lenguaje documental al mismo tiempo es muy conveniente porque
se suman las ventajas y minimizan los inconvenientes de los diferentes sistemas. Significa
un esfuerzo aadido en el momento de la indizacin pero permite recuperar de manera
ms precisa. Es decir, se combinan lenguajes para recuperar mejor.
44
CC-BY-NC-ND PID_00143964
Podemos clasificar los seis lenguajes documentales a partir de unas caractersticas o tipologas que los describen. Concretamente los lenguajes se tipifican
segn la naturaleza de sus trminos, el nivel de control, el nivel de coordinacin, la estructura y el nivel de anlisis:
Natural
Segn el nivel de control sobre los trminos
Tesauro
Codificado
Listados de autoridades
Libre
Controlado
Postcoordinado
Segn la forma de agrupar los trminos o estructura
JerrquicooSistemtico
Pormaterias
Combinatorio
Segn el nivel de anlisis
Sistemas de clasificacin
Tesauro
Por conceptos
Porpalabrasclave
X
X
CC-BY-NC-ND PID_00143964
45
a)Lenguajescodificados. Entendemos por codificado el uso de un cdigo artificial compuesto de nmeros, letras y smbolos que traducen un concepto.
Por ejemplo, el Sol, en un lenguaje como la CDU, sera 523.9.
Los lenguajes codificados son lenguajes sintticos, muy usados en bibliotecas,
ya que, adems de clasificar el contenido del fondo documental, son operativos en cualquier idioma y permiten la ordenacin de los fondos. Por otra parte,
tienen el inconveniente de ser poco comprensibles por parte de los usuarios.
Slo hay un tipo de lenguaje codificado: son los sistemasdeclasificacin.
b)Lenguajesnaturales. Entendemos por natural el uso de palabras del lenguaje usual, habitual, no cdigos. Es mucho ms prximo al usuario, ms amigable. Hay cinco lenguajes documentales naturales:
Los tesauros.
Algunos lenguajes
codificados
Son ejemplos de lenguajes codificados la Clasificacin Decimal Universal (CDU), la Clasificacin Dewey (DDC), la Clasificacin de la Library of Congress (LCC) o la Clasificacin
Colon (CC).
Ved tambin
Los sistemas de clasificacin se
estudian con ms profundidad
en el mdulo Sistemas de clasificacin documentales de
esta asignatura.
46
CC-BY-NC-ND PID_00143964
Son trminos seleccionados tanto en su forma (plural, singular, sintagma nominal, adjetivado, siglas, etc.), como en su contenido (de todos los sinnimos
se escoge uno, los homnimos se diferencian entre ellos, etc.) y como en sus
relaciones de jerarqua y asociacin (trminos conceptualmente ms genricos o especficos y trminos que se evocan mutuamente). Requieren unos gastos de construccin elevados, tanto en personal cualificado como en tiempo.
Para muchos autores son los verdaderos lenguajes documentales. Tambin se
conocen por el nombre de lenguajesartificiales.
Su funcin documental es la de representar un concepto con un nico trmino
y que slo haya un trmino por concepto, lo que se conoce como univocidad.
Los lenguajes controlados son cuatro:
Los tesauros.
47
CC-BY-NC-ND PID_00143964
La precoordinacin era una autntica necesidad en el entorno de las bibliotecas manuales, ya que no se poda buscar por una combinacin de dos o ms
trminos.
b)Postcoordinacin. La postcoordinacin consiste en combinar los trminos
de indizacin en el momento de la recuperacin. Permite combinar mltiples
trminos de indizacin siguiendo la lgica de los operadores booleanos y de
esta manera profundizar en el anlisis de contenido. No tienen sintaxis en
el momento de la indizacin. Cada trmino indizado es un punto de acceso
al documento; cuantos ms trminos indizamos, ms posibilidad tenemos de
recuperarlo.
Lenguajes postcoordinados
Un lenguaje postcoordinado, como un tesauro, representara el documento anterior sobre perros pastores como:
Perros pastores
Europa
Enciclopedia
que sera recuperado siguiendo la lgica de los operadores booleanos:
Perros Pastores AND Europa
Listados de autoridades.
Tesauro.
Ved tambin
El tema de la precoordinacin
se trata sobradamente en los
mdulos dedicados a los dos
lenguajes precoordinados:
Sistemas de clasificacin documentales y Listas de encabezamientos y listados de autoridades.
48
CC-BY-NC-ND PID_00143964
Documento2
Perros pastores
Alimentacin
Entrenamiento
Documento3
Qumica orgnica
Enciclopedia
CC-BY-NC-ND PID_00143964
49
b)Combinatoria: en la estructura combinatoria, los trminos no forman cadena, estn listados por orden alfabtico. Este tipo de estructura surgi como
reaccin a la rigidez de la estructura jerrquica, que no era fcil de actualizar.
Ejemplo extrado de la Lista de encabezamientos del CSIC
La estructura combinatoria permite la inclusin de nuevos trminos y la eliminacin de los obsoletos sin afectar al resto de la estructura del lenguaje. La
facilidad para actualizar el vocabulario los convierte en lenguajes adecuados
para todo tipo de entornos: enciclopdicos, cientficos y tcnicos.
Los lenguajes de estructura combinatoria son cinco:
Listados de autoridades.
Tesauros.
Como se puede observar, los tesauros participan de las dos estructuras: tienen
una presentacin sistemtica en forma jerrquica y una presentacin alfabtica en forma combinatoria.
El descriptor Cmic
Veamos el descriptor Cmic tanto en una presentacin como en la otra (extrado del
Tesaurus dhistria local de Catalunya).
Presentacin jerrquica (izquierda) y alfabtica (derecha)
CC-BY-NC-ND PID_00143964
50
Listados de autoridades.
Tesauro.
c) Por palabras clave: indizar por palabras clave significa indizar todas las
palabras con significado del texto. Es el proceso ms analtico que existe. No
es una tarea de indizacin humana, sino automtica. Los programas que indizan por palabras clave seleccionan slo las palabras que tienen significado
(preferentemente sustantivos).
Slo hay un lenguaje por palabras clave, y es evidentemente el nico lenguaje
automtico: el listado de palabras clave.
51
CC-BY-NC-ND PID_00143964
Por conceptos
Gestor de informacin
Documentacin
Administracin pblica
Empresa privada
Poltica de informacin
Necesidades
Nueve
Organizaciones
Organizativas
Panorama
Papel
Poltica
Privada
Profesional
Pblica
Siglo XXI
A modo de conclusin
Los lenguajes documentales se tipifican segn:
Lanaturalezadelostrminos: los trminos pueden expresarse en lenguaje codificado o natural. Entendemos por codificado el uso de un cdigo artificial compuesto
de nmeros, letras y smbolos que traducen un concepto. Entendemos por natural el
uso de palabras del lenguaje usual, habitual, no cdigos.
Laestructura: el vocabulario de los lenguajes documentales se organiza en dos estructuras: jerrquica o combinatoria. En la estructura jerrquica o arborescente, el
vocabulario se presenta en forma de cadena, con trminos genricos que agrupan
trminos ms especficos. En la estructura combinatoria, los trminos no forman cadena, estn listados por orden alfabtico.
52
CC-BY-NC-ND PID_00143964
5.6. Conclusiones
El estudio de las tipologas de los lenguajes documentales permite elaborar la
ficha descriptiva de cada uno.
Fichas descriptivas de cada lenguaje documental
Sistemasdeclasificacin
Listadodeencabezamientodematerias
Tesauro
Listadodeautoridades
Listadodedescriptoreslibres
CC-BY-NC-ND PID_00143964
53
Actividades
1. A partir del siguiente artculo elaborad un resumen informativo, uno indicativo, uno selectivo de conclusiones y uno automtico que tenga una extensin parecida al informativo.
VALLEZ, M; PEDRAZA-JIMNEZ, R. El Procesamiento del Lenguaje Natural en la Recuperacin de Informacin Textual y reas afines [en lnia en http://www.hipertext.net/web/
pag277.htm]. Hipertext.net, nm. 5, 2007. ISSN 1695-5498.
2. Indizad el mismo artculo con los tres niveles de exhaustividad. Argumentad en qu tipo
de base de datos y SID podra ser til cada uno.
3. Proponed dos ttulos de documentos, reales o inventados, donde la materia se exprese a
travs de dos sinnimos.
4. Imaginad dos ttulos ms donde aparezcan dos polismicos y proponed una manera de
diferenciarlos. Buscad el origen etimolgico de las palabras y decid si son polismicas u homnimas.
5. Responded las siguientes afirmaciones justificando la solucin:
a) Todo lenguaje controlado es codificado?
b) Todo lenguaje precoordinado es controlado?
c) Todo lenguaje libre es natural?
d) El lenguaje que tiene la tasa de coherencia ms elevada es el Listado de palabras clave?
6. El siguiente texto es un compendio de errores y medias verdades. Sabrais localizarlas y
argumentar por qu no son correctas?
Usar lenguajes naturales en la indizacin y recuperacin permite una buena comunicacin
documental. Los sistemas de clasificacin representan la materia de los documentos a travs
de mltiples notaciones. Los lenguajes que indizan por materias son los tesauros y las listas de
encabezamientos de materia. Para recuperar de manera precisa tenemos que utilizar sistemas
de clasificacin y listados de encabezamientos de materia. Los lenguajes controlados son muy
amigables para el analista y el usuario. Los lenguajes precoordinados permiten ordenar los
documentos en las estanteras.
CC-BY-NC-ND PID_00143964
54
Glosario
abstract m Terminologa anglosajona para los resmenes redactados por personas.
anforas f Relacin de referencia entre un elemento lingstico y uno anterior en el discurso.
anlisis de contenido m Operaciones de anlisis que identifican y representan de manera precisa la materia de los documentos, con el objetivo de permitir la recuperacin. Las
operaciones son dos: el resumen y la indizacin. Esta parte del anlisis documental establece
el punto de acceso por materias.
anlisis morfosintctico m Anlisis que determina la categora lxica de cada palabra:
sustantivo, verbo, adjetivo, artculo, preposicin, etc. Tambin determina el lema. Estas operaciones permiten distinguir las palabras con significado (sustantivos, adjetivos, verbos) de
las vacas (artculos, preposiciones, pronombres, etc.). El lema permite agrupar todas las palabras que son flexiones de otra (info/informar/informacin/informador/informacional/etc.).
autoridad f Trmino de indizacin propio del lenguaje documental Listado de Autoridades. Tambin se conocen con el nombre de identificadores y descriptores.
codificado adj. Tipologa de lenguaje documental consistente en el uso de un cdigo artificial compuesto de nmeros, letras y smbolos que traducen un concepto. Slo hay un tipo
de lenguaje codificado, son los sistemas de clasificacin.
combinatoria f Tipologa de lenguaje documental consistente en estructurar los trminos
de indizacin por orden alfabtico. La estructura combinatoria permite la inclusin de nuevos trminos y la eliminacin de los obsoletos sin afectar al resto de la estructura del lenguaje. Los lenguajes de estructura combinatoria son cinco: las listas de encabezamientos de
materia, los listados de autoridades, los tesauros, el listado de descriptores libres y el listado
de palabras clave.
controlado adj. Tipologa de lenguaje documental consistente en listas de trminos seleccionados tanto en su forma (plural, singular, sintagma nominal, adjetivado, siglas, etc.) como
en su contenido (de todos los sinnimos se escoge uno, los homnimos se diferencian entre
ellos, etc.) y como en sus relaciones de jerarqua y asociacin (trminos conceptualmente
ms genricos o especficos y trminos que se evocan mutuamente). Requieren unos gastos
de construccin elevados, tanto en personal cualificado como en tiempo. Son los verdaderos lenguajes documentales. Tambin se conocen por el nombre de lenguajes artificiales. Su
funcin documental es la de representar un concepto con un nico trmino y que slo haya
un trmino por concepto, lo que se conoce como univocidad. Los lenguajes controlados son
cuatro: los sistemas de clasificacin, las listas de encabezamientos, listados de autoridades
y tesauros.
describir el contenido loc. v. Ved representar el contenido
descripcin caracterstica f Ved indizacin.
descriptor m Trmino de indizacin propio de tres lenguajes documentales: listado de
autoridades, tesauros, listado de descriptores libres.
encabezamiento m Trmino de indizacin propio del lenguaje documental de las listas
de encabezamientos de materia.
entropa f Calidad aplicable a los lenguajes documentales que tienden a la seleccin, a
la restriccin del vocabulario. Es el proceso contrario al lenguaje natural que tiende a la
abundancia, a la reiteracin de conceptos, a la sinonimia en beneficio de una expresin ms
rica.
especificidad f Criterio relacionado con la exactitud en que un concepto particular que
aparece en un documento est representado por un trmino de indizacin.
estructura f Tipologa de los lenguajes documentales que los clasifica en jerrquicos o
combinatorios.
examen del documento m Primera fase del proceso de indizacin consistente en la lectura del ttulo, resumen, sumario, introduccin, ilustraciones y palabras o frases destacadas
en una tipografa diferente.
exhaustividad f Criterio relacionado con el nmero de conceptos que se tienen en cuenta
para caracterizar el contenido entero de un documento. El principal criterio de seleccin es el
CC-BY-NC-ND PID_00143964
55
valor potencial del concepto para los usuarios de su SID. Podemos distinguir entre exhaustividad baja, media y alta en funcin del nmero de descriptores.
extract m Terminologa anglosajona para los resmenes automticos. Los extracts son los
resmenes formados a partir de la extraccin de algunas frases del texto previamente seleccionadas por un programa.
fichero inverso m Fichero donde se almacenan todos los trminos de indizacin. Estos
se sitan uno detrs del otro de forma secuencial y asociados al documento al que hacen
referencia.
hipernimo adj. Decimos que una palabra es hipernima cuando tiene un campo significativo que incluye otro de menor extensin. Ejemplo: color es un hipernimo con respecto
a amarillo, naranja, verde...
hipnimo adj. Decimos que una palabra es hipnima cuando tiene un campo significativo que queda incluido en otro de mayor extensin. Ejemplo: amarillo, naranja, verde son
hipnimos ya que pertenecen al trmino color.
homonimia f Tipo de polisemia. Se da cuando dos conceptos diferentes han llegado a
tener el mismo nombre, la misma forma, pero vienen de orgenes diferentes y por lo tanto
tienen etimologas diferentes.
identificador m Trmino de indizacin propio del lenguaje documental Listado de autoridades. Tambin se conocen con el nombre de autoridad y descriptores.
indizacin f Accin de describir o identificar un documento en relacin a su contenido.
Norma UNE 50-121-91. Indizar es el resultado de examinar el documento, seleccionar los
conceptos y almacenarlos en una base de datos. Esta definicin implica tres acciones, de
las cuales la ms significativa es la seleccin de los conceptos y su traduccin al lenguaje
documental.
indizacin por conceptos loc. v. Indizacin de las ideas y nociones del texto, sin reducirlo a un tema principal. Responden a la pregunta cules son los conceptos de este documento?, van ligados necesariamente a sistemas automatizados. Los lenguajes que indizan
por conceptos son tres: listados de autoridades, tesauros, listados de descriptores libres.
indizacin por materias loc. v. Indizacin sinttica. Responden a la pregunta cul es
el tema de este documento?. Los lenguajes que indizan por materias son dos, los sistemas
de clasificacin y las listas de encabezamientos de materia.
indizacin por palabras clave loc. v. Indizacin de todas las palabras con significado
del texto. Es el proceso ms analtico que existe. No es una tarea de indizacin humana, sino
automtica. Los programas que indizan por palabras clave seleccionan slo las palabras que
tienen significado (preferentemente sustantivos). Slo hay un lenguaje por palabras clave, y
es evidentemente el nico lenguaje automtico, el listado de palabras clave.
ISO 214: 1976 f Norma internacional, traducida por AENOR como norma UNE 50-103-90
Preparacin de resmenes.
jerrquica adj. Tipologa de lenguaje documental consistente en estructurar los trminos
de indizacin de forma arborescente. El vocabulario se presenta en forma de cadena, con
trminos genricos que agrupan trminos ms especficos. Todos los trminos dependen de
un trmino superior y de significado ms genrico. Esta estructura permite agrupar los conceptos por temas.
lenguaje artificial m Ved controlado.
lenguaje documental m Vocabulario de trminos en lenguaje natural o un sistema artificial de signos normalizados que facilitan la representacin del contenido de los documentos.
Sus funciones principales son indizar el contenido de los documentos y permitir la recuperacin a partir del campo materia.
lenguaje natural m Lenguaje que usamos de forma cotidiana: cataln, castellano, vasco,
gallego, francs, etc.
libre adj. Tipologa de lenguaje documental consistente en listas de trminos extrados del
lenguaje natural sin formar parte de ningn listado establecido a priori, ni haber pasado un
proceso de control de su vocabulario. Los lenguajes libres son dos: los listados de descriptores
libres y el listado de palabras clave.
CC-BY-NC-ND PID_00143964
56
listado de autoridades m Lenguaje documental. Analtico por conceptos, natural, controlado, postcoordinado y combinatorio. Su trmino de indizacin se conoce como identificador, autoridad o descriptor.
listado de descriptores libres m Lenguaje documental. Analtico por conceptos, natural,
libre, postcoordinado y combinatorio. Su trmino de indizacin se conoce como descriptor.
listado de encabezamientos de materia m Lenguaje documental. Sinttico por materias, natural, controlado, precoordinado y combinatorio. Su trmino de indizacin se conoce
como encabezamiento.
listado de palabras clave m Lenguaje documental. Analtico por palabras clave, natural,
libre, postcoordinado y combinatorio. Su trmino de indizacin se conoce como palabra
clave.
natural adj. Tipologa de lenguaje documental consistente en el uso de palabras del lenguaje usual, habitual, no cdigos. Hay cinco lenguajes documentales naturales: las listas de
encabezamientos de materia, los listados de autoridades, los tesauros, los listados de descriptores libres y los listados de palabras clave.
naturaleza de los lenguajes f Tipologa de los lenguajes documentales que los clasifica
en codificados o naturales.
nivel de anlisis m Tipologa de los lenguajes documentales que los clasifica en lenguajes
de materias, conceptos y palabras clave.
nivel de control m Tipologa de los lenguajes documentales que los clasifica en libres o
controlados.
nivel de coordinacin m Tipologa de los lenguajes documentales que los clasifica en
precoordinados o postcoordinados.
notacin f Trmino de indizacin propio del lenguaje documental de los sistemas de clasificacin.
palabra clave f Trmino de indizacin propio del lenguaje documental de las palabras
clave o indizacin automtica. Palabra o grupo de palabras seleccionadas de manera automtica del ttulo, resumen o texto de un documento que representan el contenido y permiten
la recuperacin.
palabra vaca f Palabra sin significado en las operaciones de indizacin y resumen. Son
preposiciones, artculos, verbos, adverbios, etc.
polisemia f Propiedad de un signo lingstico de tener ms de un significado. Decimos que
dos palabras son polismicas cuando el mismo signo lingstico, palabra o sonido, tiene ms
de un significado. La palabra tiene un nico origen etimolgico y acaba teniendo significados
diferentes sin cambiar su categora gramatical.
ponderacin (de frases, de palabras) f Mtodo que evala las frases y las palabras de
un texto en funcin de parmetros como la frecuencia, la presencia de palabras indicativas
(buscan palabras como importante, esencial, conclusiones, etc.), la aparicin en lugares destacados, por ejemplo el ttulo: al principio de cada prrafo, al final a modo de conclusiones, etc.
postcoordinacin f Tipologa de lenguaje documental consistente en combinar los trminos de indizacin en el momento de la recuperacin. Los lenguajes postcoordinados slo
tienen sentido en sistemas documentales automatizados que dispongan de un fichero inverso. Los lenguajes postcoordinados son cuatro: listados de autoridades, tesauros, listados de
descriptores libres y listados de palabras clave.
precoordinacin f Tipologa de lenguaje documental consistente en determinar a priori
cmo se combinan los trminos, ya sea a la hora de construir el lenguaje, de indizar el documento, o de recuperarlo. Los dos lenguajes precoordinados son los sistemas de clasificacin
y las listas de encabezamientos de materia.
procesamiento en lenguaje natural (PLN) m Rama de la inteligencia artificial y de
la lingstica computacional que estudia los lenguajes que usan los humanos para interactuar con los ordenadores en contextos escritos y orales. EL PLN estudia cmo emular el conocimiento humano, en cuanto a la identificacin de los conceptos y frases con contenido
relevante.
relacin de significado f Ved relacin semntica.
CC-BY-NC-ND PID_00143964
57
relacin semntica f Relaciones de significado de las palabras. Las relaciones pueden ser
de tipo genrico, especfico o relacionado de un trmino con respecto a otro. En lenguaje
natural estas relaciones son implcitas pero en un lenguaje documental hay que definir estas
relaciones, agrupando y relacionando los trminos afines.
representar el contenido loc. v. Expresin que significa describir el tema o los temas de
un documento.
resumen m Presentacin abreviada y precisa de un documento, sin interpretacin ni crtica
y sin mencin expresa del autor del resumen. Norma UNE 50-103-90 Preparacin de resmenes.
resumen indicativo m Resumen que consigna slo las ideas centrales del documento. Su
lectura no puede sustituir la lectura del original.
resumen informativo m Resumen que consigna el tema central, temas adicionales, naturaleza y objetivo del documento, metodologa, resultados, conclusiones y anexos. La idea
de fondo es que un resumen informativo puede sustituir en ocasiones la lectura del documento original.
resumen selectivo m Resumen que consigna slo una parte concreta del documento. El
ms habitual es el resumen de conclusiones, pero tambin hay otros tipos, como la resea
(review).
seleccin de los trminos de indizacin f Segunda fase en el proceso de indizacin
consistente en identificar las nociones que son elementos esenciales de la descripcin del
contenido. Los criterios de seleccin son el nmero de conceptos (criterio de exhaustividad)
y la exactitud de los mismos (criterio de especificidad).
smbolo de clase m Ved Notacin.
sinonimia f Palabras que tienen el mismo significado. Ejemplo: alimento, nutriente, comida, provisin. En un sistema documental, si no se controlan y se usan indiscriminadamente, comportan silencio documental.
sistema de clasificacin m Lenguaje documental. Sinttico por materias, codificado,
controlado, precoordinado y jerrquico. Su trmino de indizacin se conoce como notacin
o smbolo de clase.
trmino de indizacin m Representacin de un concepto en lenguaje natural o un cdigo de clasificacin. Los trminos de indizacin pueden estar formados por una palabra o
ms de una.
tesauro m Lenguaje documental. Analtico por conceptos, natural, controlado, postcoordinado, jerrquico y combinatorio. Su trmino de indizacin se conoce como descriptor.
traduccin a un lenguaje documental controlado f Buscar un concepto expresado
en lenguaje natural en el listado de trminos de un lenguaje documental controlado. Utilizar
el trmino controlado para indizar y recuperar.
UNE 50-103-90 Preparacin de resmenes f Norma espaola que establece las directrices que se tienen que seguir para presentar los resmenes en los documentos. Pone especial
nfasis en la preparacin de resmenes por parte de los autores de los documentos primarios
y en la misma publicacin.
UNE 50-113-92/1 f Norma espaola titulada Documentacin e informacin. Vocabulario.
Parte 1. Conceptos fundamentales. En: Documentacin: Normas fundamentales. Madrid: AENOR, 1994.
UNE 50-121-91 f Norma espaola titulada Mtodos para el anlisis de documentos, determinacin de su contenido y seleccin de trminos de indizacin. Basa el proceso de indizacin en
tres fases: examinar el documento para identificar su contenido, seleccionar los conceptos
principales de los contenidos y traducir a un lenguaje documental.
unitrmino m La parte ms pequea con significado de un trmino de indizacin. La
norma UNE 50-113-92/1 define los unitrminos como el elemento significativo ms pequeo
de un lenguaje documental utilizado para representar un concepto especfico en un sistema
de indizacin coordinado; no se debe confundir con palabra clave o descriptor.
univocidad f Representar un concepto con un nico trmino.
CC-BY-NC-ND PID_00143964
58
Bibliografa
Bibliografa sobre el resumen
AENOR (1990). Documentacin. Preparacin de resmenes. UNE 50 103 90. Madrid: AENOR.
Climent, Salvador. Sistemes de resum automtic de documents. Digit. Hum. Revista digital dhumanitats. ISSN 1575-2275.
Lloret, E.; Ferrndez, O.; Muoz, R.; Palomar, M. (2008). Integracin del reconocimiento de la implicacin textual en tareas automticas de resmenes de textos. Procesamiento del lenguaje natural, nm. 41, pg. 183-190.
Mateo, P. L.; Gonzlez, J. C.; Villena, J; Martnez, J. L. (2003). Un sistema para resumen
automtico de textos en castellano.
Pinto Molina, M. (1992). El resumen documental: principios y mtodos. Madrid: Pirmide/
Fundacin Germn Snchez Ruiprez (Biblioteca del Libro, Y).
Bibliografa sobre la indizacin
Abadal, E.; Codina, L. (2005). Recuperacin de Informacin. En: Bases de Datos Documentales: Caractersticas, funciones y mtodo (cap. 2. p. 29-92). Madrid: Sntesis.
AENOR (1997). Mtodos para el anlisis de los documentos, determinacin de su contenido y
seleccin de los trminos de indizacin. Norma UNE 50-121-91. Madrid: AENOR.
AENOR (1997). Documentacin e informacin. Vocabulario. Parte 6: lenguajes documentales. Revista Espaola de Documentacin Cientfica, Norma UNE-50-113/6 (ISO 5127/6), vol.
20, nm. 4, pg. 417-436.
Cid, P.; Cuadrado, M.; Aguiriano, C. (1999). Fonaments de llenguatges documentals. [Document electrnic]. Barcelona: UOC.
Codina, L. (1994). El papel del lenguaje natural en los sistemas multimedia: una reflexin
sobre la tecno-simpleza y la ciber-ingenuidad. Cuadernos de documentacin multimedia, nm.
3 (junio).
Gil Leiva, I. (2008). Manual de indizacin. Teora y prctica. Gijn: Ediciones Trea (Biblioteconoma y Administracin cultural, 193).
Gil, I.; Rodrguez Muoz, J. V. (1996). El Procesamiento del lenguaje natural aplicado
al anlisis del contenido de los documentos. Revista general de informacin y documentacin,
vol. 6, nm. 2, pg. 205-218.
Gil Urdiciain, B. (1992). Funcin de los lenguajes documentales en el tratamiento de la
informacin en las organizaciones. Revista general de informacin y documentacin, vol. 2,
Nm. 2, pg. 195-200.
Gil Urdiciain, B. (2004). Manual de lenguajes documentales. Gijn: Ediciones Trea (Biblioteconoma y Administracin cultural, 106).
Norma UNE 50-113-92/1. Documentacin e informacin. Vocabulario. Parte 1. Conceptos fundamentales (1994). En: Documentacin: Normas fundamentales. Madrid: AENOR.
Slype, G. van (1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin en los
sistemas documentales. Madrid: Pirmide. Fundacin Germn Snchez Ruiprez. Biblioteca
del Libro.
Sistemas de
clasificacin
documentales
Manela Junc Campdepadrs
PID_00143962
CC-BY-NC-ND PID_00143962
Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es
CC-BY-NC-ND PID_00143962
ndice
Introduccin...............................................................................................
Objetivos.......................................................................................................
1.
1.2.
1.3.
10
1.1.2.
10
1.1.3.
Funciones .......................................................................
11
1.1.4.
12
1.1.5.
Conclusiones ..................................................................
12
14
1.2.1.
14
1.2.2.
14
1.2.3.
Conclusiones ..................................................................
16
17
1.3.1.
19
1.3.2.
21
1.3.3.
22
1.3.4.
2.
XX.................................................................................
24
1.3.5.
25
1.3.6.
Conclusiones ..................................................................
27
29
2.1.
29
2.2.
31
2.3.
33
2.3.1.
33
2.3.2.
34
2.3.3.
34
Conclusiones ..................................................................
35
36
3.1.
37
3.1.1.
Clases .............................................................................
37
3.1.2.
Notacin ........................................................................
39
3.1.3.
Conclusiones ..................................................................
40
41
2.3.4.
3.
10
3.2.
CC-BY-NC-ND PID_00143962
3.2.1.
3.3.
3.4.
41
54
3.3.1.
56
3.3.2.
65
70
3.4.1.
70
3.4.2.
72
3.4.3.
73
3.4.4.
Conclusiones ..................................................................
73
4.
Empezamos a clasificar....................................................................
75
5.
78
5.1.
78
5.2.
80
5.3.
81
83
6.1.
83
6.2.
Metodologa .................................................................................
84
6.3.
84
6.4.
Mantenimiento ............................................................................
86
Glosario........................................................................................................
90
Bibliografa.................................................................................................
94
6.
CC-BY-NC-ND PID_00143962
Introduccin
Ved tambin
Concepto
Ved
Clasificacin documental
Clases
Notacin
Auxiliares comunes
Auxiliares especiales
4. Empezamos a clasificar
5. Prcticas con la CDU
CC-BY-NC-ND PID_00143962
Bibliografayrecursosweb
Presentamos la bibliografa en dos secciones:
una seleccin de fuentes de informacin indispensables para los estudiantes que se introducen en el estudio de las clasificaciones.
Seleccinbibliogrfica
Es indispensable la consulta de la clasificacin decimal universal en edicin
de bolsillo o en CD.
La tabla siguiente muestra que las obras de Mara Pinto (ed.), Jacques Maniez e
I. C. McIlwaine son muy indicadas con respecto a la teora de las clasificaciones; y que obras como las Miguel Benito, Carmen Diez-Carrera e I. McIlwaine
lo son para las prcticas.
Obras recomendadas
Bibliografa
Teora/historia de
las clasificaciones
Benito,M.(1999). El sistema
de clasificacin decimal universal:
manual de aprendizaje. Madrid:
Taranco.
CC-BY-NC-ND PID_00143962
Bibliografa
Teora/historia de
las clasificaciones
SanSegundoManuel,R.
(1997). Principales sistemas de
clasificacin. A: M. Pinto (ed.).
Manual de clasificacin documental (pg. 67-89). Madrid: Sntesis
Biblioteconoma y Documentacin).
Seleccinrecursosweb
Por lo que respecta a los recursos web, no podemos dejar de seleccionar las
webs de las sedes oficiales de los sistemas de clasificacin ms aplicados en el
mundo La CDU y la Dewey y los tutoriales sobre la CDU.
Clasificacindecimaluniversal(weboficial,blog):
Universal Decimal Classification Consortium Homepage. La Haya: UDC Consortium Act. 2002-08-01 [en lnea]. [Consulta: 10 de octubre de 2008].
Universal Decimal Classification Blog. UDC Consortium [en lnea]. [Consulta: 10 de octubre de 2008].
ClassificacinDewey(actualizaciones,clases,blog):
OCLC Online Computer Library Center. Dewey services, Dewey decimal classification for use with OCLCs online cataloging services. [Consulta: 10 de octubre de 2008]. [En lnea].
Publiclibrariesusingspanish. Spanish version of the Dewey Decimal Classification System based on the 18th edition of DDC [Consulta: 10 de octubre
de 2008]. [En lnea].
Cabe destacar las pginas personales y tutoriales de Miguel Benito, Ferran
Burguillos y Enric Mestre para sus exposiciones pedaggicas:
Benito,Miguel. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10 de octubre de 2008]. O, tambin, en la URL Instituto
de Taranco [Fecha de consulta: 10 de octubre de 2008].
CC-BY-NC-ND PID_00143962
Objetivos
Con el estudio de los materiales asociados a este mdulo, alcanzaris los objetivos siguientes:
CC-BY-NC-ND PID_00143962
Lectura complementaria
Clasificaciones filosfico-cientficas
Sistemas de Porfirio, Platn, Aristteles, F. Bacon, A. Comte, Leibniz.
(1)
CC-BY-NC-ND PID_00143962
10
A modo de conclusin
bibliogrfico o documental.
Bibliografa
B.GilUrdiciain(1997). Los lenguajes de clasificacin documental. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y
Documentacin).
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y
utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez
Ruiprez.
M.PintoMolina(ed.) (1997). Manual de clasificacin documental. Madrid: Sntesis (Biblioteconoma y Documentacin).
Las clasificaciones bibliogrficas o documentales son un lenguaje documental que divide el conocimiento (enciclopdico o especfico de un
rea temtica) en una serie ordenada de clases y subclases basadas en
las semejanzas y diferencias.
(2)
CC-BY-NC-ND PID_00143962
11
En los archivos se presenta como la identificacin de agrupaciones documentales naturales mediante el auxilio de un sistema de clasificacin que reproduce la estructura orgnica o el entramado funcional de la institucin generadora del fondo como resultado de
su actividad natural para el cumplimiento de sus fines.
2)Usodelossistemasdeclasificacinenbibliotecas
La clasificacin se identifica en las bibliotecas con la agrupacin intelectual e incluso
fsica de los documentos en clases que mantengan entre s relaciones de superioridad y
dependencia, a partir de la extraccin y representacin codificada de su contenido temtico principal (materia) de acuerdo con las reglas de un sistema de clasificacin jerrquico
o facetado.
Lectura complementaria
Sobre los sistemas de clasificacin en los servicios de informacin y documentacin
segn Miguel ngel Esteban,
podis consultar la obra siguiente:
MaraPintoBatanea(ed.)
(1997). Manual de clasificacin documental (pg. 20).
Madrid: Sntesis (Biblioteconoma y Documentacin).
Usodelossistemasdeclasificacinenloscentrosdedocumentacin
En los centros de documentacin se considera como una actividad innecesaria habitualmente porque tiene prioridad el anlisis conceptual del contenido de los documentos,
si bien puede estar presente como una funcin auxiliar para el control de la diversidad
de la coleccin y la reduccin del rea de busca con el uso de los niveles superiores de
un tesaurus.
Aadiremos el uso de los sistemas de clasificacin para organizar el conocimiento del WWW: tal como dice I. McIlwaine, los sistemas como la CDU pueden tener dos utilidades:
informacin de calidad.
Los cuadros de clasificacin utilizados en los archivos son por esencia originales y no extrapolables a otros fondos documentales, ya que responden a los
procesos propios de la organizacin y se estudian en otras asignaturas. En consecuencia, este mdulo se centrar en los sistemas utilizados en las bibliotecas.
1.1.3. Funciones
Los sistemas de clasificacin cumplen las tres funciones siguientes:
Lectura recomendada
Para todos los interesado en
las aplicaciones de la CDU en
Internet, podis consultar la
obra siguiente:
I.C.McIlwaine (2003). Gua
para uso de la CDU (pg. 258272).
CC-BY-NC-ND PID_00143962
12
1) Ordenaciones no significativas, sin ninguna relacin con el contenido de los documentos, por ejemplo, ordenaciones numricas a partir del nmero de registro.
2) Ordenaciones con significado limitado: por lengua, pas, autor, disciplina, etc.
3) Ordenaciones altamente significativas: ordenacin por materias, de manera que los
documentos que traten de contenidos afines se coloquen cerca.
Generar subproductos del catlogo, sobre la base de su materia. Por ejemplo, listas bibliogrficas, ltimas adquisiciones ordenadas por temas...
1.1.5. Conclusiones
Las clasificaciones bibliogrficas son un lenguaje documental que representa el contenido, ordena fsicamente los documentos (ordenaciones altamente
significativas) y genera subproductos de catlogo (como las listas bibliogrficas o las ltimas adquisiciones ordenadas por temas).
Se usan en todo tipo de SID: archivos, bibliotecas, centros de documentacin
y servicios de la red.
CC-BY-NC-ND PID_00143962
13
A escala mundial, hay diversos sistemas de clasificacin documental: clasificacin decimal universal (CDU), clasificacin Dewey (CD), clasificacin de la
Library of Congress (LC), clasificacin china, clasificacin japonesa, clasificacin rusa (LBC, antigua BBK), clasificacin Colon (CC), clasificacin Bliss (CB),
clasificacin Brown.
En estos momentos de la lectura del mdulo, os habis de haber situado en
la secuencia:
Clasificar > Sistemas de clasificacin > Sistemas de clasificacin documentales > Aplicacin en las bibliotecas.
Ms informacin
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
M.A.Esteban(1997).Fundamentos epistemolgicos de la clasificacin documental.
En: M. Pinto (ed.). Manual de clasificacin documental (pg. 19-32). Madrid: Sntesis (Biblioteconoma y Documentacin).
M.Granados;A.Nicolau (2005, 6-8 de julio). La recuperaci de la informaci en els
catlegs en lnia: lus de la Classificaci decimal universal i la seva implicaci en la indexaci [en lnea]. 7. Congrs del Captol Espanyol dISKO. Barcelona: Departament
de Biblioteconomia i Documentaci de la Universitat de Barcelona. [Consulta: 1 octubre
de 2008].
Library of Congres Classification system [en lnea]. [Fecha de consulta: 1 de octubre de
2008].
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y
utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez
Ruiprez.
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
ClasificacinDewey(actualizaciones,clases,blog)
OCLC Online Computer Library Center. Dewey services, Dewey decimal classification for
use with OCLCs online cataloging services [en lnea]. [Consulta: 10 de octubre de 2008].
M.PintoMolina(ed.) (1997). Manual de clasificacin documental. Madrid: Sntesis (Biblioteconoma y Documentacin).
R. San Segundo Manuel (1997). Principales sistemas de clasificacin. En: M. Pinto
(ed.). Manual de clasificacin documental (pg. 67-89). Madrid: Sntesis (Biblioteconoma
y Documentacin).
025.431: The Dewey blog [en lnea]. [Consulta: 10 de octubre de 2008].
Universal Decimal Classification Blog [en lnea]. UDC Consortium. [Consulta: 10 de octubre de 2008].
Universal Decimal Classification Consortium Homepage. La Haya: UDC Consortium. Act.
2002-08-01 [en lnea]. [Consulta: 10 de octubre de 2008].
14
CC-BY-NC-ND PID_00143962
Clasificaciones enciclopdicas
Clasificaciones especializadas o sectoriales
Por estructura
Tipologa no excluyente
La CDU es una clasificacin enciclopdica e hbrida.
Las tablas principales nos informan de qu tratan todas las reas de conocimiento: filosofa, religin, ciencias sociales, ciencias exactas y naturales, tecnologa, arte, lenguas y literatura, geografa e historia.
Clasificaciones
enciclopdicas
Son ejemplos de clasificaciones
enciclopdicas la clasificacin
decimal universal, la clasificacin Dewey, la Library of Congress, la clasificacin Bliss.
Clasificaciones
especializadas
Clasificaciones especializadas
en el mbito mdico: clasificacin internacional de enfermedades (CIE, clasificacin internacional de enfermedades), medical subject subheadings por
la base de datos Medline.
CC-BY-NC-ND PID_00143962
15
Cada clase se va dividiendo en subclases tantas veces como sea necesario para
representar el dominio entero o todos los supuestos posibles a la hora de clasificar un fondo. Las clases derivan de un punto comn y se puede recorrer
el camino desde el objeto ms especfico al ms general, siguiendo uno solo.
Cada concepto tiene un lugar, y slo uno; por ello, tambin se las conoce como clasificacionesmonojerrquicas.
Son enumerativas, es decir, enumeran de arriba abajo y de izquierda a derecha
todas las materias previstas. Tienen una estructura lgica, van de general a
especfico y las clases son disjuntas, es decir, son conjuntos mutuamente excluyentes.
Son las ms utilizadas porque son de fcil construccin y uso para el analista.
Tambin se adecuan muy bien en entornos enciclopdicos y universales.
Las clasificacionesfacetadas estn formadas por diversas clasificaciones jerrquicas autnomas a partir de una faceta (el periodo artstico,
La clasificacin de la
Library of Congress
La clasificacin de la Library
of Congress es un buen ejemplo de clasificacin jerrquica y
enumerativa.
la tcnica, etc.) que, cuando se combinan, describen la materia del documento de manera analtica. Son clasificaciones autnomas pero articuladas, combinables.
Las clasificaciones facetadas son ms flexibles que las enumerativas. El principal terico de las clasificaciones facetadas es Ranganathan, el autor de la clasificacin Colon.
Las facetas son principios de divisin basados en las caractersticas que las
materias tienen en comn. Se trata de agrupar los conceptos segn una caracterstica concreta que comparte con otras clases. Hay facetas de tipo universal,
aplicables a todos los campos del saber, y las hay propias de una materia.
Algunos ejemplos de facetas
Facetas universales son el espacio, el tiempo.
Algunas facetas propias de una materia son, para la materia Artes: Periodo artstico, Tcnica
artstica, Tema representado... As, Romnico, Gtico, Barroco, Modernismo, seran clases de
la faceta Periodo artstico que podramos aplicar a cualquier tipo de arte. Por ejemplo:
escultura modernista, pintura modernista, arquitectura modernista...
Ved tambin
En el subapartado 1.3.3 se
profundiza en el estudio de las
facetas universales o frmula
PMEST de Ranganathan.
16
CC-BY-NC-ND PID_00143962
ponden a las facetas propias de una materia. Ejemplo: facetas propias para
astronoma.
La clasificacin decimal universal (CDU) combina la estructura jerrquica de las tablas con
los elementos facetados para representar conceptos ms
complejos y conceptos nuevos
a partir de la relacin de dos
conceptos preexistentes.
Para acabar, presentamos las ventajas y los inconvenientes que sealan B. Gil
(1997, pg. 107) y J. Maniez (1993, pg. 40):
Ventajas e inconvenientes de las clasificaciones jerrquicas y facetadas
Enumerativas o jerrquicas
Facetadas
Ventajas
La estructuracin de un dominio en trminos de ms genrico a especfico proporciona una visin completa, intuitiva y fcil para el clasificador, y tambin para el usuario que pasea por las estanteras en acceso libre.
Son analticas y, por lo tanto, permiten describir con precisin el contenido de un documento.
Son flexibles y no quedan desfasadas rpidamente.
Son fciles de automatizar, ya que los documentos se pueden buscar en conjunto o para cada faceta (tipo base de
datos relacional).
Inconvenientes
Su aplicacin es compleja.
Hay muchas materias que no se pueden representar fcilmente con facetas (conceptos de tipo mental, no objetos).
No todos los documentos tienen todas las facetas (por
ejemplo, la frmula PMEST de Ranganathan), lo cual hace
que la notacin no sea homognea.
La notacin es poco comprensible y memorizable.
1.2.3. Conclusiones
Las clasificaciones documentales admiten dos tipos de categoras:
CC-BY-NC-ND PID_00143962
17
Las clasificaciones hbridas participan de las caractersticas de las dos anteriores, combinando la estructura arborescente propia de la jerrquica con la posibilidad de expresar facetas con tablas auxiliares comunes y especiales y signos
de valor clasificatorio.
Ms informacin
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
B.GilUrdiciain(1997). Los lenguajes de clasificacin documental. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y
Documentacin).
Library of Congres Classification outline [en lnea]. [Consulta: 1 de octubre de 2008].
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y
utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez
Ruiprez.
OnlineComputerLibraryCenter. Dewey services, Dewey decimal classification for use with
OCLCs online cataloging services [en lnea]. [Consulta: 10 de octubre de 2008].
R. San Segundo Manuel (1997). Principales sistemas de clasificacin. En: M. Pinto
(ed.). Manual de clasificacin documental (pg. 67-89). Madrid: Sntesis (Biblioteconoma
y Documentacin).
Universal Decimal Classification Blog. UDC Consortium [en lnea]. [Consulta: 10 de octubre de 2008].
Universal Decimal Classification Consortium Homepage. La Haya: UDC Consortium. Act.
2002-08-01 [en lnea]. [Consulta: 10 de octubre de 2008].
CC-BY-NC-ND PID_00143962
18
Precisamente Aristteles ser el primer pensador que encontraremos en nuestro viaje, con la formulacin de la lgica aristotlica. Es l y el rbol dicotmico de Porfirio.
Aristteles y la lgica aristotlica
Aristteles y la lgica aristotlica: la lgica (que l llamaba analtica) no es una ciencia
sustantiva, sino un instrumento (en griego organon). No es una simple lgica formal,
sino toda una teora de la ciencia. Distingue la deduccin de la induccin y desarrolla
una teora bastante completa de una forma de razonamiento deductivo: el silogismo.
Aunque la lgica aristotlica tiene limitaciones importantes (desconoce las proposiciones
relacionales; considera slo las predicativas, y reduce la deduccin al silogismo), ha sido
la aportacin fundamental a esta ciencia hasta el siglo XIX.
Las ciencias, segn Aristteles, pueden ser de tres tipos:
CC-BY-NC-ND PID_00143962
19
El mtodo de Francis
Bacon
Bacon propone un nuevo mtodo para el estudio de las
ciencias, basado en: observar
inducir hacer hiptesis experimentar demostrar o no
la hiptesis y concluir. Para
Bacon, todo el saber se reduca
a tres facultades humanas: la
memoria (que genera la historia), la imaginacin (que crea
la poesa y las artes) y la razn
(que produce la filosofa y las
ciencias).
La clasificacin de Harris
En 1870, un bibliotecario norteamericano llamado Harris publica su sistema de clasificacin. Agrupa las clases en ciencias, artes e historia, un esquema que sigue directamente
el estilo de las tres facultades de Bacon.
A caballo entre los siglos XIX y XX, se da una circunstancia clave que da gran importancia
a la teora de las clasificaciones: el incremento de las colecciones de las bibliotecas.
Una vez situados en el tiempo, nos ubicaremos geogrficamente: primero iremos a Estados Unidos, a visitar a un joven de 22 aos, Melvil Dewey, de Masachusetts, que tiene el honor de ser el creador de la clasificacin ms implementada por todo el mundo actualmente; despus, a Blgica, a conocer a Paul
Otlet y Henry la Fontaine, considerados padres de la documentacin moderna
y creadores de la CDU; y, finalmente, a Madrs, en la India, para conocer a
Shiyali R. Ranganathan, bibliotecario y profesor de matemticas que revolucion la teora de las clasificaciones.
Finalmente, haremos un breve resumen del resto de clasificaciones documentales surgidas durante los siglos XIX y XX.
1.3.1. La clasificacin decimal de Dewey, de 1885
Melvil Dewey era estudiante y ayudante de bibliotecario del Amherst College
de Massachusetts. En 1873, prepar como trabajo acadmico (tena 22 aos)
la clasificacin decimal, basndose en la clasificacin de Harris.
La clasificacindecimaldeDewey se public en 1876 con el nombre de A
classification and subject index for cataloguing and arranging the books and pamphlets of a Library y en 1885 se edit como Decimal classification and relatix index
(ttulo que incluye las dos grandes aportaciones de Dewey). Dewey buscaba
una clasificacin bibliotecaria prctica que permitiera solucionar dos problemas:
a) De catalogacin: teniendo en cuenta el aumento de las colecciones, haba
que reducir tiempo y gastos a la hora de catalogar.
Melvil Dewey
CC-BY-NC-ND PID_00143962
20
b) De acceso: para facilitar el acceso directo a los usuarios sin tener que consultar el catlogo.
Dewey estudi las clasificaciones anteriores y adapt el sistema de divisin
decimal al sistema jerrquico de clasificacin y aadi un ndice.
(3)
CC-BY-NC-ND PID_00143962
21
(4)
Paul Otlet
(5)
Recursos disponibles
Nos podemos hacer una idea de la magnitud del proyecto a partir de los siguientes recursos:
Documental Biografa de Paul Otlet narrado por su bigrafo W. Boyd Rayward [en
lnea].
Extractos del documental de sugerente ttulo The man who want to classify the world
de Francoise Levie, colgados en YouTube [en lnea].
La RBU no era el nico proyecto de estas caractersticas. Otro proyecto contemporneo internacionalista y utpico fue la creacin de la lengua esperanto, por el mdico
polaco L. L. Zamenhof en 1887.
Henry la Fontaine
tema que fuera flexible, que se pudiera ampliar. Una vez autorizados a adaptar
la Dewey (que entonces iba por la quinta edicin) la tradujeron al francs e
incorporaron novedades en ella.
En palabras de Otlet, en su tratado de documentacin y en referencia a la clasificacin
Dewey:
Han pasado 36 aos desde que una afortunada casualidad puso a nuestra disposicin
una copia de su magnfico sistema de clasificacin, cuya idea, tan simple como prctica,
abri para nosotros, ms como bibligrafos que como bibliotecarios, un camino hacia
el hito que desebamos, la construccin de un catlogo universal de todo el conjunto
de ideas que los hombres durante siglos intentaron perpetuar por escrito [...] Nuestras
necesidades bibliogrficas precisaban un sistema clasificatorio que se pudiera ampliar sin
lmites.
CC-BY-NC-ND PID_00143962
22
inicial era la RBU y la CDU slo era la herramienta que permita clasificarlo,
la interrupcin que supuso el conflicto armado de la Primera Guerra Mundial
hizo que la clasificacin fuera ganando terreno al proyecto monumental, universal y utpico, y que, en la segunda edicin de la CDU de 1927-1933, el
objetivo fuera la propia clasificacin y no la RBU.
Clases principales de la clasificacin decimal universal:
0 Generalidades. Informacin y Documentacin. Informtica
1 Filosofa. Psicologa
2 Religin. Teologa
3 Ciencias sociales
4 sin ocupar de momento
5 Ciencias puras. Ciencias exactas y naturales
6 Ciencias aplicadas. Medicina. Tcnica
7 Bellas Artes. Artes aplicadas. Diversiones. Juegos. Deportes
8 Lenguaje. Lingstica. Literatura
9 Arqueologa. Geografa. Biografa. Historia
La estructura decimal.
Las Tablas auxiliares (en la Dewey los auxiliares se conocen como tablas y
las tablas principales son Schedules).
Deja una tabla principal vaca, la 4, mientras que la Dewey las utiliza todas.
Mientras la Dewey nace para clasificar libros, la CDU nace con la voluntad
de clasificar informacin, ms concreta, ms especfica.
Reflexin
La CDU tiene una gran implantacin en Europa y se estudiar de manera exhaustiva
en este mismo mdulo.
23
CC-BY-NC-ND PID_00143962
(6)
Paralelismoconla
proposicingramatical:
EjemplodeJ.Maniez:
Personalidad
Objeto
coche
Materia
Manera
a mano armada
Energa
Verbo
robo
Espacio
Complemento de lugar
Vicennes
Tiempo
Complemento de tiempo
sbado
24
CC-BY-NC-ND PID_00143962
Biblioteconoma
Personalidad [P]
Biblioteca infantil
,61
Materia [M]
Libros
;43
Energa [E]
Clasificacin (operacin)
:51
Espacio [S]
Espaa
Tiempo [T]
Siglo XX
.541
eN
XIX
XX
ClasificacinexpansivadeCutter: Boston, 1891. Charles Cutter consideraba que la Dewey no era aplicable a las bibliotecas pequeas; por eso,
ide un sistema original que se adaptaba al volumen de los fondos de la
biblioteca: la clasificacin expansiva. Consiste en pasar de una tabla a otra
de manera progresiva. Influy en la clasificacin de la Library of Congress.
Categoras de
Ranganathan y Aristteles
Las categoras de Ranganathan
y Aristteles son parecidas: la
personalidad y la materia de
Ranganathan es la sustancia de
Aristteles; el espacio es el lugar aristotlico; la energa es la
accin, y el tiempo se corresponde con el tiempo.
CC-BY-NC-ND PID_00143962
25
ClasificacinBliss: Nueva York, 1912. Clasificacin facetada. Cada materia se puede definir segn las facetas de punto de vista filosfico, terico,
histrico y prctico.
Clasificacindecimaljaponesa: Mori-Kiyosi, 1929, para la Biblioteca Imperial de Tokio. Influida por la CDU y Cutter. Tiene diez clases principales
y pocos auxiliares especiales (slo los de lugar y forma).
Clasificacin rusa (BBK, actualmente LBC): Mosc, 1924. Est fuertemente impregnada de ideologa marxista leninista (la primera clase es marxismo y leninismo, la segunda ciencias naturales...). Es el sistema de clasificacin nacional de le antigua URSS, que significa que tiene una magnitud
slo comparable a la de la Library of Congress (hablamos de volumen de
libros). La CDU tambin se usa en los pases de la ex URSS, especialmente
en las bibliotecas pblicas, gracias a la tarea que el VINITI lleva a cabo. Recordemos que VINITI, como la espaola AENOR, forma parte actualmente
del Consorcio de la CDU, entre otras.
Clasificacindocumentalchina(CDC): Beijing, 1975. Es el sistema nacional de clasificacin en China. Despus de la revolucin, la China popular propuls la creacin de un nuevo sistema de clasificacin adecuado al
cambio ideolgico. Es una clasificacin mixta o hbrida, es decir, jerrquica, pero con posibilidad de expresar facetas. Tiene cinco clases principales
En 1908, tres aos despus de la primera edicin de la CDU de 1905, el capitn Leopoldo Gimnez la aplic en la Biblioteca de Ingenieros Militares.
CC-BY-NC-ND PID_00143962
26
Durante la Segunda Repblica (1931-1939), las polticas bibliotecarias impulsan la implementacin de la CDU en las bibliotecas nacionales, universitarias,
municipales..., y una vez acabada la Guerra Civil, el ministro de Franco, Javier
Lasso de la Vega, regula el uso de la clasificacin decimal de Melvil Dewey,
modificada por el Instituto Internacional de Bibliografa de Bruselas con las
correcciones introducidas por Berln.
Esta clasificacin oficial fue abolida en 1989, pero no fue sustituida por ninguna otra recomendacin; por lo tanto, se produjo un vaco legal. Cada comunidad autnoma tena transferida la competencia de eleccin del sistema
de clasificacin.
En Catalua, el hijo de Jordi Rubi Balaguer, Jordi Rubi Lois, continu la tarea
de su padre, primero como editor en la editorial Teide de las nuevas ediciones
al cataln de la clasificacin decimal y, finalmente, en 1982, como responsable
de la cuarta y ltima edicin hasta la actualidad.
Prestad atencin al autor y coautor de la obra: Clasificacin decimal: adaptacin
para las bibliotecas catalanas; dirigida por Jordi Rubi Balaguer, 4. ed. preparada por Jordi Rubi Lois. Barcelona: Teide.
Clasificacin decimal frente a la CDU
Las ediciones catalanas de la clasificacin decimal se titulan Clasificacin decimal y no
CDU, porque la adaptacin catalana propone en ciertos casos dobles soluciones de clasificacin: la de la CDU y la de Dewey.
En palabras de Teresa Rovira (1989, pg. 11):
Por otro lado, el tronco americano y la adaptacin belga siguen una evolucin diferente:
la primera orientada [...] a la ordenacin de libros en las estanteras y de fichas en los
catlogos; la segunda hacia la clasificacin de bibliografas. Esto hace que en esta tercera
edicin catalana se diera en diversos casos cuando hay razones que lo hacen aconsejable las soluciones dobles de la CDU y la DC. Adems, no se suprime la clase 4 de lenguaje como haba hecho la CDU [...] tampoco dud en otros casos, como en las tablas de
psicologa, en dar soluciones alternativas desde la Dewey, mucho ms puestas al da. Por
todo eso, la adaptacin de 1976 no lleva ya el ttulo de clasificacin decimal de Bruselas,
sino simplemente el de clasificacin decimal, que ser, tambin, la de la cuarta y ltima
edicin, publicada en 1982, de la cual ya es plenamente responsable Jordi Rubi Lois.
En toda Espaa, podemos encontrar redes que catalogan con diferentes sistemas de clasificacin, aunque el ms usado es la CDU, y eso favorece la catalogacin cooperativa y el prstamo interbibliotecario.
La eleccin alemana
Cabe anotar el hecho de la
eleccin a raz de las relaciones diplomticas que Espaa
mantena con Alemania de la
edicin internacional alemana
que iba por la tercera edicin,
frente a otras ediciones internacionales como la inglesa,
que iba por la cuarta, o la francesa, que ya iba por la quinta.
27
CC-BY-NC-ND PID_00143962
XX
el de la CDU.
En este punto del mdulo, el estudiante tendra que situarse en la secuencia:
Clasificaciones documentales > para bibliotecas > CDU.
Bibliografa
025.431: The Dewey blog [en lnea]. [Consulta: 10 de octubre de 2008].
AENOR. Asociacin espaola de normalizacin y certificacin [en lnea].
Pilar, Arnau Riverd (2005). Documentacin: hitos histricos, precedentes - Dewey - Otlet
- FID. (pg. 96-105 y 248-255). Madrid: Mundarnau.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
B.GilUrdiciain(1997). Los lenguajes de clasificacin documental. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M.D.GiliMartnez;J.VivesGrcia (1996, julio-diciembre). La nova edici espanyola
de la CDU: arriscar-se al canvi?. tem: Revista de Biblioteconomia i Documentaci (nm.
19, pg. 94-121).
CC-BY-NC-ND PID_00143962
28
CC-BY-NC-ND PID_00143962
29
Auxiliares especiales.
CC-BY-NC-ND PID_00143962
30
a) La clasificacin decimal universal es un lenguaje documental sinttico, porque el objetivo es sintetizar el contenido de los documentos en un nico trmino de indexacin, en este caso una notacin. Por ejemplo: 378 documento
sobre enseanza universitaria. Aunque el uso de elementos facetados (auxiliares
y signos clasificatorios) la convierte en analtico-sinttica, es decir, primero se
analizan los elementos que forman la materia del documento para despus
sintetizarlos en una notacin.
b) Es un lenguaje codificado (no natural) porque la indexacin de los documentos se basa en el uso de un sistema de notacin o cdigo artificial formado
por smbolos (numricos y alfanumricos) que traducen las materias de una
clasificacin bibliogrfica a ndices ordenados. Estos cdigos, adems, sirven
para facilitar la ordenacin fsica de los documentos. Y son internacionales;
no les hace falta traduccin. Por ejemplo: 378.
c) Es un lenguaje controlado(no libre), porque tiene como objetivo la representacin unvoca del contenido de los documentos y de las consultas: un
nico concepto por trmino y un nico trmino por concepto (eliminando la
sinonimia, polisemia y homonimia). En la indexacin, slo se pueden utilizar
los cdigos que figuran en las pginas de los sistemas de clasificacin.
d) Es un lenguaje precoordinado(no postcoordinado), porque la coordinacin de los diferentes conceptos que forman una materia se produce en el momento de la indexacin, es decir, antes de almacenarlos o incorporarlos a un
catlogo.
e) Es un lenguaje de estructura hbrida o mixta, es decir, jerrquica con elementos de tipo facetados (no sintctica) porque sigue un orden lgico que
aproxima los conceptos ms especficos y los agrupa dentro de los ms generales. Esta estructura hace que los conceptos estn ordenados siguiendo una
jerarqua: cada trmino est representado por un smbolo numrico, alfabtico o alfanumrico que indica su situacin dentro de la cadena jerrquica. La
CDU presenta una estructura jerrquica, pero tiene la posibilidad de expresar
facetas, lo cual la convierte en hbrida o mixta.
f) Es el lenguaje que permite clasificar/recuperarla materia del documento y
al mismo tiempo ordenarla fsicamente, agrupando las obras por contenidos
afines, y tambin generar subproductos del catlogo, como boletines de ltimas novedades o sumarios organizados temticamente.
g) Es enciclopdico porque incorpora todos los campos del conocimiento humano.
CC-BY-NC-ND PID_00143962
31
h) Es decimal, ya que las tablas estn ordenadas por el principio de los nmeros decimales. Sus cifras tienen el valor de las fracciones decimales situadas
detrs de un 0 (cero coma) que siempre se supone. Esta estructura posibilita
que un nmero determinado se pueda subdividir indefinidamente por sucesivas agrupaciones, sin que la de partida llegue al inmediatamente superior.
Ms informacin
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000; (incluye las modificaciones de la Norma UNE 50001:2004/1M. Trad. del Master Reference File
realizada por el Centro de Informacin y Documentacin Cientfica (CINDOC) (2004) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR,.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
B.GilUrdiciain(1997). Los lenguajes de clasificacin documental. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M.Granados;A.Nicolau (2005, 6-8 de julio). La recuperaci de la informaci en els
catlegs en lnia: ls de la Classificaci decimal universal i la seva implicaci en la indexaci [en lnea]. 7. Congrs del Captol Espanyol dISKO. Barcelona: Departament de
Biblioteconomia i Documentaci de la Universitat de Barcelona. [Consulta: 1 de octubre
de 2008].
M.J.Lpez-Huertas (1997). Estructura de la clasificacin decimal universal. En: M.
Pinto (ed.). Manual de clasificacin documental (pg. 177-217). Madrid: Sntesis (Biblioteconomia y Documentacin).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.
A modo de conclusin
La CDU es un lenguaje documental analtico-sinttico, codificado, controlado, precoordinado, de estructura hbrida,
enciclopdico y decimal.
32
CC-BY-NC-ND PID_00143962
de bolsillo est pensada para los no iniciados (ya que es mucho ms sinttica)
y para la clasificacin de pequeas bibliotecas como las escolares, infantiles,
hospitalarias, de pequeos municipios, etc.
b)Enpapel/CD-ROM
Ved tambin
En el espacio de Recursos
del aula os damos acceso a
la edicin digital de la CDU
del ao 2000, Programa de la
CDU.
que pueden cambiar los dgitos de una clase, desaparecer conceptos, crearse
nuevos, subdividir un concepto para especificarlo ms, etc.
Cambios en las ltimas ediciones de la CDU
Tipos de cambios que se suceden en las diferentes ediciones
Cambios de la edicin 2000
(en relacin con la de 1995)
Se amplan considerablemente las entradas
(fsicamente se pasa de dos volmenes a
tres, en la edicin entera).
Edicin digital en CD.
Se potencia la facetacin de las tablas de
auxiliares comunes independientes de lugar
y lengua.
Subclases, como informtica, pasan a clase.
Entera de 2000.
Abreviada de 2004.
Bolsillo de 2004.
Es importante remarcar que la tcnica de clasificacin es la misma independientemente de la edicin que se consulte.
AENOR
AENOR es miembro del Consorcio de la CDU, con sede en
La Haya, como principal editor
en Espaa y responsable de la
edicin en castellano.
33
CC-BY-NC-ND PID_00143962
A modo de conclusin
Ms informacin
AENOR. Asociacin espaola de normalizacin y certificacin [en lnea]. [Consulta: 10 de
octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
GerhardJ.A.Riesthuis (1998, 16-21 de agosto). The UDC Master Reference File [en
lnea]. 64th IFLA General Conference. Amsterdam. [Consulta: 1 de octubre de 2008].
C.Soria. Cambios introducidos en la ltima edicin (nov. 2000) de la CLASIFICACIN
DECIMAL UNIVERSAL [en lnea]. [Consulta: 1 de octubre de 2008].
(7)
Representacin espaola
Dentro del Consorcio, con respecto a la representacin espaola, hay una representante de
AENOR y la profesora Rosa San
Segundo, responsable de la
adaptacin de las ediciones espaolas de la CDU de AENOR
y autora de diversa bibliografa
recomendada en este mdulo.
CC-BY-NC-ND PID_00143962
34
Las clases de la CDU se actualizan anualmente. La voluntad de los gestores de la CDU es ir adaptando las tablas a la realidad actual. A pesar
de todo, los cambios no se suceden con la rapidez que sera deseable.
Budismo
Judasmo
Cristianismo
Islam
CC-BY-NC-ND PID_00143962
35
36
CC-BY-NC-ND PID_00143962
Partesistem- Tablasprincipales:0
tica
Generalidades
1 Filosofa. Psicologa
2 Religin. Teologa
3 Ciencias sociales
4 sin ocupar de momento
5 Ciencias puras. Ciencias exactas y naturales
6 Ciencias aplicadas. Medicina. Tcnica
7 Bellas Artes. Artes aplicadas. Diversiones. Juegos. Deportes
8 Lenguaje. Lingstica. Literatura
9 Arqueologa. Geografa. Biografa. Historia
ndicealfabtico
Tablasauxiliarescomunes:
Ia Coordinacin. Extensin
Ib Relacin
Ic Lengua
Id Forma
Ie Lugar
If Razas
Ig Tiempo
Ih Notaciones ajenas a la
CDU
Ik Caractersticas generales
Visualmente, sera:
Introduccin
Ejemplo,pg.1.
1NATURALEZADELACLASIFICACIN
La clasificacin decimal universal (CDU) es un sistema
de clasificacin bibliogrfica en el que tiene cabida y
lugar todo el conocimiento humano, tanto en el plano
material como conceptual.
Su notacin, basada en nmeros arbigos (...)
Partesistemtica
Tablas principales
Ejemplodelaclase0.Generalidades 0Generalidades
00 Prolegmenos
01 Bibliografa. Catlogos
02 Biblioteconoma
030 Obras de referencia...
050 Publicaciones seriadas
06 Organizaciones
070 Peridicos
08 Poligrafas
09 Manuscritos
ndicealfabtico
EjemplodelaletraA
Abanicos 688.5
Abastecimiento de agua 628.1
Abdomen 617.55
Abogados defensores 364-48
Abolicin de la esclavitud 326.8
(...)
CC-BY-NC-ND PID_00143962
37
3.1.1. Clases
Clases principales.
Clases y subclases.
b)Segn el principiodedivisin:
c)Segn la ordenacin:
De la teora a la practica.
Conjuntos disjuntos
Dos conjuntos son disjuntos
cuando son mutuamente excluyentes. Por ejemplo: o es
escultura, o es pintura o es
grabado.
730 Escultura
75 Pintura
76 Grabado
CC-BY-NC-ND PID_00143962
38
Segn Maniez (pg. 37), no conviene que haya ni muchas ni demasiado pocas.
La base decimal nos permite llegar a tener 10 clases (la CDU, por ejemplo, tiene
10 clases principales). Si utilizamos alfabetos, podemos ampliarlas ms, ya que
adems de las letras, tenemos las combinaciones de maysculas y minsculas
y la de diferentes alfabetos como el latn o el griego.
Las clases principales tienen que contener todo el dominio. Una buena construccin prev tener una clase de generalidades comunes a todas las ciencias
y otra de diversos/otros o simplemente vaca. As, la CDU tiene la clase 0 de
generalidades y la 4 vaca. Esta estructura flexibiliza el sistema de cara a las
posibles actualizaciones.
Clasesysubclases
Las clases y subclases son todas aquellas clases no principales que conforman la secuencia jerrquica de la clasificacin.
Una clasificacin refleja las relaciones entre los conceptos, no slo los
identifica, ya que entonces es una ordenacin y no una clasificacin.
Las relaciones lgicas entre las materias son bsicamente de dos tipos: de subordinacin y de coordinacin. En la CDU se conocen con el nombre de cadena y serie, respectivamente.
Clasesdispuestasencadena
2 Religin
25 Religiones de la Antigedad
39
CC-BY-NC-ND PID_00143962
Clasesdispuestasenserie
Las clasesdispuestasenserieconsisten en series de clases coordinadas. Es un
grupo de clases mutuamente excluyentes, derivadas de la aplicacin de una
caracterstica.
34Derecho
341 Derecho
internacional
342 Derecho
constitucional
343 Derecho
penal
3.1.2. Notacin
La notacin es el trmino de indexacin propio de los sistemas de clasificacin. Es un cdigo artificial, no un lenguaje natural, hecho a partir de los nmeros, letras y smbolos que acompaan las rbricas. Representa la materia del documento; tambin se usa para su ordenacin
fsica.
347 Derecho
civil
CC-BY-NC-ND PID_00143962
40
Breve.
Lgica.
Expresiva.
Fcil de leer.
Fcil de memorizar.
3.1.3. Conclusiones
Las clases tienen el rol central de la estructura de una clasificacin. Podemos
analizar las clases en funcin de su alcance conceptual (clases principales, clases y subclases), en funcin del principio de divisin (clases en cadena o en
serie) o en funcin de su ordenacin.
La notacin es el trmino de indexacin de los lenguajes de clasificacin. Es un
cdigo artificial que acompaa las rbricas. Representa la materia y ordena el
fondo documental. Diferenciamos entre la notacin de un sistema jerrquico
de la de un sistema hbrido o facetado porque, en este caso, se necesita una
sintaxis.
Bibliografa
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
41
CC-BY-NC-ND PID_00143962
Tabla 0 Generalidades8
(8)
Tabla 0 Generalidades
00 Prolegmenos. Fundamentos de la ciencia y la cultura
01 Bibliografa y bibliografas. Catlogos. Listas de libros
02 Biblioteconoma. Bibliotecologa
030 Obras de referencia general. Enciclopedias
050 Publicaciones peridicas y publicaciones seriadas
06 Organizaciones y colectividades. Asociaciones. Congresos.
Exposiciones. Museos
070 Diarios. Prensa. Periodismo
08 Poligrafas. Colecciones. Series
09 Manuscritos. Libros preciosos y raros
Tabla 3 Ciencias sociales. Sociologa. Estadstica. Poltica. Economa. Derecho. Administracin pblica. Arte y ciencia militares. Asistencia social.
11
CC-BY-NC-ND PID_00143962
42
(11)
13
CC-BY-NC-ND PID_00143962
43
(14)
CC-BY-NC-ND PID_00143962
44
(17)
Son diez tablas, nueve ocupadas y una vacante. Recordemos que tener una
clase principal vaca es un excelente mtodo para incluir nuevos conceptos
sin alterar el esquema inicial.
El sumario de las tablas y clases pertenece a la edicin CDU de bolsillo 2004; las
ediciones abreviada y entera son ms amplias. Reproducimos las clases hasta
el segundo nivel de clasificacin, de dos dgitos, y en algunos casos, como la
tabla 6, hasta tres dgitos, igual que en la edicin original de la CDU de bolsillo.
Notaciones con la misma raz
Ved el ejemplo siguiente, en el que se muestra que la notacin tiene la misma raz, pero
es ms especfica en un caso que en el otro.
Edicin abreviada 2000 o programa CDU del aula
671.1 Joyera
671.15 Trabajo de las piedras preciosas
671.152 Talla del diamante
Reflexin
Muchos de los ejercicios son
nuevos, pero no queremos dejar de hacer constar que hemos incluido ejercicios extrados de la propia CDU o bien
de la gua oficial de AENOR, de
McIlwaine.
CC-BY-NC-ND PID_00143962
45
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal). Gijn: Trea (Biblioteconoma y administracin cultural, 26).
T.Guardans(1989, enero-junio). Les altres religions a la classificaci decimal universal.
Revista tem (nm. 4).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.
Tabla 0 Generalidades
0 Generalidades
00 Prolegmenos. Fundamentos ms generales de la ciencia y la cultura
004 Informtica
01 Bibliografa y bibliografas. Catlogos. Listas de libros
02 Biblioteconoma. Bibliotecologa
030 Obras de referencia general. Enciclopedias. Diccionarios.
Manuales, etc.
050 Publicaciones peridicas de informacin general y publicaciones seriadas
06 Organizaciones y colectividades de cualquier tipo. Asociaciones.
Congresos. Exposiciones. Museos
070 Diarios. Prensa. Periodismo
08 poligrafas. Colecciones. Series
09 Manuscritos. Libros preciosos y raros
A primera vista, el nombre de la tabla no resulta muy claro, ya que Generalidades no aclara su contenido, pero en realidad agrupa temas comunes a todas
las disciplinas: los principios bsicos de la ciencia y las materias que son comunes a la actividad intelectual (conocimiento, informtica, documentacin,
organizaciones...).
A grandes rasgos, podemos encontrar las siguientes reas:
Fuentes de informacin: bibliografas, catlogos, obras de referencia, publicaciones peridicas, poligrafas, manuscritos...
CC-BY-NC-ND PID_00143962
46
Actividad
2.Clasificad los siguientes documentos:
Documento sobre el neoplatonismo.
Documento sobre las profecas.
Documento sobre la naturaleza del conocimiento.
Hallaris la solucin en el solucionario.
CC-BY-NC-ND PID_00143962
47
En cambio, en la revisin del 2004, se empezaron a equiparar las grandes religiones. El cambio es notorio.
2 Religin. Teologa
CC-BY-NC-ND PID_00143962
48
Actividad
3.Clasificad los siguientes documentos:
Documento sobre el judasmo sefard.
Documento sobre el budismo.
Documento sobre la cienciologa.
Documento sobre la religin de los sumerios.
Hallaris la solucin en el solucionario.
Recordemos que las ciencias sociales son las que estudian la estructura y organizacin de la sociedad y que son: estadstica, demografa, sociologa, poltica,
economa, derecho, administracin y gobierno, educacin, etnologa. En definitiva, las ciencias que estudian al hombre en relacin con su comunidad.
Como se puede apreciar, son muchas disciplinas bajo una misma clase; en
consecuencia, es una de las tablas ms subdivididas y en que las notaciones
de temas importantes son ms largas.
Otra caracterstica de esta clase es la abundancia:
de elementos facetados, sobre todo de las tablas de tiempo, lugar y persona, necesarias para representar el momento histrico de la sociedad, su
ubicacin geogrfica...
49
CC-BY-NC-ND PID_00143962
32 Poltica
324 Elecciones
34 Derecho
342.8 Sistemas electorales
c)Derecho: sigue la divisin tradicional de derecho internacional, constitucional, penal, civil, eclesistico y otras ramas (del trabajo, social, urbanstico,
del medio ambiente, nuclear).
Actividad
4.Clasificad los siguientes documentos:
Documento sobre la estadstica como ciencia.
Documento sobre las finanzas pblicas.
Documento sobre el derecho constitucional.
Documento sobre las facultades universitarias.
Documento sobre la etiqueta y el protocolo.
Hallaris la solucin en el solucionario.
Ved tambin
Ved el apartado dedicado a la
historia de las clasificaciones
documentales en Espaa y Catalua.
50
CC-BY-NC-ND PID_00143962
51 Matemticas
52 Astronoma. Astrofsica. Investigacin espacial. Geodesia
53 Fsica
54 Qumica. Cristalografa. Ciencias mineralgicas
55 Ciencias de la Tierra. Geologa. Meteorologa, etc.
56 Paleontologa
57 Ciencias biolgicas
58 Botnica
59 Zoologa
Clase 5
546.26 Derivados orgnicos del carbono
553.8 Yacimentos de diamantes
Actividad
5.Clasificad los siguientes documentos:
Documento sobre aritmtica.
Documento sobre la galaxia.
Documento sobre climatologa.
Documento sobre anmonitas (fsiles cefalpodos).
Hallaris la solucin en el solucionario.
Clase 6
621.921.34 Diamantes como abrasivos
y productos para pulir
622.23 Taladros de diamantes
671.152 Talla del diamante
CC-BY-NC-ND PID_00143962
51
Es otra tabla con muchas materias de peso que acaban teniendo notaciones
de cuatro o ms cifras. Y tiene el honor de tener la clase ms extensa, la 62,
de Ingenieros y tecnologa. La causa es que es el campo cientfico que ms se
ha desarrollado en los ltimos aos. De hecho, el desarrollo de las clases en
la CDU es desigual.
En la clase 6 entran todas las ciencias aplicadas, como por ejemplo, ciencias
agrcolas, economa domstica, oficios y profesiones, industria del libro (editoriales, libreras).
Actividad
6.Clasificad los siguientes documentos:
Documento sobre otorrinolaringologa.
Documento sobre la forma de preparar comidas rpidas para llevarse.
Documento sobre editoriales (de libros).
Documento sobre acabados especiales del cuero.
Hallaris la solucin en el solucionario.
Observacin
Miguel Benito (1999, pg. 20)
pone de manifiesto que, como
la clase 62 es tan larga, es posible que dos notaciones con
el mismo nmero de dgitos
representen dos niveles muy
diferentes con respecto a la especificidad del tema. Y pone
de ejemplos como que la notacin de 4 cifras 621.3 de Ingeniera electrnica sea igual a
la 637.4, que es Huevos y productos a base de huevos. Si
hacemos la prueba, veremos
que la clase 621.3 se abre a
muchas clases, mientras que la
637.4 no lo hace.
CC-BY-NC-ND PID_00143962
52
Esta clase, aunque contiene diversas disciplinas, es de las ms fciles de entender para un profano, ya que todas las disciplinas son bastantes conocidas. Recordemos que es la clase que engloba todo tipo de artes, diversiones y deportes.
Si un artista es polifactico, se le clasifica directamente en el 7. Si, en cambio,
queremos clasificar un arte concreto, vamos a la clase correspondiente.
En el inicio de la tabla 7 encontramos unos extensos auxiliares especiales que
nos ayudarn a clasificar los aspectos de tcnica artstica (herramientas, materiales, copias, restauraciones...), periodos artsticos (prehistoria, culturas de la
Antigedad, romnico, gtico... hasta el postmodernismo), temas representa-
CC-BY-NC-ND PID_00143962
53
Para las obras de autores individuales, usaremos las especificaciones del 82....A/
Z, que consisten en poner en primer lugar la literatura que escribe el autor;
por eso tendremos que buscar el idioma original en que escribe, y si se trata
de ingls, francs o castellano se indicar tambin la nacionalidad del escritor.
Finalmente, el nombre del autor.
Ejemplo: 821.134.2(82)BORG
821 es Literatura en las distintas lenguas
134.2 proviene de: =134.2 aux. de lengua para el idioma espaol; cuando se combina para
crear literatura espaola pierde el signo inicial del igual (=) y se cambia por un punto.
(82) es el auxiliar de lugar para Argentina, que aadimos a la literatura en espaol para
diferenciar que se trata de literatura argentina en espaol.
BORG para el apellido del autor
Actividad
8.Clasificad los siguientes documentos:
Documento sobre cuentos de hadas
Documento sobre literatura hebrea
Hallaris la solucin en el solucionario.
Recordatorio importante
Como los auxiliares comunes
de lengua no se explicarn
hasta ms adelante, recomendamos volver a este punto,
una vez se hayan entendido
estos auxiliares para resolver
los ejercicios que se plantean a
continuacin.
CC-BY-NC-ND PID_00143962
54
En esta tabla, encontramos el mismo caso que en la clase anterior: no hay una
clase para la geografa de cada pas ni para la historia. Tenemos que combinar
la notacin de la clase 913 o 94 con los auxiliaresdelugarylosauxiliares
detiempo.
Ejemplo
Para representar historia de Irlanda se har con el 94 de historia y con el auxiliar de lugar
para Irlanda, que es (415).
Resultado:
94(415) Historia de Irlanda
Actividad
9.Clasificad los siguientes documentos:
Documento sobre la geografa de frica.
Documento sobre datacin con carbono.
Documento sobre banderas nacionales.
Documento sobre paleografa.
Documento sobre historia de Australia.
Hallaris la solucin en el solucionario.
Recordatorio importante
Como los auxiliares comunes
de lengua no se explicarn
hasta ms adelante, recomendamos volver a este punto,
una vez se hayan entendido
estos auxiliares para resolver
los ejercicios que se plantean a
continuacin.
55
CC-BY-NC-ND PID_00143962
Concepto solo
Matizado
666.5 Porcelana
Tipodeauxiliares
La CDU tiene dos tipos de auxiliares:
Auxiliares comunes (se abren en independientes y dependientes): se encuentran en las tablas auxiliares.
Culesson
Auxiliares comunes
Independientes
Ic Lengua
Id Forma
Ie Lugar
If Razas, pueblos y nacionalidades
Ig Tiempo
Auxiliares especiales
Dependientes
Seencuentrana
Tablas propias llamadas Tablas de auxi- Tablas propias llamadas Tablas de auxi- Repartidos en todas las clases que los
necesitan: clases principales y tablas de
liares comunes independientes
liares comunes dependientes
auxiliares comunes como los de lugar y
forma.
Losreconocemospor
Lengua =
Forma (0..)
Lugar (1/9)
Razas, pueblos y nacionalidades (= ...)
Tiempo ...
A modo de conclusin
La funcin de los auxiliares es matizar y precisar el significado de las clases.
Hay dos tipos de auxiliares:
56
CC-BY-NC-ND PID_00143962
Auxiliares especiales: no se encuentran reunidos en ninguna tabla, sino que se encuentran repartidos a lo largo de todas las tablas, tanto de las auxiliares como de
las principales. Son un tipo de auxiliares previstos slo para precisar el contenido de
ciertas materias, no de todas.
Dependientes
TabladeauxiliarescomunesdeLengua
Tabladeauxiliarescomunes.NotacionesajenasalaCDU
* Nmeros y cdigos
A/Z Nombres en orden alfabtico
Tabladeauxiliarescomunesdeforma
Tabladeauxiliarescomunesdecaractersticasgenerales
De propiedades:
-021 Propiedades de existencia
-022 Propiedades de magnitud. Cantidad
-023 Propiedades de forma. Dimensiones
-024 Propiedades de estructura
-025 Propiedades de disposicin
-026 Propiedades de accin y movimiento
-027 Propiedades operacionales
-028 Propiedades de estilo y presentacin
-029 Propiedades derivadas de otras clases principales
De materiales:
-032 Materiales minerales
-033 Materiales manufacturados
-034 Metales
-035 Materiales orgnicos
-036 Materiales macromoleculares
-037 Textiles, fibras.
-039 Otros materiales
De Personas:
-051 Personas como agentes, sujetos activos.
-052 Personas como objeto, sujetos pasivos
-053 Personas segn la edad
-054 Personas segn etnia, nacionalidad...
-055 Personas segn sexo y parentesco
-057 Personas segn ocupacin, trabajo
-058 Personas segn clase social y estado civil
Tabladeauxiliarescomunesdelugar
(1) Lugar y espacio en general. Localizacin.
(2) Designacin fisiogrfica
(3) Lugares del mundo antiguo
(4) Europa
(5) Asia
(6) frica
(7) Amrica del Norte y central
(8) Amrica del Sur
(9) Australia. rtico. Antrtico
Tabladeauxiliarescomunesderazas,pueblosynacionalidades
(=081/=088) Razas y pueblos primitivos. Razas mixtas
(=1.2/.9) Pueblos de regiones naturales
(paralela a la tabla de lugar)
(=11/=8) Pueblos y grupos lingsticos y culturales diversos
(paralela a la tabla de lengua)
Tabladeauxiliarescomunesdetiempo
0/2 Fechas y periodo de tiempo
3 Divisiones y subdivisiones del tiempo convencional
4 Periodos, edades
5 Frecuencia
6 Divisiones del tiempo geolgicas, arqueolgicas, culturales
7 Fenomenologa del tiempo
CC-BY-NC-ND PID_00143962
57
La lengua del documento se indica con el smbolo =1 / =9, igual a igual uno
a 9. En teora se puede aplicar a cualquier documento, indicando el idioma
en que est escrito, pero en la prctica slo es til cuando hay que distinguir
la lengua de los documentos. Ejemplo: ordenando todos los documentos en
francs, otro conjunto en ingls, etc.
Documento sobre setas comestibles
635.8=133.1 Setas comestibles , escrito en francs
635.8=134.1 Setas comestibles , escrito en cataln
635.8=134.2 Setas comestibles , escrito en castellano
58
CC-BY-NC-ND PID_00143962
Ejemplo
Recordatorio importante
Ejemplosdeusoparacrearclasesdelenguayliteratura:
811.133.1 Lengua francesa
811.134.1 Lengua catalana
811.134.2 Lengua castellana
821.133.1 Literatura francesa
821.134.1 Literatura catalana
821.134.2 Literatura castellana
b)Tabladeauxiliarescomunesdeforma
(0.0...) Caractersticas fsicas
(01) Bibliografa
(02) Libros en general
(03) Obras de referencia
(04) Separatas
(05) Publicaciones en serie
(06) Publicaciones de entidades
(07) Documentos para enseanza
(08) Poligrafas
(09) Presentacin en forma histrica
Enciclopedias
030(460.23)
(031)GEC
Diarios
070
Los diarios
(054)EL PAIS
Diario El Pas
CC-BY-NC-ND PID_00143962
59
Ejemplo
77(031) Enciclopedia de fotografa
77(035) Manual de fotografa
77(051) Revistas de fotografa
Esta tabla tiene tambin auxiliares especiales para expresar caractersticas fsicas, de produccin etc.
c)Tabladeauxiliarescomunesdelugar
(1) Lugar y espacio en general. Localizacin
(2) Designacin fisiogrfica
(3) Lugares del mundo antiguo
(4) Europa
(5) Asia
(6) frica
(7) Amrica del norte y central
(8) Amrica del sur
(9) Australia. rtico. Antrtico
Ved tambin
Ved el subapartado siguiente,
dedicado a los auxiliares especiales, concretamente Los auxiliares especiales de los auxiliares comunes.
CC-BY-NC-ND PID_00143962
60
Geografa de Canad
Historia de Canad
EjemplosdeusoparacrearclasesdeGeografaeHistoria
913(460.32) Geografa de las Islas Baleares
913(599) Geografa de Filipinas
913(82) Geografa de Argentina
94(460.32) Historia de las Islas Baleares
94(599) Historia de Filipinas
94(82) Historia de Argentina
Esta tabla tiene tambin auxiliares especiales para expresar caractersticas especficas de los lugares geogrficos, como zonas, puntos cardinales, unidades
polticas, etc.
d)Tabladeauxiliarescomunesderazas,pueblosynacionalidades
(=081/=088) Razas y pueblos primitivos. Razas mixtas
(=1.2/.9) Pueblos de regiones naturales
(paralela a la tabla de lugar)
(=11/=8) Pueblos y grupos lingsticos y culturales diversos
(paralela a la tabla de lengua)
Ved tambin
Ved el subapartado siguiente
dedicado a los auxiliares especiales, concretamente Los auxiliares especiales de los auxiliares comunes.
CC-BY-NC-ND PID_00143962
61
=411.21
(=411.21)
Lengua rabe
Pueblo o nacionalidad rabe
=411.16
(=411.16)
Recordatorio importante
Ahora estis en disposicin de
resolver los ejercicios planteados en el captulo 7.2 de las
Clases principales > Clase 9 de
Geografa e Historia.
Ved la diferencia de representacin entre lo que sera el pas y el conjunto de pases que
hablan la misma lengua:
(41) Gran Bretaa es un auxiliar de lugar.
(=111) Pases de habla inglesa de cualquier pas del mundo,
no slo de Gran Bretaa es un auxiliar de razas.
e)Tabladeauxiliarescomunesdetiempo
0/2 Fechas y periodo de tiempo
3 Divisiones y subdivisiones del tiempo convencional
4 Periodos, edades
5 Frecuencia
6 Divisiones del tiempo geolgicas, arqueolgicas, culturales
7 Fenomenologa del tiempo
Ved tambin
Ved la diferencia entre el anlisis documental y el anlisis de
contenido en el mdulo 1 de
esta asignatura.
62
CC-BY-NC-ND PID_00143962
Lengua: indican la lengua del documento, con el smbolo =1 / =9, igual a uno igual
a 9. Tambin se usan para crear las clases de lengua y literatura combinndolos con
las clases de la tabla 8.
Lugar: indican el espacio geogrfico, ya sea continente, pas, nacin, localidad o bien
otras referencias de espacio (lugares fsicos, lugares del mundo antiguo...). Se introducen por (1/9) parntesis uno a nueve. Tambin se usan para crear las clases de Geografa e Historia combinndolos con las clases de la tabla 9.
Como tienen un smbolo de inicio y uno de final, pueden ir a cualquier sitio de la notacin.
Si en un mismo documento hay que representar ms de un concepto con auxiliares independientes, la CDU recomienda el orden siguiente:
Clase + lugar + tiempo + forma + lengua + raza
Bibliografa
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M.Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje. Madrid: [en lnea].
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco [en lnea]. [Fecha de
consulta: 10 de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera. (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea. (Biblioteconoma y Administracin Cultural, 26).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la clasificacin decimal universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.
Fechas
2000.01.01 es el uno de
enero de 2000.
Si la fecha es anterior a Cristo, se indica con un guin en
frente:
-0350 es el ao 350 antes
de Cristo.
Siglos
Fijaos en que la numeracin se
corresponde a la centuria y no
a la expresin habitual en nmeros romanos.
06 siglo VII, es decir, los aos
600 14 siglo XV, es decir los aos
1400 19 siglo XX, es decir los aos
1900 -
Ejemplo de intervalos de
tiempo
1910/1970: del ao 1910 a
1970
11/18: del siglo XII al XIX
CC-BY-NC-ND PID_00143962
63
El asterisco (*) marca el cdigo que no es propio de la CDU, pero que se utiliza en su notacin. Suelen ser temas que la CDU no trata y que aparecen, en
cambio, en otras clasificaciones o listas. Hay que anotar en el fichero de autoridades cules son estas otras fuentes.
Ejemplo
(460*17491) Peralada Font: cdigo postal correos.
La localidad de Peralada, en el Alto Ampurdn, tiene por cdigo postal el 17491.
b)Tabladeauxiliarescomunesdecaractersticasgenerales:propiedades,
materialesypersonas
Depropiedades:
-021 Propiedades de existencia
-022 Propiedades de magnitud. Cantidad
-023 Propiedades de forma. Dimensiones
-024 Propiedades de estructura
-025 Propiedades de disposicin
-026 Propiedades de accin y movimiento
-027 Propiedades operacionales
-028 Propiedades de estilo y presentacin
-029 Propiedades derivadas de otras clases principales
Observacin
Los nombres se pueden abreviar con las tres o cuatro primeras letras, tipo BARC / VERN
/ NEWM.
64
CC-BY-NC-ND PID_00143962
Los auxiliares de propiedades: derivan de la antigua tabla de auxiliares de punto de vista (cancelada en 1998) y denotan las propiedades generales o atributos.
Ejemplo
656.23.03-027.567 Precios subvencionados de ferrocarriles.
Demateriales:
-032 Materiales minerales
-033 Materiales manufacturados
-034 Metales
-035 Materiales orgnicos
-036 Materiales macromoleculares
-037 Textiles, fibras.
-039 Otros materiales
Depersonas:
-051 Personas como agentes, sujetos activos
-052 Personas como objetos, sujetos pasivos
-053 Personas segn la edad
-054 Personas segn etnia, nacionalidad...
-055 Personas segn gnero y parentesco
-057 Personas segn ocupacin, trabajo
-058 Personas segn clase social y estado civil
Los auxiliares de personas denotan a las personas a las cuales hace referencia
el tema clasificado.
Roles y combinaciones de auxiliares
Observad el rol activo (clase -051) o pasivo (clase -052) de la persona, y la combinacin
de dos auxiliares de persona en la misma notacin (-055. 2 sexo femenino). Ejemplo de
McIlwaine (2003, pg. 103):
75.041.5
75.041.5-051
75.041.5-052
75.041.5-052-055.2
Retrato
Retratista
Persona que ha sido retratada
Mujeres retratadas
CC-BY-NC-ND PID_00143962
65
A modo de conclusin
Los auxiliares dependientes son:
Notacionesajenas: * nmeros y cdigos y A/Z Nombres en orden alfabtico. El asterisco * marca el cdigo que no es propio de la CDU, pero que se utiliza en la notacin. Suelen ser temas que la CDU no trata y que aparecen, en cambio, en otras
clasificaciones o listas. Nos permite poner nombres propios y geogrficos, siglas y
abreviaturas a nmeros de la CDU.
Ms informacin
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M. Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje.
Madrid: Taranco.
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y administracin cultural, 26).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.
Los auxiliares especiales ayudan a precisar el contenido de algunas materias, pero no de todas.
CC-BY-NC-ND PID_00143962
66
No, no todas las clases tienen auxiliares especiales, ya que no todas las temticas son susceptibles de tener elementos de matizacin comunes.
b)Cmoselocalizan?
La manera en que podemos localizar a los auxiliares especiales depender de
si consultamos una edicin en papel (como la edicin de bolsillo de la CDU)
o una edicin digital (como la que tenis en el aula). Sin embargo, los reconoceris porque siempre empiezan por las secuencias siguientes:
Punto cero a punto nuevo .0/.9: sirven para crear conjuntos y subconjuntos de conceptos.
En las versiones digitales, los auxiliares especiales se reconocen porque habremos hecho clic en un enlace que dice auxiliares especiales, o bien porque
empiezan de una de estas maneras:
.0/.9 punto cero a punto 9
-0/-9 guin cero a guin 9
0/9 apstrofo cero a apstrofo nueve
CC-BY-NC-ND PID_00143962
67
c)Mismanumeracin,mismosignificado?
Los auxiliares especiales representan las facetas particulares de las materias y
slo tienen sentido de aplicacin en su mbito temtico. En la CDU, un mismo
auxiliar como -4 significa conceptos bien diferentes segn la clase en la que
se aplique:
54-4 Productos qumicos, reactivos
62-4 Estado de los materiales en ingeniera
82-4 Ensayos, literatura
d)Cmosecombinan?
Tenemos que ver en qu clase estn adscritos los auxiliares, ya que slo se podrn combinar con esta o con otras clases que empiecen de la misma manera.
68
CC-BY-NC-ND PID_00143962
244.82-23
Libros sagrados del budismo zen
Construidaapartirde
Explicacin
En primer lugar, ponemos la clase para el budismo zen y aadimos el auxiliar especial.
Prestamos atencin al hecho de que, cuando se combinan,
desaparece el 24 del auxiliar.
Otras combinaciones: siempre que la clase empiece por 24
242-23: Libros sagrados del budismo Mahayana
El 24, que desaparece cuando se combina, nos indica que esta posicin puede ser ocupada
por cualquier clase que empiece por 24 (como la 244 de Budismo zen o la 242 de Budismo
Mahayana), pero no por una clase como la 28 del Islam (28 no es 24).
Auxiliarespecialintroducidoporpunto:
Notacinfinal:
749.035.93
Mobiliario modernista
Construidaapartirde:
7.035.93 Modernismo
749 Mobiliario artstico
Explicacin:
Los auxiliares especiales de la clase 7 son extensos y se aplican a todas las clases que
empiecen por 7, a excepcin de la clase 77, es decir, las clases 71, 72, 73, 74, 75, 76, 78,
79, lo cual los convierte en uno de los auxiliares ms combinables de las tablas.
7.035.93
72.035.93
73.035.93
74.035.93
75.035.93
76.035.93
(...)
Arte modernista
Arquitectura modernista
Escultura modernista
Dibujo modernista
Pintura modernista
Grabado modernista
e)Losauxiliaresespecialesdelosauxiliarescomunes
La CDU es rica y potente y ha previsto que incluso algunos auxiliares comunes como los de lengua, forma y lugar puedan tener sus propios elementos
facetados. Haciendo un juego de palabras, podramos decir que son facetas
de facetas.
Con un ejemplo se entender rpidamente. Para representar el concepto sur
de Italia, la notacin es la siguiente, donde la (450) es Italia y el (1-13) es sur
(este es el auxiliar especial, concretamente de la tabla de lugar):
CC-BY-NC-ND PID_00143962
69
Una vez combinados el 1 ha desaparecido, porque si no fuera as, habra significado en Italia y en el sur en general.
(450-13) Sur de Italia
(450)(1-13) Italia y el sur
Los auxiliares especiales que tienen las tablas de auxiliares comunes son:
En este ejemplo, =14 es Griego > y el auxiliar especial es =...04 (hay que llenar
los puntos sucesivos con la clase de la lengua que estamos caracterizando).
En la tabla de lugar: para fronteras, puntos cardinales (norte, sur, este, oeste y combinaciones), unidades polticas o administrativas (municipios, comunidades, capitales, imperios, colonias, grupos de Estados...). Por ejemplo:
(4-662) Pases capitalistas europeos
Punto cero a punto nueve .0/.9 sirven para crear conjuntos y subconjuntos de conceptos.
Guin cero a guin nueve -0/-9 tienen una funcin analtica.
Apstrofo cero a apstrofo nueve 0/9 son ms especficas que las de guin cero y
tienen una funcin sintetizadora.
CC-BY-NC-ND PID_00143962
70
Ms informacin
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M. Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje.
Madrid: Taranco.
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera. (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y Administracin Cultura, 26).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.
Por ejemplo:
=581 lengua china es un auxiliar de lengua
(581) Afganistn es un auxiliar de lugar
0581 Ao 581 dC es un auxiliar de tiempo
-058. 1 Personas segn clase social es una auxiliar de caractersticas personales
71
CC-BY-NC-ND PID_00143962
Combinatoria
Signo
Se lee
Funcin
Dnde se encuentran?
Ms
Suma
Barra
Extensin
Relacin
::
Doble Colon
Nexo indisoluble de
relacin
[...]
Corchetes
Agrupa notaciones
=...
Igual
Lengua
(0...)
Parntesis cero
Forma
(...)
Parntesis
Lugar
(=...)
Parntesis igual
Razas y pueblos
Comillas
Tiempo
Asterisco
A/Z
A a la Z
Ordenacin alfabtica
-0...
Guin cero
Caractersticas generales
-...
Guin
.0...
Punto cero
e...
apstrofo
Punto
...
Puntos suspensivos
Ved
Subdividid como
Subdivisin paralela
Puramente .
instructiva
CC-BY-NC-ND PID_00143962
72
Los signos con funcin combinatoria son los signos que permiten unir
dos o ms clases de la CDU para formar un concepto que no estaba
recogido previamente.
Los signos con funcin combinatoria tienen una funcin sintetizadora; permiten la expresin de frases documentales compuestas.
Son los signos siguientes:
: Se usa para representar dos conceptos relacionados. Las relaciones pueden ser diversas: de relacin en general, de comparacin, de diferencia, de
influencia.
91:93 Relacin entre Geografa e Historia
[...]Se usa para agrupar nmeros y clarificar las relaciones entre las partes
de la notacin resultante.
[72+75](450) Arquitectura y pintura italianas
Colon o doble Colon
Si utilizramos el Colon 070:32 significara relacin entre periodismo y poltica; en cambio, nos interesa remarcar que es periodismo poltico y no otra combinacin, como por
ejemplo, la poltica del periodismo.
CC-BY-NC-ND PID_00143962
73
Los signos puramente instructivos son los signos sin valor clasificatorio.
Este signo puede indicar que una clase se subdivide como otra clase o que
se subdivide como una tabla de auxiliares. Por ejemplo, 616-05-05 tabla Ik
significa que los auxiliares especiales de la clase 616-05 de patologa se abren
igual que los auxiliares de la tabla de caractersticas de personas:
616-056.25 Enfermedades de personas desnutridas,
donde -056. 25 es el estado de nutrimento de las personas.
3.4.4. Conclusiones
En la CDU, hay dos tipos de signos:
Observacin
Mientras que los signos + y /
unen conceptos que aparecen
separados o de manera consecutiva en las tablas, los signos :
y :: unen conceptos y denotan
claramente la relacin que hay
entre ellos.
CC-BY-NC-ND PID_00143962
74
Los que tienen una funcincombinatoria. Son los signos que permiten unir
dos o ms clases de la CDU para formar un concepto de lo que estaba recogido previamente. Tienen una funcin sintetizadora; permiten la expresin de
frases documentales compuestas. Son los signos: + /::: []
Los que tienen una funcinpuramenteinstructiva. Son los signos sin valor
clasificatorio, pero que tienen una funcin instructiva. Son los signos . (punto), (dividir como) y (ved tambin).
Ms informacin
F.J.lvarezGarca (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y
Documentacin).
M. Benito (1999). El sistema de clasificacin decimal universal: manual de aprendizaje.
Madrid: Taranco.
M.Benito. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta: 10
de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
C.DezCarrera (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y Administracin Cultural, 26).
I.C.McIlwaine (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
L.M.MorenoFernndez;M.D.BorgosMartnez (2002). Teora y prctica de la Clasificacin Decimal Universal (2. ed. revisada, corregida y aumentada). Gijn: Trea.
CC-BY-NC-ND PID_00143962
75
4. Empezamos a clasificar
Nos interesa la ltima clase, la 688.774; las otras dos seran un error (la primera hace
referencia a los insectos caballitos del diablo, la de telesteos hace referencia a los caballitos de mar).
Ejemplodetrminocondiversosenfoques:documentosobrelapoligamia
Una vez tenemos el documento enfrente, nos podemos encontrar en las situaciones siguientes:
1.Encontramosunaclasealaprimeraydemaneraunvoca
El documento tiene una materia que se corresponde con un solo ndice.
CC-BY-NC-ND PID_00143962
76
61 Medicina
2.Eldocumentotienemsdeunamateria,perolaCDUlasrecogejuntas
332.8 Economa de la vivienda
3.Tenemosquecombinardosomsclasesdelastablasprincipalesporque
elconceptonoexisteapriori
3.1. Cuando queramos unir dos materias independientes, pero que estn relacionadas (para formar un nuevo concepto o para precisarlo), utilizaremos
el signo:
17:61
61:17 Medicina y tica como materias relacionadas
3.3. Cuando queramos unir dos materias, con una relacin simple de adiccin,
utilizaremos el signo +.
77 + 791 Fotografa y cine
4.Tenemosquematizarunaclasedelastablasprincipalesconalgntipo
deauxiliarporqueelconceptonoexisteapriori.
4.1. Cuando la faceta sea de tipo universal en todas las tablas como la de lengua, forma, lugar, de razas y de tiempo.
En primer lugar, el nmero de la clase que representa el contenido mayoritario del documento y, acto seguido, el auxiliar comn. Si hubiera ms de un
auxiliar comn, la CDU recomienda el orden siguiente:
Clase + lugar + tiempo + forma + lengua + raza.
CC-BY-NC-ND PID_00143962
77
Ejemplo
398.332.34(495.2)17 Fiestas de la vendimia en el Peloponeso en el siglo XVIII.
Como estos auxiliares son independientes, tambin podemos ponerlos en el inicio de la
notacin por tal de agrupar todos los documentos por forma, idioma...
(495.2)398.332.3417 Fiestas de la vendimia en el Peloponeso en el siglo XVIII, teniendo
en cuenta que ordenamos todos los documentos del Peloponeso juntos.
4.2. Cuando queramos expresar una faceta de tipo particular, de las que slo
afectan a una materia, pondremos en primer lugar el nmero de la clase que
representa el contenido mayoritario del documento y, acto seguido, el auxiliar
especial.
611.3.01 Anatoma del aparato digestivo
4.3. Si el documento tuviera al mismo tiempo un auxiliar especial y uno comn, el orden sera:
Clase + auxiliar especial + auxiliar comn.
Ejemplo
28-57(532) Documento sobre la peregrinacin musulmana a La Meca
28 es Islam, 2-57 es el auxiliar especial para el concepto peregrinacin y (532) es el auxiliar
de lugar para la Arabia Saud.
A modo de conclusin
Cuando empezamos a clasificar un documento hemos de analizar el tema o los temas,
consultar las tablas principales y las de auxiliares comunes y comprobar si disponen de
auxiliares especiales.
No se recomienda usar el ndice alfabtico o el buscador del programa CDU, porque si la
materia es polismica o tiene diversos enfoques nos puede llevar a error.
Si hay que construir una notacin, puede ser el resultado de las siguientes combinaciones:
Ms informacin
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000
(2001) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo
Manuel). Madrid: AENOR.
DezCarrera,C. (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal) (pg. 134). Gijn: Trea (Biblioteconoma y Administracin Cultural, 26).
CC-BY-NC-ND PID_00143962
78
Clase1
Clase2
Objetivos
Estos ejercicios os tienen que
permitir alcanzar los objetivos
siguientes:
Aprender a ubicar conceptos en las tablas principales.
Suelen ser conceptos que
tienen entrada propia en la
CDU (no hay que construir
la notacin). Para facilitar la
tarea, se presentan ordenados por tablas.
Aprender a situar un concepto segn el enfoque
adecuado.
CC-BY-NC-ND PID_00143962
79
Clase3
Clase4
Clase5
Clase6
Clase7
Clase8
Clase9
Diversosenfoquesdelasmaterias:
CC-BY-NC-ND PID_00143962
80
Documento sobre las elecciones polticas, desde el punto de vista del de-
recho:
Documento sobre los delitos contra los derechos humanos, desde el punto
de vista del derecho penal:
Documento sobre los delitos contra los derechos humanos, desde el punto
de vista del derecho internacional:
Documento sobre los delitos contra los derechos humanos, desde el punto
de vista del derecho constitucional:
Clase1
Clase2
Clase3
Clase5
Objetivos
Estos ejercicios os tienen que
permitir alcanzar los objetivos
siguientes:
Construir notaciones combinando tablas principales
con tablas de auxiliares comunes y auxiliares especiales.
Construir notaciones utilizando los signos clasificatorios de la CDU, es decir, expresando la relacin entre
las materias unidas.
CC-BY-NC-ND PID_00143962
81
Clase6
Clase7
Clase8
Clase9
Objetivos
Estos ejercicios os tienen que
permitir alcanzar los objetivos
siguientes:
Construir notaciones combinando todos los elementos antes descritos, sin
mencionar expresamente
las partes que no integran
la notacin ni la clase a la
cual pertenecen.
CC-BY-NC-ND PID_00143962
82
CC-BY-NC-ND PID_00143962
83
Metodologa
Proceso de creacin
Mantenimiento
Lectura complementaria
El proceso de creacin de un
lenguaje documental que
se seguir en los subapartados siguientes sigue el punto
de vista que se expone en la
obra siguiente:
J.Maniez (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin
y utilizacin en los sistemas documentales. Madrid: Pirmide
/ Fundacin Germn Snchez
Ruiprez.
CC-BY-NC-ND PID_00143962
84
2)Declasificacionesanteriores: hace falta optimizar recursos y consultar cuadros previos para inspirarse o adoptarlos directamente. Ejemplo: CDU, DDC,
clasificaciones sectoriales, recopilaciones de thesaurus.
3)Deestructura: podemos escoger entre tres tipos (jerrquica, facetada o mixta).
4)Delenguayniveldeespecificidad.
5)Otros:gastos,calendario,funciones.
6.2. Metodologa
La metodologadetrabajo consiste en una combinacin de dos mtodos, el
inductivo y el deductivo. El primero se basa en la realizacin de un cuadro
segn las materias que tengamos en nuestro SID, el segundo se basa en el
dominio conceptual y su subdivisin siguiendo las reglas de divisin lgica.
Metodologas inductivas y deductivas
En una metodologa inductiva, reunimos todos los documentos sobre derecho de manera
intuitiva, agrupndolos por afinidad de contenido. Despus, relacionamos las diversas
clases que hayan salido en una ms general, y as sucesivamente.
En una metodologa deductiva, estructuramos el dominio derecho en derecho civil, derecho constitucional, derecho penal, derecho internacional... (divisin tradicional acadmica).
Ved tambin
Los thesaurus tienen diversas
presentaciones, entre las cuales la jerrquica, que se corresponde a un cuadro de clasificacin. Se estudiar ms detenidamente en el mdulo Listas de encabezamientos de
materia de la asignatura.
CC-BY-NC-ND PID_00143962
85
Decimos que hay 15 clases, y no slo las 8 del nivel inferior, porque todas
son clases susceptibles de ser utilizadas para clasificar. Por ejemplo, en la clase
marcada como nmero 2, podemos clasificar obras sobre Religin catlica; en
la clase 4 clasificar obras sobre la Biblia; en la clase 8, obras sobre el Antiguo
Testamento.
Como se puede comprobar, haran falta muchas subdivisiones para llegar, por
ejemplo, a 200 clases. Cmo se soluciona? Aumentando el nmero de clases
principales y/o aumentando el rango hasta encontrar el equilibrio que se necesita.
Podemos conseguir un cuadro de 200 clases con diversas opciones:
CC-BY-NC-ND PID_00143962
86
Actividad
Cread un cuadro de clasificacin para vuestra biblioteca personal.
CC-BY-NC-ND PID_00143962
87
Solucionario
1.
2.
3.
4.
5.
6.
7.
8.
9.
Solucionesdelosejerciciosdenivelbajo
Clase0
Documento sobre bibliografas de autor: 012
Documento sobre catlogos por materias: 017
Documento sobre las cartas al director de un diario: 070.45
Documento sobre ex-libris: 097
Clase1
Documento sobre mtodos de filosofar: 101.8
Documento sobre estados emocionales: 159.942.5
Documento sobre lgica proposicional: 164.1
Documento sobre tica profesional: 174
Clase2
Documento sobre la Iglesia catlica romana: 272
Documento sobre el Islam chita: 284
Documento sobre el agnosticismo: 299.3
Documento sobre el confucionismo (religin china): 221.7
Clase3
Documento sobre teoras de la poblacin: 314.12
Documento sobre campaas electorales: 324
Documento sobre el Ministerio de Hacienda: 354.21
Documento sobre el poder adquisitivo del consumidor: 366.2
CC-BY-NC-ND PID_00143962
88
Clase4
Clase5
Documento sobre ciencias del medio ambiente: 502
Documento sobre la capacidad calorfica de los lquidos: 536.632
Documento sobre hidrocarburos saturados: 547.21
Documento sobre silicatos bsicos: 549.614
Documento sobre biologa: 57
Documento sobre botnica - las magnolias: 582.677.1
Documento sobre la ballena azul: 599.511
Clase6
Documento sobre psicoterapia: 615.851
Documento sobre drenaje de minas: 622.5
Documento sobre enfermedades por hongos de las plantas: 632.4
Documento sobre instalaciones de agua potable (en las viviendas): 696.11
Documento sobre produccin de sosa y potasa: 661.33
Clase7
Documento sobre escultura: 730
Documento sobre dibujo anatmico: 743
Documento sobre diseo de carteles: 766
Clase8
Documento sobre la lengua coreana: 811.531
Documento sobre literatura griega: 821.14
Clase9
Documento sobre pinturas rupestres: 903.27
Documento sobre viajes de descubrimientos geogrficos: 910.4
Documento sobre rdenes de caballera: 929.71
Documento sobre la tercera guerra carlista: 94(460).073.1
Diversosenfoquesdelasmaterias:
Documento sobre el atesmo, desde el punto de vista filosfico: 141.45
Documento sobre el atesmo, desde el punto de vista religioso: 299.2
Documento sobre las elecciones polticas, desde el punto de vista poltico: 324
Documento sobre las elecciones polticas, desde el punto de vista del derecho: 342.8
Documento sobre los delitos contra los derechos humanos, desde el punto de vista del
derecho penal: 343.4
Documento sobre los delitos contra los derechos humanos, desde el punto de vista del
derecho internacional: 341.231.14
Documento sobre los delitos contra los derechos humanos, desde el punto de vista del
derecho constitucional: 342.72/.73
Solucionesdelosejerciciosdenivelmedio
Clase0
Documento sobre las piezas prehistricas de un museo: 069.51:903
Documento sobre la clasificacin decimal Dewey: 025.45CD
Documento sobre bibliografa nacional francesa: 015(44)
Documento sobre thesaurus de psicologa: 025.43:159.9
Clase1
Documento sobre la filosofa de Arthur Schopenhauer 1(091) SCHOPENHAUER o
1(430)18SCHOPENHAUER
Documento sobre el esnobismo ingls: 177.5(410)
Clase2
Documento sobre el santos de la religin cristiana: 27-36
Documento sobre el chamanismo en las religiones de los indios de Amrica del Norte:
259.2-38
Documento sobre teologa postmoderna: 2-11:141.78
Documento sobre el culto a la Luna: 2-137:523.3
Clase3
Documento sobre las escuelas privadas: 37.058
Documento sobre los partidos conservadores franceses: 329.11(44)
Documento sobre la mujer en la poltica: 32-055.2
Documento sobre los impuestos municipales: 336.22:352
Documento sobre las funciones del Parlamento cataln: 328.3(460.23)
Clase5
Documento sobre los crteres y mares de la Luna: 523.3-8
Clase6
Documento sobre la otitis: 616.284-002
Documento sobre los libros de cocina: 641.55(083.12)
Clase7
Documento sobre la pintura de Velzquez: 75Velzquez
Documento sobre los artistas alemanes postimpresionistas: 7.036.4(430)
Documento sobre las mujeres glamourosas en el cine de suspense: 791.221.5-56
Documento sobre las competiciones de judo: 796.853.23.09
CC-BY-NC-ND PID_00143962
89
Documento sobre el himno nacional de Estados Unidos de Amrica del Norte: 784.71(73)
Clase8
Documento sobre la literatura hebrea: 821.411.16
Documento sobre la poesa de Antonio Machado: 821.134.2-1MACHADO
Documento sobre las novelas de Harry Potter: 821.111-312.9ROWLING
Clase9
Documento sobre la geografa de la India: 913(540)
Documento sobre la historia de la casa de los Borbones en Espaa: 94(460).05
Documento sobre geografa poltica: 911.3:32
Documento sobre geografa de la Polinesia Francesa: 913(963)
Solucionesdelosejerciciosdenivelalto
Documento sobre Barcelona ciudad como fondo argumental de pelculas de cine:
791.237.6(460.235-25)
Documento sobre el psicoanlisis como terapia mdica: 615.851
Documento sobre el turismo como elemento del tiempo libre:379.85
Documento sobre el turismo como factor econmico: 338.48
Documento sobre los diarios franceses: 070(44)
Documento sobre los ritos y ceremonias budistas: 24-5
Documento sobre las unidades calorimtricas como medida de cantidad de calor:
536.6.081
Documento sobre la bibliografa de las publicaciones peridicas de zoologa: 016:59(05)
Documento sobre las catedrales gticas francesas: 726.6.033.5(44)
Documento sobre herramientas para hacer esculturas: 730.022
Documento sobre los hroes en las pelculas de ciencia-ficcin: 791.221.8-51
Documento sobre historia de Espaa bajo los romanos: 94(460).013
Documento sobre la Biblia por los testimonios de Jehov: 279.17-23
Documento sobre la Gran Enciclopdia Catalana, en CD-ROM: (031.034)GEC
Documento sobre los suelos de arenisca: 645.1-033.6
Documento sobre rdenes religiosas femeninas catlicas: 27-788-055.2
Documento sobre el psicoanlisis como proceso psicolgico: 159.964.2
Documento sobre cuentos fantsticos de Julio Cortzar: 821.134.2-32(82)
CC-BY-NC-ND PID_00143962
90
Glosario
Los trminos del glosario de este mdulo estn en orden alfabtico. Remiten unos a otros, y
muestran las relaciones semnticas, como un lenguaje controlado.
Si hay dos conceptos sinnimos, los trminos no aceptados se remiten al aceptado con
un ved. Ejemplo: cdigo numrico, ved notacin.
Significa que el trmino por lo comn aceptado es notacin. En el glosario, se mantienen
las dos entradas porque, a veces, hay poco consenso terminolgico en la bibliografa.
Los ejemplos de este glosario hacen referencia a la clase 52 de astronoma de la CDU, edicin
de bolsillo 2004; hay que recordar que otras ediciones, como la abreviada o el fichero bsico
de referencia, tienen ms clases.
auxiliarcomndependiente(tabla) m Las tablas son dos: notaciones ajenas a la CDU y caractersticas generales (de propiedades, materiales y personas). Como su nombre indica, son
auxiliares que slo se pueden usar como sufijos; no se han de utilizar independientemente
ni en primer lugar en la notacin.
CC-BY-NC-ND PID_00143962
91
auxiliarcomnindependiente(tabla) m Las tablas son: lengua, forma, lugar, razas, pueblos y nacionalidades, tiempo. Ya que tienen un smbolo de inicio y uno final pueden ir en
cualquier lugar de la notacin, a excepcin del de la lengua, que slo tiene smbolo en el
inicio, aunque la CDU permite aadirle detrs dos puntos.
Si en un mismo documento hay que representar ms de un concepto con auxiliares independientes, la CDU recomienda el orden siguiente: Clase + lugar + tiempo + forma + lengua
+ raza.
auxiliarespecial(tabla) m Los auxiliares especiales ayudan a precisar el contenido de algunas materias, no de todas, ya sea de alguna de las nueve clases principales, como de algunos
auxiliares comunes.
Ya que hay auxiliares especiales repartidos por todas las clases principales, no los encontramos reunidos en una sola tabla como pasa con los auxiliares comunes. En el ejemplo de
astronoma, vemos que las clases marcadas con la lnea vertical negra son las auxiliares especiales previstas para la clase 52 (y slo la clase 52).
cadena f Clases subordinadas sucesivamente (en contraposicin a las clases coordinadas
que se llaman series). En cada nivel, se escoge una caracterstica para ir subdividiendo. En el
ejemplo: de todas las ciencias naturales (fsica, qumica, botnica...) escogemos astronoma.
De todas las materias estudiadas en astronoma (teora astronmica, estrellas, universo), escogemos el sistema solar. De todos los elementos que forman el sistema solar (propiedades
y leyes, lunas, meteoritos...), escogemos los planetas. De todos los planetas, escogemos Mercurio. (Ved tambin: jerarqua.). Por ejemplo:
5 Ciencias Naturales
52 Astronoma. Astrofsica. Investigacin espacial. Geodesia
523 Sistema Solar
523. 4 Planetas
524.41 Mercurio
clase f Concepto, materia o disciplina de una clasificacin. Las clases se basan en caractersticas, atributos, propiedades o cualidades comunes. Encontramos clases en todos los niveles
de la cadena jerrquica. Las clases de primer nivel son las clases principales. Cada clase se
divide en subclases, y as sucesivamente.
Ejemplo: desde la clase 5 hasta la ltima clase, todas son clases. Las dos primeras, la 5 y la
52, se consideran clases principales; el resto, clases.
Ved tambin clases principales.
clase principal f Las clases principales son las que ocupan el primer nivel en la cadena
jerrquica. Se equiparan a las disciplinas. Por ejemplo: 52 Astronoma.
Ved tambindisciplinas.
clasificacinbibliogrfica f Ved clasificacin documental.
clasificacindocumental f Lenguaje documental que divide el conocimiento enciclopdico, o el de un rea, en una serie ordenada de clases y subclases basadas en las similitudes y
diferencias. Se utiliza para clasificar la materia de los documentos y ordenar fsicamente los
documentos originales. Son lenguajes sintticos, precoordinados, codificados, controlados y
de estructura jerrquica o hbrida con posibilidad de expresar facetas. Se llama documental
para diferenciarlo de las clasificaciones filosficas, cientficas y de las clasificaciones o taxonomas biolgicas. Por ejemplo: la clasificacin Dewey, la clasificacin decimal universal,
la clasificacin Colon, La clasificacin de la Library of Congress. Ved tambin: clasificacin
filosficaycientfica; taxonoma.
clasificacinenumerativa f Ved clasificacin monojerrquica.
clasificacinfilosficaycientfica f Sistema filosfico y de clasificacin del conocimiento. A diferencia de las clasificaciones documentales, se interesa por todo el conocimiento
humano, y no slo por el conocimiento depositado en la coleccin del SID. Por ejemplo:
la clasificacin filosfica que ms trascendencia ha tenido, desde la Edad Moderna, es la de
Francis Bacon.
clasificacinjerrquica f Estructura que enumera las clases de arriba abajo y de izquierda a
derecha. Cada tema se encuentra en un solo lugar de la cadena. Son las ms numerosas por
su facilidad de construccin y uso. Se adecuan muy bien en entornos enciclopdicos.
Ejemplos: la clasificacin de la Biblioteca del Congreso (LC).
clasificacinporfacetas f Estructura que agrupa los conceptos segn las caractersticas y los
atributos. La materia no se encuentra representada en el cuadro de clasificacin, sino que el
CC-BY-NC-ND PID_00143962
92
CC-BY-NC-ND PID_00143962
93
CC-BY-NC-ND PID_00143962
94
Bibliografa
Maniez, J. (1992). Los lenguajes documentales y de clasificacin: concepcin, construccin y utilizacin en los sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez Ruiprez.
McIlwaine, I. C. (2003). Clasificacin Decimal Universal. Gua para uso de la CDU. Madrid:
AENOR.
Reitz, Joan. Odlis Online dictionary of library and information science [en lnea]. Western Connecticut State University. [Fecha de consulta: 10 de octubre de 2008].
Referencias bibliogrficas
025.431: The Dewey blog [en lnea]. [Fecha de consulta: 10 de octubre de 2008].
lvarez Garca, F. J. (1997). Introduccin al uso prctico de la CDU. En: M. Pinto (ed.).
Manual de clasificacin documental (pg. 219-243). Madrid: Sntesis (Biblioteconoma y Documentacin).
AENOR. Asociacin espaola de normalizacin y certificacin [en lnea]. [Fecha de consulta: 10
de octubre de 2008].
Arnau Riverd, Pilar (2005). Documentacin: hitos histricos, precedentes - Dewey - Otlet - FID
(pg. 96-105 y 248-255). Madrid: Mundarnau.
Benito, M. (1999). El sistema de clasificacin decimal universal: manual de aprendizaje. Madrid:
Taranco.
Benito, Miguel. El sistema de Clasificacin Decimal Universal [en lnea]. [Fecha de consulta:
10 de octubre de 2008]. O, tambin, en la URL Instituto de Taranco. [Fecha de consulta: 10
de octubre de 2008].
Burguillos Martnez, Ferran. Tutorial de la Clasificacin decimal universal [en lnea]. [Fecha
de consulta: 10 de octubre de 2008].
CDU: Clasificacin decimal universal: norma UNE 50 001:2000 (2000) (3 vols.). Madrid: AENOR.
Classificaci decimal: adaptaci per a les biblioteques catalanes (1982) (4. ed. preparada por
Jordi Rubi i Lois). Barcelona: Teide.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000 (2001)
(adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU): edicin abreviada de la norma UNE 50001: 2000; (incluye
las modificaciones de la Norma UNE 50001:2004/1M. Trad. del Master Reference File realizada por
el Centro de Informacin y Documentacin Cientfica (CINDOC) (2004) (adaptada por Rosa San
Segundo Manuel). Madrid: AENOR.
Clasificacin Decimal Universal (CDU) de bolsillo (2004) (adaptada por Rosa San Segundo Manuel). Madrid: AENOR.
Dez Carrera, C. (1999). Tcnicas y rgimen de uso de la CDU (Clasificacin Decimal Universal)
(pg. 134). Gijn: Trea. (Biblioteconoma y Administracin Cultural, 26).
Esteban, M. A. (1997). Fundamentos epistemolgicos de la clasificacin documental. En:
M. Pinto (ed.). Manual de clasificacin documental (pg. 19-32). Madrid: Sntesis (Biblioteconoma y Documentacin).
Gil Urdiciain, B. Los lenguajes de clasificacin documental. En: M. Pinto (ed.) (1997).
Manual de clasificacin documental (pg. 91-108). Madrid: Sntesis (Biblioteconoma y Documentacin).
Gili Martnez, M. D.; Vives i Grcia, J. (1996, julio-diciembre). La nova edici espanyola
de la CDU: arriscar-se al canvi?. tem: Revista de Biblioteconomia i Documentaci (nm. 19,
pg. 94-121).
Glazier, Jack (2003). Las races culturales de la clasificacin moderna. En: IV Coloquio
Internacional de Ciencias de la Documentacin. Salamanca.
Glazier, Jack (2003). VI Congreso del Captulo Espaol de ISKO. Salamanca.
CC-BY-NC-ND PID_00143962
95
CC-BY-NC-ND PID_00143962
96
Listas de
encabezamientos
de materia y listas
de autoridades
Manela Junc Campdepadrs
PID_00143965
CC-BY-NC-ND PID_00143965
Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es
CC-BY-NC-ND PID_00143965
ndice
Introduccin...............................................................................................
Objetivos.......................................................................................................
1.
2.
3.
12
4.
16
5.
19
6.
Encabezamientos y subencabezamientos.....................................
23
6.1.
Encabezamientos .........................................................................
23
6.2.
Subencabezamientos ...................................................................
23
7.
28
8.
30
8.1.
30
8.2.
30
8.3.
32
34
9.1.
34
9.2.
36
9.3.
37
9.4.
38
40
44
44
47
49
Actividades..................................................................................................
51
Glosario........................................................................................................
52
9.
CC-BY-NC-ND PID_00143965
Bibliografa.................................................................................................
56
CC-BY-NC-ND PID_00143965
Introduccin
Ved
Autoridad
Principio de especificidad
Principio de economa
CC-BY-NC-ND PID_00143965
Objetivos
Con el estudio de los materiales asociados a este mdulo alcanzaris los siguientes objetivos generales:
En cuanto a las listasdeencabezamientosdemateria:
CC-BY-NC-ND PID_00143965
Este mdulo est dedicado a los dos lenguajes documentales que tratan las
autoridades: los listados de encabezamientos de materia y los listados de autoridades.
Las autoridades son las formas normalizadas de las entradas de un catlogo bibliogrfico o inventario de archivo.
Nombres propios
Ttulos
Materias
Entidades
Nombres geogrficos
Para evitar problemas en la recuperacin (de ruido y silencio documental) debidos a la ambigedad del lenguaje natural hay que establecer formas normalizadas en cada caso de acuerdo con las reglas internacionales de descripcin:
reglas norteamericanas de catalogacin (para las bibliotecas) y de las Normas
Internacionales sobre los Registros de Autoridad de Archivos relativos a Instituciones, Personas y Familias (ISAAR[CPF]1) (para archivos).
Estas formas normalizadas se registran en el fichero de autoridades, que anota
la forma aceptada, los trminos no seleccionados, notas de aplicacin, relaciones semnticas si es oportuno y la fuente en la que se ha basado. Este fichero
de autoridades es el listado que el analista tiene que consultar antes de indizar
para comprobar la forma aceptada.
Para analizar el contenido de un documento, el analista tiene que saber consultar las listas de encabezamientos de materia, pero tambin tiene que saber
consultar el resto de autoridades, ya que la materia de un documento tambin
puede ser:
(1)
ISAAR(CPF) es la sigla de International Standard Archival Autorithy Records for Corporate Bodies, Persons and Families, Norma Internacional sobre los Registros de Autoridad de Archivos relativos a Instituciones, Personas y Familias.
CC-BY-NC-ND PID_00143965
Estos trminos (Doris Lessing, consejo de guerra, retrato de Dorian Gray, India, Eroski) no aparecen en las listas de encabezamientos de materia porque
tienen entrada como nombres personales, de ttulo, geogrficos, etc. En consecuencia, el analista tiene que saber consultar todo tipo de autoridades.
Entre todas las autoridades, las de materia destacan por su singularidad, por
este motivo este mdulo se divide en dos grandes bloques:
Documento a): Salvador Dal autor de la obra El mito trgico del Angelus de Millet.
Documento b): Ignasi Puig escribe una obra titulada El Dal esotrico.
Documento c): Salvador Dal escribe Vida secreta (es su autobiografa).
Autor
Materia
a)
Dal,Salvador,1904-1989
Millet,Jean-Franois.ngelus
b)
PuigAlemn,Ignasi
Dal,Salvador,1904-1989
c)
Dal,Salvador,1904-1989
Dal,Salvador,1904-1989
Ttulos uniformes
Un ttulo uniforme es un ttulo
ficticio dado por el analista para agrupar todas las entradas
en un catlogo de una obra.
El ttulo uniforme se crea para controlar las diferentes ediciones, traducciones, etc. Un
ejemplo extrado del listado
LENOTI: el Pjaro de fuego de
Igor Stravinski tiene como ttulo uniforme Stravinski, Igor.
Jar ptitsa, ttulo que engloba
cualquier otra traduccin tipo
El pjaro de fuego, Loiseau de
feu, etc.
CC-BY-NC-ND PID_00143965
(2)
b) En la recuperacin:
Las listas de encabezamientos se pueden clasificar por idioma, por tema y por
tipo de biblioteca donde se aplican:
1)Poridioma
Hay listas de encabezamientos en diversos idiomas: cataln, ingls, francs,
castellano, italiano, portugus, etc.
Listas de encabezamientos en cataln, castellano, ingls y francs
Lengua
Acrnimo
Nombre de la Lista
Cataln
LEMAC
Castellano
AM BNE
10
CC-BY-NC-ND PID_00143965
Lengua
Ingls
Francs
Acrnimo
Nombre de la Lista
ME BUS
AM CSIC
LEM BP
SEARS
BILINDEX
LAVAL
RAMEAU
2)Portema
Hay listas de mbito enciclopdico (todas las ejemplarizadas en la tabla anterior) y listas especializadas en un tema.
3)Portipodebiblioteca
Podemos distinguir las listas especializadas de aplicacin en bibliotecas nacionales (AM BNE, LEMAC), en bibliotecas universitarias (ME BUS, LEMAC), en
bibliotecas pblicas (LEM BP) y en bibliotecas o centros especializados (AM
CSIC). Algunos ejemplos son:
A partir de ahora:
AM BNE = Autoridades de materia del catlogo de autoridades de la Biblioteca Nacional
de Espaa.
LEMAC = Lista de encabezamientos de materia en cataln.
ME BUS = Encabezamientos de
materia de la Biblioteca Universitaria de Sevilla.
LEM BP = Lista de encabezamientos de materia para bibliotecas pblicas.
AM CSIC = Autoridades de
materia de la red de bibliotecas del CSIC.
El conocimiento del idioma: para indizar es necesario un cierto conocimiento de la lengua de cada lista, por lo que en este mdulo trabajaremos
bsicamente las listas en cataln (LEMAC) y en castellano (AM BNE y AM
(3)
CC-BY-NC-ND PID_00143965
11
CSIC). Tambin se facilitarn ejemplos de la LCSH , para facilitar la desenvoltura en su consulta y contribuir a la competencia lingstica.
Listas en red
gratuita.
Utilizaremos el acrnimo LEM4 (Listas de encabezamientos de materia) cuando nos refiramos a principios comunes a todas las listas, sea cua sea su nacionalidad e idioma. Cuando se haga referencia a una lista concreta, se usarn
sus acrnimos respectivos.
(4)
CC-BY-NC-ND PID_00143965
12
El origen de este tipo de lenguaje documental lo encontramos en Estados Unidos de Amrica. Aparece por primera vez en 1876 de manos de Charles A.
Cutter.
Charles A. Cutter era el bibliotecario en jefe del Ateneo de Boston cuando el
gobierno de Estados unidos le encarg un estudio sobre la catalogacin en las
bibliotecas del pas. El informe tena cuatro volmenes, el ltimo de los cuales
contena las Rules for a printed dictionary catalogue, donde expone las reglas para
encontrar e indizar un documento segn su materia. Aparece ya el nombre de
headings (encabezamientos) para designar los trminos de indizacin.
Lecturas complementarias
Para ms informacin sobre el origen y la evolucin de las listas de encabezamientos ved
las obras siguientes:
I.GilLeiva (2008). Manual de indizacin. Teora y prctica. Gijn: Trea.
Charles A. Cutter elabor los principios que rigen las LEM, como el principio
Ved tambin
(5)
13
CC-BY-NC-ND PID_00143965
de los tesauros , contribuyendo a la normalizacin en la descripcin de las relaciones semnticas de los trminos.
Actualmente la mayora de las listas de encabezamientos de materia del mundo se basan en ella o son directamente traducciones
7
Bilindex es una lista basada en la LCSH, en la LEM de la Organizacin de Estados Americanos (OEA) y en la LEM de la Universidad
Autnoma de Mxico (UNAM). Es una lista bilinge, ingls-castellano. Se cre para ayudar a los analistas que no dominaban el castellano para indizar documentos en esta lengua. Se aplica en bibliotecas pblicas de ciudades de menos de 100.000 habitantes y
escolares, pero su grado de especializacin y la cobertura que da a
las publicaciones hispanas la hicieron tambin til en centros especializados y bibliotecas tcnicas.
Sears1923
A partir de 1986
Equivalencia
UF
Ved
See
Use
Genrico
xx
Bt broader term
Especfico
s.a
Nt narrow term
Trminosrelacinasociativa
Va
Rt related term
(7)
14
CC-BY-NC-ND PID_00143965
El concepto Mar
AM BNE
Maresyocanos
Fuentes:
LCSH (Ocean)
CSIC (Mares y
ocanos)
ME BUS (Ocano)
AM CSIC
Maresyocanos
Fuente LCSH (Ocean)
Trm.mat. LCSH/BNF
Ocean
LEMAC
LCSH
Mar
Fuente
LCSH: (enc.:
Ocean)
Ocean.
RAMEAU
Mer
Equiv.
LCSH:
Ocean
2)Listasdeencabezamientosdemateriaenfrancs
En la tabla siguiente se recogen las listas ms importantes de encabezamientos
de materia en francs:
LavalRpertoiredevedettes-matire(RVM)delaUniversidad
Laval
RAMEAU
RAMEAU son las siglas de Rpertoire dAutorit Matire Encyclopdique et Alphabtique Unifi, la lista de encabezamientos usada
en Francia. Est basada en el Rpertoire de vedettes-matire de la
Universidad de Laval. RAMEAU se usa en la red de bibliotecas pblicas francesas y en la Biblioteca Nacional Francesa (BNF) cubriendo de esta manera la mayora de la red bibliotecaria del pas. Desde 1987 se gestiona desde la BNF.
3)Listasdeencabezamientosdemateriaencastellano
a)EnAmrica:
En la tabla siguiente se recogen las listas ms importantes de encabezamientos
de materia en castellano en Amrica:
ListadeencabezamientosdelaOrganizacindeEstadosAme- La lista de encabezamientos de la OEA es la ampliacin de la lista
ricanos(OEA)
elaborada por Carmen Rovira y Jorge Aguayo para bibliotecas nacionales, universitarias, especializadas y pblicas de Latinoamrica.
Est basada en parte en la LCSH. Es una lista que incluye todas las
ramas del conocimiento y abarca desde trminos generales a trminos muy especficos de un mbito temtico.
b)EnelEstadoespaol:
En Espaa la primera noticia que tenemos de una lista de encabezamientos es
de 1935, de Juan Vicens Lavalle, pero no lleg a ser utilizada. La siguiente noticia es del ao 1939, cuando Lasso de la Vega y Cesreo Goicoechea publican
15
CC-BY-NC-ND PID_00143965
Los encabezamientos de materia se empiezan a utilizar en la Biblioteca Nacional de Espaa en el ao 1958, cuando
se establece la ficha nica para todas las bibliotecas pblicas del Estado y se crea un primer fichero de autoridades
de materia con los elementos bsicos de los registros de autoridad.
Este fichero de materias sirvi de base para la futura Lista de encabezamientos de materia para bibliotecas pblicas,
editada por primera vez por la Direccin General del Libro del Ministerio de Cultura en el ao 1986.
MEBUS
La Universidad de Sevilla se inspir en la LCSH y en la Laval. Es una lista de encabezamientos de tipo enciclopdico,
ya que tiene que dar cobertura a todas las bibliotecas universitarias de la ciudad. En un volumen aparte se facilitan
las traducciones de los epgrafes al ingls y francs.
AMCSIC
La primera lista data de 1965, pero la primera editada es de 1987. Actualmente contiene aproximadamente treinta y ocho mil trminos y en la versin impresa cada encabezamiento viene acompaado de su traduccin al ingls.
Es la lista que sirve para indizar las bases de datos del CSIC. Dada la temtica de estas bases de datos, la lista recoge
trminos especializados.
LEMBP
En el ao 1981 se cre una comisin de bibliotecarios para redactar una LEM especial para los fondos de una biblioteca pblica, es decir, para colecciones generales de unos treinta mil ejemplares.
En el ao 1986 el Ministerio de Cultura la edit por primera vez. Es una lista muy implementada en el Estado espaol.
En 1991, el Ministerio, junto con la Biblioteca Nacional de Espaa, redact unas normas para su aplicacin y redaccin de nuevos epgrafes.
4)Listadeencabezamientosdemateriaencataln
En la tabla siguiente se recoge la lista de referencia ms utilizada en la legua
catalana:
LEMAC
La primera lista en cataln fue elaborada en el ao 1983 por el Institut Catal de Bibliografia. Se decidi traducir
y adaptar la Lista de encabezamientos de materias para bibliotecas de 1967 de C. Rovira y J. Aguayo y en paralelo
se iba comprobando con el original de la LCSH. La tarea actualmente corre a cargo del Servei de Normalitzaci de
la Biblioteca de Catalunya y las fuentes se han ampliado con las adaptaciones de la Laval y el Rameau. Se actualiza
constantemente, en teora el periodo es semanal. La LEMAC se usa en la Biblioteca de Catalunya y en el Consorci de
8
(8)
CC-BY-NC-ND PID_00143965
16
c)Controlado. Es un lenguaje controlado porque tiene como objetivo la representacin unvoca del contenido de los documentos y de las consultas: un
nico concepto por trmino y un nico trmino por concepto (eliminando la
sinonimia y homonimia). En la indizacin y en la recuperacin slo se pueden
utilizar los trminos o encabezamientos que figuran en el vocabulario finito
que es la lista de encabezamientos.
Ved tambin
Recordad que estas caractersticas se trataron en el mdulo
Anlisis de contenidos: resumen e indizacin.
17
CC-BY-NC-ND PID_00143965
Trminoaceptado(LEMAC)
Boy Scouts
Escoltes
Escoltas
Exploradores (Boy
Scouts)
Minyons de Muntanya
Noies guies
Nois guies
Trminoaceptado(AMCSIC)
Hambre
Trminoaceptado(AMCSIC)
Masa (Cocina)
Masa (Fsica)
18
CC-BY-NC-ND PID_00143965
Correcto
Derecho - Obras de referencia
e)Estructuracombinatoriaoasociativa. Es un lenguaje de estructura combinatoria en que los trminos de indizacin se organizan alfabticamente y
se combinan entre s (encabezamientos y subdivisiones) en el momento de la
indizacin.
Ejemplo de combinacin de un encabezamiento + un subencabezamiento
AM CSIC: Vidrio - Propiedades elctricas
19
CC-BY-NC-ND PID_00143965
Principios de aplicacin
Principio de especificidad
Principio de economa
En este apartado trataremos los principios de construccin y en el captulo titulado Aprendiendo a indexar con una lista de encabezamientos trataremos
los dos principios de aplicacin.
a)Principiodeencabezamientouniforme: cada materia tiene que ser representada siempre con un nico encabezamiento y cada encabezamiento ha de
representar una nica materia. Para conseguir este principio hay que aplicar
el control sobre el vocabulario.
Ejemplo AM BNC
Trminos afines como Sinopsis y Conferencias siempre se indizarn como Congresos y
asambleas.
(9)
20
CC-BY-NC-ND PID_00143965
AN BNE
Conceptos semejantes
Variantes ortogrficas
Variedades lingsticas
Trminos obsoletos
En cuanto a los polismicos, decimos que dos palabras son polismicas cuando el mismo signo lingstico, palabra o sonido tiene ms de un significado
pero proviene de un mismo origen etimolgico, guardando una cierta relacin
conceptual a pesar de los diferentes usos. Los homnimos son un tipo de polisemia caracterizada por tener dos o ms orgenes etimolgicos diferentes.
Tanto los polismicos como los homnimos comportan ruido documental
dentro de un sistema documental.
Generalmente, el contexto en el que est insertada la palabra ya evita los problemas de ambigedad en la comunicacin habitual de conversacin o lectura, pero un polismico introducido en un sistema documental, sin el contexto,
puede dar lugar a ruido documental. Las LEM controlan los polismicos y homnimos de diversas maneras: adjetivando, poniendo parntesis con el nombre de la disciplina, haciendo frases, jugando con el singular y el plural, etc.
Ejemplos de indizacin de polismicos y homnimos
Polismicos
Matriz:ginecologa
Matriz:matemticas
Homnimos
Metro:transporte
Metro:medida
AM CSIC
Matriz
Matrices (Matemticas)
AM CSIC
Ferrocarriles metropolitanos
Metro (Unidad de longitud)
Nota
En cataln el trmino Metro slo tiene un significado, el del transporte, ya que la unidad
de medida es Metre.
LEMAC
ter
Matrius (lgebra)
LEMAC
Metro
Metre (Unitat de longitud)
CC-BY-NC-ND PID_00143965
21
d)Principiodesintaxis: las LEM tienen que establecer las reglas de combinacin de los encabezamientos con los subencabezamientos.
Ejemplo
Encabezamiento aceptado
Atlas
Nota de alcance
Este encabezamiento, que sirve para agrupar los atlas geogrficos
mundiales, se puede utilizar nicamente seguido de subdivisin o del
adjetivo que designa el pas de publicacin, ex.: Atles catalans para
los atlas geogrficos mundiales publicados en Catalua. Las obras
que tratan de los atlas se encuentran bajo el encabezamiento Atlas
- Historia
CC-BY-NC-ND PID_00143965
22
CC-BY-NC-ND PID_00143965
23
6. Encabezamientos y subencabezamientos
Los elementos que componen una lista de encabezamientos son los encabezamientos y los subencabezamientos
6.1. Encabezamientos
Son una o diversas palabras que representan conceptos.
Blanca Gil (2004, pg. 30).
Ejemplos de encabezamientos
AMBNE
Periodismo
Ajedrez
AMCSIC
Macromolculas
Teora crtica
LEMAC
Fotografia
Disseny decoratiu
LCSH
6.2. Subencabezamientos
CC-BY-NC-ND PID_00143965
24
Algunas listas ponen los subencabezamientos en listas anexas (LEM de bibliotecas pblicas) y otras los listan alfabticamente en el cuerpo central (LEMAC).
Hay subencabezamientos de aplicacin general (como los de forma) y otros
que hay que combinar bajo un tipo concreto de encabezamiento. En este ltimo caso la lista nos informa con una nota explicativa.
Ejemplo segn AM BNE
ImpuestosVase adems los nombres de los distintos impuestos y clases
de impuestos Sisa (Impuesto) Impuesto sobre el valor aadido Impuestos municipales y el subencabezamiento Impuestos bajo determinadas
materias Automoviles-Impuestos
Significa que podemos aadir Impuestos detrs de un encabezamiento de tipo Tabaco y
hacer:
Tabaco Impuestos
Aleaciones
Electrometalurgia
Fundicin
Metalografa
Metalurgia
Muchos encabezamientos + subencabezamiento de materia ya vienen construidos en la lista; otros los tenemos que combinar nosotros siguiendo una
nota de aplicacin que dice que:
a) El encabezamiento x tambin puede funcionar como subencabezamiento
o subdivisin.
Ejemplo
El encabezamiento Argot tambin puede funcionar como subencabezamiento, segn
dice la nota.
CC-BY-NC-ND PID_00143965
25
Ejemplo de encabezamiento (izquierda) y de encabezamiento que funciona como subencabezamiento o subdivisin (derecha)
2)Subencabezamientosdelugarotopogrficos
Son nombres de lugares geogrficos que precisan el encabezamiento principal.
Se usan en todo tipo de temas (Economa, Arte, Legislacin, Historia, etc.).
Algunas LEM indican qu encabezamientos pueden llevar subencabezamientos de lugar:
26
CC-BY-NC-ND PID_00143965
(10)
LEMAC
Pintura - Frana
LCSH
3)Subencabezamientosdetiempoocronolgicos
Son periodos, fechas concretas, siglos. Cada lista nos indica la manera de introducir este tipo de subencabezamientos.
Ejemplo
El siglo XIX puede introducirse de diversas maneras: 1800-1899 o 19.
Nota: Los parntesis son informativos, la subdivisin debe separarse con un guin.
CC-BY-NC-ND PID_00143965
27
Ejemplo
Ved tambin
5)Ordendelossubencabezamientos
Si la LEM no indica lo contrario, el orden es el siguiente:
Ejemplo
Dientes Cuidado e higiene - Espaa - S. XIX - Estadsticas
28
CC-BY-NC-ND PID_00143965
Las reglas forman parte del control del vocabulario que todo lenguaje documental controlado debe tener presente. Son convenciones propias de cada lista. Aunque nunca tengamos que construir una LEM entera, s que nos podemos encontrar en la situacin de tener que incorporar un encabezamiento
nuevo y hay que saber las reglas:
1)Regladelsingular/plural
Culturalmente, las listas inglesas y espaolas prefieren el plural, mientras que
las francesas y las italianas se decantan por el singular, si bien siempre hay
excepciones debidas a particularidades de la lengua, costumbres, etc.
No hay una normativa clara para el uso del singular/plural. Algunos autores
como Blanca Gil apuntan que el plural se usa para temas concretos y conta-
Los sustantivos no
contables
En castellano y cataln usamos
el singular para los sustantivos
no contables, como arroz y caf, pero hacemos excepciones
con garbanzos y judas.
En plural
Grupos: museos, delfines, italianos
rganos mltiples: huesos, pelos
Epgrafes de forma: portales, diccionarios
2)Regladelassiglas
Se prefiere la expresin completa a las siglas o acrnimos.
Lectura complementaria
Podis encontrar las observaciones de Gil en:
B.GilUrdiciain, (1996) (artculo)
29
CC-BY-NC-ND PID_00143965
Incorrecto
ISBD
3)Reglademaysculas/minsculas
Se recomienda que la primera palabra del encabezamiento, del subencabezamiento, del encabezamiento cambiado y la que va dentro de parntesis comience con mayscula.
Ejemplo con la AM CSIC
Lmparas
Gnero de punto - Industrias
Montecarlo, Mtodo de
Intervalo de energa (Fsica)
4)Regladelossignosdepuntuacin
Las LEM utilizan diversos signos y entre ellas no hay una unidad de criterio,
por lo tanto se hace necesario consultar las introducciones y manuales adjuntos a cada lista.
Los signos utilizados y sus usos ms habituales son los siguientes:
Signos poco habituales
Signo
Utilidad
Ejemplos
Guin
Alimentos - Caloras
frica - Historia - 1884/
1918
Coma
Parntesis
Diferencia homnimos
Expresa el contexto, la situacin geogrfica, el mbito temtico
Hay otros signos que no son de uso comn en las listas de encabezamientos
que estamos utilizando a lo largo de esta asignatura, pero que es bueno que
sepis que existen. Mostramos algunos ejemplos de los mismos extrados de
la obra de Gil (2008).
Signo
Lectura complementaria
I.GilLeiva (2008). Manual
de indexacin (pg. 136). Teora y prctica. Gijn: Trea.
Utilidad
Ejemplos
Dospuntos
Emploi: Paris
Comillas
Doblebarra
Art//Economia
Economia//Art
30
CC-BY-NC-ND PID_00143965
Plural
AMBNE
tica
AMCSIC
Carnitina Animales
LEMAC
Grcia
Cireres
LCSH
Toponymy
Museums
Extremeos
Cantos de pjaros
Msica para acorden
AMCSIC
Lseres en ciruga
Riego por aspersin
LEMAC
Gneres de punt
Animaci per ordinador
LCSH
Ved tambin
Recordad que el uso del singular/plural se explica en el apartado 7 de este mdulo didctico.
CC-BY-NC-ND PID_00143965
31
AMBNE
Mximas y aforismos
Cine y poltica
AMCSIC
Emigracin e inmigracin
Pintura e ilustracin de animales
LEMAC
Germans i germanes
Internet i adolescents
LCSH
3)Dosomssustantivosseparadosporcomayacabadosenetc.
AMCSIC
LEMAC
4)Unsustantivocalificadoconunparntesis
AMBNE
Vela (Deporte)
AMCSIC
Cambio
Cambio
Cambio
Cambio
LEMAC
Radi (Metall)
Radi (Os)
LCSH
Canarias (Ship)
Canarias (Islands)
(Economa)
(Filosofa)
(Psicologa)
(Sociologa)
5)Unsustantivoadjetivado
AMBNE
Industria forestal
Escultura italiana
AMCSIC
Medicina tropical
Matemticas difusas
CC-BY-NC-ND PID_00143965
LEMAC
Febre groga
Cuina francesa
LCSH
32
6)Fraseshechas
AMBNE
AMCSIC
LEMAC
LCSH
7)Frasesdondeseresaltaelconceptoaliniciodelepgrafeseparadocon
comas: consiste en alterar el orden de la expresin natural, colocando en primer lugar el trmino con ms carga significativa y separado del resto por una
coma.
Ejemplo
ngeles, Nuestra Seora de los
Bender, Test de
AMCSIC
Addison, Enfermedad de
LEMAC
Acci, Teoria de l
Albera, Serra de l
LCSH
Absolute, The
Art, Romanesque
CC-BY-NC-ND PID_00143965
33
Ejemplo de la letra B
AM CSIC
Baal (Personaje mitolgico)
Baamarani
Babel, Torre de
Babesiasis
Babesiasis bovina
Babesiosis
Babes
Babilonio
Babismo
Bable
LEMAC
Babel, Torre de
Babilonia - Civilizacin
Babilonia (Ciudad antigua)
Babismo
Bable
Bacalao
Bacalao - Industria y comercio
Bacalao - Pesca comercial
Bacalao - Industria del
Bacanales
Encabezamiento simple/compuesto.
CC-BY-NC-ND PID_00143965
34
Cada encabezamiento forma un registro de autoridad. En este registro observamos en primer lugar el encabezamiento aceptado y toda una serie de trminos conceptualmente equivalentes, ms genricos, ms especficos y trminos
que evocan una relacin.
Este apartado trata los temas siguientes:
a) Relacin de equivalencia.
b) Relacin de jerarqua:
Genrica.
Especfica.
c) Relacin de asociacin.
d) Smbolos utilizados para designar los tres tipos de relaciones.
Ejemplo de registro de autoridad extrado de la AM CSIC
Los trminosaceptados son los encabezamientos que se pueden utilizar para indizar.
Nota
Estas tres relaciones tambin
se dan en tesauros.
35
CC-BY-NC-ND PID_00143965
Ved tambin
Si un usuario busca en las bases de datos del CSIC documentos sobre los Genios, el
mismo programa lo remitir a Superdotados. Si busca en un catlogo indizado con la
LEMAC por el trmino Infncia, lo remitir a Infants.
Las siglas utilizadas para expresar la relacin de equivalencia entre ambos trminos son:
Cataln
Castellano
Angls
Empreu
EM empreu
USE
USE
Emprat per
EP emprat per
UP usado por
UF use for
CC-BY-NC-ND PID_00143965
36
AMCSIC
LEMAC
Albins EM Albinisme
Vegetals EM Plantes
Llibres doracions EM Devocionaris
LCSH
Los trminos aceptados nos informan acerca de cules han sido los trminos
no escogidos para indizar el mismo concepto.
Ejemplos de trminos aceptados y no aceptados
AMBNE
AMCSIC
LEMAC
LCSH
Ejemplo
Cartas vemos que tiene como trminos genricos:
Ejemplo de trminos genrics
Cartas
Biografa
Literatura
Ejemplo
Ejemplo de trminos especficos
Cartas
Novela espistolar
37
CC-BY-NC-ND PID_00143965
Los encabezamientos tienen encabezamientos genricos y especficos en funcin de su materia. Hay temas que por propio significado no tienen algunas
de estas relaciones.
Ejemplo
El encabezamiento Nquel de la LEMAC tiene un solo trmino genrico, ninguno equivalente y ninguno especfico.
NquelTrmino genrico:
Metales de transicin Fuentes:
LCSH (Nickel)
CSIC (Nquel)
TEI (Nquel)
N Registro: BNE19913257085
Habitualmente cada LEM marca los trminos con el nombre completo de genrico o especfico, pero a veces se utilizan siglas (las mismas que en los
tesauros):
Trminos genricos, especficos y sus siglas
AMBNE
TG / TE
AMCSIC
TG / TE
LEMAC
TG / TE
LCSH
BT / NT
38
CC-BY-NC-ND PID_00143965
Lo que hacen las relaciones asociativas es poner en contacto dos trminos o ms que por cuestiones de significado se evocan uno a otro.
No pertenecen a la misma secuencia jerrquica pero estn relacionados. Mentalmente los asociamos. La relacin es simtrica y consiguientemente recproca.
Ejemplo
Los trminos relacionados de Cartas son:
Cartas
Cartas - Redaccin
Trmino relacionado
AMCSIC
Vase adems
LEMAC
Termes relacionats
LCSH
Antesde1986
Despusde1986
EP (emprat per)
UP (usado por)
UF (use for)
ME (empreu)
USE (usar)
USE (use)
39
CC-BY-NC-ND PID_00143965
Relacionesdejerarqua
Antesde1986
Despusde1986
a) Generales
xx
TA (terme ampli)
TG (trmino general)
BT (broader term)
b) Especficas
vt
T (terme especfic)
T (trmino especfico)
NT (narrower term)
Antesde1986
Despusde1986
Relacionesdeasociacin
40
CC-BY-NC-ND PID_00143965
Ved tambin
Podis consultar el proceso de
anlisis del texto en el apartado 3 del mdulo Anlisis de
contenidos: resumen e indizacin de esta asignatura.
Para indizar correctamente con una LEM hay que tener presente:
1)Principiosdeespecificidadyeconoma
a)Principiodeespecificidad. Hay que indizar el encabezamiento ms especfico que encontremos. La especificidad est relacionada con la exactitud con
que el encabezamiento describe el contenido. Si nos quedamos por encima
(indizando con un trmino genrico) o por debajo (con un trmino especfico)
no estaremos siendo exactos.
Ejemplos del principio de especificidad
Materia
Correcto
Incorrectopor
Genrico
Demasiadoespecfico
AMBNE
Medicinas
Medicamentos
Productos sanitarios
Analgsicos
AMCSIC
Energas fsiles
Combustibles fsiles
Combustibles
Petrleo
LEMAC
Llat
Lenguas clsicas
Manuscritos latinos
41
CC-BY-NC-ND PID_00143965
Ejemplo
Combustibles fsiles / Petrleo
Llenges clssiques / Llat
(11)
CC-BY-NC-ND PID_00143965
42
Ejemplo
Un documento sobre la monarqua hispnica en tiempos del Quijote se puede indizar
con tres encabezamientos como los siguientes:
Cervantes Saavedra, Miguel de, 1547-1616. Don Quijote de la Mancha
Derecho - En la literatura
Derecho laboral
b) Definicin
Nota de la AM CSIC para la definicin de Waqf
Waqf
sese para las obras tanto las que que tratan del waqf, institucin
del derechos islmico con fondos inmovilizados dedicados a una obra
piadosa o de inters general, como para las realizaciones urbansticas, artsticas o sociales debidas a estas fundaciones.
c) Nota de aplicacin
Nota
Si el servicio de informacin y
documentacin (SID) necesitara una indizacin ms profunda, se recomienda indizar con
un tesauro, que es otro lenguaje documental natural pero postcoordinado y que tiene
ms prestaciones para hacer
anlisis que las LEM.
CC-BY-NC-ND PID_00143965
43
4)Lasobrasdereferencia
No todos los conceptos estn representados en las listas. Algunos hay que incorporarlos de alguna fuente reputada:
Diccionarios y enciclopedias considerados como autoridad dentro del dominio en cuestin. La LEMAC considera autoridades la Enciclopdia y el
Atlas del grupo Enciclopdia Catalana, el Diccionari de la llengua catalana
de lInstitut dEstudis Catalans y el Wordreference como traductor.
Especialistas en el tema.
5)Lasreglasdeconstruccin
Las reglas que hemos visto anteriormente sobre el uso del singular/plural, siglas, maysculas y minsculas por si tenemos que introducir un trmino nuevo.
Ejemplo
Supongamos que tenemos que indizar OCDE y no existe en la LEM. Como sabemos que
se prefiere el nombre entero a las siglas, indizaremos Organizacin de Cooperacin
y Desarrollo Econmico y lo haremos en la lengua del catlogo.
CC-BY-NC-ND PID_00143965
44
Una listadeautoridades es un lenguaje documental controlado que recoge ordenados alfabticamente todos los registros de autoridades presentes en el catlogo o en la base de datos bibliogrfica de la unidad de
informacin.
Nombres propios
Congresos
Ttulos
Entidades
Nombres geogrficos
Ved tambin
Las reglas de construccin de
cada registro de autoridad se
estudian en la asignatura Anlisis documental.
45
CC-BY-NC-ND PID_00143965
Al igual que los encabezamientos de materia vistos anteriormente, estas autoridades se encuentran en la misma direccin. Slo hay que cambiar en el
desplegable la opcin Materia por las otras autoridades.
Listas de autoridades
Cataln
LENOTI
Castellano
CA BNE
CA CSIC
Ingls
LC Authorities
Francs
LAVAL
RAMEAU
(12)
Autoridades especficas
Son ejemplos de autoridades
especficas la familia de los
Marqueses de Castelldosrius
(cuyo fondo histrico est en
el Archivo Nacional de Catalua), instituciones histricas o
el nombre del director general
de la empresa X.
46
CC-BY-NC-ND PID_00143965
CANTIC
LENOTI
LEMAC
14
(13)
Como se puede observar faltan las autoridades para nombres geogrficos. Los
nombres geogrficos jurisdiccionales se construyen segn el captulo 23 de
las AACR2R. Los no jurisdiccionales se sacan de algna lista de autoridades
reputada15 por el SID.
2)BibliotecaNacionaldeEspaa
Listas de autoridades de la BNE
Persona
Ttulo / Ttulo mapa
Congreso
Entidades
Materias
Geogrficos
Subencabezamientos
de materia
3)BibliotecasdelCSIC
Listas de autoridades del CSIC
Autor personal
Institucin
Congreso
Materia
Trmino geogrfico
Ttulo uniforme
Subencabezamiento
4)Autoridadeseninglsyfrancs
Consultaremos tambin autoridades en otras lenguas, como la inglesa o francesa, para facilitar la bsqueda en catlogos internacionales.
LC Authorities.
Lista de encabezamientos de
nombres y ttulos de la Biblioteca
de Catalua (LENOTI).
En Catalua las obras de
referencia son de la editorial
Enciclopdia Catalana: la Gran
Enciclopdia Catalana y el Atles.
Materia
CatlogoCSICAutoridades
(14)
(15)
Nombre
Nombre-ttulo
Ttulo
Catlogodeautoridades
CC-BY-NC-ND PID_00143965
47
Autorits RAMEAU
11.2. Tipologa
Las listas de autoridades son un lenguaje documental que tiene las siguientes
caractersticas: es analtico, natural, controlado y postcoordinado.
1)Analtico. Se trata de un lenguaje documental analtico porque permite, en
la indizacin y tambin en la recuperacin, el uso de ms de una autoridad
(o identificador).
El contenido de un documento se puede representar por tantos descriptores
controlados como sean pertinentes y necesarios para establecer un buen dilogo documental con el sistema.
Ejemplo con LENOTI
Un documento del tipo Gironins illustres que tratase de Salvador Dal, Narcs Monturiol, Pep Ventura, Josep Pla y Xavier Cugat se podria indizar con las autoridades de estos
cinco personajes.
Dal, Salvador, 1904-1989
Monturiol, Narcs
Ventura, Pep
Pla, Josep, 1897-1981
Cugat, Xavier
Ved tambin
Estas caractersticas estn basadas en las tipologas que vimos
en el apartado 5 del mdulo
Anlisis de contenidos: resumen e indizacin.
CC-BY-NC-ND PID_00143965
48
CC-BY-NC-ND PID_00143965
49
Como lenguaje controlado, las listas de autoridades tienen ventajas e inconvenientes en la indizacin y en la recuperacin.
1)Enlaindizacin
a)Ventajas:
CC-BY-NC-ND PID_00143965
50
Se trata de un lenguaje natural, no codificado, de dominio comn y constituido por elementos lxicos del lenguaje usual.
b)Inconvenientes:
2)Enlarecuperacin
a)Ventajas:
Es unvoco.
b)Inconvenientes:
CC-BY-NC-ND PID_00143965
51
Actividades
Proponemos las siguientes actividades para practicar los conocimientos de este mdulo:
1. Crea el encabezamiento para los documentos siguientes con las listas de encabezamientos
de materia y autoridades de la Biblioteca de Catalua, de la Biblioteca Nacional de Espaa
o del CSIC.
a) Abecedario griego.
b) Aire acondicionado de los coches.
c) Antologa de poesa siciliana.
d) Argot ruso.
e) Becas de estudios para aprender italiano.
f) Bibliografa sobre judos sefardes.
g) Bibliografa sobre gobierno municipal.
h) Bosques de la URSS.
i) Ciclmenes.
j) Congresos sobre reas suburbanas.
k) Conservacin del papel.
l) Contaminacin ambiental por nquel.
m) Declinaciones latinas.
n) Documento sobre becas de investigacin sobre los efectos fisiolgicos del alcohol.
o) Documento sobre el Siglo de Oro de la literatura espaola.
p) Documento sobre la obra de Garca Lorca La casa de Bernarda Alba
q) Enseanza del latn en las universidades.
r) Ikebana.
s) Novelas de Paul Auster.
t) Prediccin de la suerte en el siglo XX.
Reflexin
Las soluciones de las actividades se tratarn en el tabln de
la asignatura.
CC-BY-NC-ND PID_00143965
52
Glosario
AM BNE f Acrnimo usado en este material para las Autoridades de materia de la Biblioteca
Nacional de Espaa.
AM CSIC f Acrnimo usado en este material para las Autoridades de materia de la red de
bibliotecas del CSIC.
autoridad de materia f Ved encabezamiento.
autoridades f Formas normalizadas de las entradas de un catlogo bibliogrfico o inventario de archivo para: nombres propios, ttulos, nombres propios y ttulos, materias, entidades, nombres geogrficos.
BT Ingls. Siglas de Broad term, usadas en LEM y tesauros, para designar los trminos genricos en la relacin de jerarqua. Equivalencias en otras lenguas: cataln TA, castellano TG.
Ved tambin relacin de jerarqua.
CA BNE m Acrnimo de Catlogo de autoridades de la Biblioteca Nacional de Espaa.
CA CSIC f Acrnimo de Catlogo de autoridades de la red de bibliotecas del CSIC.
CANTIC m Catlogo de autoridades cooperativo iniciado en el ao 2007 que se realiza en el
Catlogo Colectivo de las Universidades de Catalua (CCUC) y est liderado por la Biblioteca
de Catalua.
Cutter, Charles Ammi m Bibliotecario jefe del Ateneo de Boston. Autor de las Rules for
a printed dictionary catalogue donde se exponen por primera vez las reglas para encontrar e
indizar un documento segn su temtica usando encabezamientos de materia. Cutter elabor los principios que rigen las LEM como el principio de especificidad y el de entrada directa, todos ellos vigentes en la actualidad. Tambin formul el principio de economa, las
referencias entre trminos aceptados y no aceptados, ya sean sinnimos u homnimos, los
encabezamientos simples y compuestos, los signos de puntuacin, la sintaxis a la hora de
construir encabezamientos compuestos etc.
EM Cataln. Siglas de EMPREU usadas en LEM y tesauros para designar la relacin de equivalencia entre un trmino no aceptado y otro aceptado. Equivalencias en otras lenguas: castellano USE, ingls USE.
Ved tambin relacin de equivalencia.
EM BUS Acrnimo de Encabezamientos de materia de la Universidad de Sevilla.
encabezamiento m Cada una de las entradas o autoridades de una lista de encabezamientos de materia. Trmino de indizacin propio del lenguaje documental LEM. Palabras o frases
especficas que describen la materia y representan conceptos. Estn redactados en lenguaje
natural pero son trminos controlados, es decir, han controlado la ambigedad derivada de
la sinonimia y homonimia.
encabezamientos compuestos m Conceptos expresados con ms de una palabra.
encabezamientos simples m Conceptos expresados con una sola palabra, generalmente
un sustantivo, aunque tambin pueden ser adjetivos, verbos sustantivados o nombres geogrficos. Tanto pueden ser trminos en singular como en plural.
EP Cataln. Siglas de EMPRAT PER usadas en LEM y tesauros para designar la relacin de
equivalencia entre un trmino aceptado y otro no aceptado. Equivalencias en otras lenguas:
castellano USADO POR, ingls USE FOR.
Ved tambin relacin de equivalencia.
fichero de autoridades m Fichero que recoge todos los registros de autoridades. Si este
fichero se encuentra vinculado al catlogo bibliogrfico, se conoce como catlogo de autoridades.
ISAAR(CPF) f Norma para la elaboracin de autoridades en archivos. Norma internacional
sobre los registros de autoridad de archivos relativos a instituciones, personas y familias del Consejo
internacional de archivos.
LC Authorities f Acrnimo de Library of Congress Authorities.
LCSH Acrnimo de Library of Congress Subject Headings.
CC-BY-NC-ND PID_00143965
53
CC-BY-NC-ND PID_00143965
54
CC-BY-NC-ND PID_00143965
55
TE Cataln y castellano. Siglas de terme especfic / trmino especfico, usadas en LEM y tesauros para designar los trminos especficos en la relacin de jerarqua. Equivalencias en otras
lenguas: ingls NT.
Ved tambin relacin de jerarqua.
trminos aceptados m pl Encabezamientos que se pueden utilizar para indizar. Acostumbran a ir en negrita.
trminos especficos m pl Encabezamientos que conceptualmente son ms concretos y
especficos que el encabezamiento aceptado que estamos consultando. En la cadena jerrquica se encuentran situados por debajo del encabezamiento.
trminos genricos m pl Encabezamientos que conceptualmente son ms amplios que el
encabezamiento aceptado que estamos consultando. En la cadena jerrquica se encuentran
situados por encima del encabezamiento.
trminos no aceptados m pl Trminos no admitidos para indizar. Son sinnimos, siglas,
trminos demasiado especializados, barbarismos, formas incorrectas, etc. Su funcin es controlar todas las posibles variantes y ofrecer una forma de encabezamiento nica para indizar
que ser el trmino aceptado.
TG Castellano. Siglas de Trmino genrico, usadas en LEM y tesauros para designar los trminos genricos en la relacin de jerarqua. Equivalencias en otras lenguas: cataln TA, ingls BT.
Ved tambin relacin de jerarqua.
ttulo uniforme m Ttulo ficticio dado por el analista para agrupar todas las entradas en
un catlogo de una obra. El ttulo uniforme se crea para controlar las diferentes ediciones,
traducciones, etc.
TR Cataln y castellano. Siglas de terme relacionat / trmino relacionado, usadas en LEM y
tesauros para designar la relacin de asociacin entre dos encabezamientos. Equivalencias
en otras lenguas: ingls RT.
Ved tambin relacin de asociacin.
UF Ingls. Siglas de USE FOR, usadas en LEM y tesauros para designar la relacin de equivalencia entre un trmino aceptado y otro no aceptado. Equivalencias en otras lenguas: cataln
EMPRAT PER, castellano USADO POR.
Ved tambin relacin de equivalencia
UP Castellano. Siglas de USADO POR, usadas en LEM y tesauros para designar la relacin de
equivalencia entre un trmino aceptado y otro no aceptado. Equivalencias en otras lenguas:
cataln EMPRAT PER, ingls USE FOR. Ved tambin relacin de equivalencia.
USE Castellano e Ingls. Instruccin USE (o sese) utilizadas en LEM y tesauros para designar
la relacin de equivalencia entre un trmino no aceptado y uno aceptado. Equivalencias en
otras lenguas: cataln EMPREU. Ved tambin relacin de equivalencia.
v Smbolo usado en las LEM, antes de la adopcin internacional de las siglas de tesauros, para
hacer la relacin de equivalencia entre un trmino no aceptado y otro aceptado. Actualmente
equivale a EMPREU/USE/USE. Ved tambin relacin de equivalencia.
Vt Smbolo usado en las LEM, antes de la adopcin internacional de las siglas de tesauros,
para designar los trminos especficos. Actualmente equivale a TE/TE/NT. Ved tambin relacin de jerarqua.
x Smbolo usado en las LEM, antes de la adopcin internacional de las siglas de tesauros,
para designar los trminos no aceptados. Actualmente equivale a EMPREU PER / USAR POR
/ USE FOR. Ved tambin relacin de equivalencia.
Xx Smbolo usado en las LEM, antes de la adopcin internacional de las siglas de tesauros,
para designar los trminos genricos. Actualmente equivale a TA/TG/BT. Ved tambin relacin de jerarqua.
CC-BY-NC-ND PID_00143965
56
Bibliografa
Biblioteca de Catalunya. Llista dencapalaments de matria en catal [disponible en lnea
(consulta 01-09-2009)].
http://www.bnc.cat/lemac/principis
Caro, C.; Travieso, C. Encabezamientos de materia en las bibliotecas espaolas: perspectiva histrica y situacin actual. En: Tendencias de investigacin en organizacin del conocimiento.
Concrecions a les AACR2 (Part II, encabezamientos, ttulos uniformes, referencies) (2002). Recopiladas por el Grup de Treball para las Concrecions a les AACR2 con la coordinacin del Servei de Normalitzaci Bibliogrfica. Barcelona: Biblioteca de Catalunya. (Actualizaci 2003.)
Chan, Louis Mai (1978). Library of Congress: Subject Headings: principles and application. Littleton, Colorado: Libraries Unlimited.
Gil Leiva, I. (2008). Manual de indizacin. Teora y prctica. Gijn: Trea.
Gil Urdiciain, B. (2004). Manual de lenguajes documentales. Gijn: Trea.
Informe per a la creaci de la llista dautoritats de Catalunya de noms i ttols: requeriments i funcionalitats (Octubre de 2003). Redactado por la Subcomissi Tcnica per a lElaboraci dels
Requeriments i Funcionalitats de la Llista dAutoritats de Catalunya per a la Comissi Assessora de Catalogaci.
MARC 21 concise authority format (2002). Washington, D.C.: Library of Congress.
Regles Angloamericanes de Catalogaci (1996). Barcelona, Biblioteca de Catalunya: Eumo.
Universidad de Laval (2005). Rpertoire des vedettes-matire. [S.L]: Universidad de Laval.
Biblioteca Universitaria.
Los tesauros
Damin Martnez Ferreras
PID_00143963
CC-BY-NC-ND PID_00143963
Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es
Los tesauros
Los tesauros
CC-BY-NC-ND PID_00143963
ndice
Objetivos.......................................................................................................
1.
El tesauro.............................................................................................
2.
2.1.
2.2.
10
2.3.
13
15
3.1.
15
3.2.
16
3.3.
17
3.4.
19
22
4.1.
22
4.2.
27
3.
4.
4.2.1.
4.2.2.
5.
28
29
31
5.1.
31
5.2.
32
Tesauros y ontologas........................................................................
34
6.1.
34
6.2.
35
6.3.
37
Bibliografa.................................................................................................
39
6.
CC-BY-NC-ND PID_00143963
Objetivos
1. Saber qu es un tesauro, conocer su estructura y los principales elementos que lo componen y definen: construccin, mantenimiento, tipologas,
formas de representacin y usos del tesauro.
2. Analizar el papel de los tesauros en el proceso de indizacin y recuperacin de la informacin y su importancia en los sistemas documentales especializados.
3. Conocer el proceso de creacin de un tesauro y elaborar un microtesauro.
4. Entender la funcin del tesauro como una herramienta especfica que hace
posible el objetivo final de la cadena documental, esto es, la recuperacin
y difusin de la informacin.
Los tesauros
CC-BY-NC-ND PID_00143963
1. El tesauro
Podramos definir un tesauro como una lista de trminos empleados para representar los conceptos, temas o contenidos de los documentos y que guardan entre s relaciones semnticas y genricas. Se trata de un instrumento de
normalizacin y control del vocabulario cuyo objetivo reside en eliminar la
ambigedad del lenguaje, convirtiendo el lenguaje natural de los documentos
en un lenguaje controlado.
Los tesauros
CC-BY-NC-ND PID_00143963
Los tesauros
La potenciadeuntesauro radica, adems, en la posibilidad de combinar todos esos conceptos, llamados descriptores, lo que le convierte en un lenguaje
combinatorio mucho ms rico que los tradicionales encabezamientos de materias a la hora de realizar los procesos de anlisis y recuperacin de la informacin.
Las principalescaractersticas de un tesauro son las siguientes:
a) Nace por la necesidad de crear nuevos sistemas de indizacin ms flexibles
que los tradicionales.
b) Presenta mayor especificidad de los trminos relativos a campos disciplinares concretos, lo que permite un anlisis ms preciso de los documentos.
c) A partir de la ordenacin alfabtica y como complemento a la ordenacin
sistemtica de los descriptores (por temas y significado), el tesauro facilita la
consulta del analista y del usuario. Son precisamente estas relaciones semnticas que se establecen entre los descriptores (relaciones de equivalencia, de
jerarqua y de asociacin) las que definen un tesauro y proporcionan la ayuda
necesaria en los procesos de indizacin y recuperacin de informacin.
Los tesauros pueden ser de los siguientes tipos:
Ved tambin
Las relaciones semnticas se
estudian en el subapartado 2.2
de este mdulo didctico.
Ved tambin
Los tesauros alfabticos o sistemticos los trataremos en el
apartado 3 de este mdulo didctico.
CC-BY-NC-ND PID_00143963
Las unidadeslxicas son grupos de descriptores que agrupan los trminos de indizacin bien por campos (temas), bien por clases de trminos
(facetas).
En los tesauros, los descriptores representan conceptos o nociones que pueden ser concretos, abstractos, entidades individuales o clases. Para expresar los
conceptos, los tesauros contienen unidades lxicas llamadas descriptores y no
descriptores.
1)Descriptores: trminos permitidos. Un descriptor es una palabra o conjunto
de palabras del lenguaje natural que responden a un concepto, expresado con
un nico trmino y ese trmino responde a un nico concepto. Esta univocidad se consigue seleccionando el descriptor entre sus sinnimos y estableciendo una red de relaciones semnticas con el resto de descriptores del tesauro.
Dicho trmino ser utilizado para el anlisis y la recuperacin del documento.
Los descriptores pueden ser:
a)Trminossimples: se emplean cuando el concepto es claro en s mismo,
sin necesidad de aadir ninguna otra palabra, o cuando se usa como genrico
de trminos ms concretos o especficos, como, por ejemplo, Coches.
b)Trminoscompuestos: la mayora de los trminos de un tesauro adquieren
su verdadero sentido cuando se convierten en trminos compuestos, ya que
as se logra una mayor especificidad. La estructura sintctica de los trminos
compuestos suele ser la siguiente:
Los tesauros
CC-BY-NC-ND PID_00143963
10
Si buscamos informacin de ventas de coches, caeremos en lo que se denomina silenciodocumental, ya que habr documentos que hablen sobre este
tema pero que estn indizados utilizando la palabra Automvil. Asimismo,
si buscamos slo por la palabra Automvil, nos aparecern exclusivamente
documentos que contengan esta palabra, y no, la palabra Coche.
Este problema se hubiera evitado si en el tesauro hubiera figurado la relacin
arriba expresada y, en consecuencia, tanto a la hora de indicar un documento sobre ventas de coches como a la hora de buscar informacin sobre este
tema, no hubiramos tenido otra opcin que utilizar el trmino pertinente o
descriptor, esto es, el trmino Automvil.
Los tesauros
11
CC-BY-NC-ND PID_00143963
Notacin
No existen siglas o abreviaturas normalizadas para expresar la relacin
de pertenencia.
Notacin
Las relaciones de equivalencia se suelen representar mediante el trmino USE (relacin entre el trmino no preferente y el trmino preferente, o trmino a usar ms aceptado) y las siglas UP (Usado por), que en
ingls son USE y UF.
Castellano
Ingls
Use
EM
USE
USE
Usadopor
EP
UP
UF
Los tesauros
12
CC-BY-NC-ND PID_00143963
Descriptor
Los tesauros
Nodescriptor
Automvil
coche
UP coche
USE Automvil
Se consigue as evitar la ambigedad terminolgica de la sinonimia del lenguaje natural expresada en varios trminos para referirse a un mismo concepto.
3)Relacionesdejerarqua: son las relaciones que se establecen entre los descriptores. En una relacin de jerarqua, un trmino es superior o genrico de
otro y este otro trmino es inferior o especfico del anterior. Esta estructura
clasificatoria distingue al tesauro de las listas alfabticas de materias o palabras
clave, as como de diccionarios y lxicos. De esta forma se crean campos conceptuales que clasifican los trminos y los agrupan en un campo delimitado
de significados o facetas que se van agrupando en disciplinas y sub-disciplinas.
Notacin
Para la presentacin de las relaciones jerrquicas se suelen utilizar determinadas siglas como TG (trmino genrico) y TE (trmino especfico); o
por su siglas en ingls, BT (broad term o trmino ms amplio), NT (narrow
term o trmino ms especfico).
Ingls
Cataln
Trminogenrico
TG
BT
TA (trmino amplio)
Trminoespecfico
TE
NT
TE
Descriptor
Descriptor
Productoslcteos
Yogur
TE yogur
TG Productos lcteos
Las relaciones de jerarqua constituyen el rasgo ms caracterstico de los tesauros y proporcionan una ayuda importantsima al usuario en los procesos de
indizacin y recuperacin documental.
4)Relacionesdeasociacin: son las relaciones asimtricas establecidas entre
descriptores de distintas familias, distintas a las jerrquicas o de equivalencia,
y que designan conceptos capaces de evocar mutuamente, por asociacin de
ideas, relaciones entre ellos.
13
CC-BY-NC-ND PID_00143963
Notacin
Este tipo de relacin se suele representar mediante las siglas TR (Trmino
Relacionado) o en ingls RT (Related Term).
Ingls
Cataln
TR
RT
TR
Trminorelacionado
Descriptor
Descriptor
Cargosmunicipales
AdministracinCentral
TR Administracin Central
TR Cargos municipales
La mayora de las relaciones asociativas se establecen entre trminos que comparten alguna caracterstica comn pero que pertenecen a campos semnticos
diferentes.
Ayudan al usuario en las tareas de indizacin y recuperacin documental puesto que proporcionan nuevos descriptores relacionados que facilitan la formulacin de dichas tareas.
2.3. Notas y aclaraciones
Cuando el significado de un descriptor es difuso o no est bien precisado por
su contexto semntico o lxico, se puede aadir una explicacin adicional
relacionada con el descriptor, de forma que no se produzca ambigedad dentro
del tesauro.
Estas explicaciones pueden ser notas (explicativas, histricas o de aplicacin)
o modificadores:
1)Notas. Utilizan como notacin NA:
Ejemplo
INSTALACIONES DEPORTIVAS
NA sese este trmino para referirse a instalaciones de los distintos
deportes desde el punto de vista de sus caractersticas y descripcin.
Para referirse a aspectos econmicos y de gestin sese el EQUIPAMIENTOS DEPORTIVOS
Los tesauros
CC-BY-NC-ND PID_00143963
Ejemplo
Juegos Olmpicos (Invierno).
14
Los tesauros
CC-BY-NC-ND PID_00143963
15
Los tesauros
Informacinasociada
DOM
NA
UP
Usado por. El trmino preferente o descriptor hace una referencia al no descriptor o trmino no preferente (relacin de equivalencia)
USE
TC
TG
Trmino genrico que hace referencia al trmino al cual pertenece el descriptor en cuestin (relacin de jerarqua)
TE
Trmino especfico que hace referencia al trmino que se incluye dentro del trmino en cuestin (relacin de jerarqua)
TR
Trmino relacionado que hace referencia al trmino que tiene relacin con el descriptor que nos ocupa, pero
que no pertenece al mismo grupo del descriptor analizado (relacin de asociacin)
16
CC-BY-NC-ND PID_00143963
Los tesauros
Ejemplo
Bebidas espirituosas
DOM Industrias
NA Se consideran bebidas espirituosas aquellas bebidas, exceptuando
los vinos tradicionales y la cerveza, con contenido alcohlico
procedentes de la destilacin de materias primas agrcolas.
UP Licores y aguardientes
TC Industria alimentaria
TG Industria vincola
TE Brandy
Ginebra
Ron
Vodka
Whisky
TR Alcoholismo
En cuanto a las otras lenguas, a continuacin se presenta una tabla con las
equivalencias de las notaciones:
Descriptor
Castellano
Ingls
Cataln
No es obligatorio
No es obligatorio
No es obligatorio
NA
SC
NA/NE
UP/USE
UF/USE
EP/EM
TC
TC
TT
TC
TG
TG
BT
TA
TE
TE
NT
TE
TR
TR
RT
TR
DOM
NA
UP/USE
CC-BY-NC-ND PID_00143963
17
Ejemplo
Ponemos en negrita los trminos empleados al tratar la representacin alfabtica:
Industrias
Industria alimentaria
Industria crnica
Industria conservera
Alimentos congelados
Industria del aceite
Aceite de girasol
Aceite de oliva
Industria vincola
Bebidas alcohlicas
Bebidas espirituosas
Brandy
Ginebra
Ron
Vodka
Whisky
Licores y aguardientes
Cava
Vino
Los tesauros
CC-BY-NC-ND PID_00143963
18
Ejemplo
Figura 1. Ejemplo de estructura arborescente
2)Diagramadeflechas
En esta presentacin cada campo semntico aparece por separado y tiene una
forma de presentacin rectangular:
Los tesauros
CC-BY-NC-ND PID_00143963
19
Los tesauros
CC-BY-NC-ND PID_00143963
20
2)ndicesKWOC
En los ndices KWOC (key word out context), los descriptores se enumeran poniendo todas las palabras importantes en orden alfabtico, seguidas por el
nombre entero del descriptor.
Ejemplo de ndice KWOC
3)ndicesKWAC
El ndice KWAC (key word and context) es una mezcla del KWIC y el KWOC.
Los tesauros
CC-BY-NC-ND PID_00143963
21
Los tesauros
CC-BY-NC-ND PID_00143963
22
Subdivisin del conjunto de los dominios que se van a cubrir en una serie
de microdisciplinas.
Transformacin del vocabulario libre en un lenguaje controlado, estableciendo las relaciones de pertenencia, de equivalencia semntica, de jerarqua, y redactando las notas explicativas.
1)Recoleccindelostrminos
Los tesauros
CC-BY-NC-ND PID_00143963
23
Esta fase consiste en buscar y registrar todas las palabras y expresiones significativas que intervienen en la disciplina o disciplinas cubiertas por el tesauro.
Pueden utilizarse algunas fuentesterminolgicasalternativas o complementarias:
Tesauros ajenos al servicio de documentacin, pero dedicados a los mismos dominios o a dominios prximos, descubiertos gracias a alguno de
los repertorios de tesauro disponibles en el mercado. Un tesauro ya existente resulta til porque aporta una coleccin organizada de conceptos de
la que se podr extraer lo que convenga, pero rara vez se adoptar en su
totalidad para organizar el propio patrimonio informativo. En Internet se
pueden localizar multitud de tesauros disponibles para su consulta.
Indizacin intelectual, en lenguaje natural, por medio de descriptores libres, de una muestra de varios cientos de documentos representativos para
cada uno de los grandes dominios que va a cubrir el tesauro. Se obtiene de
esta manera un inventario no ordenado de la terminologa efectivamente
utilizada por los autores para designar los conceptos que ellos manejan
habitualmente, puede que en varias lenguas, si se trata de una muestra
multilinge para crear un tesauro multilinge.
Los tesauros
CC-BY-NC-ND PID_00143963
24
2)Creacindeloscampossemnticosomicrodisciplinas
Con todo el conjunto de trminos recogidos durante la fase anterior podemos establecer un listado provisional de microsdisciplinas que completarn el
cuerpo del tesauro.
La listadelasmicrodisciplinas tiene como nica finalidad preparar un sistema de agrupacin de los descriptores que sea aceptable para el usuario y cmodo de consultar. De esta forma la lista as dispuesta ser utilizada directamente durante la siguiente etapa y se revisar continuamente a lo largo de
todo el proceso de construccin del tesauro.
3)Reduccinaunlenguajedocumental
En esta fase se establecen las relaciones entre los descriptores definidos y se
introducen las notas aclaratorias precisas:
a)Relacionesdepertenencia: lo primero que debemos conseguir es la distribucin de todos los trminos del lenguaje natural recopilados durante la
primera fase en las diferentes microdisciplinas que hemos establecido en la
segunda. De esta manera, todos los trminos quedan adscritos de forma provisional a un campo semntico o una microdisciplina.
b)Relacionesdeequivalencia: una vez que tenemos todos los descriptores
distribuidos entre las diferentes microdisciplinas, debemos examinarlas una
por una con el fin de establecer entre sus conceptos el listado de trminos
sinnimos o cuasi-sinnimos. De esta manera, empezamos a seleccionar los
trminos que pasarn a ser descriptores y los que sern no descriptores, y que
tendremos que enlazar por medio de una relacin de equivalencia semntica.
Los criterios para elegir el trmino descriptor entre sus sinnimos se deben
fundamentar en la seleccin del menos ambiguo o del ms utilizado en la profesin o por los usuarios del sistema documental. Probablemente, deberemos
consultar obras terminolgicas para asegurar la correccin de la ortografa de
estas palabras.
c)Notasexplicativas: si el trmino seleccionado como descriptor todava puede provocar alguna ambigedad dentro del tesauro, tendremos que redactar
la nota explicativa correspondiente (de definicin, histrica o de aplicacin).
d)Relacionesjerrquicas: el paso siguiente consiste en establecer las cadenas
jerrquicas entre descriptores genricos y especficos dentro de cada campo
semntico o microdisciplina.
Los tesauros
CC-BY-NC-ND PID_00143963
25
Descriptores y no descriptores.
6)Elaboracindelborradordeltesauro
La elaboracin de todo el proceso anterior dar lugar a una edicin piloto o
experimental del tesauro. Se debe procurar hacer, por lo menos, una presentacin alfabtica y otra jerrquica.
Esta edicin, o edicin 0, est destinada a la formacin de los indizadores o
analistas y a la prueba de funcionamiento del tesauro.
El ejercicio dura varios das y consiste en:
Los tesauros
CC-BY-NC-ND PID_00143963
26
Se dialoga sobre los puntos de vista adoptados por cada indizador, con el
fin de hacer que progresivamente coincidan.
Se calcula la tasa de coherencia (ratio entre el nmero de descriptores comunes y el nmero total de descriptores distintos utilizados por dos personas o dos grupos para indizar el mismo documento); al principio del
ejercicio la tasa ser escasa (entre el 20 y el 30 % segn van Slype), pero al
terminar la formacin tender hacia su valor ideal (entre el 50 y el 80 %).
7)Testdeltesauro
El test del tesauro tiene como finalidad la identificacin y resolucin de los
problemas que presenta el tesauro como herramienta para la indizacin de
un sistema documental determinado. Todas las anomalas detectadas por los
indizadores durante la indizacin de una muestra significativa de documentos
se sealan en un informe en forma de propuestas para:
Los tesauros
CC-BY-NC-ND PID_00143963
27
Las caractersticas del tesauro: lenguas, nmero de descriptores, de no descriptores, de microdisciplinas, de trminos especficos, de trminos relacionados, etc.
Una vez redactado el prefacio con esta informacin, podemos iniciar la impresin o edicin del tesauro.
4.2. Utilizacin de un tesauro
El tesauro es una herramienta viva y dinmica que se nutre de nuevos descriptores, gracias a la indizacin de nuevos documentos y a los cambios cualitativos que el mismo proceso de construccin genera. Por consiguiente, el
mantenimiento y la actualizacin peridica del tesauro se convierten en una
necesidad.
Se debe actualizar peridicamente, tanto para corregir errores y omisiones como para adaptarlo a la evolucin cientfica de la disciplina que abarca. El proceso de control debe seguir los siguientes pasos:
1)Controldelafrecuenciadeusodelosdescriptores
Para llevar esto a cabo, se debe confeccionar peridicamente un listado de los
descriptores con el nmero de ocurrencias, es decir, la cantidad de veces que
han sido utilizados en la indizacin de los documentos.
La elaboracin de estos listados, normalmente facilitada por el software de gestin documental, permite detectar:
Los tesauros
CC-BY-NC-ND PID_00143963
28
Descriptores que se han utilizado muy poco, lo que indica que el descriptor
es problemtico.
2)Deteccindeausenciadedescriptores
Con el uso del tesauro en el proceso de indizacin se pueden detectar nuevos
trminos que aparecen en los documentos, pero que no estn incluidos en el
tesauro.
Generalmente, la mayora de los sistemas documentales, especialmente las bases de datos documentales, ya han previsto esta incidencia con la inclusin de
un campo denominado descriptores candidatos en la base de datos. Todos los
conceptos que no estn en el tesauro se incluyen en este campo.
Peridicamente, los responsables del tesauro elaboran un listado de estos descriptores candidatos y estudian su posible inclusin en el tesauro.
3)Problemasdeusodeltesauro
Con el uso del tesauro tambin se empiezan a detectar diferentes problemticas:
Los tesauros
Descriptores poco
utilizados
Esto puede suceder, por ejemplo, porque el descriptor es
demasiado especfico, no se
entiende su significado, etc.
Descriptores demasiado
utilizados
Esto puede suceder porque el
descriptor es demasiado genrico y en consecuencia hay
que crear descriptores ms especficos, etc.
CC-BY-NC-ND PID_00143963
29
Los tesauros
CC-BY-NC-ND PID_00143963
30
Si slo se han requerido en muy pocas ocasiones, no sera necesario incluirlos ya que podemos utilizar el descriptor ms genrico. Otra solucin
es incluirlos como no descriptores.
Si la peticin de los descriptores es frecuente, podemos incluirlos, estableciendo previamente las correspondientes relaciones de pertenencia, jerarqua, equivalencia y asociacin.
Los tesauros
CC-BY-NC-ND PID_00143963
31
Las prestaciones de dichos sistemas son variadas en funcin del software que
se utilice, pero en lneas generales su utilizacin permite:
a) Incluir trminos y registrar automticamente las relaciones invertidas con
otros trminos del tesauro.
b) Editar diferentes presentaciones del tesauro (alfabticas, sistemticas, ndices permutados) y seleccionar el tipo de relacin que queremos visualizar en
el listado (con trminos relacionados, notas explicativas, trminos genricos,
etc. o sin ellos).
c) Utilizarse directamente en la consulta. Si el software forma parte del sistema
de gestin de la base de datos documental, puede permitir la seleccin de los
trminos desde el tesauro, la ejecucin inmediata de la bsqueda y la recuperacin de los documentos pertinentes.
d) Contar con prestaciones para los administradores del tesauro como las siguientes:
Posibilidad de mantener un fichero histrico donde se reflejen las modificaciones y los cambios que se hacen en los diferentes descriptores.
Elaboracin automtica de estadsticas (de frecuencia de uso de los descriptores, del nmero de relaciones existentes en el tesauro, etc.).
Los tesauros
CC-BY-NC-ND PID_00143963
32
1) Los ms simples estn asociados a un sistema de gestin documental concreto. Aunque contienen las prestaciones bsicas para la gestin de tesauros,
presentan tambin carencias en cuanto a la identificacin correcta de las relaciones entre los descriptores.
2) Los ms complejos son programas especficos de gestin de tesauros. Incorporan funcionalidades diversas, como la de validar automticamente los trminos y las relaciones entre ellos, lo cual ahorra tiempo en la verificacin de
dichas relaciones y evita cometer errores.
Ejemplos de software de gestin de tesauros
Recomendamos consultar la bibliografa, pero por poner algn ejemplo podemos sealar
los siguientes segn usemos el idioma ingls o el espaol:
TemaTres (en espaol): es una aplicacin web para la gestin de lenguajes documentales. Se encuentra orientada especialmente al desarrollo de tesauros jerrquicos, pero tambin puede utilizarse para desarrollar estructuras de navegacin web, o como
complemento de un gestor de contenidos en bibliotecas digitales o en una biblioteca
tradicional.
Los tesauros
CC-BY-NC-ND PID_00143963
33
Los tesauros
Desarrollo de una estructura hipertextual donde se establezcan hipervnculos entre todos los elementos estructurales (descriptores, no descriptores, notas de alcance, etc.), y tambin entre las distintas partes del tesauro.
Potencia el desarrollo de tesauros multilinges y multidisciplinares fomentando la cooperacin internacional, y, por lo tanto, impulsando la reutilizacin e interoperabilidad de recursos.
Enlace de inters
Recomendamos visitar la pgina de Willpower, empresa
de consultora independiente especializada en todos los
temas relacionados con la
gestin de la informacin y
que proporciona exhaustiva
y abundante informacin relativa a la construccin, gestin, mantenimiento y utilizacin de tesauros, as como multitud de referencias a
tesauros de todo el mundo,
normativa, instituciones y
gestin de tesauros.
CC-BY-NC-ND PID_00143963
34
6. Tesauros y ontologas
En relacin con el proceso sealado en el apartado anterior, relativo a la creciente digitalizacin del mbito de la representacin y recuperacin de informacin segn Arano (2005), son varias las herramientas que han sido objeto
de estudio, al igual que lo han sido los campos de conocimiento donde estas
herramientas se han originado: la lingstica, la inteligencia artificial, la documentacin, la ingeniera lingstica, etc.
En relacin con nuestro objeto de estudio, esto es, la representacin y recuperacin de informacin, estas herramientas son, entre otras, las siguientes:
Sistemas de clasificacin.
Listas de encabezamiento.
Bases de conocimiento.
Taxonomas.
Tesauros.
Mapas conceptuales.
Ontologas.
Redes semnticas.
Dentro de este amplio espectro de herramientas de representacin y recuperacin de informacin, son los tesauros y las ontologas los que con mayor
frecuencia son objeto de vinculacin en la bibliografa aunque provengan de
mbitos disciplinarios distintos.
6.1. Los tesauros
Como ya hemos visto anteriormente, un tesauro es un tipo de lenguaje documental que representa la estructuracin conceptual de un determinado campo
del conocimiento y se convierte en una herramienta de control terminolgico, puesto que la estructuracin del tesauro se basa en conceptos.
Los conceptos son representados por trminos seleccionados que evidencian
ese control terminolgico, ya que con dicho control se busca mejorar la precisin de la indizacin y recuperacin de la informacin, ambas funciones bsicas de los tesauros.
Los tesauros
CC-BY-NC-ND PID_00143963
35
Los tesauros
CC-BY-NC-ND PID_00143963
36
c) Funciones. Son un tipo concreto de relacin donde se identifica un elemento mediante el clculo de una funcin que considera varios elementos de
la ontologa. Por ejemplo, pueden aparecer funciones como categorizar-clase,
asignar-fecha, etc.
d)Instancias. Se utilizan para representar objetos determinados de un concepto.
e)Axiomas. Son teoremas que se declaran sobre relaciones que deben cumplir
los elementos de la ontologa. Por ejemplo: Si A y B son de la clase C, entonces
A no es subclase de B.
Las caractersticas ms representativas de las ontologas son las siguientes:
Podemosidentificarnivelesdeabstraccindelasontologas. Estos niveles de generalizacin o abstraccin nos dan una tipologa de ontologas.
La idea es caracterizar una red de ontologas usando multiplicidad y abstraccin, y puesto que no podemos aspirar a tener una descripcin completa del mundo, podemos pensar en una estrategia de construccin gradual de abajo arriba.
Definir clases en la ontologa, esto es, los conceptos y sus relaciones (clases,
subclases).
Los tesauros
CC-BY-NC-ND PID_00143963
37
Se engloban dentro de los lenguajes controlados, ya que utilizan el vocabulario de un dominio especfico a partir de un nmero de trminos bsicos y de las relaciones que se establecen entre los mencionados trminos.
Los tesauros
CC-BY-NC-ND PID_00143963
38
Estn relacionados con la terminologa empleada para representar los conceptos de un dominio especfico.
Ambos utilizan jerarquas para agrupar trminos en categoras y subcategoras y pueden utilizarse para catalogar y organizar recursos de informacin.
b)Diferencias
Si bien los tesauros estn destinados a ser usados por humanos, las ontologas pueden ser usadas por humanos para compartir conocimiento y por
agentes de software para procesarlo.
En los tesauros, la descripcin de los conceptos es limitada y no formalizada, mientras que en las ontologas es explcita y formalizada.
Los tesauros
CC-BY-NC-ND PID_00143963
39
Bibliografa
Bibliografa bsica
Aitchison, J.; Gilchrist, A.; Bawden, D. (2000). Thesaurus construction and use: a practical
manual (4.a ed.). Chicago: Fitzroy Dearborn.
Arano, S. (2005). Los tesauros y las ontologas en la Biblioteconoma y la Documentacin.
Hipertext.net (nm. 3, 2005). [Consultado en septiembre de 2009.]
Chaumier, J. (1986). Anlisis y lenguajes documentales: el tratamiento lingstico de la informacin documental. Barcelona: Mitre (Ciencias de la Comunicacin).
Craven, T. C. (1997). Introductory tutorial on thesaurus construction. Londres (Ontario, Canada). University of Western Ontario (actualitzado en 2008). [Consultado en septiembre de
2009.]
Currs, E. (1998). Ontologas, taxonoma y tesauros: manual de construccin y uso. Gijn: Ediciones Trea.
Garca Jimnez, A. (2004). Instrumentos de representacin del conocimiento: tesauros
versus ontologas. Anales de documentacin (nm. 7, 2004, pg. 79-95).
Gruber, T. R. (1993). A Translation Approach to Portable Ontology Specifications. Knowledge Acquisition (5(2), pg. 199-220). [Consultado en septiembre de 2009.]
Hurtado, D; Sequeda, J. (2006). Propuesta del Uso de Ontologas para la Bsqueda de
Semntica en Laboratorios de Investigacin y Desarrollo: OLID.
NISO Z39.19-2005. Guidelines for the Construction, Format, and Management of Monolingual
Controlled Vocabularies.
NISO Z39.19-2003. Guidelines for the Construction, Format, and Management of Monolingual
Thesauri.
Lancaster, F. W. (1995). El control del vocabulario en la recuperacin de la informacin.
Educacin. Materiales (nm. 12). Valencia: Universidad de Valencia.
Lozano Tello, A. (2000). Ontologas en la Web semntica. I.s Jornadas de Ingeniera
Web'01. [Consultado en septiembre de 2009.]
Mulholland, P. (1999). Introduction to Ontologies. Knowledge Media Institute, The Open
University (Walton Hall) Milton Keynes, UK
Slype, G. van (1991). Los lenguajes de indizacin. Concepcin, construccin y utilizacin en los
sistemas documentales. Madrid: Pirmide / Fundacin Snchez Ruiprez (Biblioteca del Libro).
Toms Lpez, M. (2004). Diseo de un tesauro conceptual de folklore de la Regin de
Murcia. Scire (vol. 10, nm. 1, pg. 65-76).
UNE-50-106 (ISO 2788-1986). Documentacin: Directrices para el establecimiento y desarrollo
de tesauros monolinges (1990). Asociacin Espaola de Normalizacin y Certificacin (AENOR).
UNE-50-125 (ISO 5964-1985). Documentacin: Directrices para la creacin y desarrollo de tesaurus multilinges (1997). Asociacin Espaola de Normalizacin y Certificacin (AENOR).
Willpower Information (1999). Thesaurus principles and practice. [Consultado en septiembre de 2009.]
Recopilacin de enlaces a recursos de informacin sobre tesauros en lnea
American Society of Indexers. Thesauri online. Wheat Ridge [Colorado]: American Society of Indexers. [Consultado en septiembre de 2009.]
Arano, S; Codina, L. (2004). La estructura conceptual de los tesauros en el entorno digital: nuevas esperanzas para viejos problemas?. 9.s Jornadas Catalanas de informacin y
Documentacin. Barcelona 24-26 Nov 2004. [Consultado en septiembre de 2009.]
Los tesauros
CC-BY-NC-ND PID_00143963
40
Centre for Digital Library Research. BUBL Link/5:15 Thesauri / BUBL Information Service. Glasgow: University of Strathclyde. [Consultado en septiembre de 2009.]
CINDOC. Tesauros y Glosarios IEDCYT en lnea. Madrid: Centro de Informacin y Documentacin Cientfica. [Consultado en septiembre de 2009.]
Koch, T. Controlled vocabularies, thesauri and classification systems available in the WWW.
Lund: Lund University. [Consultado en septiembre de 2009.]
Library of Congress Thesauri. Washington: Library of Congress. [Consultado en septiembre de 2009.]
McKiernan, G. (2001). Controlled vocabularies: Beyond bookmarks: schemes for organizing the web. Ames: Iowa State University. [Consultado en septiembre de 2009.]
Middleton, M. Thesaurus online sites. Controlled vocabularies: resource guide. Brisbane:
School of Information Systems, QUT. [Consultado en septiembre de 2009.]
Recopilacin de enlaces a recursos sobre software de gestin de tesauros
Jessica Milstead. Thesaurus management software. Wheat Ridge: American Society of
Indexers. [Consultado en septiembre de 2009.]
Michael Middleton. Thesaurus management software: Controlled vocabularies: resource
guide. Brisbane: School of Information Systems. [Consultado en septiembre de 2009.]
Willpower Information. Software for building and editing thesauri. [Consultado en
septiembre de 2009.]
Recopilacin de enlaces a recursos de informacin generales sobre ontologas
a) Pginas web
Ontologas (Juan Carlos Cmara, 2002) . Learning Metadata Standards. [Consultado en septiembre de 2009.]
Ontology (Tom Gruber). [Consultado en septiembre de 2009.]
Semanticweb. [Consultado en septiembre de 2009.]
Sites Relevant to Ontologies and Knowledge Sharing (Richard Fikes). [Consultado en septiembre de 2009.]
Gua Breve de la Web Semntica (Consorcio World Wide Web, W3C). [Consultado en septiembre de 2009.]
b) Artculos
Arano, Silvia (2005). Los tesauros y las ontologas en la Biblioteconoma y la Documentacin. Hipertext.net (nm. 3, 2005). [Consultado en septiembre de 2009.]
Arano, Silvia; Codina, Llus (2004). La estructura conceptual de los tesauros en el entorno digital: nuevas esperanzas para viejos problemas?. 9.s Jornadas Catalanas de Informacin y Documentacin. Barcelona 24-26, nov. 2004. [Consultado en septiembre de 2009.]
Caldera-Serrano, J.; Sanchez-Jimnez, R. (2008). Ontologa para el control y recuperacin de informacin onomstica en televisin. El Profesional de la Informacin (vol. 17,
nm. 1, enero-diciembre, pg. 86-91)
Garca Jimnez, A. (2004). Instrumentos de representacin del conocimiento: tesauros
versus ontologas. Anales de documentacin (nm. 7, 2004, pg. 79-95).
Hurtado Bustamante, D. P.; Sequeda Sanclemente, J. F. (2006). Propuesta del Uso
de Ontologas para la Bsqueda Semntica en Laboratorios de Investigacin y Desarrollo:
OLID. [Consultado en septiembre de 2009.]
Legg, C. (2007). Ontologies on the Semantic Web. Annual Review of Information Science
and Technology (vol. 41, nm. 1, 2007).
Lozano Tello, A. (2000). Ontologas en la Web semntica. I.s Jornadas de Ingeniera
Web'01. [Consultat a setembre de 2009.]
Los tesauros
CC-BY-NC-ND PID_00143963
41
Pedraza Jimnez, R.; Codina, L.; Rovira, C. (2007). Web semntica y ontologas en el
procesamiento de la informacin documental. El Profesional de la Informacin (vol. 16, nm.
6, noviembre-diciembre, pg. 569-578).
Sanchez Jimnez, R.; Gil-Urdiciain, B. (2007). Lenguajes Documentales y ontologas.
El Profesional de la Informacin (vol. 16, nm. 6, noviembre-diciembre, pg. 551-560).
Reiss, M.; Moal, M.; Barnard, Y.; Ramu, J. P.; Froger, A. (2006). Using Ontologies
to Conceptualize the Aeronautical Domain. A: Proceedings of the International Conference on
Human-Coputer Interaction in Aeronautics (pg. 56-63).
Los tesauros
Listado de
descriptores
libres y listado de
palabras clave
Manela Junc Campdepadrs
PID_00144350
CC-BY-NC-ND PID_00144350
Los textos e imgenes publicados en esta obra estn sujetos excepto que se indique lo contrario a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 Espaa de Creative Commons. Podis copiarlos,
distribuirlos y transmitirlos pblicamente siempre que citis el autor y la fuente (FUOC. Fundacin para la Universitat
Oberta de Catalunya), no hagis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es
CC-BY-NC-ND PID_00144350
ndice
Introduccin...............................................................................................
Objetivos.......................................................................................................
1.
2.
2.1.
Tipologa ......................................................................................
2.2.
10
2.2.1.
11
2.2.2.
Indizacin ......................................................................
11
2.2.3.
14
15
17
3.1.
17
3.1.1.
18
3.1.2.
2.3.
3.
19
3.2.
30
3.3.
31
Actividades..................................................................................................
35
Glosario........................................................................................................
37
Bibliografa.................................................................................................
39
CC-BY-NC-ND PID_00144350
Introduccin
Ved
Lenguaje libre
Descriptor libre
Palabra clave
Palabra vaca
Clculo de frecuencia
Frecuencia inversa
Discriminacin
Anlisis morfolgico
Anlisis sintctico
Anlisis semntico
CC-BY-NC-ND PID_00144350
Objetivos
Con el estudio de los materiales asociados a este mdulo alcanzaris los objetivos siguientes:
CC-BY-NC-ND PID_00144350
Este ltimo mdulo est dedicado a los dos lenguajes documentales libres: los
listados de descriptores libres y los listados de palabras clave.
Baratos: los gastos de construccin son mnimos. Los elabora una persona
o un programa informtico.
Rpidos: tanto en la construccin, que es inmediata, como en la actualizacin de su vocabulario, que se va incorporando al listado a medida que
va ingresando en el fondo documental.
Fcilesdeusar: no necesitan conocimientos previos sobre lenguajes documentales, control de vocabulario, o precoordinacin, entre otros.
(1)
CC-BY-NC-ND PID_00144350
CC-BY-NC-ND PID_00144350
Estos trminos son escogidos por el analista, sin verificar si existen ni cmo
se introducen en una lista previamente establecida. Por lo tanto, no es un
lenguaje controlado, sino libre, y por eso recibe este nombre.
2.1. Tipologa
Las listas de descriptores libres son un lenguaje documental que tiene las ca-
Ved tambin
ractersticas siguientes:
1) Se trata de un tipo de lenguajeanaltico (frente a los sintticos). En el proceso de indizacin se identifican los conceptos que conforman el contenido
del documento y se representan mediante una serie de descriptores. Por esta
razn, su aplicacin est ligada a la existencia de sistemas automatizados que
permiten la recuperacin de la informacin mediante la combinacin de estos
descriptores.
Ejemplo
Ponemos como ejemplo el resumen siguiente:
DalmauRibalta,A. (2002). Los ctaros. Editorial UOC (Biblioteca Lectus Universitaria).
El catarismo es un movimiento cristiano disidente de la Baja Edad Media. Se extendi
por diversos puntos de Europa, con una incidencia especial en el Languedoc. Esta obra
da a conocer qu fue exactamente el catarismo y su trayectoria.
La obra Los ctaros procura distinguir la llamada Iglesia de Dios de toda una literatura esotrica y legendaria que la ha deformado de manera significativa y que, al mismo tiempo,
se aleja de una concepcin historiogrfica tradicional, ya superada, que la consideraba
como una simple prolongacin del antiguo maniquesmo.
A lo largo de esta obra se explica en qu consista la liturgia, los ritos y la doctrina religiosa
de esta Iglesia, considerada hertica y perseguida por la Iglesia catlica. Resumid su trgica
historia con hechos tan relevantes como la llamada cruzada albigense y el nacimiento de
la Inquisicin.
El analista indiza ms de un trmino2:
Baja Edad Media
ctaros
cristianismo
disidencia religiosa
Europa
liturgia
Languedoc
(2)
En contraposicin al LEMAC,
que es un lenguaje sinttico y sera
un nico trmino:
LEMAC: Ctars-Histria
10
CC-BY-NC-ND PID_00144350
(3)
3
3) Se trata de un lenguajelibre porque est formado por trminos de indizacin extrados del lenguaje natural y que se utilizan o se sugieren en el mismo
documento. El listado de descriptores resultante est constituido por una coleccin no ordenada de conceptos (slo por orden alfabtico). Estos conceptos
estn expresados por palabras o expresiones extradas de los documentos, o
propuestos por los mismos documentalistas, sin verificar si estn en una lista
establecida a priori (es tambin, por lo tanto, un lenguaje construido a posteriori).
4) Se trata de un tipo de lenguajepostcoordinado, ya que permite la coordinacin de conceptos en el momento de la recuperacin y la utilizacin de un
gran nmero de trminos de indizacin o puntos de acceso. La combinacin
precisa de estos diferentes descriptores, en la recuperacin, se tiene que remitir
al documento buscado.
5) Se trata de un tipo de lenguajedeestructuracombinatoriaoasociativa,
en el que los conceptos o descriptores se organizan de una manera independiente y slo se produce la combinacin o interseccin en las operaciones de
indizacin y recuperacin. Por lo tanto, se trata de un lenguaje en el que los
trminos que lo componen se organizan en una lista por orden alfabtico sin
respetar ningn otro tipo de estructura que site cada descriptor en una cadena lgica, jerrquica o estructurada de conceptos.
Ejemplo
En este caso, el indizador hace:
Ctars AND Europa
CC-BY-NC-ND PID_00144350
11
El procesodecreacin de una lista de descriptores libres es muy sencillo: el analista va leyendo los documentos que tiene que indizar y va
tomando nota de los trminos que son interesantes segn su parecer.
Los va anotando y los clasifica en orden alfabtico. Les da un mnimo
de forma y procura eliminar duplicidades de nmero y gnero (singular-plural, masculino-femenino), usa una nica lengua y elimina algunos sinnimos.
Los descriptores libres tienen un gasto de construccin casi nulo. Son inmediatos, permiten un vocabulario actualizado, y se adaptan a la realidad del SID.
En algunos casos el listado de descriptores libres suele ser el primer paso en la
tarea de crear un lenguaje documental. Los analistas empiezan por redactar un
listado de descriptores libres con la intencin de controlarlo y avanzar hacia
un lenguaje documental realmente controlado. Si el analista quiere ejercer un
poco de control sobre sus descriptores, sin llegar a trabajar con un vocabulario por completo controlado, como seran las listas de encabezamientos o los
tesauros, tiene que tomar algunas medidas, como por ejemplo:
Sustantivo + adjetivo.
2.2.2. Indizacin
El analista lee el documento, determina la materia del documento y acto seguido propone un descriptor. Representndolo verbalmente, el analista dira
este documento trata de tal tema. No consulta ninguna lista, no comprueba
si el trmino que piensa est aceptado o no, no tiene que seguir las reglas de
combinacin de ningn lenguaje; tiene libertad total a la hora de indizar.
Ved tambin
Las medidas de control de vocabulario detalladas en el apartado dedicado a las listas de
encabezamientos de materia
del mdulo Listas de encabezamientos de materia y listas
de autoridades son adecuadas tambin en este caso.
12
CC-BY-NC-ND PID_00144350
Analista B
catarismo
herejas
rdenes monsticas
religin
Analista C
albigenses
cismas
historia medieval
Languedoc
Un segundo aspecto que hay que destacar es el grado de exhaustividad. Recordemos que el grado de exhaustividad puede ser alto, medio o bajo y que afecta
a los lenguajes postcoordinados como ste, en el que el analista puede escoger
el nmero de trminos para representar un documento.
De esta manera, con una lista de descriptores libres podemos indizar el libro
de los ctaros con tres grados diferentes:
Exhaustividad
profunda o alta
Baja Edad Media
catarismo
ctaros
ctaros, historia
cristianismo
cruzada albigense
disidencia religiosa
doctrina religiosa
Iglesia de Dios
Europa
Inquisicin
liturgia
Languedoc
ritos religiosos
Exhaustividad
genrica o baja
Baja Edad Media
ctaros
Languedoc
CC-BY-NC-ND PID_00144350
13
No necesita traduccin de los conceptos del lenguaje natural de los documentos a un lenguaje artificial.
Ejemplo
Si en el texto de los ctaros que estamos usando como ejemplo se hablaba de literatura
esotrica y legendaria, el analista puede indizar leyendas o literaturaesotrica sin comprobar la forma en ninguna lista, si es aceptado o no, si se prefiere la forma singular/plural, si se puede adjetivar o no, si tiene relaciones semnticas que ayuden a la indizacin.
No hace falta una formacin previa de los analistas. Precisamente la ausencia de reglas y principios hace innecesaria la formacin.
Por el marco temporal: Baja Edad Media, Edad Media, historia medieval.
Algunos analistas optan por indizar el trmino tal y como aparece en el documento (por
ejemplo, Languedoc) y otros realizan la accin de escoger trminos que creen que tienen
ms posibilidades de ser recuperados (por ejemplo, Francia).
CC-BY-NC-ND PID_00144350
14
(4)
http://www.flickr.com/
a los recursos web. Mathes (2004) habla de metadatos generados por el usuario.
Pueden indizar fotografas4, webs5, blogs6 y compartir sus descriptores para colaborar en la indizacin de todo tipo de contenidos en el espacio web compar-
(5)
http://delicious.com/
http://www.mister-wong.es/users/
500000111/
(6)
http://technorati.com/
puede indizar wiki, otro enciclopedia, otro obra de referencia, por ejemplo.
Lectura complementaria
Si queris ampliar la informacin sobre los metadatos generados por el usuario, podis consultar la pgina web
de Adam Mathes:
Folksonomies
CC-BY-NC-ND PID_00144350
15
el usuario. Algunos autores proponen alfabetizar al usuario dndole instrucciones para indizar, pero se duda de su eficacia, ya que una de las razones del
xito del tagging es la libertad que da al indizador internauta.
2.3. Listado de descriptores libres en la recuperacin
a) Las ventajas que tienen los listados de descriptores libres en la recuperacin
son las siguientes:
CC-BY-NC-ND PID_00144350
16
mente ms genrico como puede ser lenguaje documental. En un lenguaje controlado, esta
vinculacin se hara evidente (con siglas del tipo TG o TA) y ayudara a la recuperacin.
Las soluciones a estos inconvenientes pasan por recopilar toda la lista que seamos capaces de elaborar sobre el concepto: trminos genricos y especficos,
polismicos, sinnimos, siglas, variantes idiomticas, cambios de gnero y nmero. Las estrategias de bsqueda suelen ser complejas.
CC-BY-NC-ND PID_00144350
17
El listadodepalabrasclave es un vocabulario ordenado alfabticamente de los trminos con carga significativa extrados de un documento
mediante un programa informtico.
Una lista de palabras clave est constituida por una coleccin dispuesta en
orden alfabtico de las palabras significativas, llamadas tambin no vacas (es
decir, todas las palabras que no son artculos, conjunciones, pronombres, preposiciones, numerales y ciertos verbos y adverbios), extradas de una manera
automtica por el ordenador a partir del ttulo, del resumen y cada vez ms
a menudo del texto completo de los documentos (van Slype). Acostumbran
a ser listas monolinges.
Los listados de palabras clave tienen la misma tipologa que los listados de
descriptores libres. Los dos lenguajes son:
analticos,
naturales,
libres,
postcoordinados,
de estructura combinatoria.
Las diferencias entre ellos, que son diferencias grandes, residen en que:
Los listados de descriptores libres indizan conceptos y los listados de palabras clave indizan en su mayora unitrminos.
La indizacinautomtica es el mtodo por el que un ordenador aplica un algoritmo (o programa) al ttulo, resumen o texto completo del
documento para identificar los trminos que puedan representar la materia y ser usados como trminos de indizacin y recuperacin en un
ndice o lista.
Lectura complementaria
Si queris ampliar vuestro conocimiento sobre la informacin dada por van Slype, podis leer la obra siguiente.
G.vanSlype (1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin
en los sistemas documentales
(pg. 23). Madrid: Pirmide /
Fundacin Germn Snchez
Ruiprez (Biblioteca del Libro).
CC-BY-NC-ND PID_00144350
18
(7)
Lectura complementaria
Para ampliar la informacin
sobre la indizacin automtica, podis leer la obra siguiente:
E.Mndez;J.A.Moreiro
(1999). Lenguaje natural e
indizacin automatizada.
Ciencias de la Informacin
(pg. 11-24).
Morfologa: trabaja en el mbito de la palabra. Asigna la categora gramatical de las palabras y la raz comn (o lema). Recordemos que las categoras gramaticales son sustantivo, verbo, adjetivo, adverbio, entre otras, y
que morfolgicamente pueden ser de diversos gneros, nmeros, tiempo
y modo. La lematizacin permite contar todas las veces que un concepto
aparece en el texto aunque se exprese con formas diferentes.
3) La estadstica tiene diversas aplicaciones en documentacin, pero en indizacin automtica interviene especialmente en el clculo de la frecuencia
relativa de las palabras en un texto. Esta tcnica calcula cuntas veces aparece
una palabra en un texto y en funcin de unos baremos (ni las palabras ms
Ejemplo de
desambiguacin
Por ejemplo, columna en un
texto de arquitectura o columna en un texto de periodismo.
19
CC-BY-NC-ND PID_00144350
repetidas, ni las menos) se seleccionan las palabras clave del documento. Los
tericos de este mtodo son G. K. Zipf (1949), H. P. Luhn (1957), Sparck Jones
(1972) y G. Salton (1989).
Trataremos con ms detalle estos procesos en el prximo subapartado.
3.1.2. Funcionamiento y evolucin de los programas de
indizacin automtica
Los primeros estudios en indizacin automtica datan de las dcadas de 19501960. Se basaban en principios estadsticos y probabilsticos. En la dcada de
1970, G. Salton incorpora el modelo de valor de discriminacin y de relevancia de los trminos. En la dcada de 1980 aparecen los criterios lingsticos y
en la de 1990 se plantea la indizacin automtica de informacin multimedia
(imgenes y sonido). Desde la dcada de 1980 hasta la actualidad, los programas de indizacin automtica combinan el clculo estadstico con el etiquetado morfolgico y el anlisis sintctico.
Evolucin de los programas de indizacin automtica
1950-1960
Clculos estadsticos y probabilsticos
1970
1980
1980-actualidad
Modelo mixto: estadstico + lingstico
Los programas informticos de indizacin automtica buscan emular el proceso mental humano. La cuestin central que nos interesa es cmo pueden
detectar las palabras con ms carga semntica, con ms significado del texto?.
Con este objetivo, suelen seguir los siguiente pasos:
1)Lecturadelosdocumentos
El primer paso es leer el texto. Para hacerlo el documento se debe encontrar
en formato electrnico. Actualmente, muchos documentos ya se encuentran
en soporte electrnico. Tambin son fcilmente accesibles los ttulos, resmenes, sumarios o bien el texto completo en las bases de datos de publicaciones
peridicas y catlogos bibliogrficos. Si se trata de documentacin en soporte
papel, primero hay que escanearla y aplicar un programa de tipo OCR (reconocimiento ptico de caracteres) para transformar la imagen de la pgina escaneada en texto electrnico.
Cmo puede un programa detectar una palabra? El programa detecta la palabra porque la considera una cadena de caracteres entre espacio en blanco y
espacio en blanco.
2)Diseo
El equipo de documentalistas y programadores debe decidir:
Programas OCR
Estos programas OCR estn
implementados en la mayora
de escneres domsticos. Recomendamos hacer la prueba
de escanear una pgina y convertirla en texto.
CC-BY-NC-ND PID_00144350
20
Las partes del documento que sern indizables. Son obligatorios el ttulo
y el resumen y es deseable el texto entero, sobre todo en artculos.
El tratamiento que darn a las cifras, los signos de puntuacin, los guiones,
las maysculas/minsculas y los acentos. Habitualmente son caracteres
que no aportan significado, pero en determinados contextos pueden ser
determinantes.
Las palabrasvacas son palabras sin significado, como los artculos, los
pronombres, las preposiciones, las conjunciones o los adverbios, que
son filtradas antes o despus del procesamiento del texto.
Las palabras vacas son muy frecuentes pero aportan poco valor de contenido
semntico al texto y poca ayuda a la recuperacin, ya que el usuario no las
utiliza en la bsqueda y tampoco son recogidas en el fichero inverso de la base
de datos. Se conocen como listas de detencin en castellano y como stop word
list en ingls (Hans Peter Luhn fue el creador del trmino y del concepto stop
word).
Se elabora una lista de estas palabras vacas y se introducen en el programa,
que va leyendo el texto palabra por palabra y las contrasta con el fichero de
palabras vacas. Si el programa las encuentra en la lista, es que son vacas y no
las indiza. Si no aparecen en la lista, es que tienen significado.
Palabras vacas
Artculos
Pronombres
mo, nuestro
Verbos
Adverbios
tranquilamente, eficazmente
Preposiciones
Ejemplo
Hay veces que estos caracteres
s tienen importancia:
Cifras: TV3, 1492.
Puntos, guiones, signos:
www.uoc.edu, Canal+, email.
Acentos (tiles para diferenciar diacrticos): deu/Du
en cataln, te/t en castellano.
CC-BY-NC-ND PID_00144350
Numerales
cuarto, octavo
Adjetivos
Conjunciones
21
Ejemplo
La lista de palabras vacas se
puede evitar, por ejemplo, para recuperar un concepto como el diario El Pas, en el que
el artculo tiene un papel importante.
22
CC-BY-NC-ND PID_00144350
Ejemplo
En un texto de historia los nmeros (como 1914, 1936), los numerales (Jaime I) y los
adjetivos pueden tener mucha carga significativa (Alta y Baja Edad Media; sobrenombres
adjetivados de personajes como Jaime I el Conquistador y acontecimientos como la guerra fra). En el ejemplo siguiente, las palabras subrayadas son palabras vacas:
Palabras castellanas que son vacas o que no dependen del mbito temtico
Palabra
En el texto
Economa
Derecho
Educacin
ESO
"Eso es lo importante..."
"La reforma de la ESO"
ESO
ESO
ESO
ESO
Cabo
cabo
cabo
cabo
cabo (geografa)
Tuya
tuya
tuya
tuya
tuya (rbol)
Fuente: extracto de I. Gil Leiva (2008). Manual de indizacin. Teora y prctica (pg. 333). Gijn: Trea.
Multidisciplinario
23
CC-BY-NC-ND PID_00144350
Ejemplo
Supongamos el texto Osiris es el primero de todos los humanos y dioses que vive una
segunda vez.
Descompongamos ahora el texto como lo hara un programa de indizacin automtica.
Partimos del supuesto de que el programa tiene una lista de palabras vacas predeterminada que incluye preposiciones, conjunciones, numerales, verbos y artculos.
Texto
Resultado de
la indizacin
Osiris
no est
es un nombre propio
es
el
es un artculo
primero
es un numeral
de
es una preposicin
todos
los
es un artculo
humanos
no est
es un sustantivo
es una conjuncin
dioses
no est
es un sustantivo
que
es una conjuncin
vive
una
es un artculo
segunda
es un numeral
vez
no est
es un sustantivo
Osiris
humanos
dioses
vez
24
CC-BY-NC-ND PID_00144350
13,97
grand
674,68
aller
234,58
laisse
120,97
ami
95,16
les
avec
3.019,71
16.011,00
neutre
11,52
0,03
collge
24,42
permutable
comit
73,71
pour
5.332,48
tre
1.986,23
translateur
0,06
got
98,77
vitamines
3,84
CC-BY-NC-ND PID_00144350
25
Luhn aplica esta tcnica para eliminar las palabras vacas. A partir de l, todos
los sistemas utilizan esta tcnica para crear la lista de palabras vacas.
b)Frecuenciainversa: Sparck Jones (1972) puso de manifiesto la capacidad
de discriminacin de un trmino frente a otro. Esta discriminacin tiene que
ser vista en el conjunto de la coleccin, no en un solo documento. Hay que
comparar las palabras clave entre los documentos del fondo para detectar cules son realmente discriminatorias.
26
CC-BY-NC-ND PID_00144350
Ejemplo
Lectura recomendada
FranciscoJavierMartnez
Mndez. Recuperacin de informacin en la red.
Eliminemos las palabras vacas el, los, a, al, del, de, los, ms, no y todas las formas del verbo
visitar (visitad, visitar). Nos queda:
Doc.
Museo
Picasso
Barcelona
Barrio
Borne
Figueras
Juguete
Famosos
Dal
Siguiendo el ejemplo, la palabra museo que aparece en cada documento no tiene mucha
utilidad para discriminar el documento 1 del resto, en cambio Picasso, Barcelona y todas
las palabras que aparecen poco seran discriminatorias. Para medir este valor de discriminacin se propone la frecuencia inversa. El peso de una palabra aumenta si aparece pocas
veces en un documento y disminuye si aparece a menudo en el resto de documentos.
Pesos de cada palabra
Museo
Borne
0,602
Picasso
0,301
Juguete
0,602
Figueras
0,301
Famosos
0,602
Barcelona
0,602
Dal
0,602
Barrio
0,602
CC-BY-NC-ND PID_00144350
27
Palabra: morfologa.
Asigna la categora gramatical de cada una de las palabras del texto (como
nombre comn, verbo, adjetivo, adverbio o artculo), segn cul sea el
gnero, el nmero, el tiempo y el modo. Con ello se reduce el abanico de
palabras susceptibles de contener informacin, ya que detecta las palabras
vacas y las flexiones derivadas de los accidentes gramaticales (como el
gnero y el nmero). En la red hay aplicaciones gratuitas que analizan
morfolgicamente un texto; los ejemplos ms comunes son Daedalus en
castellano o Thera en castellano y cataln.
Lectura complementaria
Si queris ampliar la informacin sobre el sistema de indizacin ideado por Salton, podis leer la obra siguiente:
I.GilLeiva;J.V,Rodrguez
Muoz (1996). Tendencias
en los sistemas de indizacin
automtica. Estudio evolutivo. Revista Espaola de Documentacin Cientfica (vol. 19,
n. 3, pg. 273-291).
28
CC-BY-NC-ND PID_00144350
Ejemplo
Analizaremos un texto sobre fertilidad con Daedalus:
Con lematizador
frtil: tres resultados
CC-BY-NC-ND PID_00144350
29
El anlisis sintctico es til para los polismicos o alguna palabra que por su
similitud podra ser considerada vaca por el programa.
Ejemplo
Analizamos la frase: Esta nota para maana8, en la que morfolgicamente cada palabra
tiene diversas opciones, pero que el anlisis sintctico puede aclarar. Por ejemplo, nota
puede ser un nombre comn femenino (la nota escrita) o una forma verbal (3. persona
del singular del presente de indicativo o 2. persona del singular del imperativo del verbo
notar), pero dentro de la frase, por su posicin, slo puede ser considerada como nombre
comn y, en consecuencia, sera una palabra que habra que indizar, no una palabra vaca.
Sin embargo, cabe decir que actualmente no todos los analizadores sintcticos pueden
llegar a estas prestaciones y cometen errores.
(8)
CC-BY-NC-ND PID_00144350
30
tesauros y ontologas.
Para la indizacin automtica son muy interesantes las bases de datos del tipo
WordNet, que dan informacin lxica y semntica de los trminos. Un algoritmo vinculado a la WordNet puede resolver casos de sinonimia o hiperonimia, ya que la base de datos proporciona relaciones bsicas de significado.
WordNet y Euro WordNet son bases de datos multilinges en diversos idiomas
(Euro WordNet comprende el neerlands, el italiano, el castellano, el alemn,
el francs, el checo y el estonio). Cada idioma disea su WordNet pero mantiene la misma estructura que la inicial de Princeton en cuanto a los trminos
sinnimos con relaciones semnticas de relacin de equivalencia entre ellos.
Las diferentes WordNet estn conectadas entre ellas y proporcionan acceso a
una ontologa compartida. En acceso gratuito slo se encuentra la Wordnet
de Princeton.
Los tesauros participan en el anlisis semntico en que aportan las relaciones
semnticas de equivalencia, jerarqua y asociacin de cada palabra clave seleccionada. Las ontologas aportan, adems, el detalle en cada tipo de relacin.
Un ejemplo es todo tipo de relaciones de asociacin entre dos descriptores.
3.2. El listado de palabras clave en la indizacin
El programa de indizacin automtica reconoce palabras, para ser ms exactos,
cadenas de caracteres entre un espacio y el siguiente. Por lo tanto, reconoce
palabras, no expresiones formadas por ms de una palabra. Decimos, pues,
que el listado de palabras clave indiza unitrminos.
Las ventajas que tienen las listas de palabras clave en la indizacin son las
siguientes:
Coherencia de indizacin exacta entre diversos SID. Dos SID con el mismo
programa indizador llegarn al mismo resultado.
Indizacin exhaustiva y tan especfica como lo sea el contenido del documento indizado.
Riqueza terminolgica extraordinaria: evolucin automtica de la terminologa, paralela a la misma evolucin del conocimiento y de la ciencia.
Unitrmino
Recordemos que los unitrminos son el elemento con significado ms pequeo de un trmino de indizacin. Lluvia es
un unitrmino. Lluvia de estrellas podra ser un descriptor de
un tesauro formado por dos
unitrminos: lluvia y estrellas.
CC-BY-NC-ND PID_00144350
31
Uno de los inconvenientes que tienen las listas de palabras clave en la indizacin es que las palabras con significado se indizarn tal como salgan en el
texto. Por lo tanto, puede indizar:
El mismo trmino en diferentes idiomas, por ejemplo: fuentes de informacin, fonts dinformaci, information resources, en funcin de la lengua del
texto. Y no tiene relaciones de equivalencia entre los trminos, como tienen los tesauros multilinges.
Las bsquedas pueden ser muy precisas (todos los trminos significativos
estn presentes).
CC-BY-NC-ND PID_00144350
32
La inmediatez: el documento llega y, en cuestin de segundos, est indizado y disponible para la bsqueda.
Prdida de conceptos. Como el programa indiza unitrminos, los conceptos expresados de una manera compuesta se separan en dos unidades y
pierden el sentido.
No permite la univocidad.
Ejemplo de prdida de
conceptos
Universidad de Barcelona, por
ejemplo, se separa en universidad y Barcelona. Separar conceptos puede dar lugar a coordinacin falsa en la recuperacin como en este caso, en
el que recuperamos todas las
universidades de la ciudad de
Barcelona: UB (Universidad de
Barcelona), UPF (Universidad
Pompeu Fabra), URL (Universidad Ramon Llull), entre otras.
No aparece ningn tipo de control sobre variantes ortogrficas, sobre plurales, adjetivos, verbos, siglas, entre otros, ni se ejerce ningn control sobre los errores ortogrficos o de impresin que pueden aparecer en los documentos.
Ejemplo de estrategia de
bsqueda
Para buscar documentos sobre
la Unin Europea, por ejemplo, habra que pensar en todos sus sinnimos y siglas como UE / Unin Europea / European Union / CEE / Comunidad
Econmica Europea.
CC-BY-NC-ND PID_00144350
33
35
CC-BY-NC-ND PID_00144350
Actividades
Listadodedescriptoreslibres
1. Indizad con un listado de descriptores libres el resumen siguiente con los tres grados de
exhaustividad.
Lpez Alonso, C.; Sr, A. (eds.) (2003). Nuevos gneros discursivos: los textos electrnicos.
Madrid: Biblioteca Nueva.
Esta obra describe la transformacin de determinados discursos sociales ante la revolucin
de las nuevas tecnologas de la informacin y de la comunicacin (TIC). En efecto, Internet
forma parte de nuestra vida diaria y ya no es fcil prescindir de este medio tecnolgico. Esta
obra, que consta de tres partes, analiza estos nuevos gneros discursivos:
En la primera parte, se describen los distintos textos electrnicos el correo, los chats, los
foros y otros escritos en la red, como prensa, newsletters, E-zinc, etc.
En la segunda, se introduce al lector en la gnesis y evolucin de los lenguajes informticos
y sus diferentes tipos, especialmente los lenguajes de marcado y los modelos hipermedia.
La tercera, finalmente, se centra en los nuevos productos hipertextuales en el campo del
discurso de transmisin de conocimientos con muy variadas utilizaciones: la enseanza a
distancia o textos de consulta como los diccionarios.
2. Indizad el resumen anterior para dos bases de datos diferentes: una genrica y la otra
especializada en documentacin.
3. Analizad detenidamente el ejemplo de los tres analistas que indizan el documento sobre
los ctaros y decid por qu motivos son tan diversos los resultados.
Analista A
Baja Edad Media
ctaros
Francia
movimientos cristianos disidentes
Analista B
catarismo
herejas
rdenes monsticas
religin
Analista C
albigense
cismas
historia medieval
Languedoc
4. Elaborad una lista con las operaciones que hay que llevar a cabo sobre el lxico para transformar una lista de descriptores libres en un lenguaje controlado no codificado.
Listadodepalabrasclave
1. Indizad el texto siguiente simulando el funcionamiento de una lista de palabras clave:
Piero de Benedetto dei Franceschi (Sansepolcro, Toscana, 1416-1492) fue un pintor del quattrocento italiano conocido por su alias Piero della Francesca. Tambin fue gemetra y matemtico.
Es uno de los personajes principales y fundamentales del Renacimiento. Piero della Francesca
es un personaje itinerante: es una figura que encontraremos en Ferrara entre 1447 y 1448
trabajando con Lionello dEste; en Rimini para Sigismundo Malatesta en torno al 1450; en
Roma para el papa Po II entre 1458 y 1459, y en Urbino para Federico de Montefeltro en
diversas ocasiones. Su actitud itinerante se suele comparar con la de Leon Batista Alberti. El
autor nace en Borgo San Sepolcro (al norte de Florencia, en la zona de la Umbra) en 1416.
El autor proviene de una familia de mercaderes y, por eso, saba aritmtica, clculo, lgebra,
geometra y contar con el baco. Despus de la formacin que tuvo para llevar el negocio
familiar se form con un maestro local que se llamaba Antonio di Anghiari para ser pintor. En
aquellos momentos, haba muchos estilos: todava estaba vigente el linealismo y el lirismo de
Fra Angelizo, Panozzo Gonzolo o Filippo Lipi y, por otra parte, estaba el realismo geomtrico
de Paolo Uccelo.
Tiene un estilo pictrico muy particular y, por lo tanto, es fcil de identificar. Utiliza una luz
muy diurna y unos colores muy brillantes, que le provienen de su contacto con Domenico
de Venezziano. En su obra siempre est presente el peso de la geometra, que implica, por
una parte, utilizar la perspectiva lineal y, por la otra parte, reducir las figuras a la esencia. Las
figuras de Piero della Francesca son muy estticas, poco nerviosas, lo que va al revs que en el
resto de pinturas renacentistas de Florencia, que a medida que avanzamos en el tiempo cada
vez son ms dinmicas. Tambin vemos que sus figuras son poco expresivas y monolticas.
Longhi, cuando habla de Piero, dice que sus figuras son columnes.
"Piero della Francesca", Wikipedia
CC-BY-NC-ND PID_00144350
36
a) Disead las opciones del programa que simularis (partes del texto, signos y smbolos).
b) Cuntas palabras vacas habis localizado?
c) Qu inconvenientes plantear en la recuperacin?
CC-BY-NC-ND PID_00144350
37
Glosario
anlisis morfolgico m Rama de la gramtica tradicional que estudia la forma de las
palabras, independientemente de sus relaciones o funciones dentro de la frase. La forma de
las palabras se distribuye en diversas categoras llamadas partes de la oracin, que son, entre
otros, nombres, adjetivos y verbos. Tambin estudia las variaciones que pueden experimentar
por motivos de los accidentes gramaticales como el gnero, el nmero, la declinacin o la
conjugacin.
anlisis semntico m Rama de la lingstica que estudia el significado de las palabras. Su
utilidad reside en desambiguar sinnimos, polismicos y vincular anforas con el trmino
al que hacen referencia.
anlisis sintctico m Estudio de la funcin o de las asociaciones de las palabras dentro
de la frase, lo que se llama estructura sintctica. Identifica los componentes de la frase: sujeto,
predicado, complementos u objetos y su concordancia. El programa de anlisis sintctico
toma la frase e intenta hacer evidente la estructura con la que se ha construido dentro de un
conjunto de anlisis posibles conocidos como gramtica.
automatic indexing f Ved indizacin automtica.
clasificacin social f Ved indizacin social.
coordinacin falsa f Recuperacin inesperada (y errnea) que a pesar de contener los
elementos de la bsqueda corresponden a temas diferentes.
descriptor libre m Trmino de indizacin propio del lenguaje documental. Lista de descriptores libres.
etiquetaje colaborativo m Ved indizacin social.
etiquetaje social m Ved indizacin social.
folksonoma f Neologismo (Thomas van der Wal) resultado de la fusin de folk (gente,
popular) y taxonoma (gestin de la clasificacin), lo que da como resultado una indizacin
gestionada popularmente.
sin. indizacin social.
frecuencia de aparicin f Ley de Zipf. El psiclogo y psicolingista estadounidense George Kingsley Zipf (1949) propuso que el nmero de veces que un trmino aparece en un texto
(frecuencia) y la posicin que ocupa en una lista de palabras ms o menos frecuentes (rango)
es constante. Para Zipf los escritores usan un abanico reducido de palabras, preferentemente
cortas y su longitud es inversamente proporcional a la frecuencia.
frecuencia inversa f Sparck Jones (1972) puso de manifiesto la capacidad de discriminacin de un trmino frente a otro. Esta discriminacin tiene que ser vista en el conjunto de
la coleccin, no en un solo documento. Hay que comparar las palabras clave entre los documentos del fondo para detectar cules son realmente discriminatorias.
indizacin automtica f Mtodo por el que un ordenador aplica un algoritmo (o programa) al ttulo, resumen o texto completo del documento con el fin de identificar los trminos que puedan representar la materia y usar como trminos de indizacin y recuperacin
en un ndice o lista.
en automatic indexing.
indizacin social f Tipo de indizacin en red en el que los internautas asignan etiquetas
con descriptores a los recursos web. La asignacin de las etiquetas se hace sin nimo de lucro,
no se busca un beneficio econmico sino beneficiarse de bsquedas mejores. Los descriptores
escogidos no se supervisan ni tienen ninguna estructura semntica.
sin. clasificacin social, etiquetado colaborativo, etiquetado social, folksonoma
en tagging.
lematizacin f Localizacin de la raz comn de un grupo de palabras.
en stemming.
listado de descriptores libres f Lenguaje documental. Vocabulario monolinge de trminos de indizacin ordenados alfabticamente. Estos trminos son escogidos por el analista, sin verificar si existen o cmo se introducen en una lista previamente establecida.
CC-BY-NC-ND PID_00144350
38
listado de palabras clave f Lenguaje documental. Vocabulario ordenado alfabticamente de los trminos con carga significativa extrados de un documento mediante un programa
informtico.
machine-aided indexing m Ved mtodo de indizacin semiautomtica.
mtodo de indizacin semiautomtica m El programa selecciona posibles descriptores
procedentes de un tesauro o de una lista controlada y un documentalista acepta o deniega
la propuesta.
en machine-aided indexing.
mtodo estadstico m Primera aproximacin a la indizacin automtica. Calcula el peso
(ponderacin) de las palabras: ni las palabras ms repetidas (por vacas) ni las menos repetidas
(por especficas) son adecuadas para ser seleccionadas. Los mtodos estadsticos aplicados
son de tres tipos: frecuencia, frecuencia inversa y discriminacin. Se pueden usar solos o en
combinacin.
mtodo lingstico m Mtodo que permite analizar el texto en tres niveles de profundidad: palabra (anlisis morfolgico), frase (anlisis sintctico) y texto (anlisis semntico).
OCR m Ved reconocimiento ptico de caracteres.
palabra vaca f Palabra sin significado como, por ejemplo, artculos, pronombres, preposiciones o conjunciones, que es filtrada antes o despus del procesamiento del texto. Son
palabras muy frecuentes pero que aportan poco valor de contenido semntico al texto y
tambin poca ayuda en la recuperacin, ya que el usuario no las utiliza en la bsqueda y
tampoco son recogidas en el fichero inverso de la base de datos.
sin. lista de detencin
en stop word list.
palabra clave f Trmino de indizacin propio del lenguaje documental. Lista de palabras
clave.
reconocimiento ptico de caracteres m Programa que transforma la imagen de la pgina escaneada en texto electrnico (de la expresin inglesa optical character recognition, OCR).
stemming m Ved lematizacin.
stop word list f Ved palabra vaca.
tagging m Ved indizacin social.
valor de discriminacin del trmino m Mtodo estadstico aplicado a la indizacin
automtica, desarrollado por Salton (1985). La medida de los cambios en la separacin espacial que se manifiesta cuando una palabra cualquiera es asignada en una coleccin como
trmino de indizacin para representar mejor las diferencias que pueda haber entre los documentos. La asignacin reduce la densidad espacial y, por el contrario, un discriminador
pobre incrementa la densidad espacial. De este modo, si primero se calculan las densidades
espaciales y se atribuyen a cada trmino, es posible especificar los trminos en orden decreciente segn sus valores de discriminacin.
CC-BY-NC-ND PID_00144350
39
Bibliografa
Alonso Berrocal, J. L.; Figuerola, C. G.; Zazo Rodrguez, A. (2009). Recuperacin avanzada de la informacin. Salamanca. [Fecha de consulta: 31 de julio de 2009].
Cid, P.; Cuadrado, M.; Aguiriano, C. (1999). Fonaments de llenguatges documentals [documento electrnico]. Barcelona: UOC.
Gil Leiva, I. (2008). Manual de indizacin. Teora y prctica. Gijn: Trea.
Gil Leiva, I.; Rodrguez Muoz, J. V. (1996). Tendencias en los sistemas de indizacin
automtica. Estudio evolutivo. Revista Espaola de Documentacin Cientfica (vol. 19, n. 3,
pg. 273-291).
Hassan Montero, Y. (2006). Indizacin social y recuperacin de informacin. No Solo
Usabilidad (n. 5). ISSN 1886-8592.
Mndez, E.; Moreiro, J. A. (1999). Lenguaje natural e indizacin automatizada. Ciencias
de la Informacin (pg. 11-24).
Quintarelli, E. (2005). Folksonomies: power to the people. ISKO Italy-UniMIB meeting:
Miln. [Fecha de consulta: 31 de julio de 2009].
Salton, G. (1988). Automatic text processing: the transformation, analysis, and retrieval of information by computer. Reading: Addison-Wesley.
Slype, G. van (1991). Los lenguajes de indizacin: concepcin, construccin y utilizacin en los
sistemas documentales. Madrid: Pirmide / Fundacin Germn Snchez Ruiprez (Biblioteca
del Libro).
Pginas web interesantes
Cibermetra
Cybermetrics. Recursos presentados por el departamento de CINDOC dentro del Consejo
Superior de Investigaciones Cientficas; artculos, seminarios, etc.
Blog spot. Acceso a algunos artculos sobre cibermetra.
Cybermetrics. Software disponible relativo a la cibermetra.
Webometrics and organizations. Enlaces hacia publicaciones y grupos de trabajo sobre cibermetra.
Applications of informetrics to information retrieval research. Artculo que relaciona la cibermetra con la recuperacin de informacin.
The diameter of the world wide web. Artculo sobre la medicin de la web realizada por los
autores.
Inteligencia artificial
World Scientific: Connecting great minds. Vnculos a varias publicaciones peridicas sobre
campos especializados como inteligencia artificial o sistemas neuronales.
AI international. Vnculos a entidades investigadoras sobre el tema como universidades y
laboratorios, as como vnculos a congresos que versen sobre el mismo como la AAAI o las
PRICAI.
Otras pginas web de inters
The Open Archives Initiative.
GOOGLE-WATCH. Pgina crtica sobre el sistema de recuperacin de Google (el aparente uso
comercial del orden de la recuperacin).
RDF: modelo de metadatos flexible. Pgina sobre metadatos, con recursos web relacionados.
DUBLINCORE: Metadata Initiative (DCMI). Iniciativa de metadatos para pginas web, conversin de formatos... Proyectos, software, grupos de trabajo.
CC-BY-NC-ND PID_00144350
40
Pew Internet & american life. Web dependiente del Pew Research Center, con acceso a publicaciones de actualidad sobre internet.
z39.50 International Standard Maintenance Agency. Pgina sobre el mantenimiento de este
protocolo de bsqueda e intercambio de informacin.