2) Herramientas de Recuperación. J.T y W

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 33

[Texto interpretado al español de Joudrey, D. N. ; Taylor, A. G. & Wisser, K. M. (2018).

Organization of information. (4th ed.). Santa Barbara, CA.: Libraries Unlimited. 3.


Retrieval Tools, por el Prof. Gerardo Salta, para su uso en el dictado de clases en la
Carrera de Biblioteología, ISET Nº 18 “20 de Junio”, Rosario]

Herramientas de recuperación
Este capítulo discute las herramientas de recuperación (retrieval tools), las
que constituyen bloques básicos en la organización de la información
registrada. Dichas herramientas de recuperación conllevan las siguientes
preguntas: ¿por qué se necesitan herramientas de recuperación?¿cuáles son
las herramientas de recuperación básicas, sus formatos y sus funciones?

La necesidad de las herramientas de recuperación


Las herramientas de recuperación son sistemas creados para recuperar
información. Se diseñan para ayudar a los usuarios a encontrar, identificar,
seleccionar, obtener y explorar recursos de información de todo tipo. Asisten a
los usuarios recuperando directamente información (por ej., a través de la
búsqueda en la Web) o a través de documentos relevantes que son parte de
colecciones organizadas (por ej., una búsqueda en el catálogo). Para este
escrito, las herramientas de recuperación, generalmente, contienen registros
que actual como sustitutos de los recursos. Cada registro sustituto (surrogate
record) – también llamado descripción o metadatos (metadata) – brinda
suficiente información – autor, título y fecha de creación – para servir como una
representación acotada y facilitar el acceso a un recurso de información
individual dentro de una colección (por ej., un DVD en una biblioteca).
Sin embargo, los registros sustitutos pueden no ser la única vía para
recuperar información. En la medida que las tecnologías de la Web Semántica
avanzan, el énfasis sobre el registro sustituto como unidad de descripción
puede menguar. En su lugar, puede ponerse mayor énfasis en la creación de
enunciados de metadatos individuales, que están vinculados separadamente al
recurso como una forma de identificación y descripción. No obstante, en este
momento, el registro sustituto permanece como la unidad principal de
descripción en la mayoría de los ambientes de información, y por esto,
constituye el foco de este capítulo. Los registros sustitutos se ordenan y
recuperan por puntos de acceso. Un punto de acceso puede ser un nombre, un
título o un término temático elegido por un indizador o por un catalogador. En
los sistemas en línea, un punto de acceso puede ser cualquier palabra en un
registro que pueda ser buscada por palabra clave (keyword) – es decir, que
esta palabra no sea una palabra vacía (stopword).
Las herramientas de recuperación son esenciales como pilares básicos de
los sistemas que organizan la mayor parte de la información registrada
existente. El sueño de brindar acceso a toda la información registrada existió
desde 1892, cuando Otlet y La Fontaine organizaron una conferencia para
crear el Control Bibliográfico Universal (Universal Bibliographic Control) – en
adelante CBU. Ambos autores querían crear un archivo centralizado que
incluyera, particularmente, registros bibliográficos de artículos de todas las

1
revistas científicas del mundo. La magnitud de la tarea conllevó que tuvieran
que desarrollarse nuevas técnicas, diferentes de las practicas bibliotecarias
convencionales. La evolución del CBU en el siglo XX conllevó que cada país
sea responsable de la creación de registros bibliográficos de sus recursos de
información y que los comparta con otros países. El concepto también se
extendió al control de autoridad de los encabezamientos de nombres y títulos
usados como puntos de acceso. La IFLA (International Federation of Library
Associations and Institutions) a través de uno de sus programas combinó los
ideales del CBU con el concepto de elaborar registros legibles por ordenador.
Las muchas herramientas de recuperación que se han desarrollado como
resultado del sueño de Otlet y La Fontaine nos han acercado mucho más al
CBU.

Las herramientas de recuperación básicas,


sus formatos y funciones
Las herramientas de recuperación básicas discutidas en este capítulo son:
las bibliografías, los catálogos, los índices, los instrumentos de localización
(finding aids), los registros (registers), motores de búsqueda (search engines).
Las bases de datos y las redes bibliográficas tienen diferentes roles internos
en las herramientas de recuperación. Estas se discuten en el próximo capítulo,
que tratan los tópicos de sistemas y diseño de sistemas.

Bibliografías
LISTAS Básicamente, son listas de recursos de información. Son esenciales para
académicos y aquellos profesionales involucrados con libros y otras fuentes de
información. La bibliografía reúne una lista de fuentes basados en un tema, un
autor, un período de tiempo, etc. Algunas de ellas incluyen anotaciones como
reseñas breves que indican el tema y/o comentan la utilidad del recurso de
información.
La bibliografía suele estar adicionada a las obras académicas y consiste de
la lista de los recursos de información que consultó el autor de la obra, las que
también pueden presentarse como entidades completamente separadas – es
decir, como obras escindidas. Cada recurso de información representado en
una bibliografía, tiene una descripción corta (que no debe confundirse ni con
una anotación ni con un resumen). La descripción típica incluye autor, título,
edición, editorial, lugar de publicación y fecha de publicación. En el caso de
partes de una obra, como el artículo de una revista o el capítulo de un libro,
incluye autor, título, nombre de la obra, volumen – si es aplicable – fecha de
publicación y número de páginas. Algunas citas también incluyen
características físicas.
En una bibliografía, cada descripción suele aparecer en un solo lugar de la
lista, frecuentemente bajo el autor de la obra – el primero de ellos, si son más
de uno. Generalmente, esta herramienta provee solo un punto de acceso. En
las bibliografías que se ordenan solo por autor, los demás atributos como el
título, el tema, etc., no constituyen puntos de acceso (i.e., los usuarios que solo
conocen el título, el nombre de un segundo o de un último creador, o el tema de

2
una obra, no estará fácilmente disponible para recuperar acerca de él dese la
bibliografía). Las descripciones se construyen acorde a varios estilos de cita.
Ejemplos de manuales de estilo y un ejemplo de cita de cada uno de ellos se
proveen debajo:

con estas ● APA (American Psychological Association)


vamos a
Mitchell, T. R., & Larson, J. R., Jr. (1987). People in organizations: An
trabajar
en la introduction to organizational behavior (3rd ed.). New York:
materia McGraw-Hill.

● Chicago Manual of Style


Mitchell, Terence R., and James R. Larson, Jr. People in Organizations:
An Introduction to Organizational Behavior. 3rd ed. New York:
McGraw-Hill, 1987.

● MLA (Modern Language Association) 3


Mitchell, Terence R., and James R. Larson, Jr. People in Organizations:
An Introduction to Organizational Behavior. 3rd ed. New York:
McGraw-Hill, 1987. Print.

● Science (Scientific Style and Format)


Mitchell TR, Larson JR, Jr. People in organizations: an introduction to
organizational behavior. 3rd ed. New York (NY): McGraw-Hill; 1987.

● Turabian
Mitchell, Terence R., and James R. Larson, Jr. People in Organizations:
An Introduction to Organizational Behavior. 3rd ed. New York:
McGraw-Hill, 1987.

● Style Manual (U.S. Government Style Manual)6


Mitchell, Terence R., and James R. Larson, Jr. People in Organizations:
An Introduction to Organizational Behavior. 3rd ed. (New York:
McGraw-Hill, 1987).

Cada bibliografía cuenta con un foco u ordenamiento particular, siendo los


más comunes por:

Foco Propósito
Tema Reunir juntos recursos acerca de un tema particular.
Creador Reunir todas o algunas obras de un creador particular y,
algunas veces, incluir fuentes acerca del creador.
Lengua Reunir recursos textuales en los que el texto está en una
o más lenguas particulares.
Periodo Reunir todos los recursos que salen a la luz en un
temporal período de tiempo particular
Lugar Reunir recursos creados en una ubicación particular. Esta
podría ser una ubicación de envergadura, como un
continente, o una mas pequeña, como un país, región,
estado, ciudad o comunidad. Puede ser también una

3
institución, como una bibliografía de todas las obras de
una facultad de una universidad particular.
Editorial Reunir todos los productos de una editorial particular
Forma Reunir recursos de información que aparecen en un
cierto formato o género (por ej., videocasete, recursos
electrónicos, poesía, biografías). Estos siempre se
combinan virtualmente con uno de los otros focos.

Suele ocurrir que dos o más de estos ordenamientos se combinen en una


bibliografía. Por ejemplo, lengua, tema y período temporal.
Un localizador (pathfinder) – también llamado explorador, pionero o guía –
es un tipo especial de bibliografía en bibliotecas que constituye una verdadera
herramienta de recuperación. Los localizadores son bibliografías con una
función especial en las bibliotecas. Mientras la mayoría de las bibliografías no
indican donde esta ubicado un ítem, los localizadores se focalizan en recursos
disponibles en una configuración definida para un usuario que desea proseguir
investigaciones en un área temática determinada. Además de la lista de
recursos relevantes, el localizador también puede incluir instrucciones
específicas sobre como buscar en el catálogo local, en las bases de datos
accesibles localmente y en recursos de referencia específicos relacionados a
un área temática específica. Por ejemplo, puede incluir una lista de
encabezamientos de materia relacionados al tópico que pueden utilizarse en el
catálogo. Los bibliotecarios de referencia han creado localizadores durante
décadas. Los localizadores originales fueron documentos impresos disponibles
solamente en la biblioteca, aunque ahora estas guías se encuentran
principalmente en el sitio Web de la biblioteca. En años recientes, han sido
desarrollados productos de software para la creación y la gestión de guías de
investigación de la biblioteca. Estos van en un rango de productos de software
propietarios (como LibGuides) a software de código abierto (como Subject
Plus). Otra opción reside en adaptar otras herramientas Web, como wikis o
blogs, para cumplir con el propósito de manera más económica y de fácil
implementación.

este apartado es importante Catálogos


16pags.
Los catálogos proveen acceso a los ítems individuales de las colecciones de
recursos de información – por ejemplo, entidades físicas como libros,
videocasetes, y CD en una biblioteca; obras de un artista en un museo de arte;
páginas Web en Internet; etc. Cada recurso de información se representa por
una descripción que es, en algún sentido, más extensa que un asiento de
bibliografía. En tal sentido, la descripción comporta la asignación de uno o más
puntos de acceso. Un punto de acceso puede ser cualquier palabra en un
registro, cuando la búsqueda es por palabras clave; sin embargo, el término
punto de acceso se aplica usualmente a un nombre, título o tema que se
presenta en el registro, de manera escindida respecto a la descripción. Un
punto de acceso se construye en un cierto orden – por ejemplo, el apellido
seguido del nombre(s) – y se mantiene por medio del control de autoridad. El
control de autoridad es el proceso de reunir todas las formas variantes que se
aplican a un nombre particular, todas las formas variantes del título que se
aplican a una única obra, y las relaciones que se establecen entre todos los

4
sinónimos, los términos relacionados, los términos genéricos y los términos
específicos que se aplican a un encabezamiento de materia particular.
Las descripciones en un catálogo se elaboran de acuerdo a un estándar
seleccionado por cada comunidad particular – por ejemplo, en bibliotecas se
utiliza RDA (Recursos, Descripción y Acceso; en inglés Resource Description
and Access) y las Reglas de Catalogación Anglo Americanas, 2a. ed. (AACR2);
en archivos se utiliza DACS (Describing Archives: A Content Standard); CCO
(Cataloging Cultural Objects) para algunas colecciones de arte.

Propósitos del catálogo

Los catálogos han servido tradicionalmente a dos grupos de usuarios. Un


grupo es aquel constituido por los empleados de la institución, los que
necesitan recuperar recursos de información o necesitan recuperar información
acerca de dichos recursos – es decir, metadatos. Por ejemplo, el catálogo es
utilizado por los bibliotecarios encargados de desarrollar la colección de la
biblioteca en el proceso de descubrir lo que la biblioteca ya posee o no, como
paso previo para seleccionar nuevos materiales. Otros usos se dan en los
museos, cuando sus empleados buscan objetos para conformar una exhibición.
El uso más comúnmente comprendido de un catálogo es aquel llevado a
cabo por los usuarios que llevan en préstamo los libros o los consultan en las
salas de la biblioteca. Si dichos usuarios tienen una obra conocida en mente,
pueden buscar en el catálogo dicha obra por su autor o su título – búsqueda
que se denomina “de ítem conocido”. Los usuarios también pueden tratar de
buscar por palabra clave, si lo único que recuerdan son ciertas palabras del
título o cualquier otro atributo. Si los usuarios saben que necesitan las obras de
un determinado autor, buscan bajo el nombre de dicho autor. Si los usuarios no
conocen una obra particular, pero buscan sobre algún tópico particular, lo
hacen a través de encabezamientos de materia o por palabra clave por tema, o
por una búsqueda general por palabra clave. En los catálogos en línea, la
búsqueda por palabra clave es frecuentemente apropiada para ayudar a las
personas a encontrar un registro que se parece o corresponde al tópico
solicitado por el usuario. Una vez que el registro potencialmente útil es
encontrado, el usuario puede identificar en dicho registro un encabezamiento
de materia controlado o autorizado o una notación clasificatoria para el tópico
buscado. En usuario puede buscar por dicho encabezamiento o notación
temática en el catálogo – frecuentemente, a través de un clic del mouse sobre
el encabezamiento o la notación resaltada. Alternativamente, el usuario puede
a través de la notación clasificatoria ir al estante de la biblioteca para
determinar si existen obras pertinentes que se relacionen con aquella
identificada.
A través de los años se han realizado muchos intentos para determinar los
propósitos del catálogo. Charles Cutter presentó sus “objetivos” del catálogo en
su obra Rules for a Printed Dictionary Catalog, en 1876. Los objetivos de Cutter
se listan en la Figura 3.1. Si el lenguaje de los objetivos fuera actualizado, ellos
deberían referir actualmente entre otras cosas, a recursos, no solo a libros. El
primer objetivo, la función de encontrar (finding function), expresa que un
catálogo debería ayudar al usuario a recuperar un recurso si uno de sus puntos
de acceso clave son concidos y si son parte de la colección. El segundo
objetivo, la función de reunión (gathering function), establece que un catálogo

5
debería ser capaz de visualizar todos los recursos en la colección por creador,
sobre una temática específica o en un género particular o forma literaria. El
tercer objetivo, la función de selección (selection function), ayuda a los
usuarios a elegir el recurso que necesitan en base a los atributos bibliográficos
(por ej., versión, lengua, formato, fecha) o la naturaleza del contenido (por ej.,
género, forma). En dicha obra, Cutter se refirió solo a los catálogos de
biblioteca que representaban únicamente libros, aunque si dichos objetivos se
ampliaran a archivos, museos y otras instituciones que coleccionan recursos,
aún representan lo que los catálogos y otras herramientas de recuperación se
supone que harían hoy día.

1) Permitir a una persona encontrar un libro por:

(A) autor
(B) título
(C) tema, siendo, en los tres casos, conocido

2) Mostrar que tiene la biblioteca:

(D) por un autor dado


(E) por una materia dada
(F) por un tipo de literatura dada

3) Asistir en la elección de un libro:

(G)por su edición (bibliográfico)


(H) por su carácter (literario o temático)

Figura 3.1 Objetivos del Catálogo de Cutter

Seymour Lubetzky trabajó durante la mitad del siglo XX en la simplificación


de las reglas de catalogación, y postuló que los códigos de catalogación
deberían reconstruirse de acuerdo con objetivos adoptados deliberadamente y
principios bien constituidos. En tal sentido, estableció:

…”El primer objetivo es permitir al usuario del catálogo determinar


fácilmente si la biblioteca tiene o el libro que él busca… El segundo
objetivo es revelar al usuario del catálogo, bajo una forma del nombre del
autor, que obras de un autor particular y que ediciones o traducciones de
una obra particular tiene una biblioteca”… (Lubetzky, 1953: 36)

La obra de Lubetzky fue la base de los Principios de París, adoptados por la


Conferencia Internacional sobre los Principios de Catalogación, desarrollada en
París en 1961. El segundo de estos principios fue las “Funciones del catálogo”,
el que sostenía que (International Conference on Cataloguing Principles, 1961:
91-96):

El catálogo debería ser un instrumento eficiente para establecer:

2.1 Si la biblioteca contiene un libro particular especificado por:

6
(a) su autor y título; o
(b) en caso de no existir autor, solo por su título; o
(c) si ambos, autor y título, fuesen inapropiados o insuficientes para la
identificación, un sustituto de calidad para el título; y

2.2
(a) qué escritos bajo un autor particular y
(b) qué ediciones de un escrito particular, se encuentran en la biblioteca

En 1998, la IFLA publicó los Requerimientos Funcionales de los Registros


Bibliográficos (FRBR), donde presentó cuatro tareas del usuario de índole
general que los registros bibliográficos están dirigidos a cumplimentar. Estas
cuatro tareas se han construido sobre la obra de Cutter y sobre los Principios
de París y, esencialmente, representan las funciones principales del catálogo
(FRBR, 1998: 82):

las más ● encontrar entidades que se correspondan con el criterio de


importantes búsqueda establecido por el usuario.
son estas
IFLA
● identificar entidades (por ej., personas, obras, temas)
● seleccionar entidades apropiadas para las necesidades de los
usuarios.
● obtener acceso a las entidades descritas.

La cuarta de las tareas de FRBR es un agregado actual a los objetivos


identificados por Cutter, pero varios autores han reconocido que el catálogo
difiere de otras herramientas de recuperación en cuanto a que facilita la
ubicación física del recurso de información que se representa en la descripción.
En 2016, una quinta tarea del usuario fue propuesta en el borrador Library
Reference Model (LRM) de IFLA—un documento que busca armonizar FRBR y
los otros dos modelos de requisitos funcionales establecidos por IFLA. La
quinta tarea es explorar (explore) las relaciones entre un recurso y otro. El LRM
no ha sido adoptado al momento de escribir este texto, pero se espera que sea
aceptado como agregado a las tareas del usuario.
Otro propósito importante al que sirve el catálogo, consiste en actuar como
el inventario de la colección – esto es, proveer un registro de lo que es poseido.
Frecuentemente, para el logro de este propósito se ha utilizado el catálogo
topográfico (shelflist). Un catálogo topográfico incluye una copia de cada
registro en el catálogo, ordenado en la forma en que los recursos de
información están ubicados en el estante. Originalmente, el catálogo
topográfico seguía literalmente el orden de los ítems en el estante,
comenzando una nueva secuencia con cada cambio de formato, o con cada
cambio en la ubicación de la colección, o con cada cambio en el tamaño de los
ítems ingresados. Más tarde, los catálogos topográficos fueron organizados
frecuentemente por notación clasificatoria, independientemente del formato u
otra categorización. Esta última forma es la que reviste el concepto de los
catálogos en línea. El propósito de servir como inventario sigue vigente aún,

7
pero la imagen mental de un catálogo topográfico con un ordenamiento idéntico
al del estante se ha perdido.
Una unión de catálogos (union catalogs) es una variante del concepto de
catálogo que solo representa las existencias de una institución. Una unión de
catálogos representa las existencias de más de una institución o colección. Una
unión de catálogos de una biblioteca central y de sus sucursales, por ejemplo,
muestra ítems que pueden estar almacenados en una o más sucursales,
además de aquellos almacenados en la biblioteca principal. La información de
ubicación indica donde se almacena el ítem. Una unión de catálogos de un
consorcio de instituciones trabaja de la misma forma: la información sobre
ubicación física muestra que ítems están alojados en que instituciones del
consorcio de bibliotecas. OCLC cuenta con una unión de catálogos, donde
cada recurso de información se corresponde con un registro maestro, y
asociados con él se encuentra un registro de existencias (holdings) que indica
la presencia del ítem en las colecciones de las bibliotecas cooperantes.

Formas de los catálogos

Los catálogos pueden aparecer en formas diferentes y pueden contar con


distintos ordenamientos. Los formatos a considerar son: catálogos en forma de
libro (book catalogs), catálogos de fichas (card catalogs), catálogos en
microforma (microform catalogs), y catálogos en línea de acceso público (online
public access catalog, OPAC).

Catálogos en forma de libro. Los catálogos en forma de libro fueron


originalmente listas manuscritas. Después de la invención de la imprenta, los
catálogos en forma de libro fueron impresos, aunque no siempre en un orden
discernible. Eventualmente, los asientos fueron impresos en orden alfabético o
clasificado, aunque este tipo de catálogo era muy caro para reproducir y
actualizar de manera frecuente. A principio del siglo XX, los catálogos en forma
de libros fueron casi completamente reemplazados por los catálogos de fichas,
los que podían actualizarse rápidamente en la medida en que las fichas se
intercalaban, siendo relativamente barato para mantener y crear. Los catálogos
en forma de libros tuvieron un breve renacer en las décadas de 1960 y de 1970
cuando (1) las computadoras hicieron fácil y menos caro producir catálogos en
forma de libro; (2) los catálogos en fichas extensos se volvieron difíciles de
manipular; y (3) el rápido crecimiento de las bibliotecas hizo deseable contar
con múltiples copias de los catálogos. Para mantener actualizado un catálogo
en forma de libro, se requiere usualmente producir suplementos, lo que resulta
en múltiples búsquedas para satisfacer una demanda de información.
Usualmente, los suplementos se producen entre los 3 y 6 meses, por lo que los
nuevos materiales ingresados a la biblioteca carecen de representación en el
catálogo durante ese lapso de tiempo.
Los catálogos en línea han reemplazado en la mayoría de los casos a los
catálogos en forma de libro y a los catálogos de fichas, pero los catálogos en
forma de libro se utilizan aun para exhibiciones, obras de artistas, archivos
temáticos, etc. Los catálogos en forma de libro facilitan que los usuarios
conozcan los contenidos de colecciones especiales, estando situados en
diferentes lugares. Por ejemplo, los catálogos en forma de libros de las
sociedades históricas son adquiridos usualmente por coleccionistas de

8
materiales genealógicos. Este uso, sin embargo, puede reemplazarse por la
disponibilidad de los catálogos en la Web. Los catálogos en forma de libro
existen también en algunas biblioteca y archivos como la única herramienta de
recuperación disponible para acceder a materiales antiguamente adquiridos, ya
que algunas instituciones han sostenido no convertir todos sus registros de
catálogos de materiales raros en formato legible por computadora disponibles
en el catálogo en línea.
Una ventaja de los catálogos en forma de libro sobre los catálogos en línea
radica en que los primeros son compactos y portables y pueden ser
consultados en cualquier lugar. Sin embargo, las computadoras laptop y la
tecnología de conexión inalámbrica a Internet están volviendo accesible desde
cualquier sitio el catálogo en línea.

9
Fig. 3.2. Una Representación de una Página de un Catálogo en forma de Libro

Otra ventaja reside en que mirar una página con asientos en un catálogo en
forma de libro es relativamente rápido, y algunas personas prefieren este medio
antes que mirar la pantalla del computador con las respuestas en línea. Una
ilustración de un catálogo en forma de libro se ve en la Figura 3.2

10
Catálogos de fichas. En un catálogo de fichas, cada descripción
bibliográfica se prepara en una ficha estándar de 7,5 x 12,5 cm, intercaladas en
gavetas repletas de fichas, en cajones diseñados especialmente. Las
dimensiones de las fichas no fueron siempre estándar, dado que durante los
inicios del catálogo en fichas se usaron diferentes tamaños ( 3 x 5 plg., 1 ½ x 5
plg., 1 ½ x 10 plg. y 4 x 6 plg.). Los catálogos de fichas fueron popularizados en
los Estados Unidos por las fichas de la Library of Congress (LC), las que
estuvieron disponibles a la distribución en 1901, y por las fichas producidas por
la editorial H.W. Wilson, disponibles en 1938, en respuesta de las necesidades
de las bibliotecas pequeñas – ambas instituciones han cesado actualmente la
producción de fichas de catálogo.
Los avances tecnológicos han cambiado los usos del catálogo de fichas. En
primer lugar, el tipeo en máquinas de escribir suplantó la escritura manuscrita
de las fichas. La impresión offset fue utilizada por LC en la producción de sus
fichas. Luego, la fotocopia de una ficha maestra permitía la creación del juego
de fichas completo de la biblioteca a nivel local. Finalmente, el advenimiento de
la impresión por computadora hizo posible la producción de fichas, adaptada
por las bibliotecas locales o por emprendimientos distantes. En esta última
instancia, las fichas eran frecuentemente enviadas al destinatario en cajas,
presentándose ya alfabetizadas y listas para intercalar.
Gracias a la influencia de las fichas de LC, los catálogos en fichas y el orden
de la información registrada en las fichas lograron una estandarización durante
décadas.

Fig. 3.4. Una Representación de una Ficha de Catálogo Impresa


Los usuarios de catálogos de fichas podían recorrer distintas bibliotecas,
utilizando dichos catálogos con la suficiente confianza como para estar

11
dispuestos a utilizar catálogos distantes tan fácilmente como los catálogos
locales. Sin embargo, el ordenamiento de los catálogos de fichas
frecuentemente solía diferir de biblioteca en biblioteca. Los catálogos en línea
han reemplazado a la mayoría de los catálogos en fichas en Estados Unidos,
aunque algunas bibliotecas, archivos y museos aun tienen catálogos en fichas,
especialmente las pequeñas instituciones o aquellas que solo han tenido una
mínima conversión de datos a formato legible por ordenador. En muchos
países, existen más catálogos de fichas, y en algunos los catálogos de fichas
son aun la forma predominante. La Figura 3.4 muestra un ejemplo de catálogo
de fichas contemporáneo.

Catálogos en microforma. La creación de catálogos en microforma con


salida de computadora (computer output microform catalog) o catálogos COM,
se volvieron posibles en la década de 1960. Estos son producidos en
microficha o en microfilm y requieren un lector de microforma para permitir su
manipulación. Se producen como los catálogos en forma de libro, pero como no
tienen que ser reproducidos en papel ni encuadernados, pueden ser
completamente reproducidos con adiciones cada 3 meses, o no recurrir a la
tarea de generar suplementos. Debido a su carácter impopular, fueron
reemplazados rápidamente por los catálogos en línea. Se ha producido el
hallazgo de que los usuarios utilizan el microfilm solo si es la única forma de
acceder a la información que buscan, ya que la mayoría de las personas
encuentran complicado utilizar el lector así como dificultosa la lectura del
microfilm.

la más importante OPAC. Los catálogos de acceso público en línea (OnLine Public Access
clase 4 Catalogs, OPAC) constituyen la forma predominante del catálogo en los
del Estados Unidos, y en otros países, actualmente. En este catálogo, los registros
15/5/2023 se almacenan en un servidor local o remoto. Los registros se visualizan
solamente ante una demanda de información. Cuentan con mayor flexibilidad
en la visualización de los resultados de búsqueda.
La Figura 3.5 muestra la pantalla de búsqueda básica del OPAC de Beatley
Library del Simon College. La Figura 3.6 muestra un registro único de dicho
catálogo de biblioteca. Los catálogos en línea no están estandarizados aún,
aunque en una o más instituciones que hayan adquirido el mismo software, las
visualizaciones parecieran contar con algunos aspectos similares. Los autores
en este campo, hace tiempo que demandan la necesidad de la estandarización,
de manera que los usuarios pueden moverse de catálogo en catálogo o puedan
realizar búsquedas sobre múltiples catálogos desde un solo lugar, y poder
encontrar y visualizar registros de una manera uniforme. En años recientes, las
insatisfacciones con estos aspectos de los catálogos en línea han sido
expresadas por muchos profesionales en el campo de la bibliotecología y la
ciencia de la información. La frustración vinculada con la dificultad en el uso de
los catálogos en línea, se intensifica cuando se procede a comparar dicho
catálogo con los motores de búsqueda en Internet – como Google – que son
relativamente fáciles de utilizar. A veces este descontento ha conducido a
cuestionamientos respecto a las perspectivas a largo plazo de los catálogos en
línea. Si los proveedores comerciales de catálogos responden por medio de
mejoras en el ordenamiento de los resultados de búsqueda – por ejemplo,
enfatizando las relaciones entre recursos – los catálogos en línea pueden ser

12
vistos otra vez como proveedores de recursos que no están disponibles en los
motores de búsqueda, y de esta forma asegurar su supervivencia futura.
Algunos creen que cuando la Web Semántica sea una realidad y todos los tipos
de recursos (bibliográficos y demás) se conectan usando técnicas de datos
vinculados, entonces quizás los motores de búsqueda generales reemplazarán
a los OPAC que usamos hoy día para encontrar información en las bibliotecas,
sin embargo, esto puede ocurrir en mucho tiempo.

Figura 3.5. Pantalla de Búsqueda básica en un OPAC (Beatley Library,


Simmons College, Boston Mass.)

Ordenamiento y Visualización (Displays) en los Catálogos

Los registros en un catálogo deben ordenarse de alguna manera, o quedan


inutilizados. En los catálogos de fichas, los registros se intercalan en un cierto
orden. En los catálogos en forma de libro y en los catálogos COM, los registros
se ordenan como son impresos sucesivamente en un orden particular. Sin
embargo, los registros en los OPAC, no se ponen en un lugar; existe flexibilidad
porque los registros se ordenan internamente dentro de las bases de datos sea
en una secuencia de orden de los asientos (entry) en el sistema o en un orden
aleatorio. Esto permite la customización de la visualización de los resultados de
búsqueda en los catálogos en línea. Así el ordenamiento discutido aquí se
aplica al ordenamiento de las respuestas visualizadas a partir de las preguntas
de búsqueda, en el caso del catálogo en línea, y no en el orden interno dentro
de la base de datos. (Para más información acerca del ordenamiento de la
visualización de los metadatos véase el Apendice C).
En general, existen dos ordenamientos básicos que tienen sentido en los
catálogos impresos (i.e., todos los formatos de catálogos que ocurrieron antes
de la versión en línea). Los registros de catálogo estuvieron en orden
clasificado o alfabético. Estos ordenamientos son posibles en el catálogo en

13
línea, aunque estas no son las únicas opciones de visualización. En los OPAC
actuales, se ofrecen varias opciones para visualizar los resultados de
búsqueda; los usuarios pueden elegir el ordenamiento que mejor se aplique a
sus búsquedas particulares desde una lista de opciones.

Figura 3.6. Un registro Bibliográfico en un OPAC (Beatley Library,


Simmons College, Boston Mass.)

Clasificado o sistemático. Los catálogos clasificados usualmente tienen


más de una sección. En la sección principal del catálogo, el ordenamiento o la
visualización se da de acuerdo al orden del esquema de clasificación utilizado
en la institución. Esta sección es ordenada temáticamente, donde el tema se
representa mediante una notación clasificatoria, antes que mediante términos
temáticos alfabéticos. Pueden asignarse más de una notación clasificatoria a
un único registro, en la medida en que existan muchos conceptos temáticos en
el recurso de información.
Los catálogos sistemáticos tienen la ventaja que los usuarios pueden mirar
registros correspondientes a conceptos más amplios y más estrechos, al
mismo tiempo que buscan registros sobre un concepto particular. En cierto
modo, es similar al browsing en el estante a través de la signatura topográfica,

14
excepto en que en el catálogo sistemático cada recurso de información puede
representarse por varias notaciones que significan la totalidad de sus
conceptos temáticos, no solamente por una notación clasificatoria como ocurre
con los ítems en el estante. Un ejemplo de una página de un catálogo impreso
clasificado se presenta en la Figura 3.7, donde pueden verse los asientos
ordenados por la signatura topográfica asociada con cada recurso.
En la medida en que es imposible para cualquier persona conocer todas las
notaciones clasificatorias relacionadas a una materia, existe una sección en el
catálogo que lista las representaciones verbales de todos los tópicos y brinda la
notación para cada tópico (por ej., Electric cooking, Slow = 641.5884) Los
usuarios que buscan por autor y por título, deben utilizar otras secciones del
catálogo. En los catálogos de fichas, los catálogos en forma de libro y en los
catálogos en microforma, las secciones de autor, título y tema se ordenan
alfabéticamente, en los OPAC se presenta la búsqueda por palabras y el orden
de la visualización de los resultados varia.
Los catálogos clasificados se utilizan tradicionalmente en Europa y en
países en los que se habla más de una lengua. La sección clasificada o
sistemática del catálogo puede incluir registros para cada una de las lenguas
representadas, con varias lenguas intercaladas en la misma notación
clasificatoria. La sección el catálogo que brinda acceso a la identificación de la
notación clasificatoria, y a los autores y títulos puede estar en la lengua
convencional utilizada por los usuarios. Estados Unidos no sintió
tradicionalmente la necesidad de esta aproximación. Hoy día, al afirmarse que
el acceso al catálogo a través de Internet es de índole global, se esta
reconsiderando el concepto del catálogo sistemático en el sentido de su
capacidad de poder almacenar y visualizar registros en diferentes lenguas con
notaciones clasificatorias de carácter universal. Si los índices que dirigen al
catálogo sistemático se elaboran en varias lenguas, puede brindarse el acceso
a través de más de una lengua. Además, favorece el browsing y las búsqueda
amplias y estrechas, las que son especialmente útiles para usuarios en línea
inexpertos.

Alfabético. Los primeros catálogos en Estados Unidos fueron ordenados


por categorías temáticas amplias en orden alfabético. Si una colección
consistía de unos pocos libros, existía una ínfima necesidad de elaborar una
clasificación u ordenamiento. En la medida en que el catálogo crecía, las
categorías amplias requerían ser subdivididas, de manera que se creaban
categorías más reducidas, las que se ordenaban alfabéticamente dentro de
cada categoría más amplia. Por ejemplo, si la categoría más amplia era
“Animales domésticos”, las subcategorías bajo ella podían ser caballos, gatos,
mulas, perros, etc. Este tipo de ordenamiento de los catálogos se denominó
catálogos clasificados alfabéticos (alphabetic-classed catalogs). En la medida
en que las categorías temáticas se multiplicaban, se volvía más difícil predecir
las categorías temáticas y donde localizarlas. Comenzó a tomar sentido,
entonces, la ubicación de todas las subcategorías creadas en orden alfabético,
independientemente de la clase a la que pertenecía. Charles Cutter elaoró un
desarrollo que denominó catálogo diccionario (dictionary catalog). Cutter
recomendó el orden alfabético de autores, títulos y temas, todos ellos
intercalados en el mismo catálogo.

15
Figura 3.7. Una Representación de una Página de un Catálogo Clasificado o
Sistemático en Forma de Libro

Un ejemplo de catálogo diccionario impreso se encuentra en la Figura 3.2.


La página en dicha figura contiene la siguiente mezcla de asientos (entries):
ejemplo
desopilante 1. un asiento de título para Jottings from Jail
de una 2. un asiento de autor por Joseph Joubert
catálogo
diccionario 16
3. un asiento de autor por Daniel N. Joudrey
4. otro asiento de autor por Joudrey por una edición anterior de este
libro, The Organization of Information
5. un asiento de título para un libro de poemas en francés, Les Joeus en
Feu
6. un asiento temático para un libro biográfico para niños acerca de
Jack Jouett
7. un asiento para Alain Jouffroy, un editor
8. un asiento para un manual editado por Louis Joughin
9. un asiento de autor para el libro de Joughin sobre Sacco y Vanzetti
10. un asiento de título para un libro acerca de la película Le Jour se
Lève
11. una referencia de nombre personal (de Jouve a Ward Jouve)

El intercalado de varios tipos de asientos es lo que define a este tipo de


ordenamiento como un catálogo diccionario.
El catálogo diccionario de fichas fue el estándar que reinó durante la
primera mitad del siglo XX. Luego, los catálogos de las grandes bibliotecas se
volvieron complicados para intercalar nuevas fichas, ya que el tamaño y la
complejidad de la reglas de alfabetización se transformaban en obstáculos para
su normal crecimiento. Las primeras reglas de alfabetización han reflejado la
influencia de los asientos de catálogos clasificados y de catálogos clasificados
alfabéticos que utilizaban categorías. Cutter recomendó el ordenamiento
alfabético, pero sosteniendo que los nombre y títulos que comienzan con una
palabra que también podría representar un tema se intercalen en el siguiente
orden: nombre personal, entidad geográfica, entidad corporativa,
encabezamiento temático, título, por ejemplo:

Glass, Richard [nombre personal]


Glass Mountains (Tex.) [entidad geográfica]
Glass Art Society [entidad corporativa]
Glass [encabezamiento temático]
Glass art [encabezamiento temático]
Glass menagerie [título]

Puede observarse que este ordenamiento no es estrictamente alfabético, y


que entraña complicaciones para los catálogos extensos.
Los intentos para dividir estos enormes catálogos, resultaron en la aparición
de los catálogos divididos (divided catalogs). Algunas veces fueron divididos en
dos, y otras veces en tres. En el caso de la división en dos, se escindian en un
catálogo de autor y título y en un catálogo temático. En el caso de tres, la
división era por autor, título y tema. En el ordenamiento de autor-título-tema, los
registros de obras acerca de una persona se intercalaban frecuentemente en el
catálogo temático, mientras los registros de obras que la persona escribió se
intercalaban en el catálogo de autor. Sin embargo, se consideró útil mantener
los registros para las obras escritas por y acerca de una persona juntas, de
manera que todos los nombres fueran localizados en un solo lugar del
catálogo, sea que este fuera para el nombre como creador o para el nombre
como tema. En un catálogo de fichas dividido, existirán gavetas (o conjuntos de
gavetas) separadas, usadas para las diferentes secciones del catálogo (véase

17
Figura 3.8). El catalogo dividido fue más fácil y económico para quienes se
encargaban de la gestión y del mantenimiento del mismo. Sin embargo, este
tipo de catálogo asume que los usuarios conocen la diferencia entre asientos
de autor, título y tema, lo que no siempre ocurre.

Figura 3.6. Un Catálogo Alfabético de Fichas Dividido

Con el desarrollo de los OPAC en la década de 1980, los catálogos


divididos se movieron al ambiente en línea. Un usuario, usualmente, realiza su
búsqueda por autor, por título o por tema (aunque después más opciones de
búsqueda se pusieron disponibles). En este caso, rara vez es posible recuperar
las obras escritas por y acerca de una persona en la misma búsqueda; esto no
fue posible hasta que apareció la búsqueda general por palabra clave,
disponible en el catálogo en línea, que es extremadamente imprecisa porque el
nombre puede aparecer en partes diferentes del registro del campo creador o
tema. Las búsquedas generales por palabras clave son similares a la
aproximación del catálogo diccionario que orden aun catálogo, dado que uno
no tiene que elegir el tipo de búsqueda que desea conducir; los términos de
búsqueda son recuperados sin importar donde aparecen en el registro del
catálogo. El ordenamiento del catálogo también se encuentra disponible en los
OPAC actuales; es usualmente logrado a través de una búsqueda por signatura
topográfica, si tal tipo de búsqueda se encuentra disponible—cosa que no
siempre es el caso. De cierta manera, la sofisticación que se edificó en el
diseño de los catálogos de dichas a través de reglas de ordenamiento
alfabéticas elaboradas, fue abandonada por la conveniencia de la búsqueda
automatizada.

Otros Ordenamientos. Las visualizaciones de las búsquedas hoy día no


están siempre en orden alfabético o clasificado. La programación específica de
los OPAC determina que tipos de ordenamientos de resultados de búsqueda
son posibles y cuando cada ordenamiento es usado como visualización por

18
defecto (default display). En algunos catálogos, las búsquedas por creadores o
por títulos puede devolver una visualización alfabética de puntos de acceso
controlados-autorizados para creadores o una lista de títulos en orden
alfabético, aunque otros sistemas cuentan con un marco por defecto que se
usa para casi todos los tipos de búsqueda: el ranking de relevancia (relevance
ranking). El ordenamiento por relevancia puede ser misterioso para los
usuarios y para los profesionales de la información. La idea es que los recursos
que están más estrechamente conectados con los términos de búsqueda se
ubiquen más arriba entre los resultados de búsqueda. La relevancia se
determina por algoritmos, y se define de forma diferente en cada sistema. Se
basa en una combinación de factores (por ej., ubicación, peso del campo,
frecuencia de términos) que puede ser adaptada de alguna forma de acuerdo a
las preferencias de la institución.
La elección de ordenamientos en la visualización y la elección de
búsquedas disponibles varia de catálogo en catálogo. Algunos, por ejemplo, no
proveen a los usuarios la posibilidad de llevar a cabo búsquedas por signatura
topográfica o por notación clasificatoria, aunque permiten que los resultados de
búsqueda por título o creador sean ordenamos por signatura topográfica.
Algunos OPAC no permiten browsing de listas controladas-autorizadas de
nombres, focalizándose principalmente—en su lugar—sobre la búsqueda por
palabra clave. La mayoría de los catálogos en línea actuales permite a los
usuarios la elección del orden en que se presentan los resultados de búsqueda.
Los catálogos permiten ordenamientos por:

● Ranking de relevancia
visto en clase ● Nombre del creador (alfabético por apellido)
● Título (alfabético por la primera palabra, excepto artículos)
● Signatura topográfica
● Orden cronológico ascendente (fecha de publicación más antigua a la
última)
● Orden cronológico descendente (desde la última a la más antigüa)
● Los recursos mas populares, primero
● Tipo de material o formato

Las elecciones ofrecidas por los catálogos pueden variar desde dos o tres
de estas opciones de ordenamiento a, quizás, la mayoría de los tipos listados.
En algunos sistemas, estos ordenamientos pueden incluir también opciones
para una variedad de sub-ordenamientos bajo el primer criterio elegido (por ej.,
ordenado primero por creador y luego subordenado por título o por fecha de
publicación).

Índices

Los índices son herramientas de recuperación que proveen acceso a los


contenidos analizados de los recursos de información – por ejemplo, artículos
de revistas, papers en proceedings de conferencias, etc. Los índices de final de
libro, aunque permiten el acceso a los contenidos analizados de la obra, no
constituyen herramientas de recuperación tal como se definen en este capítulo.
Estos índices de final de libro se preparan al mismo momento de la publicación
de la obra, no en un tiempo posterior en un esfuerzo de proveer control

19
bibliográfico. Sin embargo, estos auxilian en la recuperación de la información
encontrada en el texto en mano. Algunos sitios Web también cuentan con
índices que funcionan de manera similar a los índices de final de libro, pero en
lugar de contar con un número de página como referencia para la localización,
cada asiento del índice se vincula directamente a un “ancla” HTML en la que se
halla indizado el sitio. En la Web se los denomina índices A-Z para distinguirlos
de los árboles de búsqueda y los motores de búsqueda. La indización para
generar Índices A-Z utiliza software especializado – como HTML Indexer y
XRefHT32. Como los índices de libros, un Índice Web A-Z puede contener
asientos de segundo nivel o subordinados, asientos variantes y referencias
cruzadas.
Los índices considerados como herramientas de recuperación en el sentido
de este capítulo se encuentran escindidos de los recursos de información que
analizan. Los índices de bases de datos – también llamados índices de revistas
o índices de publicaciones seriadas – son claros ejemplos de herramientas de
recuperación. Estos índices no tienen control de autoridad de nombres. Un
nombre como Lois Mai Chan puede ingresarse dentro del mismo índice en
diferentes momentos como: Chan, L.; Chan, LM; Chan, L.M.; Chan, Lois M;
Chan, Lois Mai y, aún, Mai Chan, Lois. Los índices mantienen usualmente,
control de autoridad sobre los temas. Los indizadores tienden a utilizar
vocabularios controlados – llamados tesauros – para agrupar aquellos términos
temáticos deseados en el índice. Un tesauro contiene un lenguaje
sistematizado que subsume los términos específicos bajo términos genéricos y
provee una estructura de relaciones entre términos.
A diferencia de los catálogos, los índices no se limitan a lo que está
disponible en una configuración local o en una colección particular, y
usualmente no brindan información para la localización ulterior de la
información. Brindan, como parte de la descripción, el recurso más amplio en el
que puede encontrarse la obra más pequeña. Especialmente en el caso de los
índices impresos, puede ser necesario para un usuario de un índice buscar en
el catálogo la ubicación de una obra mayor. En algunos índices en línea, existe
la posibilidad de vincularse con catálogos en línea para permitir a los usuarios
ver rápidamente si su biblioteca cuenta con la obra mayor. Si dicha obra mayor
no se encuentra en el catálogo local, el usuario puede buscar en una unión de
catálogos o recurrir al préstamo interbibliotecario. Los índices en línea cuentan,
crecientemente con vínculos a las versiones electrónicas de los artículos.
La indización puede ser llevada a cabo por personas o por computadoras,
automáticamente, o por una combinación de ambas. La indización en las bases
de datos es aun, en su mayor parte, completada por indizadores entrenados,
aunque exista alguna asistencia automática. Los índices pueden encontrarse
en formato impreso o en formato legible por ordenador, la mayoría de los
cuales se encuentran en línea. Algunos índices en versión impresa se ordenan
alfabéticamente – a la manera de un diccionario – con asientos de autor, título y
temas intercalados. Otros reflejan un ordenamiento dividido, contando con un
índice de autor/título separado del índice temático. Los índices en línea tienen
interfaces que indican como buscar y como visualizar los resultados. Como en
el caso de catálogos en línea de acceso público (OPAC) no existe una
estandarización a ser seguida entre índice e índice. Los OPAC, al menos,
cuentan con la normalización devenida del uso de RDA o AACR2, mientras no

20
existe un estándar como tal comúnmente utilizado en la construcción de índices
[…]. Existe una norma internacional ISO sobre índices publicada en 1996.
Otra diferencia entre catálogos e índices, es que estos últimos tienden a ser
creados por empresas comerciales – como H.W. Wilson – o por sociedades
profesionales – como American Chemical Society. Frecuentemente, se tarifa
directamente el uso de la versión en línea del índice. Las bibliotecas suelen
comprar los índices impresos , o pagar el acceso de sus usuarios a la consulta
de índices en línea […].
Un ejemplo de índice se muestra en la Figura 3.9, e ilustra los tipos de
información incluidos en un índice de artículos de revistas académicas.

21
Figura 3.9. Una Representación de un Asiento de Indice para un Artículo de una
Revista Académica

Comienza con el título del artículo y luego lista varias características del
artículo, incluyendo quien lo escribe, información de contacto y afiliación.
También hay información de la revista, incluyendo su título, tipo,
identificador—usualmente, el ISSN. Otra información incluye el nomre de la
editorial, el volumen y el número, los números de página y la extensión del
artículo. También hay un resumen indicativo o descriptivo y temas asociados.
La mayoría de los índices son elaborados por humanos. Sin embargo, desde la
década de 1950 se comenzó a trabajar en la indización automática que
descansa en la computadora para elaborar el índice, desarrollando tareas
repetitivas a una alta velocidad. El primer método automático, introducido por
Luhn en 1958, se conoció como indización o índice KWIC (Key Word In
Context). En un índice KWIC, los títulos se ordenan de manera tal que cada
palabra del título ocurre una vez en orden alfabético en el centro de la página,
con las restantes palabras de izquierda a derecha de la palabra central, en el
orden en que aparezcan en el título – por esto, la palabra alfabetizada se
considera “en contexto”.
KWIC
Introduction to Cataloging and Classification.
Introduction to Cataloging and Classification.
Introduction to Cataloging and Classification.
Una adaptación del método KWIC, se conoce como KWOC (Key Word Out
Context), el que presenta las palabras en el margen izquierdo en lugar de la
mitad de la página, y el título se imprime a la derecha o debajo de la palabra
clave seleccionada
KWOC
Cataloging
Introduction to Cataloging and Classification.
Classification
Introduction to Cataloging and Classification.
Introduction
Introduction to Cataloging and Classification.
Dos tipos adicionales identificados ambos como KWAC se utilizan menos
frecuentemente. El primero, Key Word and Context, es una combinación de
KWIC y KWOC, en el que la palabra significativa aparece tanto en la posición
del encabezamiento y en el contexto, como en el resto del título. El segundo,
Key Word and Context, permite al indizador aumentar el título con palabras
adicionales para proveer mayor significado y mejorar el acceso al recurso.

KWAC: Key Word And Context


Cataloging and Classification. Introduction to
Classification. Introduction to Cataloging and
Introduction to Cataloging and Classification.

22
KWAC: Key Word Augmented in Context
Cataloging and Classification [in Libraries]. Introduction to
Classification [in Libraries]. Introduction to Cataloging and
Introduction to Cataloging and Classification [in Libraries].
Libraries. Introduction to Cataloging and Classification

La aplicación actual de la indización automática es la indización de los


motores de búsqueda. Un motor de búsqueda se considera, algunas veces,
como un índice; aunque, de manera precisa, un motor de búsqueda crea listas
de términos a las que se denominan índices. Un motor de búsqueda (search
engine) es un programa de computadora que busca páginas Web a partir de
palabras clave vía un programa llamado “araña” (spider). La lista de
documentos regresa a una base de datos interna y puestos en orden por un
programa de indización de acuerdo a las palabras o conceptos contenidos en el
documento. Con el desarrollo de los microdatos, los vocabularios de marcado
generales (tales como Schema.org) y el uso de otras etiquetas de metadatos,
la indización de los motores de búsqueda puede volverse más precisa para los
usuarios. Los motores de búsqueda se describen más abajo.

No hay que leerlo Instrumentos de localización

Los instrumentos de localización (finding aids) – algunas veces llamados


inventarios (inventories) – son descripciones de colecciones de archivo que
tienden a ser más extensas que los registros de catálogos, los asientos de
índices y las citas de bibliografías. Los archivos usualmente mantienen el
control sobre colecciones enteras – no sobre sus piezas individuales – de
materiales de archivo de fuentes personales o corporativas. Así, un instrumento
de localización describe una colección, no una correspondencia o un registro
único dentro de una colección. Mientras algunos instrumentos de localización
no son accesibles públicamente, se esta volviendo raro que los archivos
dispongan de sus instrumentos de localización en la Web. Un instrumento de
localización en si mismo como herramienta de recuperación, es frecuentemente
descrito en un registro de catálogo, esto es, un registro sustituto para describir
el instrumento de localización – el que en sí mismo constituye un sustituto para
la colección de archivo – se crea para proveer puntos de acceso por nombre,
título y tema. El estándar de contenidos DACS (Describing Archives: A Content
Standard) se usa para crear instrumentos de localización y registros
bibliográficos MARC. Un ejemplo de un instrumento de localización se presenta
en la Figura 3.10.
Un instrumento de localización puede comportar una descripción breve o
extensa, dependiendo el tamaño de la colección del archivo, la complejidad de
su organización y el nivel de granularidad deseado en la descripción. Ya que
los materiales en archivos son diferentes de los tipos de recursos de
información encontrados en otras instituciones, los tipos de metadatos
registrados en un instrumento de localización son considerablemente diferentes
de los que se encuentran en catálogos o índices. En los instrumentos de
localización típicos se encuentra la siguiente información:

23
● Procedencia—incluyendo creador, título, fechas e historia
administrativa y biográfica;
● Condiciones y extensión—incluye la cantidad (número, volumen
y pies lineales y cúbicos) y la mención de las condiciones de la
colección;
● Alcance y notas de contenido—incluye la descripción de la
naturaleza de la colección, que abarca la extensión y profundidad,
los vacíos o discontinuidades, los tipos de materiales y los puntos
de acceso para nombres y materias de la colección;
● Orden y estructura—incluye una descripción de cómo esta
organizada y ordenada la colección, y una lista detallada de los
contenedores;
● Información administrativa—incluye la ubicación, condiciones de
uso, restricciones, adquisición y accesión, repositorio e información
de conservación

24
25
26
Figura 3.10. Un Ejemplo de Instrumento de Localización (Beatley Library
Collection: CC30, Simmons College Archives, Boston, MA)

no hay que leerlo Registros (Registers) y Otras Bases de Datos de Museos

Los registros (registers) constituyen la herramienta de control principal para


los museos. Un registro puede también denominarse registro de accesión
(accesion log). Funciona como un catálogo, aunque tiene clases de puntos de
acceso adicionales. El proceso de registro en un museo se parece mucho al
proceso de catalogación de una biblioteca. Durante el proceso de registro se
identifica el objeto, el donante, cualquier asociación (por ejemplo, habiendo
pertenecido a una persona particular), cualquier necesidad de información para
propósitos de seguro, etc. A cada objeto se le asigna un número de
identificación. El registro de accesión se transforma en la base para uno o más

27
archivos que ayudan a proveer la organización de información al contenido del
museo.
Adicionalmente, los museos proveen bases de datos de acceso público en
línea. Por ejemplo, el Pitt Revers Museum en Oxford, Inglaterra, cuenta con
una base de datos de objetos y una base de datos de fotografías. Un usuario
puede buscar cada base de datos completando los campos de búsqueda. La
base de datos de objetos – también llamada Catálogo de la Colección de
objetos (Objects Collection Catalogue) – contiene “cajas” de búsqueda (search
box) para nombre del objeto, país del que proviene el objeto – la que contiene
una lista desplegable con los nombres de países; el grupo cultural del que
provine el objeto; de que material esta hecho; cuando fue coleccionado; etc. La
base de datos de fotografías – también llamada Catálogo de Colección de
Fotografías (Photographs Collection Catalogue) – además de los campos de
búsqueda para objetos mencionados, contiene “cajas” de búsqueda para
actividad y eventos representados; personas mostradas; fotógrafo; proceso
fotográfico; dimensiones de la imagen; fecha de la fotografía; etc. Se sugiere
que los usuarios no busquen en más de tres campos a la vez en la base de
datos [Pitt Revers Museum, disponible en http://www.prm.ox.ac.uk/, consultado
Abril 25, 2011]
Un ejemplod e una aproximación más comprensiva y estilizada es la de
National Gallery of Art (NGA), en Washington, DC. La colección entera (dibujos,
pinturas, fotografías, impresos y esculturas) puede ser buscada en, al menos,
dos métodos diferentes a través del sitio Web. La primera interfaz se denomina
“Search the Collection”. Permite al usuario buscar los “registros objetos” de la
colección por el nombre del artista, palabras clave del título, o en la descripción
del objeto, donantes y propietarios, números de accesión, la historia de
exhibiciones y otros campos. Después de que una búsqueda inicial se
completa, los usuarios pueden filtrar sus resultados de búsqueda por
multimedio, nacionalidad, periodo de tiempo, estilos y si un objeto está en
exhibición. Se provee una imagen digital para la mayoría de las obras. Además,
algunas obras de arte tienen descripciones extensas. Por ejemplo, los
resultados de búsqueda para la pintura Cape Cod Evening de Edward Hooper,
comienza con alguna breve información:

● Material/Técnica: óleo sobre lienzo


● Dimensiones:
o Totales: 76.2 × 101.6 cm (30 x 40 plg.)
o Marco: 106.7 × 132.1 cm (42 x 52 plg.)
● Collección: John Hay Whitney Collection
● Número de Accesión: 1982.76.6

Siguiendo esto, entre otras cosas, se muestra un ensayo que describe la


historia de la obra con sus referencias bibliográficas, un resumen técnico y las
notas, descripciones de la procedencia de las obras, su historia de exhibición y
los recursos donde la obra ha aparecido […].
La otra interfaz disponible es a través del repositorio de imágenes del NGA.
Esta herramienta de recuperación separada permite a los usuarios buscar en
cualquier lugar en la descripción de la obra de arte o en el título, por nombre de
artista y número de inventario. Provee filtros de búsqueda por nacionalidad,
clasificación (el tipo de pintura, escultura, arte multimedial (media art)),

28
multimedia y fechas. Los resultados de búsqueda proveen imágenes digitales
descargables para muchas de las obras, un vínculo al registro del objeto
(mencionado mas arriba) y una breve descripción.

● Artista Luis Meléndez


● Información del Artista Español, 1715–1780
● Título Naturaleza muerta con higos y pan
● Fecha c. 1770
● Medio óleo sobre lienzo
● Clasificación Pintura
● Dimensiones
o Total: 47.6 × 34 cm (18 3/4 × 13 3/8 in.)
o Marco: 65.6 × 49.2 × 4.4 cm (25 13/16 × 19 3/8 × 1
3/4 in.)
● Credit o Colección permanente para el público
● No. Accesión 2000.6.1
● Digitalización Captura digital directa
● Uso de la imágen acceso abierto

Además de la búsqueda por redes particulares, NGA también provee un


índice de búsqueda por nombres de artistas, que puede filtrarse por
nacionalidad, fechas, la primera letra del apellido, etc. Este constituye una
aproximación particular de un museo para proveer información acerca de sus
colecciones al público en general. Otras instituciones que preservan patrimonio
cultural utilizan otras aproximaciones.

Motores de Búsqueda

Para la mayoría de los que buscan información, los motores de búsqueda


son probablemente la más familiar de todas las herramientas de recuperación
discutidas en este capítulo. Los motores de búsqueda (search engines) son
herramientas desarrolladas para sistemas informáticos, particularmente
Internet, para encontrar casos de frases o palabras solicitadas presentes en los
documentos cubiertos por el alcance de la herramienta. Se desarrollan con el
propósito de buscar en el texto completo de los documentos – o en los índices
de dichos documentos – frases o palabras particulares.
Algunos motores de búsqueda se utilizan para buscar solo en un recurso
particular, como el sitio Web de una organización, como en el sitio de OCLC.
Otros motores de búsqueda se utilizan para buscar en Internet como un todo –
aunque solo un pequeño porcentaje es actualmente buscado por cada uno de
los motores. Mediante el uso de un programa denominado “araña” (spider) –
también conocido como crawler, robot o agente (agent) – cada motor de
búsqueda colecciona automáticamente información de recursos Web y las
ubica dentro de una base de datos de registros o en un índice de texto
completo, similar a una concordancia. La “araña” se programa para recorrer la
Web, para recuperar y bajar copias de ciertas páginas Web y cualquier vínculo
que estas comporten, de cualquier vínculos con los vínculos, etc. Un índice
colectivo masivo creado por la base de datos “araña” sirve como lugar de
búsqueda cuando los usuarios ingresan términos en las “cajas” de búsqueda
respectivas. Estos índices (algunos comprenden mas de 100 millones de GB

29
(GigaBytes) de datos son sobre los que se busca cuando los usuarios ingresan
términos en las cajas de búsqueda.
Obviamente, no se indizan todas las páginas Web de Internet. Algunos
recursos pueden ser indizados solo por unos pocos motores de búsqueda – de
esta manera, puede contarse con una variedad de respuestas cuando se busca
en diferentes motores de búsqueda a partir del mismo concepto de búsqueda.
Además, no todos los motores de búsqueda indizan cada tipo de material
disponible en Internet. En años recientes, aquellos recursos electrónicos en
formato PDF y PowerPoint se han vuelto recuperables en la Web. En algunos
casos, los recursos pueden estar protegidos por claves o contraseñas
(password), y como resultado no pueden ser indizadas por un motor de
búsqueda ya que no están accesibles al robot. En otros casos, algunos
recursos pueden ser indizados y transformarse en resultados de búsqueda,
aunque tengan restringido su acceso – un hecho que descubre una persona
solo después de intentar acceder a la información. En general, solo la Web
superficial se incluye en los índices de motores de búsqueda; la llamada Web
profunda, incluye muchas cosas que el público en general no querría ver
indizadas en los motores de búsqueda (por ej., correspondencia de e-mails,
transacciones financieras, perfiles de datos, etc.).
De manera diferente a los catálogos y a los instrumentos de localización, los
motores de búsqueda se han vuelto una parte ubicua de las interacciones
rutinarias de los usuarios que acceden a Internet. Debido a la familiaridad
general con los motores de búsqueda y su relativa facilidad de uso (solo lanzar
algunas palabras clave en una caja de búsqueda), otras herramientas de
recuperación lucen, frecuentemente, anticuadas y complejas en comparación.
Algunos usuarios no siempre se percatan que los motores de búsqueda ponen
publicidad y vínculos esponsoreados entre los primeros resultados de
búsqueda, o que aquella información con mayor profundidad se encuentre
mucho mas abajo en la lista de resultados.
No existen dudas acerca de que los motores de búsqueda se han vuelto
más avanzados en los últimos años. Google es uno de los más sofisticados
tanto al brindar asistencia en la búsqueda (por ej., preguntando “Quizas,
quisiste decir…”, en respuesta a una palabra con un error ortográfico) y en la
visualización de los resultados, aunque aún se presentan inconvenientes. Al
momento de este escrito, no existen aún distinciones reales entre homógrafos,
por ejemplo, en la primera página de los resultados de búsqueda para el
término puente, Google devuelve una mezcla de recursos que abarcan sitios de
inversiones, puentes carreteros, accidentes con puentes, videoclips musicales,
información crediticia bancaria, entro otros resultados. La manipulación de los
sinónimos y de los términos relacionados es algo misterioso. En Google, la
búsqueda por mascotas graciosas devuelve divertidos videos acerca de
mascotas, pero algunos resultados son de perros traviesos no encontrándose
la palabra mascotas en ningún lugar de la página). Aunque las personas
comprenden que un perro es un tipo de mascota, las computadoras no lo
hacen y no pueden conocer esto; tienen que ser programadas para conectar
estas cadenas de caracteres y tratarlos como conceptos relacionados. Aunque
Google reconoce que cuenta con un “sistema de sinónimos” y lleva a cabo el
análisis de petabytes de documentos Web y datos de búsquedas históricas
para erigir una intrincada comprensión de que pueden significar las palabras en
diferentes contextos. Google no es particularmente comunicativo acerca de

30
como trabaja el control de sinónimos. Desafortunadamente, este sistema de
sinónimos no es algo que el usuario pueda explorar de manera directa.
La visualización de los resultados de búsqueda se ordena usualmente de
acuerdo a un ranking de relevancia, el que puede calcularse de varios modos.
Un motor de búsqueda puede medir la relevancia brindando un peso diferente
a factores como: cuan frecuentemente ocurre un término en una página o
archivo; si los términos están próximos o dispersos; si los términos están en el
encabezamiento (header) del documento o en el cuerpo del texto; y, cuan
común (o único) es un término particular. Los motores de búsqueda continúan
esforzándose en pos de lograr métodos más sofisticados de medir la
relevancia. Por ejemplo, Google utiliza una fórmula que examina mas de 200
factores diferentes para determinar la relevancia. Google usa factores comunes
en su fórmula, como la ubicación de la palabra y la frecuencia de la palabra;
pero, también usa criterios menos esperados como la calidad del sitio, la región
geográfica, el historial de búsqueda y la popularidad del sitio (i.e., cuan
frecuentemente una página esta vinculada por otras páginas Web), como
elementos del ranking de los resultados de búsqueda.
Cuando los metadatos fueron desarrollados inicialmente para describir
documentos Web, la mayoría de los motores de búsqueda no tomaban en
consideración los metadatos suministrados por los usuarios en su ranking de
relevancia debido a los metadatos ilícitos (por ej., incluyendo términos
populares que no tienen relación con el sitio que esta siendo descrito. Con el
desarrollo de los datos vinculados, sin embargo, los principales motores de
búsqueda comenzaron a incorporar ahora la inclusión de datos estructurados
como parte del marcado subyacente del texto de los recursos Web. Las
aproximaciones de codificación, como JASON-LD (Java Script Object Notation
for Linked Data), microdatos, y RDFa (Resource Description Framework in
Attibutes)—en combinación con vocabularios especializados (como las
categorías establecidas en Schema.org) para identificar la semántica
necesaria—pueden ser usadas para agregar más metadatos contextuales,
directamente en los recursos Web. Por ejemplo, en una búsqueda sobre
recetas en un sitio sobre cocina sería muy útil que el motor de búsqueda
pudiera distinguir entre aspectos dietéticos asociados con las recetas y los
ingredientes de las recetas. Con el apoyo de los datos vinculados y por el
procesamiento de los metadatos contextuales encontrados, codificados en los
documentos Web, los motores de búsqueda esperan continuar mejorando en
las décadas venideras.
Pueden o no proveer resultados intelectualmente satisfactorios como lo son
los resultados obtenidos de otras herramientas de recuperación. Sin embargo,
los usuarios frecuentemente manifiestan satisfacción en tanto encuentran algo
relacionado con lo que están buscando de manera rápida. Aún así, la mayoría
de los usuarios no saben si lo que encontraron es auténtico, autorizado o lo
mejor disponible respecto al tópico de interés. Las búsquedas por ítems
conocidos o por nombres específicos son muchas veces menos satisfactorias
que las búsquedas de información sobre un tópico. Google y los demás
motores de búsqueda, se actualizan y refinan continuamente, testean sus
algoritmos y fórmulas en las búsquedas para mejorar las experiencias de
búsquedas en Internet.

31
Directorios

En la década de 1990 y comienzos del 2000, existieron algunas alternativas


para encontrar recursos Web, diferentes al uso de motores de búsqueda. La
alternativa a los motores de búsqueda estuvo constituida por los directorios
(directories) y las “pasarelas” temáticas (subject gateway). Como se discutió en
el Capítulo 1, los directorios organizaron colecciones de vínculos a sitios Web.
El directorio creado por Yahoo! fue uno de los más grandes y mejor conocidos.
Yahoo! empleaba indizadores humanos en la creación de sus directorios. Estos
indizadores humanos agregaban términos y categorizaban los registros en un
índice de árbol temático jerárquico. La búsqueda podía darse por browsing a
través de las categorías o mediante palabras clave. Algunos directorios se
organizaron de acuerdo a las clasificaciones bibliotecarias tradicionales (por
ejemplo, Cyberstacks), pero la mayoría de ellos eran creados de forma original
por los diseñadores de los directorios, usualmente con 12 a 6 categorías de
alto nivel (por ej., Arte, Negocios, Computadoras, Finanzas, Juegos).
Los directorios y las pasarelas temáticas, en ese tiempo el primer lugar para
buscar sitios Web, han declinado considerablemente en popularidad debido al
ascenso de los motores de búsqueda asi como también por los tremendos
esfuerzos y recursos que demandaba mantener las extensas listas de recursos
Web en cambio continuo. La mayoría de los directorios de Internet y pasarelas
temáticas que perduraron han dejado de operar, aunque hay algunas que
permanecen abiertas. Para adquirir el sentido de como estos directorios fueron
organizados y que búsqueda de información en la Web fue común en el milenio
pasado, seria bueno visitar uno de los últimos directorios de Internet a gran
escala. The Best of The Web Directory < https://botw.org/>

La Necesidad de Revisitar las Herramientas de Recuperación

En el actual ambiente de información considerablemente focalizado en la


Web, es frecuente la tentación de pensar que es necesario nada mas que un
motor de búsqueda. Algunos sienten que si un recurso no puede ser
encontrado a través de Google, entonces dicho recurso puede no ser visto
como valioso. No obstante, esto puede estar muy alejado de la verdad. Puede
ser fácil de olvidar que mucha de la información del mundo no esta en línea en
este momento y que mucha de la información probablemente nunca lo estará.
Además, mucho de lo que esta disponible en forma electrónica no esta
necesariamente disponible de forma gratuita para todos. La información es aún
una commodity. La mayoría de los e-books no son gratuitos, sino que se
venden. Un artículo de revista que se necesite, se obtendrá por medio de un
pago. Pueden existir costos asociados con la información accesible en línea.
Aunque esto puede cambiar en el futuro, las herramientas de recuperación
individuales (más allá de los motores de búsqueda) aún tienen roles vitales que
jugar en la reunión de información. Sin embargo, los catálogos, los índices y
otras herramientas de recuperación, son frecuentemente comparados de
manera negativa con respecto a los motores de búsqueda. Los estudiantes y
los académicos han expresado de manera similar: ¿Por qué aún se utiliza el
catálogo “rígido”?¿Por qué no puede el catálogo parecerse más a Google (o a
Amazon, o a Facebook)? El deseo de herramientas claras y amigables para el

32
usuario es comprensible y ubicuo, y existen profesionales de la información que
estan trabajando para rectificar esta situación. No obstante, debemos ser
cuidadosos al recordar que esta no es una competencia. Ninguna cosa es tan
simple como poner palabras clave en la caja única de búsqueda de Google.
Hay veces que los usuarios y los profesionales de la información necesitan de
tipos de búsqueda más avanzadas que no están disponibles comúnmente en la
aproximación de los motores de búsqueda (por ej., una búsqueda por autor
antes que una búsqueda general por palabras clave).
Distintos tipos de herramientas de recuperación se han diseñado para
describir diferentes clases de materiales dirigidas a comunidades disímiles. Los
profesionales de la información deben comprender donde y como acceder a la
mejor información en cada situación particular. Por ejemplo, uno debe acceder
a un instrumento de localización si quiere información detallada acerca de una
colección de archivo—confiar en el breve registro de catálogo para la colección,
usualmente, no es suficiente. Utilizar Google para llegar a la página de
Wikipedia sobre Eleanor Roosevelt puede ser un buen punto de partida para un
informe escolar, aunque no proveerá información comprensiva acerca de su
vida y logros; los materiales impresos publicados, como biografías o historias
acerca de tal personal, proveerán una información de mayor profundidad y un
catálogo recuperará más fácilmente dichos materiales (en la medida que estén
en dicha colección) […]. Debemos ser muy cautelosos respecto a la
sobredependencia de una única herramienta de recuperación. El truco reside
en considerar que se conocen todas las herramientas y que estas se usan
cuando son necesarias y apropiadas.

Conclusión
Un siglo atrás, Charles Cutter estableció que el catálogo debería permitir a
las personas encontrar un libro del que fueran conocidos su título, autor o tema;
debería mostrar que está disponible en la biblioteca bajo un autor particular, un
tema particular o un tipo de literatura; y, debería asistir en la elección de un
libro por su edición o carácter. Un siglo después, los “objetivos” de Cutter son
aún bastante apropiados, excepto en que deben expandirse a todos los tipos
de recursos de información más allá de los libros en las bibliotecas, así como a
un número de herramientas de recuperación diferentes más allá de los
catálogos. Este capítulo ha discutido las principales herramientas usadas en la
organización y en la recuperación de información registrada. Los registros
sustitutos que constituyen una herramienta de recuperación deben ser creados
y codificados por humanos o automáticamente mediante programas de
computadora (creados por humanos) […].

33

También podría gustarte