2) Herramientas de Recuperación. J.T y W
2) Herramientas de Recuperación. J.T y W
2) Herramientas de Recuperación. J.T y W
Herramientas de recuperación
Este capítulo discute las herramientas de recuperación (retrieval tools), las
que constituyen bloques básicos en la organización de la información
registrada. Dichas herramientas de recuperación conllevan las siguientes
preguntas: ¿por qué se necesitan herramientas de recuperación?¿cuáles son
las herramientas de recuperación básicas, sus formatos y sus funciones?
1
revistas científicas del mundo. La magnitud de la tarea conllevó que tuvieran
que desarrollarse nuevas técnicas, diferentes de las practicas bibliotecarias
convencionales. La evolución del CBU en el siglo XX conllevó que cada país
sea responsable de la creación de registros bibliográficos de sus recursos de
información y que los comparta con otros países. El concepto también se
extendió al control de autoridad de los encabezamientos de nombres y títulos
usados como puntos de acceso. La IFLA (International Federation of Library
Associations and Institutions) a través de uno de sus programas combinó los
ideales del CBU con el concepto de elaborar registros legibles por ordenador.
Las muchas herramientas de recuperación que se han desarrollado como
resultado del sueño de Otlet y La Fontaine nos han acercado mucho más al
CBU.
Bibliografías
LISTAS Básicamente, son listas de recursos de información. Son esenciales para
académicos y aquellos profesionales involucrados con libros y otras fuentes de
información. La bibliografía reúne una lista de fuentes basados en un tema, un
autor, un período de tiempo, etc. Algunas de ellas incluyen anotaciones como
reseñas breves que indican el tema y/o comentan la utilidad del recurso de
información.
La bibliografía suele estar adicionada a las obras académicas y consiste de
la lista de los recursos de información que consultó el autor de la obra, las que
también pueden presentarse como entidades completamente separadas – es
decir, como obras escindidas. Cada recurso de información representado en
una bibliografía, tiene una descripción corta (que no debe confundirse ni con
una anotación ni con un resumen). La descripción típica incluye autor, título,
edición, editorial, lugar de publicación y fecha de publicación. En el caso de
partes de una obra, como el artículo de una revista o el capítulo de un libro,
incluye autor, título, nombre de la obra, volumen – si es aplicable – fecha de
publicación y número de páginas. Algunas citas también incluyen
características físicas.
En una bibliografía, cada descripción suele aparecer en un solo lugar de la
lista, frecuentemente bajo el autor de la obra – el primero de ellos, si son más
de uno. Generalmente, esta herramienta provee solo un punto de acceso. En
las bibliografías que se ordenan solo por autor, los demás atributos como el
título, el tema, etc., no constituyen puntos de acceso (i.e., los usuarios que solo
conocen el título, el nombre de un segundo o de un último creador, o el tema de
2
una obra, no estará fácilmente disponible para recuperar acerca de él dese la
bibliografía). Las descripciones se construyen acorde a varios estilos de cita.
Ejemplos de manuales de estilo y un ejemplo de cita de cada uno de ellos se
proveen debajo:
● Turabian
Mitchell, Terence R., and James R. Larson, Jr. People in Organizations:
An Introduction to Organizational Behavior. 3rd ed. New York:
McGraw-Hill, 1987.
Foco Propósito
Tema Reunir juntos recursos acerca de un tema particular.
Creador Reunir todas o algunas obras de un creador particular y,
algunas veces, incluir fuentes acerca del creador.
Lengua Reunir recursos textuales en los que el texto está en una
o más lenguas particulares.
Periodo Reunir todos los recursos que salen a la luz en un
temporal período de tiempo particular
Lugar Reunir recursos creados en una ubicación particular. Esta
podría ser una ubicación de envergadura, como un
continente, o una mas pequeña, como un país, región,
estado, ciudad o comunidad. Puede ser también una
3
institución, como una bibliografía de todas las obras de
una facultad de una universidad particular.
Editorial Reunir todos los productos de una editorial particular
Forma Reunir recursos de información que aparecen en un
cierto formato o género (por ej., videocasete, recursos
electrónicos, poesía, biografías). Estos siempre se
combinan virtualmente con uno de los otros focos.
4
sinónimos, los términos relacionados, los términos genéricos y los términos
específicos que se aplican a un encabezamiento de materia particular.
Las descripciones en un catálogo se elaboran de acuerdo a un estándar
seleccionado por cada comunidad particular – por ejemplo, en bibliotecas se
utiliza RDA (Recursos, Descripción y Acceso; en inglés Resource Description
and Access) y las Reglas de Catalogación Anglo Americanas, 2a. ed. (AACR2);
en archivos se utiliza DACS (Describing Archives: A Content Standard); CCO
(Cataloging Cultural Objects) para algunas colecciones de arte.
5
debería ser capaz de visualizar todos los recursos en la colección por creador,
sobre una temática específica o en un género particular o forma literaria. El
tercer objetivo, la función de selección (selection function), ayuda a los
usuarios a elegir el recurso que necesitan en base a los atributos bibliográficos
(por ej., versión, lengua, formato, fecha) o la naturaleza del contenido (por ej.,
género, forma). En dicha obra, Cutter se refirió solo a los catálogos de
biblioteca que representaban únicamente libros, aunque si dichos objetivos se
ampliaran a archivos, museos y otras instituciones que coleccionan recursos,
aún representan lo que los catálogos y otras herramientas de recuperación se
supone que harían hoy día.
(A) autor
(B) título
(C) tema, siendo, en los tres casos, conocido
6
(a) su autor y título; o
(b) en caso de no existir autor, solo por su título; o
(c) si ambos, autor y título, fuesen inapropiados o insuficientes para la
identificación, un sustituto de calidad para el título; y
2.2
(a) qué escritos bajo un autor particular y
(b) qué ediciones de un escrito particular, se encuentran en la biblioteca
7
pero la imagen mental de un catálogo topográfico con un ordenamiento idéntico
al del estante se ha perdido.
Una unión de catálogos (union catalogs) es una variante del concepto de
catálogo que solo representa las existencias de una institución. Una unión de
catálogos representa las existencias de más de una institución o colección. Una
unión de catálogos de una biblioteca central y de sus sucursales, por ejemplo,
muestra ítems que pueden estar almacenados en una o más sucursales,
además de aquellos almacenados en la biblioteca principal. La información de
ubicación indica donde se almacena el ítem. Una unión de catálogos de un
consorcio de instituciones trabaja de la misma forma: la información sobre
ubicación física muestra que ítems están alojados en que instituciones del
consorcio de bibliotecas. OCLC cuenta con una unión de catálogos, donde
cada recurso de información se corresponde con un registro maestro, y
asociados con él se encuentra un registro de existencias (holdings) que indica
la presencia del ítem en las colecciones de las bibliotecas cooperantes.
8
materiales genealógicos. Este uso, sin embargo, puede reemplazarse por la
disponibilidad de los catálogos en la Web. Los catálogos en forma de libro
existen también en algunas biblioteca y archivos como la única herramienta de
recuperación disponible para acceder a materiales antiguamente adquiridos, ya
que algunas instituciones han sostenido no convertir todos sus registros de
catálogos de materiales raros en formato legible por computadora disponibles
en el catálogo en línea.
Una ventaja de los catálogos en forma de libro sobre los catálogos en línea
radica en que los primeros son compactos y portables y pueden ser
consultados en cualquier lugar. Sin embargo, las computadoras laptop y la
tecnología de conexión inalámbrica a Internet están volviendo accesible desde
cualquier sitio el catálogo en línea.
9
Fig. 3.2. Una Representación de una Página de un Catálogo en forma de Libro
Otra ventaja reside en que mirar una página con asientos en un catálogo en
forma de libro es relativamente rápido, y algunas personas prefieren este medio
antes que mirar la pantalla del computador con las respuestas en línea. Una
ilustración de un catálogo en forma de libro se ve en la Figura 3.2
10
Catálogos de fichas. En un catálogo de fichas, cada descripción
bibliográfica se prepara en una ficha estándar de 7,5 x 12,5 cm, intercaladas en
gavetas repletas de fichas, en cajones diseñados especialmente. Las
dimensiones de las fichas no fueron siempre estándar, dado que durante los
inicios del catálogo en fichas se usaron diferentes tamaños ( 3 x 5 plg., 1 ½ x 5
plg., 1 ½ x 10 plg. y 4 x 6 plg.). Los catálogos de fichas fueron popularizados en
los Estados Unidos por las fichas de la Library of Congress (LC), las que
estuvieron disponibles a la distribución en 1901, y por las fichas producidas por
la editorial H.W. Wilson, disponibles en 1938, en respuesta de las necesidades
de las bibliotecas pequeñas – ambas instituciones han cesado actualmente la
producción de fichas de catálogo.
Los avances tecnológicos han cambiado los usos del catálogo de fichas. En
primer lugar, el tipeo en máquinas de escribir suplantó la escritura manuscrita
de las fichas. La impresión offset fue utilizada por LC en la producción de sus
fichas. Luego, la fotocopia de una ficha maestra permitía la creación del juego
de fichas completo de la biblioteca a nivel local. Finalmente, el advenimiento de
la impresión por computadora hizo posible la producción de fichas, adaptada
por las bibliotecas locales o por emprendimientos distantes. En esta última
instancia, las fichas eran frecuentemente enviadas al destinatario en cajas,
presentándose ya alfabetizadas y listas para intercalar.
Gracias a la influencia de las fichas de LC, los catálogos en fichas y el orden
de la información registrada en las fichas lograron una estandarización durante
décadas.
11
dispuestos a utilizar catálogos distantes tan fácilmente como los catálogos
locales. Sin embargo, el ordenamiento de los catálogos de fichas
frecuentemente solía diferir de biblioteca en biblioteca. Los catálogos en línea
han reemplazado a la mayoría de los catálogos en fichas en Estados Unidos,
aunque algunas bibliotecas, archivos y museos aun tienen catálogos en fichas,
especialmente las pequeñas instituciones o aquellas que solo han tenido una
mínima conversión de datos a formato legible por ordenador. En muchos
países, existen más catálogos de fichas, y en algunos los catálogos de fichas
son aun la forma predominante. La Figura 3.4 muestra un ejemplo de catálogo
de fichas contemporáneo.
la más importante OPAC. Los catálogos de acceso público en línea (OnLine Public Access
clase 4 Catalogs, OPAC) constituyen la forma predominante del catálogo en los
del Estados Unidos, y en otros países, actualmente. En este catálogo, los registros
15/5/2023 se almacenan en un servidor local o remoto. Los registros se visualizan
solamente ante una demanda de información. Cuentan con mayor flexibilidad
en la visualización de los resultados de búsqueda.
La Figura 3.5 muestra la pantalla de búsqueda básica del OPAC de Beatley
Library del Simon College. La Figura 3.6 muestra un registro único de dicho
catálogo de biblioteca. Los catálogos en línea no están estandarizados aún,
aunque en una o más instituciones que hayan adquirido el mismo software, las
visualizaciones parecieran contar con algunos aspectos similares. Los autores
en este campo, hace tiempo que demandan la necesidad de la estandarización,
de manera que los usuarios pueden moverse de catálogo en catálogo o puedan
realizar búsquedas sobre múltiples catálogos desde un solo lugar, y poder
encontrar y visualizar registros de una manera uniforme. En años recientes, las
insatisfacciones con estos aspectos de los catálogos en línea han sido
expresadas por muchos profesionales en el campo de la bibliotecología y la
ciencia de la información. La frustración vinculada con la dificultad en el uso de
los catálogos en línea, se intensifica cuando se procede a comparar dicho
catálogo con los motores de búsqueda en Internet – como Google – que son
relativamente fáciles de utilizar. A veces este descontento ha conducido a
cuestionamientos respecto a las perspectivas a largo plazo de los catálogos en
línea. Si los proveedores comerciales de catálogos responden por medio de
mejoras en el ordenamiento de los resultados de búsqueda – por ejemplo,
enfatizando las relaciones entre recursos – los catálogos en línea pueden ser
12
vistos otra vez como proveedores de recursos que no están disponibles en los
motores de búsqueda, y de esta forma asegurar su supervivencia futura.
Algunos creen que cuando la Web Semántica sea una realidad y todos los tipos
de recursos (bibliográficos y demás) se conectan usando técnicas de datos
vinculados, entonces quizás los motores de búsqueda generales reemplazarán
a los OPAC que usamos hoy día para encontrar información en las bibliotecas,
sin embargo, esto puede ocurrir en mucho tiempo.
13
línea, aunque estas no son las únicas opciones de visualización. En los OPAC
actuales, se ofrecen varias opciones para visualizar los resultados de
búsqueda; los usuarios pueden elegir el ordenamiento que mejor se aplique a
sus búsquedas particulares desde una lista de opciones.
14
excepto en que en el catálogo sistemático cada recurso de información puede
representarse por varias notaciones que significan la totalidad de sus
conceptos temáticos, no solamente por una notación clasificatoria como ocurre
con los ítems en el estante. Un ejemplo de una página de un catálogo impreso
clasificado se presenta en la Figura 3.7, donde pueden verse los asientos
ordenados por la signatura topográfica asociada con cada recurso.
En la medida en que es imposible para cualquier persona conocer todas las
notaciones clasificatorias relacionadas a una materia, existe una sección en el
catálogo que lista las representaciones verbales de todos los tópicos y brinda la
notación para cada tópico (por ej., Electric cooking, Slow = 641.5884) Los
usuarios que buscan por autor y por título, deben utilizar otras secciones del
catálogo. En los catálogos de fichas, los catálogos en forma de libro y en los
catálogos en microforma, las secciones de autor, título y tema se ordenan
alfabéticamente, en los OPAC se presenta la búsqueda por palabras y el orden
de la visualización de los resultados varia.
Los catálogos clasificados se utilizan tradicionalmente en Europa y en
países en los que se habla más de una lengua. La sección clasificada o
sistemática del catálogo puede incluir registros para cada una de las lenguas
representadas, con varias lenguas intercaladas en la misma notación
clasificatoria. La sección el catálogo que brinda acceso a la identificación de la
notación clasificatoria, y a los autores y títulos puede estar en la lengua
convencional utilizada por los usuarios. Estados Unidos no sintió
tradicionalmente la necesidad de esta aproximación. Hoy día, al afirmarse que
el acceso al catálogo a través de Internet es de índole global, se esta
reconsiderando el concepto del catálogo sistemático en el sentido de su
capacidad de poder almacenar y visualizar registros en diferentes lenguas con
notaciones clasificatorias de carácter universal. Si los índices que dirigen al
catálogo sistemático se elaboran en varias lenguas, puede brindarse el acceso
a través de más de una lengua. Además, favorece el browsing y las búsqueda
amplias y estrechas, las que son especialmente útiles para usuarios en línea
inexpertos.
15
Figura 3.7. Una Representación de una Página de un Catálogo Clasificado o
Sistemático en Forma de Libro
17
Figura 3.8). El catalogo dividido fue más fácil y económico para quienes se
encargaban de la gestión y del mantenimiento del mismo. Sin embargo, este
tipo de catálogo asume que los usuarios conocen la diferencia entre asientos
de autor, título y tema, lo que no siempre ocurre.
18
defecto (default display). En algunos catálogos, las búsquedas por creadores o
por títulos puede devolver una visualización alfabética de puntos de acceso
controlados-autorizados para creadores o una lista de títulos en orden
alfabético, aunque otros sistemas cuentan con un marco por defecto que se
usa para casi todos los tipos de búsqueda: el ranking de relevancia (relevance
ranking). El ordenamiento por relevancia puede ser misterioso para los
usuarios y para los profesionales de la información. La idea es que los recursos
que están más estrechamente conectados con los términos de búsqueda se
ubiquen más arriba entre los resultados de búsqueda. La relevancia se
determina por algoritmos, y se define de forma diferente en cada sistema. Se
basa en una combinación de factores (por ej., ubicación, peso del campo,
frecuencia de términos) que puede ser adaptada de alguna forma de acuerdo a
las preferencias de la institución.
La elección de ordenamientos en la visualización y la elección de
búsquedas disponibles varia de catálogo en catálogo. Algunos, por ejemplo, no
proveen a los usuarios la posibilidad de llevar a cabo búsquedas por signatura
topográfica o por notación clasificatoria, aunque permiten que los resultados de
búsqueda por título o creador sean ordenamos por signatura topográfica.
Algunos OPAC no permiten browsing de listas controladas-autorizadas de
nombres, focalizándose principalmente—en su lugar—sobre la búsqueda por
palabra clave. La mayoría de los catálogos en línea actuales permite a los
usuarios la elección del orden en que se presentan los resultados de búsqueda.
Los catálogos permiten ordenamientos por:
● Ranking de relevancia
visto en clase ● Nombre del creador (alfabético por apellido)
● Título (alfabético por la primera palabra, excepto artículos)
● Signatura topográfica
● Orden cronológico ascendente (fecha de publicación más antigua a la
última)
● Orden cronológico descendente (desde la última a la más antigüa)
● Los recursos mas populares, primero
● Tipo de material o formato
Las elecciones ofrecidas por los catálogos pueden variar desde dos o tres
de estas opciones de ordenamiento a, quizás, la mayoría de los tipos listados.
En algunos sistemas, estos ordenamientos pueden incluir también opciones
para una variedad de sub-ordenamientos bajo el primer criterio elegido (por ej.,
ordenado primero por creador y luego subordenado por título o por fecha de
publicación).
Índices
19
bibliográfico. Sin embargo, estos auxilian en la recuperación de la información
encontrada en el texto en mano. Algunos sitios Web también cuentan con
índices que funcionan de manera similar a los índices de final de libro, pero en
lugar de contar con un número de página como referencia para la localización,
cada asiento del índice se vincula directamente a un “ancla” HTML en la que se
halla indizado el sitio. En la Web se los denomina índices A-Z para distinguirlos
de los árboles de búsqueda y los motores de búsqueda. La indización para
generar Índices A-Z utiliza software especializado – como HTML Indexer y
XRefHT32. Como los índices de libros, un Índice Web A-Z puede contener
asientos de segundo nivel o subordinados, asientos variantes y referencias
cruzadas.
Los índices considerados como herramientas de recuperación en el sentido
de este capítulo se encuentran escindidos de los recursos de información que
analizan. Los índices de bases de datos – también llamados índices de revistas
o índices de publicaciones seriadas – son claros ejemplos de herramientas de
recuperación. Estos índices no tienen control de autoridad de nombres. Un
nombre como Lois Mai Chan puede ingresarse dentro del mismo índice en
diferentes momentos como: Chan, L.; Chan, LM; Chan, L.M.; Chan, Lois M;
Chan, Lois Mai y, aún, Mai Chan, Lois. Los índices mantienen usualmente,
control de autoridad sobre los temas. Los indizadores tienden a utilizar
vocabularios controlados – llamados tesauros – para agrupar aquellos términos
temáticos deseados en el índice. Un tesauro contiene un lenguaje
sistematizado que subsume los términos específicos bajo términos genéricos y
provee una estructura de relaciones entre términos.
A diferencia de los catálogos, los índices no se limitan a lo que está
disponible en una configuración local o en una colección particular, y
usualmente no brindan información para la localización ulterior de la
información. Brindan, como parte de la descripción, el recurso más amplio en el
que puede encontrarse la obra más pequeña. Especialmente en el caso de los
índices impresos, puede ser necesario para un usuario de un índice buscar en
el catálogo la ubicación de una obra mayor. En algunos índices en línea, existe
la posibilidad de vincularse con catálogos en línea para permitir a los usuarios
ver rápidamente si su biblioteca cuenta con la obra mayor. Si dicha obra mayor
no se encuentra en el catálogo local, el usuario puede buscar en una unión de
catálogos o recurrir al préstamo interbibliotecario. Los índices en línea cuentan,
crecientemente con vínculos a las versiones electrónicas de los artículos.
La indización puede ser llevada a cabo por personas o por computadoras,
automáticamente, o por una combinación de ambas. La indización en las bases
de datos es aun, en su mayor parte, completada por indizadores entrenados,
aunque exista alguna asistencia automática. Los índices pueden encontrarse
en formato impreso o en formato legible por ordenador, la mayoría de los
cuales se encuentran en línea. Algunos índices en versión impresa se ordenan
alfabéticamente – a la manera de un diccionario – con asientos de autor, título y
temas intercalados. Otros reflejan un ordenamiento dividido, contando con un
índice de autor/título separado del índice temático. Los índices en línea tienen
interfaces que indican como buscar y como visualizar los resultados. Como en
el caso de catálogos en línea de acceso público (OPAC) no existe una
estandarización a ser seguida entre índice e índice. Los OPAC, al menos,
cuentan con la normalización devenida del uso de RDA o AACR2, mientras no
20
existe un estándar como tal comúnmente utilizado en la construcción de índices
[…]. Existe una norma internacional ISO sobre índices publicada en 1996.
Otra diferencia entre catálogos e índices, es que estos últimos tienden a ser
creados por empresas comerciales – como H.W. Wilson – o por sociedades
profesionales – como American Chemical Society. Frecuentemente, se tarifa
directamente el uso de la versión en línea del índice. Las bibliotecas suelen
comprar los índices impresos , o pagar el acceso de sus usuarios a la consulta
de índices en línea […].
Un ejemplo de índice se muestra en la Figura 3.9, e ilustra los tipos de
información incluidos en un índice de artículos de revistas académicas.
21
Figura 3.9. Una Representación de un Asiento de Indice para un Artículo de una
Revista Académica
Comienza con el título del artículo y luego lista varias características del
artículo, incluyendo quien lo escribe, información de contacto y afiliación.
También hay información de la revista, incluyendo su título, tipo,
identificador—usualmente, el ISSN. Otra información incluye el nomre de la
editorial, el volumen y el número, los números de página y la extensión del
artículo. También hay un resumen indicativo o descriptivo y temas asociados.
La mayoría de los índices son elaborados por humanos. Sin embargo, desde la
década de 1950 se comenzó a trabajar en la indización automática que
descansa en la computadora para elaborar el índice, desarrollando tareas
repetitivas a una alta velocidad. El primer método automático, introducido por
Luhn en 1958, se conoció como indización o índice KWIC (Key Word In
Context). En un índice KWIC, los títulos se ordenan de manera tal que cada
palabra del título ocurre una vez en orden alfabético en el centro de la página,
con las restantes palabras de izquierda a derecha de la palabra central, en el
orden en que aparezcan en el título – por esto, la palabra alfabetizada se
considera “en contexto”.
KWIC
Introduction to Cataloging and Classification.
Introduction to Cataloging and Classification.
Introduction to Cataloging and Classification.
Una adaptación del método KWIC, se conoce como KWOC (Key Word Out
Context), el que presenta las palabras en el margen izquierdo en lugar de la
mitad de la página, y el título se imprime a la derecha o debajo de la palabra
clave seleccionada
KWOC
Cataloging
Introduction to Cataloging and Classification.
Classification
Introduction to Cataloging and Classification.
Introduction
Introduction to Cataloging and Classification.
Dos tipos adicionales identificados ambos como KWAC se utilizan menos
frecuentemente. El primero, Key Word and Context, es una combinación de
KWIC y KWOC, en el que la palabra significativa aparece tanto en la posición
del encabezamiento y en el contexto, como en el resto del título. El segundo,
Key Word and Context, permite al indizador aumentar el título con palabras
adicionales para proveer mayor significado y mejorar el acceso al recurso.
22
KWAC: Key Word Augmented in Context
Cataloging and Classification [in Libraries]. Introduction to
Classification [in Libraries]. Introduction to Cataloging and
Introduction to Cataloging and Classification [in Libraries].
Libraries. Introduction to Cataloging and Classification
23
● Procedencia—incluyendo creador, título, fechas e historia
administrativa y biográfica;
● Condiciones y extensión—incluye la cantidad (número, volumen
y pies lineales y cúbicos) y la mención de las condiciones de la
colección;
● Alcance y notas de contenido—incluye la descripción de la
naturaleza de la colección, que abarca la extensión y profundidad,
los vacíos o discontinuidades, los tipos de materiales y los puntos
de acceso para nombres y materias de la colección;
● Orden y estructura—incluye una descripción de cómo esta
organizada y ordenada la colección, y una lista detallada de los
contenedores;
● Información administrativa—incluye la ubicación, condiciones de
uso, restricciones, adquisición y accesión, repositorio e información
de conservación
24
25
26
Figura 3.10. Un Ejemplo de Instrumento de Localización (Beatley Library
Collection: CC30, Simmons College Archives, Boston, MA)
27
archivos que ayudan a proveer la organización de información al contenido del
museo.
Adicionalmente, los museos proveen bases de datos de acceso público en
línea. Por ejemplo, el Pitt Revers Museum en Oxford, Inglaterra, cuenta con
una base de datos de objetos y una base de datos de fotografías. Un usuario
puede buscar cada base de datos completando los campos de búsqueda. La
base de datos de objetos – también llamada Catálogo de la Colección de
objetos (Objects Collection Catalogue) – contiene “cajas” de búsqueda (search
box) para nombre del objeto, país del que proviene el objeto – la que contiene
una lista desplegable con los nombres de países; el grupo cultural del que
provine el objeto; de que material esta hecho; cuando fue coleccionado; etc. La
base de datos de fotografías – también llamada Catálogo de Colección de
Fotografías (Photographs Collection Catalogue) – además de los campos de
búsqueda para objetos mencionados, contiene “cajas” de búsqueda para
actividad y eventos representados; personas mostradas; fotógrafo; proceso
fotográfico; dimensiones de la imagen; fecha de la fotografía; etc. Se sugiere
que los usuarios no busquen en más de tres campos a la vez en la base de
datos [Pitt Revers Museum, disponible en http://www.prm.ox.ac.uk/, consultado
Abril 25, 2011]
Un ejemplod e una aproximación más comprensiva y estilizada es la de
National Gallery of Art (NGA), en Washington, DC. La colección entera (dibujos,
pinturas, fotografías, impresos y esculturas) puede ser buscada en, al menos,
dos métodos diferentes a través del sitio Web. La primera interfaz se denomina
“Search the Collection”. Permite al usuario buscar los “registros objetos” de la
colección por el nombre del artista, palabras clave del título, o en la descripción
del objeto, donantes y propietarios, números de accesión, la historia de
exhibiciones y otros campos. Después de que una búsqueda inicial se
completa, los usuarios pueden filtrar sus resultados de búsqueda por
multimedio, nacionalidad, periodo de tiempo, estilos y si un objeto está en
exhibición. Se provee una imagen digital para la mayoría de las obras. Además,
algunas obras de arte tienen descripciones extensas. Por ejemplo, los
resultados de búsqueda para la pintura Cape Cod Evening de Edward Hooper,
comienza con alguna breve información:
28
multimedia y fechas. Los resultados de búsqueda proveen imágenes digitales
descargables para muchas de las obras, un vínculo al registro del objeto
(mencionado mas arriba) y una breve descripción.
Motores de Búsqueda
29
(GigaBytes) de datos son sobre los que se busca cuando los usuarios ingresan
términos en las cajas de búsqueda.
Obviamente, no se indizan todas las páginas Web de Internet. Algunos
recursos pueden ser indizados solo por unos pocos motores de búsqueda – de
esta manera, puede contarse con una variedad de respuestas cuando se busca
en diferentes motores de búsqueda a partir del mismo concepto de búsqueda.
Además, no todos los motores de búsqueda indizan cada tipo de material
disponible en Internet. En años recientes, aquellos recursos electrónicos en
formato PDF y PowerPoint se han vuelto recuperables en la Web. En algunos
casos, los recursos pueden estar protegidos por claves o contraseñas
(password), y como resultado no pueden ser indizadas por un motor de
búsqueda ya que no están accesibles al robot. En otros casos, algunos
recursos pueden ser indizados y transformarse en resultados de búsqueda,
aunque tengan restringido su acceso – un hecho que descubre una persona
solo después de intentar acceder a la información. En general, solo la Web
superficial se incluye en los índices de motores de búsqueda; la llamada Web
profunda, incluye muchas cosas que el público en general no querría ver
indizadas en los motores de búsqueda (por ej., correspondencia de e-mails,
transacciones financieras, perfiles de datos, etc.).
De manera diferente a los catálogos y a los instrumentos de localización, los
motores de búsqueda se han vuelto una parte ubicua de las interacciones
rutinarias de los usuarios que acceden a Internet. Debido a la familiaridad
general con los motores de búsqueda y su relativa facilidad de uso (solo lanzar
algunas palabras clave en una caja de búsqueda), otras herramientas de
recuperación lucen, frecuentemente, anticuadas y complejas en comparación.
Algunos usuarios no siempre se percatan que los motores de búsqueda ponen
publicidad y vínculos esponsoreados entre los primeros resultados de
búsqueda, o que aquella información con mayor profundidad se encuentre
mucho mas abajo en la lista de resultados.
No existen dudas acerca de que los motores de búsqueda se han vuelto
más avanzados en los últimos años. Google es uno de los más sofisticados
tanto al brindar asistencia en la búsqueda (por ej., preguntando “Quizas,
quisiste decir…”, en respuesta a una palabra con un error ortográfico) y en la
visualización de los resultados, aunque aún se presentan inconvenientes. Al
momento de este escrito, no existen aún distinciones reales entre homógrafos,
por ejemplo, en la primera página de los resultados de búsqueda para el
término puente, Google devuelve una mezcla de recursos que abarcan sitios de
inversiones, puentes carreteros, accidentes con puentes, videoclips musicales,
información crediticia bancaria, entro otros resultados. La manipulación de los
sinónimos y de los términos relacionados es algo misterioso. En Google, la
búsqueda por mascotas graciosas devuelve divertidos videos acerca de
mascotas, pero algunos resultados son de perros traviesos no encontrándose
la palabra mascotas en ningún lugar de la página). Aunque las personas
comprenden que un perro es un tipo de mascota, las computadoras no lo
hacen y no pueden conocer esto; tienen que ser programadas para conectar
estas cadenas de caracteres y tratarlos como conceptos relacionados. Aunque
Google reconoce que cuenta con un “sistema de sinónimos” y lleva a cabo el
análisis de petabytes de documentos Web y datos de búsquedas históricas
para erigir una intrincada comprensión de que pueden significar las palabras en
diferentes contextos. Google no es particularmente comunicativo acerca de
30
como trabaja el control de sinónimos. Desafortunadamente, este sistema de
sinónimos no es algo que el usuario pueda explorar de manera directa.
La visualización de los resultados de búsqueda se ordena usualmente de
acuerdo a un ranking de relevancia, el que puede calcularse de varios modos.
Un motor de búsqueda puede medir la relevancia brindando un peso diferente
a factores como: cuan frecuentemente ocurre un término en una página o
archivo; si los términos están próximos o dispersos; si los términos están en el
encabezamiento (header) del documento o en el cuerpo del texto; y, cuan
común (o único) es un término particular. Los motores de búsqueda continúan
esforzándose en pos de lograr métodos más sofisticados de medir la
relevancia. Por ejemplo, Google utiliza una fórmula que examina mas de 200
factores diferentes para determinar la relevancia. Google usa factores comunes
en su fórmula, como la ubicación de la palabra y la frecuencia de la palabra;
pero, también usa criterios menos esperados como la calidad del sitio, la región
geográfica, el historial de búsqueda y la popularidad del sitio (i.e., cuan
frecuentemente una página esta vinculada por otras páginas Web), como
elementos del ranking de los resultados de búsqueda.
Cuando los metadatos fueron desarrollados inicialmente para describir
documentos Web, la mayoría de los motores de búsqueda no tomaban en
consideración los metadatos suministrados por los usuarios en su ranking de
relevancia debido a los metadatos ilícitos (por ej., incluyendo términos
populares que no tienen relación con el sitio que esta siendo descrito. Con el
desarrollo de los datos vinculados, sin embargo, los principales motores de
búsqueda comenzaron a incorporar ahora la inclusión de datos estructurados
como parte del marcado subyacente del texto de los recursos Web. Las
aproximaciones de codificación, como JASON-LD (Java Script Object Notation
for Linked Data), microdatos, y RDFa (Resource Description Framework in
Attibutes)—en combinación con vocabularios especializados (como las
categorías establecidas en Schema.org) para identificar la semántica
necesaria—pueden ser usadas para agregar más metadatos contextuales,
directamente en los recursos Web. Por ejemplo, en una búsqueda sobre
recetas en un sitio sobre cocina sería muy útil que el motor de búsqueda
pudiera distinguir entre aspectos dietéticos asociados con las recetas y los
ingredientes de las recetas. Con el apoyo de los datos vinculados y por el
procesamiento de los metadatos contextuales encontrados, codificados en los
documentos Web, los motores de búsqueda esperan continuar mejorando en
las décadas venideras.
Pueden o no proveer resultados intelectualmente satisfactorios como lo son
los resultados obtenidos de otras herramientas de recuperación. Sin embargo,
los usuarios frecuentemente manifiestan satisfacción en tanto encuentran algo
relacionado con lo que están buscando de manera rápida. Aún así, la mayoría
de los usuarios no saben si lo que encontraron es auténtico, autorizado o lo
mejor disponible respecto al tópico de interés. Las búsquedas por ítems
conocidos o por nombres específicos son muchas veces menos satisfactorias
que las búsquedas de información sobre un tópico. Google y los demás
motores de búsqueda, se actualizan y refinan continuamente, testean sus
algoritmos y fórmulas en las búsquedas para mejorar las experiencias de
búsquedas en Internet.
31
Directorios
32
usuario es comprensible y ubicuo, y existen profesionales de la información que
estan trabajando para rectificar esta situación. No obstante, debemos ser
cuidadosos al recordar que esta no es una competencia. Ninguna cosa es tan
simple como poner palabras clave en la caja única de búsqueda de Google.
Hay veces que los usuarios y los profesionales de la información necesitan de
tipos de búsqueda más avanzadas que no están disponibles comúnmente en la
aproximación de los motores de búsqueda (por ej., una búsqueda por autor
antes que una búsqueda general por palabras clave).
Distintos tipos de herramientas de recuperación se han diseñado para
describir diferentes clases de materiales dirigidas a comunidades disímiles. Los
profesionales de la información deben comprender donde y como acceder a la
mejor información en cada situación particular. Por ejemplo, uno debe acceder
a un instrumento de localización si quiere información detallada acerca de una
colección de archivo—confiar en el breve registro de catálogo para la colección,
usualmente, no es suficiente. Utilizar Google para llegar a la página de
Wikipedia sobre Eleanor Roosevelt puede ser un buen punto de partida para un
informe escolar, aunque no proveerá información comprensiva acerca de su
vida y logros; los materiales impresos publicados, como biografías o historias
acerca de tal personal, proveerán una información de mayor profundidad y un
catálogo recuperará más fácilmente dichos materiales (en la medida que estén
en dicha colección) […]. Debemos ser muy cautelosos respecto a la
sobredependencia de una única herramienta de recuperación. El truco reside
en considerar que se conocen todas las herramientas y que estas se usan
cuando son necesarias y apropiadas.
Conclusión
Un siglo atrás, Charles Cutter estableció que el catálogo debería permitir a
las personas encontrar un libro del que fueran conocidos su título, autor o tema;
debería mostrar que está disponible en la biblioteca bajo un autor particular, un
tema particular o un tipo de literatura; y, debería asistir en la elección de un
libro por su edición o carácter. Un siglo después, los “objetivos” de Cutter son
aún bastante apropiados, excepto en que deben expandirse a todos los tipos
de recursos de información más allá de los libros en las bibliotecas, así como a
un número de herramientas de recuperación diferentes más allá de los
catálogos. Este capítulo ha discutido las principales herramientas usadas en la
organización y en la recuperación de información registrada. Los registros
sustitutos que constituyen una herramienta de recuperación deben ser creados
y codificados por humanos o automáticamente mediante programas de
computadora (creados por humanos) […].
33