Indexacion y Asociacion

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 6

¿Qué es índice?

El índice de una base de datos es una estructura de datos que mejora la velocidad de


las operaciones, por medio de un identificador único de cada fila de una tabla, permitiendo
un rápido acceso a los registros de una tabla en una base de datos. Además, el índice tiene
un funcionamiento similar al índice de un libro, guardando parejas de elementos: el
elemento que se desea indexar y su posición en la base de datos. Para buscar un elemento
que esté indexado, sólo hay que buscar en el índice dicho elemento para, una vez
encontrado, devolver un registro que se encuentre en la posición marcada por el índice.

El espacio en disco requerido para almacenar el índice es generalmente menor que


el espacio de almacenamiento de la tabla, puesto que los índices generalmente contienen
solamente los campos clave de acuerdo con los que la tabla será ordenada, y excluyen el
resto de los detalles de la tabla. Esto permite almacenar en memoria principal los índices
por completo, lo que permite realizar más rápida la búsqueda de la dirección física del
registro en las tablas.

Indexación

La indexación es el proceso mediante el cual se examinan ordenadamente los datos


e informes para elaborar su índice, que es el que facilita la búsqueda de información y
ayuda a seleccionar con mayor exhaustividad, que significa que es muy completo y
profundo de la información más pertinente de acuerdo con las características de los
usuarios. Además es el procedimiento por el cual se aplica la modalidad para mantener
constante el tiempo, el valor de compra en toda transacción, compensando a la misma de
una forma directa e indirecta.

Esto por lo general se aplica a instancia de la corrección de los precios de


determinados productos de consumo, salarios, tipos de interés, entre otros, con la misión de
equilibrarlos y acercarlos al alza general de precios. La indexación al aplicar Será el
resultado de la medición de un índice. Por otra parte el ámbito de la informática, se
llama indexación al proceso por donde le buscador va rastreando el sitio y a su vez
incorporan la base de datos son conjunto informativos organizados en un mismo contexto
para su uso y vinculación. Este proceso es de suma importancia para las páginas
web porque permite que la página web aparezca en algunos de los buscadores, pero
aquellas páginas que no se haya indexado como debería no aparecer entre los resultados de
una búsqueda.

Cuando las páginas web son indexadas el contenido puede ser rastreado por
los spiders que es un sistema informático que busca archivos almacenados en servicios
web para lograr buenas posiciones y también se utiliza en el ámbito económico.

 Indexar una base de datos: Requiere de una buena comprensión de los datos, las
funciones de usuario y de cómo está indexada la base de datos. Los índices utilizan
componentes clave de los datos de una tabla en una estructura binaria para mejorar
la capacidad de búsqueda. Cada registro de datos en la tabla debe estar asociado con
datos en el índice. Indexar puede aumentar notablemente la velocidad de búsqueda.
Sin embargo, un inconveniente de los índices es que cada operación de inserción,
actualización o supresión necesita una actualización de los índices. Cuando una
tabla incluye índices múltiples, cada índice puede aumentar el tiempo que lleva
procesar las actualizaciones de la tabla. Si se desea reducir el número de índices
para mejorar la velocidad de procesamiento, se deben eliminar los índices que son
menos valiosos a los efectos de la búsqueda.

Técnicas de indexación y asociación

Existen varias técnicas de indexación y asociación. Ninguna de ellas es mejor. Sin


embargo existen aplicaciones específicas de bases de datos donde aplicarlas. Cada técnica
debe ser valorada según los siguientes criterios:

 Tipos de acceso: Los tipos de acceso que se soportan eficazmente. Estos tipos
podrían incluir la búsqueda de registros con un valor concreto en un atributo, o
buscar los registros cuyos atributos contengan valores en un rango especificado.
 Tiempo de acceso: El tiempo que se tarda en buscar un determinado elemento de
datos, o conjunto de elementos, usando la técnica en cuestión.
 Tiempo de inserción: El tiempo empleado en insertar un nuevo elemento de datos.
Este valor incluye el tiempo empleado en buscar el lugar apropiado donde insertar
el nuevo elemento de datos, así como el tiempo empleado en actualizar la estructura
del índice.
 Tiempo de borrado: Es el tiempo empleado en borrar un elemento de datos. Este
valor incluye el tiempo empleado en buscar el elemento a borrar, así como el tiempo
empleado en actualizar la estructura del índice.
 Espacio adicional requerido: El espacio adicional ocupado por la estructura del
índice. Como normalmente la cantidad necesaria de espacio adicional suele ser
moderada, es razonable sacrificar el espacio para alcanzar un rendimiento mejor.

Índice Denso

Es aquel en el cual aparece un registro índice para cada valor de la clave búsqueda
en el archivo. El registro índice contiene el valor de la clave y un puntero al primer registro
con ese valor de la clave de búsqueda. . El resto de registros con el mismo valor de la clave
de búsqueda se almacenan consecutivamente después del primer registro, dado que, ya que
el índice es con agrupación, los registros se ordenan sobre la misma clave de búsqueda. Las
implementaciones de índices densos pueden almacenar una lista de punteros a todos los
registros con el mismo valor de la clave de búsqueda; esto no es esencial para los índices
con agrupación.

Índice Disperso:

Sólo se crea un registro índice para algunos de los valores. Al igual que en los
índices densos, cada registro índice contiene un valor de la clave de búsqueda y un puntero
al primer registro con ese valor de la clave. Para localizar un registro se busca la entrada del
índice con el valor más grande que sea menor o igual que el valor que se está buscando. Se
empieza por el registro apuntado por esa entrada del índice y se continúa con los punteros
del archivo hasta encontrar el registro deseado.

Generalmente es más rápido localizar un registro si se usa un índice denso en vez de


un índice disperso. Sin embargo, los índices dispersos tienen algunas ventajas sobre los
índices densos, como el utilizar un espacio más reducido y un mantenimiento adicional
menor para las inserciones y borrados. Existe un compromiso que el diseñador del sistema
debe mantener entre el tiempo de acceso y el espacio adicional requerido. Un buen
compromiso es tener un índice disperso con una entrada del índice por cada bloque. Es tos
porque el mayor coste de procesar una petición en la base de datos es el empleado en traer
un bloque de disco a la memoria. Una vez el bloque en memoria, el tiempo en examinarlo
es prácticamente despreciable.

Índice Multinivel:

Si el índice primario no cabe en la memoria principal, el acceso a las entradas de


índice se hace costosas.  Si un índice es lo bastante pequeño como para guardarlo en la
memoria principal, el tiempo de búsqueda para encontrar una entrada será breve. Sin
embargo, si el índice es tan grande que se debe guardar en disco, buscar una entrada
implicará leer varios bloques de disco.

La solución es guardar el índice primario en el Disco como un archivo secuencial y


construir un índice disperso sobre él.

 Índices externos: índice disperso del índice primario


 Índices internos: archivo del índice primario.

Usando los dos niveles de indexación y con el índice más externo en memoria
principal hay que leer un único bloque índice, en vez de los siete que se leían con la
búsqueda binaria. Si al archivo es extremadamente grande, incluso el índice exterior podría
crecer demasiado para caber en la memoria principal. En este caso se podría crear todavía
otro nivel más de indexación. De hecho, se podría repetir este proceso tantas veces como
fuese necesario. Los índices con dos o más niveles se llaman índices multinivel. La
búsqueda de registros usando un índice multinivel necesita claramente menos operaciones'
de E/S que las que se emplean en la búsqueda de registros con la búsqueda binaria.

Actualización del índice

Sin importar el tipo de índice que se esté usando, los índices se deben actualizar
siempre que se inserte o se borre un registro del archivo.

 Borrado: Primero se busca el índice a borrar. Si el registro borrado era el único


registro con el valor de su clave de búsqueda, entonces se borra este valor del
índice. Para índices densos el proceso es similar al utilizado para borrar un registro
en un archivo. Para índices dispersos, se borra un valor clave sustituyendo su
entrada en el índice por el siguiente valor de la clave. Si el siguiente valor de la
clave de búsqueda tenía ya una entrada, se borra la entrada en lugar de reemplazarla.
 Inserción: Primero se realiza una búsqueda usando el valor de la clave de búsqueda
del registro a insertar. Si el índice es denso y el valor de la búsqueda no aparece en
el índice, el valor se inserta en el índice. Si el índice es disperso y almacena una
entrada por cada bloque, no es necesario cambiar el índice a menos que se cree un
nuevo bloque. En este caso, el primer valor que aparezca en el nuevo bloque es el
valor a insertar en el índice.

Asociación:

 Un cajón (bucket) es una unidad de almacenamiento que puede guardar uno o más
registros (generalmente un bucket es un bloque de disco).
 En la organización de archivo asociativo (hash file organization) se obtiene un
bucket de un registro directamente del valor de su clave de búsqueda usando
una función de asociación (hash function).
 Formalmente, sea K el conjunto de todos los valores de clave de búsqueda y
sea B el conjunto de todas las direcciones de cajón. Una función de asociación h es
una función de K a B. Sea h una función asociación.
 Para insertar un registro con clave de búsqueda Ki, calcularemos h(Ki),
y proporciona la dirección del cajón para insertar el registro.
 Para realizar una búsqueda con el valor Ki de la clave de búsqueda, simplemente se
calcula h(Ki) y luego se busca el cajón con esa dirección.
Función de la asociación:
 Propiedades de una buena distribución.
 Distribución uniforme. Esto es, cada cajón tiene asignado el mismo número de
valores de la clave de búsqueda dentro del conjunto de todos los valores posibles de
la clave de búsqueda.
 Distribución aleatoria. Esto es, en el caso promedio, cada cajón tendrá casi el mismo
número de valores asignados a él, sin tener en cuenta la distribución actual de los
valores de la clave de búsqueda.
 Generalmente las funciones de asociación realizan el cálculo.

También podría gustarte