Capítulo 1 - Datos, Tablas, Columnas y Filas
Capítulo 1 - Datos, Tablas, Columnas y Filas
Capítulo 1 - Datos, Tablas, Columnas y Filas
Resultados de aprendizaje
De forma general, como una primera aproximación, puede entederse que una base
de datos es un deposito digital en el que se almacenan datos y se ponen a disposición
para ser consultados, actualizados, eliminados, administrados y controlados. También
debe mencionarse que existe software construido para administrar y operar las bases
de datos, los cuales se conocen de forma genérica como DBMS por su denominación
en inglés (Database Management System). Estas definiciones serán suficientes por el
momento para avanzar en el aprendizaje de las bases de datos, específicamente las
bases de datos relacionales.
Los datos esenciales para administrar la colección de una plataforma de este tipo son
los correspondientes a las canciones y a quienes las interpretan, es decir, los artistas.
Hay que tener presente que los artistas pueden ser solistas o grupos. También, una
canción puede hacer parte de un álbum en el que se publican un número específico
de canciones o puede ser un sencillo, es decir, una canción publicada o lanzada de
forma individual.
Cada fila de la tabla Artistas representa a un solista o a un grupo del cual se tiene
canciones en la colección. Para cada artista se registra el nombre, el tipo, es decir si
es solista o es un grupo, su género musical principal y el año de lanzamiento en el
mercado. También hay un dato numérico que sirve de identificador individual para
cada artista dentro de la tabla, el cual no tiene un significado específico, no es un dato
que tenga sentido por fuera de la base de datos.
Artistas
identificador nombre año de lanzamiento tipo género principal
50001 Carlos Vives 1986 Solista Vallenato
50002 Niche 1979 Grupo Salsa
50003 Shakira 1990 Solista Pop
50004 Binomio de Oro de América 1976 Grupo Vallenato
50005 J Balvin 2006 Solista Urbano Latino
Canciones
identificador título duración género artista álbum
10001 La tierra del olvido 4:25 Vallenato 50001 La tierra del olvido
10002 Ojos así 3:57 Pop 50003 ¿Dónde están los ladrones?
10003 Mi gente 3:05 Urbano Latino 50005 Sencillo
10004 Ambiente 4:08 Urbano Latino 50005 Vibras
10005 Cali pachanguero 4:51 Salsa 50002 No hay quinto malo
10006 La creciente 3:04 Vallenato 50004 El binomio de oro
10007 Sueños de conquista 4:02 Vallenato 50004 Por lo alto
10009 Carito 3:39 Pop 50001 Déjame entrar
10011 Una aventura 5:16 Salsa 50002 Cielo de tambores
10012 Ginza 4:39 Urbano Latino 50005 Sencillo
10013 Octavo día 4:32 Pop 50003 ¿Dónde están los ladrones
10014 Quiero verte sonreír 3:18 Pop 50001 Déjame entrar
Con los datos de la tabla Artistas puede determinarse que el artista Carlos Vives es
un Solista cuyo género musical principal es el Vallenato y está activo en el mundo de la
música desde el año 1986. De la misma forma puede observarse que el artista llamado
Niche es un Grupo que está activo en el mundo de la música desde el año 1979 y su
género musical principal es la Salsa. En ambos casos, los datos registrados en la
primera columna, es decir, los números 50001 y 50002 no tienen ningún significado
específico con el artista correspondiente, solamente nos son útiles para identificarlos
dentro de la tabla, para llegar a la fila que le corresponde a cada uno, o para determinar
filas de otras tablas con las que tenga relación.
En las tablas se registran únicamente los datos que se requieren almacenar, procesar
y administrar. Estos son solamente algunos datos de los que podrían identificarse. Por
ejemplo, en la tabla Artistas no están todos los datos de los artistas. Por lo tanto, lo
que se almacena en cada fila es una representación parcial, limitada o simplificada de
la realidad. En otras palabras, se está creando una abstracción de la realidad. En la
Figura 1-1 se presentan dos ejemplos de los datos que deberían registrarse en la tabla
Artistas para un grupo y un solista, los cuales son una abstracción de la realidad.
nombre: Timbalina
lanzamiento: 2015
tipo: Grupo
género: Folk pop latino
Las columnas que conforman la tabla Canciones permiten almacenar los datos más
importantes que se requieren para que los usuarios puedan utilizar la colección. En
estas columnas, también llamadas campos o atributos, se registran el título de la
canción, la duración, el género, el identificador del artista que la interpreta y el nombre
del álbum en el cual está contenida. Cuando una canción no está contenida en un
álbum se registra la palabra Sencillo como nombre del álbum.
Cada fila de la tabla Canciones corresponde a una y solamente una canción que hace
parte de la colección. No tendría sentido tener dos filas con exactamente los mismos
datos porque se estaría duplicando una canción, lo cual constituye una pérdida de
integridad que puede generar errores en el procesamiento.
A partir de los datos de esta tabla puede decirse que la canción La tierra del olvido tiene
una duración de 4:25 hace parte de un álbum llamado La tierra del olvido y es de género
Vallenato. El artista que interpreta esta canción es el que está registrado con el
identificador 50001. Si no existiera la tabla Artistas no podría determinarse a quién
corresponde ese identificador, pero en este caso puede observarse que el artista con
identificador 50001 es el Solista llamado Carlos Vives de acuerdo con lo que está
registrado en la tabla Artistas.
Tabla 1-3 Elementos de análisis para definir cómo obtener los datos requeridos desde una base
de datos
El análisis realizado para dar respuesta a la pregunta indica que se requiere seleccionar
únicamente dos columnas de la tabla Artistas y que no es necesario aplicar filtros o
condiciones porque se necesitan los datos de todos los artistas registrados en la
colección. En la Tabla 1-4 se señala específicamente el conjunto de datos de la tabla
Artistas que debería generarse como respuesta a la pregunta.
Artistas
identificador nombre año de lanzamiento tipo género principal
El análisis realizado para dar respuesta a esta pregunta también indica que se requiere
seleccionar únicamente dos columnas, pero, en este caso, son columnas de la tabla
Canciones. Al igual que en el ejemplo anterior, tampoco es necesario aplicar filtros o
condiciones porque se necesitan los datos de todas las canciones, es decir, se
necesitan todas las filas de la tabla. En la Tabla 1-6 se señala específicamente el
conjunto de datos de la tabla Canciones que debería generarse como respuesta.
Canciones
identificador título duración género artista álbum
10001 La tierra del olvido 4:25 Vallenato 50001 La tierra del olvido
10002 Ojos así 3:57 Pop 50003 ¿Dónde están los ladrones?
10003 Mi gente 3:05 Urbano Latino 50005 Sencillo
10004 Ambiente 4:08 Urbano Latino 50005 Vibras
10005 Cali pachanguero 4:51 Salsa 50002 No hay quinto malo
10006 La creciente 3:04 Vallenato 50004 El binomio de oro
10007 Sueños de conquista 4:02 Vallenato 50004 Por lo alto
10009 Carito 3:39 Pop 50001 Déjame entrar
10011 Una aventura 5:16 Salsa 50002 Cielo de tambores
10012 Ginza 4:39 Urbano Latino 50005 Sencillo
10013 Octavo día 4:32 Pop 50003 ¿Dónde están los ladrones
10014 Quiero verte sonreír 3:18 Pop 50001 Déjame entrar
En este caso, la tabla resultante que da respuesta a la pregunta tiene dos columnas y
doce filas, tal y como se muestra en la Tabla 1-7.
título duración
El análisis realizado para dar respuesta a la tercera pregunta plantea que, al igual que
para la segunda pregunta, se requieren datos ubicados únicamente en la tabla
Canciones. En este caso deben mostrarse los datos registrados en tres columnas de
la tabla, pero tiene un elemento diferente y es la necesidad de utilizar los datos de la
columna duración para determinar las filas que deben mostrarse. Con esta acción de
filtrado se excluyen las filas para las cuales la condición no se cumple. En la Tabla 1-8
se señala el conjunto de datos de la tabla Canciones que debería generarse como
respuesta a la pregunta. También se resaltan los valores almacenados en la columna
duración que cumplen la condición de la pregunta.
Canciones
identificador título duración género artista álbum
10001 La tierra del olvido 4:25 Vallenato 50001 La tierra del olvido
10002 Ojos así 3:57 Pop 50003 ¿Dónde están los ladrones?
10003 Mi gente 3:05 Urbano Latino 50005 Sencillo
En este caso, la tabla resultante que da respuesta a la pregunta tiene tres columnas y
siete filas, tal y como se muestra en la Tabla 1-9 . La columna duración se utiliza para
responder la pregunta, pero no se incluye en la tabla resultante. En otras palabras, no
todas las columnas requeridas para realizar la consulta terminarán incluyéndose en la
tabla resultante. Algunas, como en este caso, podrían utilizarse para filtrar las filas que
harán parte del resultado.
Para satisfacer las necesidades especificadas en las tres preguntas anteriores fue
suficiente con presentar los datos tal y como están almacenados en las tablas. Este
uso es muy frecuente pero muy básico. Lo que ocurre normalmente es que se necesita
realizar alguna operación para mostrar datos derivados o calculados a partir de los
que están almacenados en las tablas. Para ilustrar se abordará la siguiente pregunta.
En la Tabla 1-10 puede observar el conjunto de datos de la tabla Artistas que hará
parte de la respuesta. También se resaltan en color verde los valores almacenados en
las columnas año de lanzamiento y género principal que cumplen la condición
requerida. En amarillo se resaltan los valores que cumplen parcialmente la condición
y, por ende, esas filas no hacen parte de la respuesta.
Artistas
identificador nombre año de lanzamiento tipo género principal
Además, puede observarse que el orden de aparición de las columnas del resultado
es diferente al que tiene la tabla de origen, lo cual se hace para cumplir con precisión
milimétrica lo especificado en la pregunta. En la Tabla 1-11 puede observar la tabla
resultante, la cual está compuesta de cinco columnas y una fila.
El uso de las bases de datos puede ir mucho más allá de la simple resolución de
preguntas utilizando una única tabla. En el capítulo siguiente se muestra que las
posibilidades para usar y aprovechar los datos se expanden significativamente al
trabajar con el poderoso lenguaje estructurado de consulta o SQL (de su nombre en
inglés Structured Query Language).
Las tablas son las estructuras básicas de almacenamiento que se utilizan en las
bases de datos relacionales.
En las columnas de una tabla se almacena los datos que representan las
características más importantes de una entidad de un contexto.
Los datos almacenados en las tablas pueden y deben ser utilizados para
satisfacer necesidades de datos en un momento especifico.
Para obtener los datos requeridos debe identificarse en cuál tabla están
almacenados, determinar si se requieren todas las columnas o solo algunas,
definir si se necesitan todas las filas o un subconjunto de éstas, y, finalmente,
si es necesario realizar operaciones para derivar nuevos datos que permitan
satisfacer plenamente la necesidad.
1. Proponga dos tablas que puedan utilizarse para almacenar los datos más
importantes en las situaciones que se enuncian en los siguientes literales.
título álbum
La tierra del olvido La tierra del olvido
Cali pachanguero No hay quinto malo
Una aventura Cielo de tambores
Octavo día ¿Dónde están los ladrones
10. ¿Cuál es su opinión sobre las implicaciones éticas del trabajo con bases de
datos?