Guia de Aprendizaje Unidad 1 - SQL
Guia de Aprendizaje Unidad 1 - SQL
Guia de Aprendizaje Unidad 1 - SQL
INFORMACIÓN GENERAL
IDENTIFICACIÓN DE LA GUÍA. Unidad 1. Sistemas de Bases de Datos Relacionales
FECHA DE APLICACIÓN:
PROGRAMA DE FORMACIÓN: Informática: Diseño de Bases de Datos en SQL
ID:
CENTRO: Automatización Industrial
RESULTADOS DE APRENDIZAJE:
Comprender la importancia que tienen las bases de datos al ser aplicadas en solución de casos,
estando en capacidad de identificar el procedimiento para efectuar la normalización de las tablas que
las componen.
CRITERIOS DE EVALUACIÓN:
Presenta el análisis relacional de datos utilizando las reglas para llegar a cada una de las tres formas
normales.
Registra aporte en el foro temático utilizando sus propias palabras y analizando el cuestionamiento
planteado.
Responde a la evaluación teórica planteada.
DESARROLLO DE LA GUIA
INTRODUCCIÓN:
• Desde que los datos son almacenados en el mínimo número de lugares, las posibilidades de
inconsistencias en la información son reducidas al mínimo
• Las estructuras normalizadas son óptimas para efectuar actualizaciones de los datos. Dado que los
datos existen en el mínimo número de lugares, una operación de actualización (UPDATE)
necesitará acceder a una mínima cantidad de datos
PROCEDIMIENTOS DE NORMALIZACIÓN
El proceso de normalización involucra básicamente tres pasos. Después de cada paso, la base de datos se
convierte en formas llamadas “formas normales”. Generalmente, la “tercera forma normal” es el estado que
debe alcanzar una base de datos para que se diga que está totalmente normalizada. La cuarta y la quinta
forma normal también existen, pero no son usadas en el diseño de una base de datos.
Propiedades de una relación: Una tabla debe satisfacer ciertos criterios previos antes de calificar para
convertirse en una relación
No duplicados: No debe haber nunca dos columnas o filas totalmente idénticas, entonces hacen falta
algunos atributos que las haga diferentes y distinguibles. Ejemplo: Dos registros de discos compactos en
una tienda serían idénticos si son dos copias del último álbum de Shakira, si no fuera porque cada disco
compacto tiene un número código que los hace diferentes
Clave Única: Cada registro tiene que tener una llave única que lo identifique. Cualquier atributo puede ser
una llave, pero en lo posible trataremos de elegir como llave única al atributo que tenga una longitud menor
y fija, como por ejemplo un numero de ID. Si un atributo es insuficiente para identificar un registro de
manera única, entonces más de un atributo puede conformar la llave única. En tal caso, el número de
atributos que conformen una llave debe ser el mínimo necesario y suficiente
Insignificancia del orden: La secuencia en la cual los atributos son escritos no debe importar. Podemos
escribir el ID del empleado de primero o el nombre y el apellido de primero y esto no afectará las relaciones
que establezcamos con otras tablas. Por otro lado, los registros deben ser totalmente independiente de su
secuencia o posición en la base de datos (dependencia posicional). Esto significa que si intentamos
identificar un registro por su posición dentro de la tabla, estaremos creando una llave
Forma no-normalizada: Los datos, en su forma elemental, no están normalizados. Por lo tanto, lo primero
con lo que debemos comenzar es con los datos elementales o básicos que conformarán el diccionario de
datos. El diccionario de datos es creado a partir de los documentos o diagramas de flujo de la compañía.
Se deben listar los elementos uno debajo del otro. Así, obtendremos la forma no-normalizada para el
ejercicio de ARD (Análisis Relacional de Datos), con el cual deberemos obtener al final distintos grupos de
elementos. Más tarde, dichos grupos se combinarán con los grupos de otros documentos al cual también
se les ha hecho el análisis ARD y se establecerán relaciones entre ellos.
Ejercicio: Consideremos el documento ORDEN DE COMPRA de la siguiente figura, usado para colocar
una orden de pedido al proveedor de discos compactos.
Versión: 01
Servicio Nacional de Aprendizaje - SENA
Código: F08-6060-002
Regional Caldas.
Sistema Integrado de Mejora GUÍA DE APRENDIZAJE. Página 3 de 8
Continua Institucional
En la lista de arriba, los ítems después de PROV-NIT son repetitivos, esto quiere decir, que para una misma
orden aparecen varias veces, dado que en una misma orden se pueden encargar varias categorías o varios
títulos de la misma categoría.
Los grupos repetitivos deben ser separados de la UNF y ser escritos como un grupo independiente con su
respectiva llave. Este grupo debe relacionarse con el grupo no repetitivo enlazando la llave del grupo no
repetitivo junto con la llave del repetitivo. De esta manera tenemos:
Versión: 01
Servicio Nacional de Aprendizaje - SENA
Código: F08-6060-002
Regional Caldas.
Sistema Integrado de Mejora GUÍA DE APRENDIZAJE. Página 4 de 8
Continua Institucional
El grupo repetitivo tiene a CODIGO como llave. Sin embargo, esta llave no es única, dado que se puede
repetir en otros números de orden. Necesita ser combinada con la llave del primer grupo. Al combinar el
campo ORD-NO junto con el campo CODIGO para el segundo grupo, podemos deducir que esta
combinación puede actuar como llave única, ya que no puede haber una misma orden que tenga 2 códigos
iguales. Por lo tanto, después de aplicar la primera forma normal, obtenemos estos grupos:
Solo aquellos grupos de datos que tengan llaves combinadas son analizados (llaves que tengan más de un
campo o atributo para lograr unicidad). Por lo tanto, para la segunda forma normal, nos concentraremos
solo en el grupo 2, el cual tiene una llave compuesta.
En el grupo 2, cualquier atributo que no dependa enteramente de la llave compuesta (es decir, que no
dependa de todos los atributos de la llave a la vez sino de uno solo de ellos) es separado del grupo principal
y es aislado en un grupo independiente junto con el atributo de la llave inicial del cal si es dependiente.
Veamos el proceso para que haya mayor claridad:
Al analizar el grupo 2, encontramos que el campo TITULO depende enteramente del campo CODIGO y no
de la llave compuesta. Llegamos a esta conclusión deduciendo que el título del CD está asociado a un
único código, por lo cual podríamos pensar que CODIGO y TITULO son campos redundantes ya que con
cualquiera de ellos podemos identificar al elemento, pero pensemos en que el diseño no nos permite
deshacernos de ninguno de los campos, ya que las instrucciones nos obligan a usar y almacenar TODA la
información disponible en el diccionario de datos.
Por ello, lo que si podemos hacer, aplicando la segunda forma normal, es aislar un tercer grupo, que tenga a
CODIGO como llave y TITULO como campo de la tabla. Igual sucede con el campo VLR-UNIT; este ampo
está asociado exclusivamente al campo CODIGO. Esto es, cada Titulo de CD con un código determinado,
debe corresponder a un valor de venta que se establece una sola vez por cada elemento. De esta manera,
si en algún momento necesitamos alterar el valor unitario de un CD, sólo debemos hacerlo en la tabla del
grupo 3, una única vez por elemento.
Versión: 01
Servicio Nacional de Aprendizaje - SENA
Código: F08-6060-002
Regional Caldas.
Sistema Integrado de Mejora GUÍA DE APRENDIZAJE. Página 5 de 8
Continua Institucional
En este nivel, ya nos podemos imaginar mentalmente la utilidad de separar el diccionario de datos en
distintos grupos. Imaginémonos que queremos ingresar 50 órdenes al sistema y en todas está incluido el
CD de Juanes, cuyo código es 1520. El título asociado al código 1520 es “Fíjate Bien”. Si no existiera el
grupo 3, para cada una de las órdenes estaríamos ingresando no sólo 50 veces el código 1520, sino que
también nos toca digitar 50 veces el texto “Fíjate bien”. Consideramos que esto último es un trabajo que se
puede ahorrar al aplicar la segunda forma normal, ya que si dejamos una tabla separada para CODIGO y
TITULO, al ingresar las órdenes solo nos toca digitar 50 veces el código 1520 en la tabla del grupo 2 (cada
vez asociado a un número de orden distinto y único) y una sola vez el mismo código en la tabla 3, con lo
cual el texto “Fíjate bien” solo tendría que ser digitado una vez. En el evento en que se nos pida consultar el
título del CD en un registro de la tabla 2, simplemente usaremos el valor del campo CODIGO de dicho
registro para trasladar la consulta a la tabla 3, quien nos devolverá la información buscada del Título.
Todos los campos o atributos en cada grupo que no sean llaves, deben ser examinados para chequear que
no existan interdependencias entre ellos. Si se encuentran algunas, tales dependencias deben ser
separadas en distintos grupos cuya llave debe ser el campo del cual son dependientes, dejando este campo
llave también en el grupo original.
Si analizamos el grupo 1, encontramos que los campos PROV-NAME, PROV-DIR y PROV-NIT son
enteramente dependientes del campo PROV-NO
Del grupo 2 ya sacamos las interdependencias durante la segunda forma normal y el grupo tres es
precisamente el resultado de esa separación de la segunda forma normal, por lo tanto lo ignoramos en esta
etapa. Nos concentramos solo en el grupo 1.
Al separar en un grupo la información del proveedor, dejando un cuarto grupo con esta información,
obtenemos la tercera forma normal, la cual queda de la siguiente manera: en conclusión, después de aplicar
Versión: 01
Servicio Nacional de Aprendizaje - SENA
Código: F08-6060-002
Regional Caldas.
Sistema Integrado de Mejora GUÍA DE APRENDIZAJE. Página 6 de 8
Continua Institucional
RESUMEN DE LA NORMALIZACIÓN
FORMULACIÓN DE ACTIVIDADES:
1. Para desarrollar esta actividad es necesario que abra el programa Word (Inicio -> Todos los Programas
-> Microsoft Office -> Microsoft Office Word 2007).
2. Tenga en cuenta la factura de venta mostrada en la siguiente imagen para efectuar el Análisis
Relacional de Datos completo, siguiendo uno a uno los pasos de la normalización.
Versión: 01
Servicio Nacional de Aprendizaje - SENA
Código: F08-6060-002
Regional Caldas.
Sistema Integrado de Mejora GUÍA DE APRENDIZAJE. Página 7 de 8
Continua Institucional
3. Prepare el diccionario de datos o UNF (forma no normalizada) indicando todos los campos que son
requeridos para almacenar la totalidad de información de la factura, recuerde señalar la llave primaria,
ya que incluso las formas no normalizadas deben contenerla.
4. Aplique la primera forma normal separando los grupos repetitivo y no repetitivo, recuerde que en cada
uno de los grupos resultantes debe marcar la llave primaria y analizarlo a fondo de manera que ésta
pueda actuar como llave única. Es importante ir detallando en forma textual los pasos que sigue para
obtener los grupos, de esa manera retendrá mejor el procedimiento para poder aplicarlo a otros
ejercicios.
5. Proceda a aplicar la segunda forma normal separando las dependencias de las llaves compuestas,
recuerde una vez mas que es importante ir justificando el procedimiento aplicado; en este punto debe
centrarse en el segundo grupo hallado al escribir la primera forma normal ya que éste es el que contiene
una llave combinada, la idea es separar todos aquellos campos que no dependan totalmente de los dos
atributos que conforman la llave primaria, aislando así un tercer grupo.
6. Aplique la tercera forma normal separando las dependencias de los campos no llave, no olvide detallar
el proceso y tenga en cuenta que debe analizar todos los atributos que no sean llave e identificar que
entre éstos no existen interdependencias y en caso de encontrarlas, aislar otros grupos usando para
ellos como llave el campo del cual son dependientes.
Versión: 01
Servicio Nacional de Aprendizaje - SENA
Código: F08-6060-002
Regional Caldas.
Sistema Integrado de Mejora GUÍA DE APRENDIZAJE. Página 8 de 8
Continua Institucional
7. Verifique todo el proceso efectuado y tenga en cuenta que para cada una de las formas normales debe
entregar los grupos resultantes y la justificación detallada en teoría del paso a paso que llevó a cabo.
8. Por último, recuerde que es muy importante señalar/subrayar/resaltar en cada grupo resultante el o los
campos que conformen la llave primaria.
Opine sobre una de las ventajas de implementar bases de datos en las empresas.
Recuerde participar activamente de la discusión y adicional a su aporte, realizar comentarios respecto a las
secuencias creadas por sus compañeros de manera que se genere más discusión y haya lugar a nuevos
interrogantes que enriquezcan el proceso de aprendizaje.
La evaluación consta de 4 preguntas, encontrará preguntas de selección múltiple con única respuesta y
selección múltiple con múltiple respuesta, preste especial atención para saber cómo debe responder; las de
única respuesta se caracterizan por mostrar las opciones precedidas por y las de múltiple respuesta, van
precedidas por
BIBLIOGRAFIA DE ANEXOS:
http://basdatos.tripod.com/modelos.html
http://www.wikilearning.com/tutorial/diseno_de_bases_de_datos_en_sql-ejercicio/21129-5