Diseño de Archivos y Base de Datos
Diseño de Archivos y Base de Datos
Diseño de Archivos y Base de Datos
Dentro de los Sistemas de Informacion existe un factor importante que ayuda con la preservacin de la informacin, llamado ARCHIVO, que es un conjunto de todas las presencias de un archivo diseado. Es la esencia del Sistema de Informacin, los datos deben de estar disponibles cuando el usuario los requiera, deben de ser precisos, deben permitir su actualizacion con un almacenamiento eficiente para que el acceso a la informacin tenga un propsito en la administracin, planeacin, control o en la toma de decisiones. Los archivos manejan una serie de conceptos cuya comprensin es necesaria para comenzar a aproximarnos a la gestin de datos y al diseo de archivos.
Adems representan aquellas acciones que integran el contenido fundamental de la gestin de documentos electrnicos de archivo.
Objetivos: - Saber seleccionar la mejor forma de almacenar y consultar un conjunto de datos para un uso especifico. - Conocer mtodos de archivos que se puedan utilizar con cada dispositivo de almacenamiento. Terminologa Bsica de Archivos: Campo: Es un carcter o grupo de caracteres (alfabticos o numricos) que tiene un significado especfico. Se utiliza un campo para definir y guardar un dato.
REGISTRO: Es el conjunto completo de datos relacionados pertenecientes a una entrada. Cada campo tiene fijo su longitud y tipo ya sea alfanumrico, numrico alfabtico. Cuando el numero y tamao de los datos en un registro son constantes para registro, se considera de longitud fija. Los registros de longitud variable son mas fciles de manejar pero menos comunes que los fijos
Se incluye cada registro en un archivo ya que pertenece a la misma identidad. El tamao del archivo se determina por el numero de registros que hay en l.
En la relacion ALUMNO cursa ASIGNATURA agregamos la entidad PROFESOR porque interesa saber las las asignaturas que imparten.
TIPOS DE ARCHIVOS: Un Archivo es el conjunto de todas las presencias de un registro diseado. Tpicamente, en los sistemas de informacin pueden encontrarse varios tipos de archivos:
Archivos Maestros:
Contiene todos los registros de una determinada base de datos, cada uno de los cuales consiste en un conjunto de campos de longitud variable. Cada registro se identifica con un numero nico, asignado automticamente por CDS/ISIS (Paquete de software para los sistemas de almacenamiento y recuperacin de informacin no numrica) al ser creado ; este numero es denominado Master File Number ( Numero del archivo maestro).
Archivos de Transacciones: Es un archivo temporal, que tiene dos propsitos: acumular datos acerca de los eventos en el momento que ocurran y al actualizar los archivos maestros para reflejar el resultado de las transacciones actuales. Muchos de los archivos maestros contienen registro de longitud variable.
Archivos de Tablas: Este tipo de archivos, contienen datos de referencia utilizados en el procesamiento de transacciones, actualizacin de los archivos maestros o produccin de salida. Los archivos de tablas conservan el espacio de almacenamiento y facilitan el mantenimiento del programa guardando en un archivo datos que, de otra forma se incluiran en los programas o en los registros del archivo maestro.
Archivos de Reporte Los archivos de reporte son archivos temporales que se utilizan cuando el tiempo de impresin no esta disponible para todos los reportes producidos, lo cual sucede con frecuencia en el procesamiento sobrepuesto. Este tipo de archivos se pueden utilizar con muchos dispositivos de salidas, como los graficadores, unidades de microfilm y microficha o sistemas tipogrficos comerciales.
Archivo de Respaldo:
Los archivos de respaldo son una copia de un archivo maestro, de transaccin o de tablas hecho para garantizar que se dispone de un duplicado si algo le sucede al original; tambin se hacen copias de los archivos para el almacenamiento de datos a largo plazo y generalmente se guardan lejos del centro de computo para garantizar su preservacin.
Archivo de Trabajo o (Archivos Temporales): Son archivos especiales que contienen una replica, subconjunto temporales o formas alternativas de organizacin de archivos maestros o de transacciones. Este tipo de archivos de trabajo normalmente se crean y son utilizados por el programa informtico apropiado y luego se destruyen. Adems no se emplean en contextos de bases de datos.
Archivos de Movimiento Son registros especiales de actualizaciones de otros archivos, en especial archivos maestros y de transacciones. Se utilizan en conjunto con los archivos de datos no activos para recuperar datos "perdidos".
METODOS DE ORGANIZACIN DE ARCHIVOS La organizacin de archivos se refiere a la estructura fsica de un archivo sobre el disco. Los tres mtodos de organizacin de archivos disponibles son: secuencial, directo e indexado. Cada una de estas organizaciones es usada por el SMBD (Sistema manejador de Base de Datos) en alguna forma. La organizacin secuencial es usada para archivos journal; para copias de backup de la BD (Base de Datos); para ciertos archivos que sirven como entrada a aplicaciones batch; para archivos de transacciones batch, etc. Las organizaciones directas e indexadas son tcnicas usadas por el SMBD para el almacenamiento de data dentro de la base de datos. Una organizacin de archivos, junto con las posibles tcnicas de acceso para esa organizacin constituye un mtodo de acceso. Una tcnica de acceso define los pasos involucrados en el almacenamiento y la recuperacin de registros especficos a travs de acceso secuencial o aleatorio a dicho registro.
Organizacin Secuencial En este tipo de organizacin, los registros son almacenados en la secuencia fsica en la que ellos van a ser procesados. Existen dos tipos posibles de organizacin secuencial. Si los registros son almacenados sin ningn orden especfico sino slo por su orden cronolgico de llegada el archivo correspondiente es una pila. Los archivos journal, los backups, los archivos de transacciones batch son del tipo pila. El segundo tipo de organizacin secuencial es aplicable en un ambiente de procesamiento de archivos, donde un gran porcentaje de los registros necesitan ser accesados frecuentemente. Un archivo con este tipo de organizacin secuencial tiene todos sus registros almacenados segn el valor de una clave que es normalmente la clave primaria.
Organizacin Directa La organizacin directa da un performance excepcional en un ambiente on-line, donde se requiere acceso aleatorio. En la organizacin directa, cada registro es almacenado y recuperado en una direccin de disco sobre la base de una frmula que es aplicada a un valor de un campo del registro. Son posibles dos tipos de organizacin directa, una usando tcnicas de direccionamiento en base a una clave y la otra usando tcnicas hashing.
Organizacin Indexada La organizacin indexada provee acceso eficiente a los registros de ambas formas, tanto secuencialmente como aleatoriamente; los registros lgicos son almacenados en un archivo llamado archivo de datos y existe un archivo separado llamado archivo ndice que contiene registros formados por el valor clave y la direccin del registro lgico que tiene ese valor de clave. Se dice entonces que el archivo de datos est indexado por el archivo ndice. Muchos S.O. (Sistema Operativo) restringen el tipo de archivos ndices permitidos a aquellos definidos sobre valores nicos o claves primarias, estos son llamados ndices primarios, sin embargo tambin pueden permitir definir ndices sobre una clave secundaria no nica. Estos son llamados ndices secundarios. En general existen dos tipos de organizacin indexada posibles: organizacin aleatoria indexada y organizacin secuencial indexada.
CINTAS MAGNETICAS
Han servido para el almacenamiento de datos desde hace 50 aos, y se han hecho muchos avances en la composicin de la cinta, la envoltura y densidad de datos. La cinta magntica es un medio o soporte de almacenamiento de informacin grabada en pistas sobre una banda plstica con material magnetizado (generalmente oxido de hierro); y en donde se pueden guardar tanto video, como audio y datos. Cual es la diferencia de la cinta magntica con los discos magnticos? La respuesta es que las cintas tiene un acceso secuencial mientras que los discos es aleatorio.
Clasificacin de las Cintas La anchura de la cinta. Aunque existen diferentes tamaos, La anchura ms comn de una cinta de alta capacidad ha sido como mximo de media pulgada. Mtodo de grabacin: son una forma de clasificar la tecnologa y cada cambio ha reutilizado la cinta magntica para aprovechar el medio de almacenamiento. Es Lineal si los datos son escritos linealmente ordenados en pistas paralelas a la longitud de la cinta; o por escaneo 'helical' que escribe pequeas pistas curvada desde un borde de la cinta hasta el otro.
DISCOS MAGNETICOS Los discos magnticos son sistemas de almacenamiento de informacin que en la actualidad tienen una gran importancia, ya que constituyen el principal soporte utilizado como memoria masiva auxiliar. A pesar de que son ms costosos que las cintas magnticas, son sistemas de acceso directo, y con ellos se consiguen tiempos medios de acceso menores que con las cintas magnticas. Un disco magntico est constituido por una superficie metlica o plstica recubierta por una capa de una sustancia magntica. Los datos se almacenan mediante pequeos cambios en la imanacin, en uno u otro sentido. El plato o disco puede ser de plstico flexible o puede ser rgido. En el primer caso tenemos disquetes o discos flexibles (en ingls floppy disk o disquetes) y en el segundo caso discos rgidos o duros.
Tanto en los discos rgidos como en los flexibles la informacin se graba en circunferencias concntricas, no notndose visualmente las zonas grabadas. Cada una de las circunferencias concntricas grabadas constituye una pista. As mismo el disco se considera dividido en arcos iguales denominados sectores, de esta forma cada pista est compuesta de sectores. Los sectores de las pistas ms exteriores son de mayor longitud que las interiores, ahora bien el nmero de bits grabados en cada sector es siempre el mismo, con lo que la densidad de grabacin ser mayor en las pistas interiores que en las exteriores. Los sectores comienzan con una cabecera de identificacin, indicando su direccin completa.
Una base de datos es un almacn que nos permite guardar grandes cantidades de informacin de forma organizada para que luego podamos encontrar y utilizar fcilmente. A continuacin te presentamos una gua que te explicar el concepto y caractersticas de las bases de datos. Se puede definir como un conjunto de informacin relacionada que se encuentra agrupada o estructurada.
Es un sistema formado por un conjunto de datos almacenados en discos que permiten el acceso directo a ellos y un conjunto de programas que manipulen ese conjunto de datos.
Todas las empresas requieren almacenar informacin. Desde siempre lo han hecho. La informacin puede ser de todo tipo. Cada elemento informativo (nombre, direccin, sueldo, etc.) es lo que se conoce como dato (en ingls data). Las soluciones utilizadas por las empresas para almacenar los datos son diversas. Antes de la aparicin de la informtica se almacenaban en ficheros con cajones y carpetas y fichas. Tras la aparicin de la informtica estos datos se almacenan en archivos digitales dentro de las unidades de almacenamiento del ordenador (a veces en archivos binarios, o en hojas de clculo)
Adems las empresas requieren utilizar aplicaciones informticas para realizar tareas
propias de la empresa a fin de mecanizar a las mismas. Estas aplicaciones requieren manejar los datos de la empresa.
En los inicios de la era informtica, cada programa almacenaba y utilizaba sus propios datos de forma un tanto catica. La ventaja de este sistema (la nica ventaja), es que los procesos eran independientes por lo que la modificacin de uno no afectaba al resto. Pero tiene grandes inconvenientes:
realizar esas modificaciones (ya que es difcil que esa modificacin afecte a
todos los datos) Lgicamente la solucin a este problema es hacer que todas las aplicaciones utilicen los mismos datos. Esto provoca que los datos deban estar mucho ms protegidos y controlados. Adems los datos forman una estructura fsica y funcional que es lo que se conoce como base de datos. De esta forma una base de datos es una serie de datos relacionados que forman una estructura lgica, es decir una estructura reconocible desde un programa informtico. Esa estructura no slo contiene los datos en s, sino la forma en la que se relacionan.
Las bases de datos empiezan a aparecer en los aos 60 y triunfan en los aos setenta y
ochenta.
Usuarios: Personas que manipulan los datos del sistema. Hay tres categoras: Usuarios finales: Aquellos que utilizan datos de la base de datos para su trabajo cotidiano que no tiene por qu tener que ver con la informtica. Normalmente no utilizan la base de datos directamente, si no que utilizan aplicaciones creadas para ellos a fin de facilitar la manipulacin de los datos. Estos usuarios slo acceden a ciertos datos. Desarrolladores: Analistas y programadores encargados de generar aplicaciones para los usuarios finales.
SISTEMA GESTOR DE BASES DE DATOS Un sistema gestor de bases de datos o SGBD (aunque se suele utilizar ms a menudo las siglas DBMS procedentes del ingls, Data Base Management System) es el software que permite a los usuarios procesar, describir, administrar y recuperar los datos almacenados en una base de datos.
Los datos son responsabilidad del DBMS, por lo que cualquier acceso debe ser realizado por ste. Lgicamente el DBMS va a acabar comunicndose con el Sistema Operativo ya que el acceso a los ficheros de datos implica utilizar funciones del sistema operativo.
MODELADO DE DATOS Modelos de Datos: Los modelos se utilizan en todo tipo de ciencias. Su finalidad es la de simbolizar una parte del mundo real de forma que sea ms fcilmente manipulable. En definitiva es un esquema mental (conceptual) en el que se intentan reproducir las caractersticas de una realidad especfica. En el caso de los modelos de datos, lo que intentan reproducir es una informacin
En la ilustracin aparecen los distintos esquemas que llevan desde el mundo real a la base de datos fsica. Como se ve aparecen varios esquemas intermedios. Los que estn ms a la izquierda se alejan ms de las caractersticas fsicas. Los elementos de ese esquema son: Mundo real. Contiene la informacin tal cual la percibimos como seres humanos. Es el punto de partida Esquema conceptual. Representa el modelo de datos de forma independiente del DBMS que se utilizar. Esquema cannico (o de base de datos). Representa los datos en un formato ms cercano al del ordenador Esquema interno. Representa los datos segn el modelo concreto de un sistema gestor de bases de datos (por ejemplo Oracle)
Base de datos fsica. Los datos tal cual son almacenados en disco.
MODELO ENTIDAD RELACION Entidad: Se trata de cualquier objeto u elemento (real o abstracto) acerca del cual se pueda almacenar informacin en la base de datos. Ejemplos de entidades son Pedro, la factura nmero 32456, el coche matrcula 3452BCW. Una entidad no es un propiedad concreta sino un objeto que puede poseer mltiples propiedades (atributos). Conjunto de entidades: Las entidades que poseen las mismas propiedades forman conjuntos de entidades. Ejemplos de conjuntos de entidades son los conjuntos: personas, facturas, coches, etc.
Representacin grfica de las entidades En el modelo entidad relacin los conjuntos de entidades se representan con un rectngulo dentro del cual se escribe el nombre de la entidad:
Representacin de la Entidad Persona Tipos de entidades Regulares Son las entidades normales que tienen existencia por s mismas sin depender de otras. Su representacin grfica es la indicada arriba Dbiles Su existencia depende de otras. Por ejemplo la entidad tarea laboral slo podr tener existencia si existe la entidad trabajo. Las entidades dbiles se presentan de esta forma:
RELACION Representan asociaciones entre entidades. Es el elemento del modelo que permite relacionar en s los datos del modelo. Por ejemplo, en el caso de que tengamos una entidad personas y otra entidad trabajos. Ambas se realizan ya que las personas trabajan y los trabajos son realizados por personas.
Ejemplo de Relacin La representacin grfica de las entidades se realiza con un rombo al que se le unen lneas que se dirigen a las entidades, las relaciones tienen nombre (se suele usar un verbo). En el ejemplo anterior podra usarse como nombre de relacin, trabajar:
EJEMPLO DE RELACIONES
Cardinalidad Indica el nmero de relaciones en las que una entidad puede aparecer. Se anota en trminos de: Cardinalidad mnima. Indica el nmero mnimo de asociaciones en las que aparecer cada ejemplar de la entidad (el valor que se anota es de cero o uno) Cardinalidad mxima. Indica el nmero mximo de relaciones en las que puede aparecer cada ejemplar de la entidad (puede ser uno o muchos) En los esquemas entidad / relacin la cardinalidad se puede indicar de muchas formas. Actualmente una de las ms populares es esta:
EJEMPLO:
En el ejemplo, cada equipo cuenta con varios jugadores. un jugador juega como mucho en un equipo y podra no jugar en ninguno. Cada entrenador entrena a un equipo (podra no entrenar a ninguno), el cual tiene un solo entrenador .
Roles A veces en las lneas de la relacin se indican roles. Los roles representan el papel que juega una entidad en una determinada relacin. Ejemplo:
Atributos:
Describen propiedades de las entidades y las relaciones. En este modelo se representan con un crculo, dentro del cual se coloca el nombre del atributo. Ejemplo:
Tipos de Atributos:
Compuestos
Identificador
Se trata de uno o ms campos cuyos valores son nicos en cada ejemplar de una entidad. Se indican subrayando el nombre del identificador. Para que un atributo sea considerado un buen identificador tiene que cumplir:
1> Deben distinguir a cada ejemplar teniendo en cuenta las entidades que utiliza el modelo. No tiene que ser un identificador absoluto.
2> Todos los ejemplares de una entidad deben tener el mismo identificador.
3> Cuando un atributo es importante aun cuando no tenga una entidad concreta asociada, entonces se trata de una entidad y no de un atributo
Entidades is a
Son relaciones de tipo is a (es un) aquellas en las que una entidad se descompone en entidades especializadas. Hay dos tipos de entidades is a: especializaciones y generalizaciones. Las especializaciones consisten en que una entidad se divide en entidades ms concretas. La entidad general comparte con las especializadas sus atributos. Se observa una especializacin cuando hay ejemplares para los que no tienen sentido algunos de los atributos, mientras que para otros s. Se denomina generalizacin si se agrupan varias entidades en una o ms entidades generales. Se observa una generalizacin si en varias entidades se observan atributos iguales, lo que significa que hay una entidad superior que posee esos atributos. En cualquier caso la representacin en el modelo es la misma, se representan con un tringulo que tiene el texto ISA. Ejemplo:
En estas relaciones se habla tambin de herencia, ya que tanto los profesores como los bedeles como los otros, heredan atributos de la entidad personal (se habla de la superentidad personal y de la subentidad profesores) Se puede colocar un crculo (como el del nmero cero) en lado de la superentidad para indicar que es opcional la especializacin, de otro modo se tomar como obligatoria (el personal tiene que ser alguna de esas tres cosas) Se puede indicar tambin exclusividad. Esto ocurre cuando entre varias lneas hacia una relacin, las entidades slo pueden tomar una. Se representa con un ngulo en el diagrama:
En el diagrama el ngulo indica que el personal slo puede ser o profesor o bedel u otros. No puede ser dos cosas a la vez
1> Encontrar entidades (conjuntos de entidades) 2> Identificar atributos de las entidades 3> Buscar identificadores
DIFERENCIA ENTRE ARCHIVO Y BASE DE DATOS 1. Los archivos son personales las bases de datos son compartidas. 2. En los archivos pueden haber mas de un dato repetido en las bases de datos lo datos no son repetidos 3. Los archivos no se relacionan entre si, las bases de datos estn relacionadas segn un esquema. 4. El acceso a los archivos es restringido y personal, a las bases de datos el acceso es abierto a las personas de una empresa o a un publico especifico 5. La seguridad de los archivos es poca por lo cual pueden ser cambiados constantemente, las bases de datos no son diseadas para que los datos sean modificables por el contrario son muy seguras. 6. Los archivos son poco eficientes por que no son muy actuales, las bases de datos son actuales y muy eficientes.