TAREA 1 - Mineria de Datos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 3

Datamining (Minera de datos)

El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que


permiten explorar grandes bases de datos, de manera automtica o semiautomtica,
con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado contexto.
Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de
un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos
casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes
neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario
les atribuye algn significado especial pasan a convertirse en informacin. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que
surge entre la informacin y ese modelo represente un valor agregado, entonces nos
referimos al conocimiento.
Modelo entidad-relacin
Un diagrama o modelo entidad-relacin (a veces denominado por sus siglas en
ingls, E-R "Entity relationship", o del espaol DER "Diagrama de Entidad Relacin") es
una herramienta para el modelado de datos que permite representar las entidades
relevantes de un sistema de informacin as como sus interrelaciones y propiedades.

Modelo relacional
El modelo relacional para la gestin de una base de datos es un modelo de
datos basado en la lgica de predicados y en la teora de conjuntos. Es el modelo ms
utilizado en la actualidad para modelar problemas reales y administrar datos
dinmicamente. En este modelo todos los datos son almacenados en relaciones, y
como cada relacin es un conjunto de datos, el orden en el que stos se almacenen no
tiene relevancia (a diferencia de otros modelos como el jerrquico y el de red). Esto
tiene la considerable ventaja de que es ms fcil de entender y de utilizar por un
usuario no experto. La informacin puede ser recuperada o almacenada por medio de
consultas que ofrecen una amplia flexibilidad y poder para administrar la informacin.


Modelos De Datos

La parte esencial de la estructura de base de datos es el modelo de datos: una
coleccin de herramientas conceptuales para describir los datos, las relaciones de
datos, la semntica de los datos y las ligaduras de consistencia. Los diferentes modelos
de datos que se han propuesto se clasifican en tres grupos diferentes: modelos lgicos
basados en objetos, modelos lgicos basados en registros y modelos fsicos.


Modelos Lgicos Basados En Objetos

Los modelos lgicos basados en objetos se usan para describir datos en los niveles
lgico y de vistas. Proporcionan capacidades estructurales muy flexibles y permiten
que las ligaduras se especifiquen explcitamente.

Los modelos ms conocidos son:

Modelo Entidad - Relacin (E - R)

Modelo Orientado a Objetos (OO).

Modelo De Datos Semntica

Modelo De Datos Funcional


Modelo Entidad - Relacin (MER)

Esta basado en una percepcin del mundo real que consta de una coleccin de objetos
bsicos, llamados entidades, y de las relaciones entre estos objetos. Una entidad es
una cosa u objeto que es distinguible de otros objetos. Una relacin es una asociacin
entre varias entidades. Se maneja la correspondencia de cardinalidades que expresa el
nmero de entidades que pueden estar relacionadas con una entidad por medio de
relaciones.

Modelo Orientado a Objetos

Est basado en una coleccin de objetos. Un objeto contiene valores almacenados en variables
ejemplares dentro de este objeto. Contiene fragmentos de cdigo que operan dentro del mismo y
a stos se les llama mtodos. La nica manera en que pueden acceder a la base de datos es a
travs del paso de mensajes a otro objeto. Los objetos que contienen los mismos tipos de valores
y los mismos mtodos se agrupan en clases. Los objetos acceden a los datos de otros objetos
mediante el envo de mensajes.

Modelos Lgicos Basados En Registros

Se usan para especificar la estructura lgica completa de la base de datos para proporcionar una
descripcin de alto nivel de la implementacin. Este se estructura en registros de formato fijo de
diferentes tipos. En cada tipo de registro se define un nmero de campos y cada uno tiene una
longitud fija. Los principales modelos trabajados a travs del tiempo son el modelo relacional, el
de red y el jerrquico (el primero es el utilizado actualmente).

Existen tres modelos principales:

Modelo Relacional: Se usa una coleccin de tablas para representar tanto los datos como las
relaciones entre ellos. Cada tabla contiene varias columnas, y cada columna tienen un nombre
nico.

Modelo De Red: Se representan por medio de colecciones de registros y las relaciones entre los
datos se representan por medio de enlaces que se pueden ver como apuntadores. Los registros se
organizan como colecciones de grafos dirigidos.

Modelo Jerrquico: Es similar al modelo de redes, en el sentido en que los datos y relaciones entre
los datos se representan mediante registros y enlaces. La diferencia es que en lugar de organizarse
como grafos estos lo hacen como colecciones de rboles.

Modelos Fsicos De Datos

Se usa para describir datos en un nivel ms bajo.

Los ms conocidos son:

Modelo de unificacin

Modelo de memoria por marcos.

Un esquema de bases de datos se expresa mediante un conjunto de definiciones que se expresa
en un lenguaje de definicin de datos (LDD). Las instrucciones del LDD se compilan dando lugar a
un conjunto de tablas que se almacenan en un archivo especial, el diccionario de datos contiene
meta datos que son datos acerca de los datos.

Un lenguaje de manipulacin de datos (LMD) es un lenguaje que permite a los usuarios acceder o
manipular datos. Hay dos tipos: LMD proced mentales que requieren que se especifiquen los
datos requeridos y como se buscarn, y los LMD no proced mentales que solo requiere que se
especifique que datos se requieren.

El gestor de transacciones es el responsable de asegurar que la base de datos permanezca en un
estado consistente a pesar de los fallos del sistema. El gestor de transacciones tambin se asegura
que las transacciones ocurran sin conflictos.

Un gestor de almacenamiento es un mdulo de programa que proporciona la interfaz entre los
datos de bajo nivel almacenados en la base de datos y los programas de aplicacin y las consultas
enviadas al sistema. El gestor de almacenamiento es responsable de la interaccin con los datos
almacenados en el disco.

También podría gustarte