Minería de Datos
Minería de Datos
Minería de Datos
Ir a la navegaciónIr a la búsqueda
La minería de datos o exploración de datos (es la etapa de análisis de
"Knowledge Discovery in Databases" o KDD) es un campo de la estadística y
las ciencias de la computación referido al proceso que intenta descubrir
patrones en grandes volúmenes de conjuntos de datos. 12 Utiliza los métodos de
la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases
de datos. El objetivo general del proceso de minería de datos consiste en
extraer información de un conjunto de datos y transformarla en una estructura
comprensible para su uso posterior. Además de la etapa de análisis en bruto,
supone aspectos de gestión de datos y de bases de datos, de procesamiento
de datos, del modelo y de las consideraciones de inferencia, de métricas de
Intereses, de consideraciones de la teoría de la complejidad computacional, de
post-procesamiento de las estructuras descubiertas, de la visualización y de la
actualización en línea.
El término es un concepto de moda, y es frecuentemente mal utilizado para
referirse a cualquier forma de datos a gran escala o procesamiento de la
información (recolección, extracción, almacenamiento, análisis y estadísticas),
pero también se ha generalizado a cualquier tipo de sistema informático de
apoyo a decisiones, incluyendo la inteligencia artificial, aprendizaje automático
y la inteligencia empresarial. En el uso de la palabra, el término clave es el
descubrimiento, comúnmente se define como "la detección de algo nuevo".
Incluso el popular libro "La minería de datos: sistema de prácticas herramientas
de aprendizaje y técnicas con Java" (que cubre todo el material de aprendizaje
automático) originalmente iba a ser llamado simplemente "la máquina de
aprendizaje práctico", y el término "minería de datos" se añadió por razones de
marketing. A menudo, los términos más generales "(gran escala) el análisis de
datos", o "análisis". O cuando se refieren a los métodos actuales, la inteligencia
artificial y aprendizaje automático, son más apropiados.
La tarea de minería de datos real es el análisis automático o semi-automático
de grandes cantidades de datos para extraer patrones interesantes hasta ahora
desconocidos, como los grupos de registros de datos (análisis clúster),
registros poco usuales (la detección de anomalías) y dependencias (minería
por reglas de asociación). Esto generalmente implica el uso de técnicas de
bases de datos como los índices espaciales. Estos patrones pueden entonces
ser vistos como una especie de resumen de los datos de entrada, y pueden ser
utilizados en el análisis adicional o, por ejemplo, en el aprendizaje automático
y análisis predictivo. Por ejemplo, el paso de minería de datos podría identificar
varios grupos en los datos, que luego pueden ser utilizados para obtener
resultados más precisos de predicción por un sistema de soporte de
decisiones. Ni la recolección de datos, la preparación de datos, ni la
interpretación de los resultados y la información son parte de la etapa de
minería de datos, pero que pertenecen a todo el proceso KDD como pasos
adicionales.
Los términos relacionados con la obtención de datos, la pesca de datos y
espionaje de los datos se refieren a la utilización de métodos de minería de
datos a las partes de la muestra de un conjunto de datos de población más
grandes establecidas que son (o pueden ser) demasiado pequeñas para las
inferencias estadísticas fiables que se hizo acerca de la validez de cualquier
patrón descubierto. Estos métodos pueden, sin embargo, ser utilizados en la
creación de nuevas hipótesis que se prueban contra poblaciones de datos más
grandes.
Índice
1Proceso
2Protocolo de un proyecto de minería de datos
3Técnicas de minería de datos
4Ejemplos de uso de la minería de datos
o 4.1Negocios
4.1.1Análisis de la cesta de la compra
4.1.2Patrones de fuga
4.1.3Fraudes
4.1.4Recursos humanos
o 4.2Comportamiento en Internet
o 4.3Terrorismo
o 4.4Juegos
o 4.5Videojuegos
o 4.6Ciencia e Ingeniería
4.6.1Genética
4.6.2Ingeniería eléctrica
4.6.3Análisis de gases
5Minería de datos y otras disciplinas análogas
o 5.1De la estadística
o 5.2De la informática
6Minería de datos basada en teoría de la información
7Tendencias
8Herramientas de software
9Véase también
10Referencias
11Enlaces externos
Proceso[editar]
Un proceso típico de minería de datos consta de los siguientes pasos
generales:
Tendencias[editar]
La Minería de Datos ha sufrido transformaciones en los últimos años de
acuerdo con cambios tecnológicos, de estrategias de marketing, la extensión
de los modelos de compra en línea, etc. Los más importantes de ellos son:
Herramientas de software[editar]
Existen muchas herramientas de software para el desarrollo de modelos de
minería de datos tanto libres como comerciales como, por ejemplo:
RapidMiner
KNIME
Neural Designer
OpenNN
Orange
R
SPSS Modeler
SAS
STATISTICA
Weka