Investigacion
Investigacion
Investigacion
DE BASE DE DATOS
INGENIERÍA EN DESARROLLO Y GESTIÓN DE SOFTWARE
DOCENTE:
ADÁN JAIMES JAIMES
NOVENO CUATRIMESTRE
ESTUDIANTE: JUNIO
BRYAN RAMOS SALVADOR 2024
INTRODUCCIÓN
a) BIOMÉTRICOS
Los sistemas biométricos en bases de datos se refieren a la aplicación de
tecnologías que utilizan características físicas o comportamentales únicas de un
individuo, como huellas dactilares, iris, voz, rostro, entre otros, para identificar de
manera única a los usuarios y controlar el acceso a los datos.
La función principal de los sistemas biométricos en bases de datos es garantizar la
autenticación y autorización de usuarios, asegurando que solo personas
autorizadas puedan acceder a la información almacenada en la base de datos.
Algunas características clave de los sistemas biométricos en bases de datos
incluyen la precisión en la identificación de usuarios, la capacidad de evitar el uso
de contraseñas o tarjetas de acceso, y la posibilidad de integrarse con otros
sistemas de seguridad.
Ventajas:
• Seguridad mejorada: Al utilizar rasgos únicos de cada individuo, se reduce el
riesgo de accesos no autorizados
• Eliminación de contraseñas: No es necesario recordar contraseñas, lo que
disminuye el riesgo de robo o pérdida de credenciales.
• Mayor comodidad: Los usuarios no tienen que llevar consigo tarjetas de
acceso ni recordar contraseñas.
• Auditoría y trazabilidad: Se puede llevar un registro detallado de las acciones
realizadas por cada usuario.
Desventajas:
b) MÁQUINA A MÁQUINA
La comunicación de máquina a máquina (M2M) es un término que describe la
comunicación automática entre dispositivos, máquinas o sistemas informáticos sin
intervención humana directa.
Su función principal es permitir que los dispositivos intercambien datos de manera
automática y eficiente, lo que puede incluir la recolección, procesamiento y
transmisión de información relevante para su operación.
Características:
Ventajas:
Desventajas:
c) DATOS DE TRANSACCIONES
Los datos de transacciones son registros de actividades específicas que ocurren en
un sistema informático, como transacciones financieras, compras en línea, registros
de cambios en bases de datos, etc.
La principal función de los datos de transacciones es registrar y mantener un
historial preciso de todas las operaciones realizadas en un sistema. Esto es
fundamental para garantizar la integridad de los datos y permitir la recuperación de
información en caso de errores o fallos del sistema.
Características:
Ventajas:
Desventajas:
Funciones:
Ventajas:
Desventajas:
e) WEB
Se refiere a la técnica de extraer información de páginas web y almacenarla en una
base de datos. Este proceso puede realizarse de manera automatizada utilizando
herramientas especializadas que acceden a las páginas, extraen la información
relevante y la organizan en una estructura que pueda ser almacenada y consultada
posteriormente.
La función principal de la WEB en una base de datos es obtener datos de fuentes
externas, como sitios web, para enriquecer la información disponible en la base de
datos. Esto puede incluir datos como precios de productos, noticias, información de
redes sociales, entre otros.
Características:
Desventajas:
f) MEDIOS SOCIALES
Los medios sociales son plataformas en línea donde los usuarios pueden crear
perfiles, compartir información, interactuar con otros usuarios y generar contenido
en forma de texto, imágenes, videos, etc. En el contexto de bases de datos, los
medios sociales se refieren a la información generada y almacenada en estas
plataformas.
La función principal de los medios sociales en bases de datos es proporcionar un
medio para que los usuarios compartan información, se conecten con otros
usuarios, expresen sus opiniones y participen en conversaciones. Esto crea una
gran cantidad de datos que pueden ser analizados para obtener insights sobre el
comportamiento de los usuarios, tendencias, preferencias, etc.
Características:
Ventajas:
Desventajas:
a) CUANTITATIVOS Y CUALITATIVOS
a. Cuantitativos
Los datos cuantitativos son aquellos que se pueden medir y expresar
numéricamente. Representan cantidades, medidas o atributos que pueden ser
cuantificados.
Estos datos son utilizados para realizar análisis estadísticos, modelado matemático,
cálculos numéricos y análisis predictivo.
Características:
Ventajas:
Desventajas:
b. Cualitativos
Los datos cualitativos son descriptivos y representan cualidades, características o
atributos que no se pueden cuantificar numéricamente. Se centran en las
percepciones, opiniones y experiencias.
Estos datos se utilizan para comprender fenómenos complejos, explorar
significados, identificar patrones cualitativos y obtener información subjetiva.
Características:
• Describen cualidades y características.
• No se pueden medir directamente con números.
• Capturan información subjetiva y contextual.
• Son útiles para comprender el contexto y las experiencias de las
personas.
Ventajas:
• Proporcionan insights profundos sobre el comportamiento humano,
percepciones y opiniones.
• Son útiles para explorar temas complejos y contextuales.
• Permiten una comprensión holística de los datos.
Desventajas:
• Son más difíciles de cuantificar y analizar de manera numérica.
• La interpretación puede ser subjetiva y variar según el analista.
• No permiten comparaciones cuantitativas directas como los datos
cuantitativos.
b) CONTINUOS,DICRETAS Y ESCALARES
a. Datos Continuos
Son datos que pueden tomar cualquier valor dentro de un rango. No tienen límites
claros y pueden ser fraccionarios.
Son útiles para representar medidas que pueden variar de manera continua, como
la temperatura, la altura, el peso, etc.
Características:
Ventajas:
Desventajas:
b. Datos Discretos
Son datos que solo pueden tomar valores específicos dentro de un conjunto finito o
numerable. Tienen límites claros y son contables.
Son útiles para representar cantidades que se pueden contar, como el número de
personas, el número de productos en inventario, etc.
Características:
Ventajas:
c. Datos Escalares
Son datos que representan una magnitud única, como un número, sin dirección ni
orientación.
Características:
Ventajas:
Desventajas:
En análisis de datos y bases de datos, los tipos de datos como Nominal, Ordinal,
Binario y Numérico se utilizan para categorizar y organizar la información de manera
adecuada. Aquí te detallo cada uno de ellos:
a. Nominal
Función: Se utiliza para etiquetar o clasificar datos sin ningún tipo de orden o
jerarquía.
Características:
Ventajas:
Desventajas:
Representa datos que tienen un orden predefinido, pero las diferencias entre los
valores no son significativas.
Características:
Ventajas:
Desventajas:
Representa datos que solo pueden tener dos valores posibles, como
verdadero/falso, sí/no, 1/0, etc.
Características:
Ventajas:
Desventajas:
a. Estructura
Características:
Ventajas:
b. Datos No Estructurados
Características:
Ventajas:
c. Datos Semiestructurados
Características:
Ventajas:
Desventajas:
a. Base de Datos
Características:
Desventajas:
b. Hoja De Cálculo
Una hoja de cálculo es una aplicación informática que permite organizar datos en
filas y columnas, realizar cálculos y generar gráficos a partir de esos datos.
Las hojas de cálculo son utilizadas para realizar análisis de datos, crear informes y
llevar a cabo tareas de contabilidad, presupuesto, seguimiento de inventario, entre
otras.
Características:
Ventajas:
Desventajas:
c. Archivos de Texto
Los archivos de texto son utilizados para almacenar información en formato legible
y simple, como configuraciones, registros, datos de configuración, etc.
Características:
Ventajas:
Desventajas:
Funciones:
Características:
Ventajas:
Desventajas:
1. Extracción (Extraction):
• En esta fase, los datos se extraen de diversas fuentes, que pueden ser bases
de datos relacionales, archivos planos, servicios web, entre otros.
• Se utiliza software especializado para extraer los datos de manera eficiente
y segura, evitando pérdida de información y manteniendo la integridad de los
datos durante la extracción.
2. Transformación (Transformation):
• Una vez que los datos han sido extraídos, se realiza la transformación para
prepararlos para su posterior carga en el almacén de datos.
• En esta etapa, se aplican diversas operaciones de limpieza, validación,
filtrado, enriquecimiento y transformación de datos.
• Se utilizan herramientas y técnicas como limpieza de datos, conversión de
formatos, cálculos, normalización, deduplicación, entre otros.
3. Carga (Loading):
• En la fase de carga, los datos transformados y preparados se cargan en el
almacén de datos o data warehouse.
• El proceso de carga puede ser incremental (solo cargando datos nuevos o
modificados desde la última carga) o completo (cargando todos los datos
nuevamente).
• Se deben considerar aspectos como la integridad de los datos, la
optimización de la carga para mejorar el rendimiento y la programación de
cargas automáticas en intervalos regulares.
CONCLUSIONES
En conclusión, la gestión efectiva de datos abarca varios aspectos clave que van
desde la identificación de su procedencia hasta su almacenamiento y análisis en un
entorno organizado como un data warehouse.
Las herramientas como el data warehouse son esenciales para integrar, consolidar
y mantener la integridad de los datos, permitiendo un acceso eficiente y seguro para
su análisis. Este proceso implica la extracción, transformación y carga de datos
(ETL), donde se limpian, validan y preparan los datos para su posterior uso en la
toma de decisiones y la generación de informes.
• Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit: The Definitive
Guide to Dimensional Modeling. John Wiley & Sons.
• Redman, T. C. (2015). Data Driven: Profiting from Your Most Important
Business Asset. Harvard Business Press.
• Inmon, W. H. (2005). Building the Data Warehouse (4th ed.). John Wiley &
Sons.
• Kudyba, S. (2011). Data Mining and Business Analytics with R. John Wiley &
Sons.
• Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques
(3rd ed.). Morgan Kaufmann.
• Kimball, R., Ross, M., Thornthwaite, W., Mundy, J., & Becker, B. (2013). The
Data Warehouse Lifecycle Toolkit (2nd ed.). John Wiley & Sons.
• Microsoft. (2020). Introduction to Data Warehousing. Recuperado de
“https://learn.microsoft.com/en-us/sql/relational-databases/data-
warehousing/data-warehousing”.
• IBM. (2020). What is ETL? Extract, Transform, Load Explained. Recuperado
de “https://learn.microsoft.com/en-us/sql/relational-databases/data-
warehousing/data-warehousing”.
• Oracle. (2020). Data Warehouse vs. Data Lake: How They Differ and Why
They Matter. Recuperado de “https://www.oracle.com/big-data/guide/data-
warehouse-vs-data-lake.html”.