Aprendizaje Automático
Aprendizaje Automático
Aprendizaje Automático
En muchas ocasiones el campo de actuación del aprendizaje automático se solapa con el de la estadística
inferencial, ya que las dos disciplinas se basan en el análisis de datos. Sin embargo, el aprendizaje
automático incorpora las preocupaciones de la complejidad computacional de los problemas. Muchos
problemas son de clase NP-hard, por lo que gran parte de la investigación realizada en aprendizaje
automático está enfocada al diseño de soluciones factibles a esos problemas. El aprendizaje automático
también está estrechamente relacionado con el reconocimiento de patrones. El aprendizaje automático
puede ser visto como un intento de automatizar algunas partes del método científico mediante métodos
matemáticos. Por lo tanto es un proceso de inducción del conocimiento.
El aprendizaje automático tiene una amplia gama de aplicaciones, incluyendo motores de búsqueda,
diagnósticos médicos, detección de fraude en el uso de tarjetas de crédito, análisis de mercado para los
diferentes sectores de actividad, clasificación de secuencias de ADN, reconocimiento del habla y del
lenguaje escrito, juegos y robótica.
Resumen
Algunos sistemas de
aprendizaje automático
intentan eliminar toda
necesidad de intuición o
conocimiento experto de
los procesos de análisis de
datos, mientras otros tratan
de establecer un marco de
colaboración entre el
experto y la computadora.
De todas formas, la
intuición humana no
puede ser reemplazada en
su totalidad, ya que el
diseñador del sistema ha
de especificar la forma de
representación de los datos y los métodos de manipulación y caracterización de los mismos. Sin embargo,
las computadoras son utilizadas por todo el mundo con fines tecnológicos muy buenos.
Modelos
El aprendizaje automático tiene como resultado un modelo para resolver una tarea dada. Entre los modelos
se distinguen3
Los modelos pueden también clasificarse como modelos de agrupamiento y modelos de gradiente. Los
primeros tratan de dividir el espacio de instancias en grupos. Los segundos, como su nombre lo indican,
representan un gradiente en el que se puede diferenciar entre cada instancia. Clasificadores geométricos
como las máquinas de vectores de apoyo son modelos de gradientes.
Tipos de algoritmos
Los diferentes algoritmos de Aprendizaje Automático se agrupan en
una taxonomía en función de la salida de los mismos. Algunos tipos
de algoritmos son:
Aprendizaje supervisado
Aprendizaje no supervisado
Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos formado tan
solo por entradas al sistema. No se tiene información sobre las categorías de esos
ejemplos. Por lo tanto, en este caso, el sistema tiene que ser capaz de reconocer
patrones para poder etiquetar las nuevas entradas.
Aprendizaje semisupervisado
Este tipo de algoritmos combinan los dos algoritmos anteriores para poder clasificar de
manera adecuada. Se tiene en cuenta los datos marcados y los no marcados.
Aprendizaje por refuerzo
El aprendizaje por refuerzo es el más general entre las tres categorías. En vez de que un
instructor indique al agente qué hacer, el agente inteligente debe aprender cómo se
comporta el entorno mediante recompensas (refuerzos) o castigos, derivados del éxito o
del fracaso respectivamente. El objetivo principal es aprender la función de valor que le
ayude al agente inteligente a maximizar la señal de recompensa y así optimizar sus
políticas de modo a comprender el comportamiento del entorno y a tomar buenas
decisiones para el logro de sus objetivos formales.
Transducción
Similar al aprendizaje supervisado, pero no construye de forma explícita una función.
Trata de predecir las categorías de los futuros ejemplos basándose en los ejemplos de
entrada, sus respectivas categorías y los ejemplos nuevos al sistema.
Aprendizaje multi-tarea
Métodos de aprendizaje que usan conocimiento previamente aprendido por el sistema de
cara a enfrentarse a problemas parecidos a los ya vistos.
El aprendizaje automático las personas lo llevamos a cabo de manera automática ya que es un proceso tan
sencillo para nosotros que ni nos damos cuenta de cómo se realiza y todo lo que implica. Desde que
nacemos hasta que morimos los seres humanos llevamos a cabo diferentes procesos, entre ellos
encontramos el de aprendizaje por medio del cual adquirimos conocimientos, desarrollamos habilidades
para analizar y evaluar a través de métodos y técnicas así como también por medio de la experiencia propia.
Sin embargo, a las máquinas hay que indicarles cómo aprender, ya que si no se logra que una máquina sea
capaz de desarrollar sus habilidades, el proceso de aprendizaje no se estará llevando a cabo, sino que solo
será una secuencia repetitiva.
Técnicas de clasificación
Árboles de decisiones
Este tipo de aprendizaje usa un árbol de decisiones como modelo predictivo. Se mapean observaciones
sobre un objeto con conclusiones sobre el valor final de dicho objeto.
Los árboles son estructuras básicas en la informática. Los árboles de atributos son la base de las decisiones.
Una de las dos formas principales de árboles de decisiones es la desarrollada por Quinlan de medir la
impureza de la entropía en cada rama, algo que primero desarrolló en el algoritmo ID3 y luego en el C4.5.
Otra de las estrategias se basa en el índice GINI y fue desarrollada por Breiman, Friedman et alia. El
algoritmo de CART es una implementación de esta estrategia.5
Reglas de asociación
Los algoritmos de reglas de asociación procuran descubrir relaciones interesantes entre variables. Entre los
métodos más conocidos se hallan el algoritmo a priori, el algoritmo Eclat y el algoritmo de Patrón
Frecuente.
Algoritmos genéticos
Los algoritmos genéticos son procesos de búsqueda heurística que simulan la selección natural. Usan
métodos tales como la mutación y el cruzamiento para generar nuevas clases que puedan ofrecer una buena
solución a un problema dado.
Las redes de neuronas artificiales (RNA) son un paradigma de aprendizaje automático inspirado en las
neuronas de los sistemas nerviosos de los animales. Se trata de un sistema de enlaces de neuronas que
colaboran entre sí para producir un estímulo de salida. Las conexiones tienen pesos numéricos que se
adaptan según la experiencia. De esta manera, las redes neurales se adaptan a un impulso y son capaces de
aprender. La importancia de las redes neurales cayó durante un tiempo con el desarrollo de los vectores de
soporte y clasificadores lineales, pero volvió a surgir a finales de la década de 2000 con la llegada del
aprendizaje profundo.
Las MVS son una serie de métodos de aprendizaje supervisado usados para clasificación y regresión. Los
algoritmos de MVS usan un conjunto de ejemplos de entrenamiento clasificado en dos categorías para
construir un modelo que prediga si un nuevo ejemplo pertenece a una u otra de dichas categorías.
Algoritmos de agrupamiento
Las técnicas de agrupamiento hacen inferencias diferentes sobre la estructura de los datos; se guían
usualmente por una medida de similitud específica y por un nivel de compactamiento interno (similitud
entre los miembros de un grupo) y la separación entre los diferentes grupos.
El agrupamiento es un método de aprendizaje no supervisado y es una técnica muy popular de análisis
estadístico de datos.
Redes bayesianas
Una red bayesiana, red de creencia o modelo acíclico dirigido es un modelo probabilístico que representa
una serie de variables de azar y sus independencias condicionales a través de un grafo acíclico dirigido.
Una red bayesiana puede representar, por ejemplo, las relaciones probabilísticas entre enfermedades y
síntomas. Dados ciertos síntomas, la red puede usarse para calcular las probabilidades de que ciertas
enfermedades estén presentes en un organismo. Hay algoritmos eficientes que infieren y aprenden usando
este tipo de representación.
Conocimiento
En el aprendizaje automático podemos obtener 3 tipos de conocimiento, que son:
1. Crecimiento
Es el que se adquiere de lo que nos rodea, el cual guarda la información en la memoria
como si dejara huellas.
2. Reestructuración
Al interpretar los conocimientos el individuo razona y genera nuevo conocimiento al cual
se le llama de reestructuración.
3. Ajuste
Es el que se obtiene al generalizar varios conceptos o generando los propios.
Los tres tipos se efectúan durante un proceso de aprendizaje automático pero la importancia de cada tipo de
conocimiento depende de las características de lo que se está tratando de aprender.
El aprendizaje es más que una necesidad, es un factor primordial para satisfacer las necesidades de la
inteligencia artificial.
En el aprendizaje no supervisado, en cambio, el programa no cuenta con datos que definan qué
información es satisfactoria o no. El objetivo principal de estos programas suele ser encontrar patrones que
permitan separar y clasificar los datos en diferentes grupos, en función de sus atributos. Siguiendo el
ejemplo anterior un software de aprendizaje no supervisado no sería capaz de decirnos si una imagen dada
es un rostro o no pero sí podría, por ejemplo, clasificar las imágenes entre aquellas que contienen rostros
humanos, de animales, o las que no contienen. La información obtenida por un algoritmo de aprendizaje no
supervisado debe ser posteriormente interpretada por una persona para darle utilidad.
Aplicaciones
Motores de búsqueda
Diagnóstico médico
Detección de fraudes con el uso de tarjetas de crédito
Análisis del mercado de valores
Clasificación de secuencias de ADN
Reconocimiento del habla
Robótica
Minería de datos
Big Data
Previsiones de series temporales
Software
Muchos lenguajes de programación pueden usarse para implementar algoritmos de aprendizaje automático.
Los más populares para 2015 eran R y Python.6 R es muy usado ante todo en el campo académico,
mientras que Python es más popular en la empresa privada.
Entre los paquetes de software que incluyen algoritmos de aprendizaje automatizado, se hallan los
siguientes:
Software comercial
SPSS Modeler Microsoft Azure Machine RCASE
Mathematica Learning STATISTICA
MATLAB Neural Designer SAS
Oracle Data Mining
Sesgos
Los algoritmos de aprendizaje automático a menudo pueden verse afectados por el sesgo que puedan tener
los datos (Ver sesgo algoritmico). Por ejemplo, no se podrán clasificar todos aquellas entradas de las que no
se haya recibido ninguna información en la fase de entrenamiento. De hecho, cuando el entrenamiento se
realiza con datos clasificados por el ser humano el aprendizaje automático tiende a crear los mismos sesgos
que hay en la sociedad. Algunos ejemplos de esto son cuando en 2015 el algoritmo de Google photos
identificaba algunas personas negras con gorilas, o en 2016 cuando el bot de Twitter de Microsoft
desarrollo comportamientos racistas y machistas a base de observar el tráfico de datos en dicha red social.
Por este motivo en los últimos años ha habido una tendencia a desarrollar métodos para aumentar la
equidad, es decir, para reducir el sesgo en este tipo algoritmos por parte de los expertos en IA. Citando a
Fei-fei Li "La IA no tiene nada de especial. Se inspira en personas, es creada por personas, y lo más
importante impacta en las personas. Es una herramienta muy poderosa que tan solo hemos comenzado a
entender, y esa es una gran responsabilidad" 7
Véase también
Aprendizaje profundo
Dinámica de sistemas
Inteligencia artificial
Inteligencia computacional
Internet de las cosas
Sistema dinámico
Reconocimiento de patrones
Reglas de asociación
Robot autónomo
Equidad (aprendizaje automático)
Referencias
1. Russell, Stuart; Norvig, Peter (2009). Inteligencia Artificial: Un Enfoque Moderno (3rd
edición). p. 229.
2. Russell and Norvig (2021). Artificial Intelligence: A Modern Approach (en inglés). Pearson.
p. 651. ISBN 9780134610993.
3. Flach 2012 Págs. 20-21
4. Sutton, Richard S., Barto, Andrew G. Reinforcement Learning: An Introduction. The MIT
Press.
5. Flach 2012 Págs. 155-156
6. Four main languages for analytics and data mining science (KD Nuggets) (http://www.kdnug
gets.com/2014/08/four-main-languages-analytics-data-mining-data-science.html)
7. «Fei-Fei Li's Quest to Make Machines Better for Humanity» (https://www.wired.com/story/fei-f
ei-li-artificial-intelligence-humanity/). Wired (en inglés). ISSN 1059-1028 (https://portal.issn.org/resou
rce/issn/1059-1028). Consultado el 17 de diciembre de 2019.
Bibliografía
Bishop, Christopher (2008) Pattern Recognition and Machine Learning. Springer Verlag.
ISBN=978-0-3873-1073-2.
Flach, Peter (2012) Machine Learning: The Art and Science of Algorithms that Make Sense
of Data. Cambridge University Press. ISBN 978-1-107-42222-3.
Gollapudi, Sunila (2016) Practical Machine Learning. Packt Publishing. ISBN=978-1-78439-
968-4.
Ian H. Witten and Eibe Frank (2011). Data Mining: Practical machine learning tools and
techniques Morgan Kaufmann, 664 pág., ISBN 978-0-12-374856-0.
Mitchell, T. (1997). Machine Learning, McGraw Hill. ISBN 0-07-042807-7
Raschka, Sebastian (2015). Python Machine Learning, Packt Open Source. ISBN 978-1-
78355-513-0
Enlaces externos
Ejemplos prácticos de Machine Learning en Español (https://machinelearningenespanol.co
m/blog/)
Blog sobre Aprendizaje Automático - La biblia del Machine Learning (http://www.rubenjrom
o.com/)
El Machine Learning cambiará el mundo (https://www.emerita.legal/blog/el-machine-learnin
g-cambiara-el-mundo/)
Machine Learning Development with Perl (http://www.perlmonks.org/index.pl?node_id=638
391) (en inglés)
Estudio y aplicación de técnicas de aprendizaje automático orientadas al ámbito médico:
estimación y explicación de predicciones individuales. Universidad Autónoma de Madrid (ht
tps://repositorio.uam.es/bitstream/handle/10486/12100/59264_Di_Deco_Sampedro_JavierP
FM.pdf?sequence=1)
AlphaGo (https://www.netflix.com/title/80190844) Archivado (https://web.archive.org/web/201
80204185620/https://www.netflix.com/title/80190844) el 4 de febrero de 2018 en Wayback
Machine.
Machine Learning explicado (podcast) (https://pochocosta.com/podcast/9-machine-learning-
explicado/)
Machine Learning: Selección de métricas de clasificación (en español) (http://sitiobigdata.co
m/2019/01/19/machine-learning-metrica-clasificacion-parte-3/)
Obtenido de «https://es.wikipedia.org/w/index.php?title=Aprendizaje_automático&oldid=151074419»