Redes Neutrales
Redes Neutrales
Redes Neutrales
INTRODUCCION
Las redes neuronales son la herramienta preferida para muchas aplicaciones de minería de
datos predictiva por su potencia, flexibilidad y facilidad de uso. Las redes neuronales
predictivas son especialmente útiles en las aplicaciones cuyo proceso subyacente sea
complejo; por ejemplo:
Prever la demanda de los consumidores para racionalizar los costes de producción y
entrega.
Predecir la probabilidad de respuesta al marketing mediante correo directo para
determinar a qué unidades familiares de una lista de correo debe enviarse una oferta.
Puntuar a un solicitante para determinar el riesgo que supone concederle un crédito.
Detectar transacciones fraudulentas en una base de datos de reclamaciones de
seguros.
Las redes neuronales utilizadas en aplicaciones predictivas, como las redes de perceptrón
multicapa (MLP) y de función de base radial (RBF), se supervisan en el sentido de que los
resultados pronosticados por el modelo pueden compararse con los valores conocidos de las
variables objetivo. La opción de redes neuronales le permite ajustar las redes MLP y RBF y
guardar los modelos resultantes para la puntuación.
Las redes neuronales artificiales (ANN) están formadas por capas de nodos, que contienen
una capa de entrada, una o varias capas ocultas y una capa de salida. Cada nodo, o neurona
artificial, se conecta a otro y tiene un peso y un umbral asociados. Si la salida de un nodo
individual está por encima del valor de umbral especificado, dicho nodo se activa y envía
datos a la siguiente capa de la red. De lo contrario, no se pasan datos a la siguiente capa de
la red.
Las redes neuronales se basan en entrenar datos para aprender y mejorar su precisión con el
tiempo. No obstante, una vez que estos algoritmos de aprendizaje se ajustan de manera
precisa, constituyen potentes herramientas de informática e inteligencia artificial, lo que
nos permite clasificar y agrupar los datos a gran velocidad. Las tareas de reconocimiento de
voz o reconocimiento de imagen pueden tardar minutos frente a las horas que requiere la
identificación manual de expertos humanos. Una de las redes neuronales más conocidas es
el algoritmo de búsqueda de Google.
La historia de las redes neuronales es más larga de lo que la mayoría cree. Aunque la idea
de una "máquina que piensa" se remonta hasta los antiguos griegos, nos centraremos en los
acontecimientos clave que llevaron a la evolución de pensar en redes neuronales, cuya
popularidad ha fluctuado en el tiempo:
1943: Warren S. McCulloch y Walter Pitts publicaron "A logical calculus of the ideas
immanent in nervous activity" (PDF, 1 MB) (enlace externo a IBM). El objetivo de este
estudio era entender cómo el cerebro humano podía producir patrones complejos a través
de células cerebrales conectadas o neuronas. Una de las principales ideas que surgieron de
este trabajo fue la comparación de las neuronas con un umbral binario a la lógica booleana
(es decir, 0/1 o sentencias verdaderas/falsas).
1958: a Frank Rosenblatt se le atribuye el desarrollo del perceptrón, documentado en su
estudio "The Perceptron: A Probabilistic Model for Information Storage and Organization
in the Brain" (enlace externo a IBM). Llevó el trabajo de McCulloch y Pitt un paso más allá
al introducir las ponderaciones en la ecuación. Utilizando un sistema IBM 704, Rosenblatt
consiguió que un ordenador aprendiera a distinguir cartas marcadas en la izquierda de
cartas marcadas en la derecha.
1974: aunque muchos investigadores contribuyeron a la idea de la retropropagación, Paul
Werbos fue la primera persona en Estados Unidos en descubrir su aplicación a las redes
neuronales en su Tesis doctoral (PDF, 8,1 MB) (enlace externo a IBM).
1989: Yann LeCun publicó un estudio (PDF, 5,7 MB) (enlace externo a IBM) que ilustra
cómo el uso de restricciones en la retropropagación y su integración en la arquitectura de
redes neuronales se puede utilizar para entrenar algoritmos. Esta investigación utilizó con
éxito una red neuronal para reconocer los dígitos de código postal escritos a mano
proporcionados por el servicio de correos de Estados Unidos.
Para obtener más información sobre las diferencias entre las redes neuronales y otras
formas de inteligencia artificial, como machine learning, lea la entrada de blog
"Diferencias entre IA, machine learning, deep learning y redes neuronales".
Las redes neuronales convolucionales (CNN) son similares a las redes de propagación hacia
delante, pero normalmente se utilizan para el reconocimiento de imágenes, el
reconocimiento de patrones y/o la visión artificial. Estas redes aprovechan los principios
del álgebra lineal, particularmente la multiplicación de matriz, para identificar patrones
dentro de una imagen.
Las redes neuronales recurrentes (RNN) se identifican por sus bucles de retroalimentación.
Estos algoritmos de aprendizaje se utilizan principalmente con datos de series temporales
para hacer predicciones sobre resultados futuros, por ejemplo, predicciones del mercado de
acciones o previsiones de ventas.
APLICACIÓN NUERONALES
Piense en cada nodo individual como su propio modelo de regresión lineal, formado por
datos de entrada, ponderaciones, un sesgo (o umbral) y una salida. La fórmula sería similar
a la siguiente:
Una vez que se determina una capa de entrada, se asignan ponderaciones. Estas
ponderaciones permiten determinar la importancia de cualquier variable, donde las más
grandes contribuyen más significativamente a la salida en comparación con otras entradas.
A continuación, todas las entradas se multiplican por sus respectivas ponderaciones y se
suman. A continuación, la salida se pasa a través de una función de activación, que
determina la salida. Si la salida supera un determinado umbral, activa el nodo y pasa los
datos a la siguiente capa de la red. Como resultado, la salida de un nodo se convierte en la
entrada del nodo siguiente. Este proceso de pasar datos de una capa a la siguiente define
esta red neuronal como una red de propagación hacia delante.
Vamos a desglosar lo que puede parecer un solo nodo utilizando valores binarios. Podemos
aplicar este concepto a un caso más tangible, por ejemplo, si debe ir a hacer surf (Sí: 1, No:
0). La decisión de ir o no ir es nuestro resultado predicho, o y-hat. Supongamos que hay
tres factores que influyen en la toma de decisiones:
Ahora tenemos que asignar varias ponderaciones para determinar la importancia. Las
ponderaciones más grandes indican que algunas variables son más importantes para la
decisión o el resultado.
CONCLUSIONES
las redes neutrales son la vía para construir infraestructura digital puesto que
optimizan costos y reducen el impacto.
Al ocuparse de construir y operar, las redes neutrales permiten a los operadores
concentrarse en el servicio a los usuarios finales. Por ello, los operadores solo se
deberían concentrar en el servicio al cliente, la oferta, el marketing y el valor
agregado. Por otro lado, el operador neutral debe construir y operar la red, y, ofrecer
una red de calidad. La cooperación entre empresas debe ser el punto de referencia
para ampliar la conectividad en la región y en Colombia. Lo anterior, supone una
combinación de tecnologías, donde cada uno tiene una responsabilidad.
RECOMENDACIONES
Las redes de acceso abierto permitan el transporte de datos, a través de fibra óptica,
con un fácil acceso a cualquier operador de telecomunicaciones.
Además, brindar a los clientes servicios de alta calidad y libre elección, con un
ecosistema estable y sostenible.