Tutorial de aprendizaje profundo para principiantes: conceptos básicos de redes neuronales
¿Qué es Deep Learning?
Aprendizaje profundo es un software informático que imita la red de neuronas del cerebro. Es un subconjunto del aprendizaje automático basado en redes neuronales artificiales con aprendizaje de representación. Se llama aprendizaje profundo porque utiliza redes neuronales profundas. Este aprendizaje puede ser supervisado, semisupervisado o no supervisado.
Los algoritmos de aprendizaje profundo se construyen con capas conectadas.
- La primera capa se llama capa de entrada.
- La última capa se llama Capa de salida.
- Todas las capas intermedias se denominan capas ocultas. La palabra profunda significa que la red une neuronas en más de dos capas.

Cada capa oculta está compuesta de neuronas. Las neuronas están conectadas entre sí. La neurona procesará y luego propagará la señal de entrada que recibe en la capa superior. La intensidad de la señal dada a la neurona en la siguiente capa depende del peso, el sesgo y la función de activación.
La red consume grandes cantidades de datos de entrada y los procesa a través de múltiples capas; la red puede aprender características cada vez más complejas de los datos en cada capa.
Proceso de aprendizaje profundo
Una red neuronal profunda proporciona precisión de última generación en muchas tareas, desde la detección de objetos hasta el reconocimiento de voz. Pueden aprender automáticamente, sin conocimientos predefinidos codificados explícitamente por los programadores.
Para entender la idea del aprendizaje profundo, imaginemos una familia con un bebé y sus padres. El niño pequeño señala objetos con su dedo meñique y siempre dice la palabra "gato". Como sus padres están preocupados por su educación, no dejan de decirle "Sí, eso es un gato" o "No, eso no es un gato". El bebé insiste en señalar objetos, pero se vuelve más preciso con la palabra "gatos". El niño pequeño, en el fondo, no sabe por qué puede decir que es un gato o no. Simplemente ha aprendido a jerarquizar características complejas, a pensar en un gato observando a la mascota en general y a seguir centrándose en detalles como la cola o la nariz antes de tomar una decisión.
Una red neuronal funciona de manera muy similar. Cada capa representa un nivel más profundo de conocimiento, es decir, la jerarquía del conocimiento. Una red neuronal con cuatro capas aprenderá características más complejas que una con dos capas.
El aprendizaje se produce en dos fases:
Primera fase: La primera fase consiste en aplicar una transformación no lineal de la entrada y crear un modelo estadístico como salida.
Segunda fase: La segunda fase tiene como objetivo mejorar el modelo con un método matemático conocido como derivada.
La red neuronal repite estas dos fases cientos o miles de veces hasta alcanzar un nivel tolerable de precisión. La repetición de estas dos fases se llama iteración.
Para dar un ejemplo de aprendizaje profundo, observe el movimiento a continuación: el modelo está tratando de aprender a bailar. Después de 10 minutos de entrenamiento, la modelo no sabe bailar y parece un garabato.
Después de 48 horas de aprendizaje, la computadora domina el arte de bailar.
Clasificación de redes neuronales
Red neuronal poco profunda: La red neuronal Shallow tiene solo una capa oculta entre la entrada y la salida.
Red neuronal profunda: Las redes neuronales profundas tienen más de una capa. Por ejemplo, el modelo Google LeNet para reconocimiento de imágenes cuenta con 22 capas.
Hoy en día, el aprendizaje profundo se utiliza de muchas maneras, como en automóviles sin conductor, teléfonos móviles, motores de búsqueda de Google, detección de fraudes, televisión, etc.
Tipos de redes de aprendizaje profundo
Ahora, en este tutorial de redes neuronales profundas, aprenderemos sobre los tipos de redes de aprendizaje profundo:
Redes neuronales de retroalimentación
El tipo más simple de red neuronal artificial. Con este tipo de arquitectura, la información fluye en una sola dirección, hacia adelante. Es decir, el flujo de información comienza en la capa de entrada, pasa a las capas “ocultas” y termina en la capa de salida. La red
no tiene bucle. La información se detiene en las capas de salida.
Redes neuronales recurrentes (RNN)
RNN Es una red neuronal multicapa que puede almacenar información en nodos de contexto, lo que le permite aprender secuencias de datos y generar un número u otra secuencia. En palabras simples, es una red neuronal artificial cuyas conexiones entre neuronas incluyen bucles. Las RNN son adecuadas para procesar secuencias de entradas.
Por ejemplo, si la tarea es predecir la siguiente palabra en la oración “¿Quieres un…………?
- Las neuronas RNN recibirán una señal que apunta al inicio de la oración.
- La red recibe la palabra "Hacer" como entrada y produce un vector del número. Este vector se retroalimenta a la neurona para proporcionar una memoria a la red. Esta etapa ayuda a la red a recordar que recibió "Do" y lo recibió en la primera posición.
- La red procederá de manera similar con las siguientes palabras. Se necesitan las palabras "tú" y "quiero". El estado de las neuronas se actualiza al recibir cada palabra.
- La etapa final ocurre después de recibir la palabra "a". La red neuronal proporcionará una probabilidad para cada palabra en inglés que pueda usarse para completar la oración. Un RNN bien capacitado probablemente asigna una alta probabilidad a "café", "bebida", "hamburguesa", etc.
Usos comunes de RNN
- Ayude a los comerciantes de valores a generar informes analíticos
- Detectar anomalías en el contrato de estado financiero.
- Detectar transacciones fraudulentas con tarjetas de crédito
- Proporcionar un título para las imágenes.
- Chatbots de potencia
- Los usos estándar de RNN ocurren cuando los profesionales trabajan con secuencias o datos de series temporales (por ejemplo, grabaciones de audio o texto).
Redes neuronales convolucionales (CNN)
CNN es una red neuronal de múltiples capas con una arquitectura única diseñada para extraer características cada vez más complejas de los datos en cada capa para determinar el resultado. Las CNN son adecuadas para tareas perceptivas.
CNN se utiliza principalmente cuando hay un conjunto de datos no estructurados (por ejemplo, imágenes) y los profesionales necesitan extraer información de él.
Por ejemplo, si la tarea es predecir el título de una imagen:
- La CNN recibe una imagen de, digamos, un gato; esta imagen, en términos informáticos, es una colección de píxeles. Generalmente, una capa para la imagen en escala de grises y tres capas para una imagen en color.
- Durante el aprendizaje de características (es decir, capas ocultas), la red identificará características únicas, por ejemplo, la cola del gato, la oreja, etc.
- Cuando la red haya aprendido a reconocer una imagen, podrá proporcionar una probabilidad para cada imagen que conozca. La etiqueta con mayor probabilidad se convertirá en la predicción de la red.
Aprendizaje reforzado
Aprendizaje reforzado Es un subcampo del aprendizaje automático en el que los sistemas se entrenan recibiendo “recompensas” o “castigos” virtuales, esencialmente aprendiendo por prueba y error. DeepMind de Google ha utilizado el aprendizaje por refuerzo para vencer a un campeón humano en los juegos de Go. El aprendizaje por refuerzo también se utiliza en los videojuegos para mejorar la experiencia de juego proporcionando bots más inteligentes.
Uno de los algoritmos más famosos son:
- Q-aprendizaje
- Red Q profunda
- Estado-Acción-Recompensa-Estado-Acción (SARSA)
- Profundo gradiente determinista de políticas (DDPG)
Ejemplos de aplicaciones de aprendizaje profundo
Ahora, en este tutorial de aprendizaje profundo para principiantes, aprendamos sobre las aplicaciones de aprendizaje profundo:
IA en finanzas
El sector de la tecnología financiera ya ha comenzado a utilizar la IA para ahorrar tiempo, reducir costos y agregar valor. El aprendizaje profundo está cambiando la industria crediticia mediante el uso de calificaciones crediticias más sólidas. Los tomadores de decisiones crediticias pueden utilizar la IA para aplicaciones sólidas de préstamos crediticios para lograr una evaluación de riesgos más rápida y precisa, utilizando inteligencia artificial para tener en cuenta el carácter y la capacidad de los solicitantes.
Underwrite es una empresa de tecnología financiera que ofrece una solución de inteligencia artificial para empresas generadoras de crédito. underwrite.ai utiliza IA para detectar qué solicitante tiene más probabilidades de pagar un préstamo. Su enfoque supera radicalmente a los métodos tradicionales.
IA en RRHH
Under Armour, una empresa de ropa deportiva, revoluciona la contratación y moderniza la experiencia del candidato con la ayuda de la IA. De hecho, Under Armour reduce el tiempo de contratación para sus tiendas minoristas en un 35%. Under Armour se enfrentó a un creciente interés de popularidad en 2012. Tenían, en promedio, 30000 currículums al mes. Leer todas esas solicitudes y comenzar el proceso de selección y entrevistas estaba tomando demasiado tiempo. El largo proceso para contratar e integrar a las personas afectó la capacidad de Under Armour de tener sus tiendas minoristas completamente dotadas de personal, preparadas y listas para operar.
En ese momento, Under Armour contaba con toda la tecnología de recursos humanos “imprescindible”, como soluciones transaccionales para abastecimiento, aplicación, seguimiento e incorporación, pero esas herramientas no eran lo suficientemente útiles. elegir bajo armadura HireVue, un proveedor de inteligencia artificial para soluciones de recursos humanos, tanto para entrevistas bajo demanda como en vivo. Los resultados fueron un farol; lograron disminuir en un 35% el tiempo de llenado. A cambio, contrataron personal de mayor calidad.
IA en marketing
La IA es una herramienta valiosa para la gestión del servicio al cliente y los desafíos de personalización. El reconocimiento de voz mejorado en la gestión de centros de llamadas y el enrutamiento de llamadas como resultado de la aplicación de técnicas de inteligencia artificial permite una experiencia más fluida para los clientes.
Por ejemplo, el análisis de audio mediante aprendizaje profundo permite a los sistemas evaluar el tono emocional de un cliente. Si el cliente responde mal a la Chat de AI, el sistema puede redirigir la conversación a operadores humanos reales que se hagan cargo de la cuestión.
Aparte de los tres ejemplos de aprendizaje profundo anteriores, la IA se utiliza ampliamente en otros sectores/industrias.
¿Por qué es importante el aprendizaje profundo?
El aprendizaje profundo es una herramienta poderosa para hacer de la predicción un resultado procesable. El aprendizaje profundo sobresale en el descubrimiento de patrones (aprendizaje no supervisado) y la predicción basada en conocimientos. Big Data es el combustible para el aprendizaje profundo. Cuando ambos se combinan, una organización puede obtener resultados sin precedentes en términos de productividad, ventas, gestión e innovación.
El aprendizaje profundo puede superar a los métodos tradicionales. Por ejemplo, los algoritmos de aprendizaje profundo son un 41 % más precisos que los algoritmos de aprendizaje automático en la clasificación de imágenes, un 27 % más precisos en el reconocimiento facial y un 25 % más precisos en el reconocimiento de voz.
Limitaciones del aprendizaje profundo
Ahora, en este tutorial de redes neuronales, aprenderemos sobre las limitaciones del aprendizaje profundo:
Etiquetado de datos
La mayoría de los modelos de IA actuales se entrenan mediante “aprendizaje supervisado”, lo que significa que los humanos deben etiquetar y categorizar los datos subyacentes, lo que puede ser una tarea considerable y propensa a errores. Por ejemplo, las empresas que desarrollan tecnologías para autos autónomos están contratando a cientos de personas para que anoten manualmente horas de transmisiones de video de vehículos prototipo para ayudar a entrenar estos sistemas.
Obtenga enormes conjuntos de datos de entrenamiento
Se ha demostrado que técnicas simples de aprendizaje profundo como CNN pueden, en algunos casos, imitar el conocimiento de expertos en medicina y otros campos. La ola actual de máquina de aprendizajeSin embargo, requiere conjuntos de datos de entrenamiento que no sólo estén etiquetados sino que también sean lo suficientemente amplios y universales.
Los métodos de aprendizaje profundo requirieron miles de observaciones para que los modelos se volvieran relativamente buenos en tareas de clasificación y, en algunos casos, millones para que funcionaran al nivel de los humanos. Sin sorpresa, el aprendizaje profundo es famoso en las gigantescas empresas tecnológicas; están utilizando big data para acumular petabytes de datos. Les permite crear un modelo de aprendizaje profundo impresionante y muy preciso.
explicar un problema
Los modelos grandes y complejos pueden ser difíciles de explicar en términos humanos. Por ejemplo, por qué se tomó una decisión en particular. Es una de las razones por las que la aceptación de algunas herramientas de IA es lenta en áreas de aplicación donde la interpretabilidad es útil o incluso necesaria.
Además, a medida que se expande la aplicación de la IA, los requisitos regulatorios también podrían impulsar la necesidad de modelos de IA más explicables.
Resumen
Descripción general del aprendizaje profundo: El aprendizaje profundo es el nuevo estado del arte para inteligencia artificialLa arquitectura de aprendizaje profundo se compone de una capa de entrada, capas ocultas y una capa de salida. La palabra profunda significa que hay más de dos capas completamente conectadas.
Existe una gran cantidad de redes neuronales, donde cada arquitectura está diseñada para realizar una tarea determinada. Por ejemplo, CNN funciona muy bien con imágenes, RNN brinda resultados impresionantes con series temporales y análisis de texto.
El aprendizaje profundo ahora está activo en diferentes campos, desde finanzas hasta marketing, cadena de suministro y marketing. Las grandes empresas son las primeras en utilizar el aprendizaje profundo porque ya cuentan con una gran cantidad de datos. El aprendizaje profundo requiere tener un amplio conjunto de datos de entrenamiento.