Tutoriel d'apprentissage profond pour les débutants : bases du réseau de neurones
Qu'est-ce que le Deep Learning?
L'apprentissage en profondeur est un logiciel informatique qui imite le réseau de neurones d'un cerveau. Il s'agit d'un sous-ensemble de l'apprentissage automatique basé sur des réseaux de neurones artificiels avec apprentissage par représentation. C’est ce qu’on appelle l’apprentissage profond car il utilise des réseaux de neurones profonds. Cet apprentissage peut être supervisé, semi-supervisé ou non supervisé.
Les algorithmes d'apprentissage profond sont construits avec des couches connectées.
- La première couche est appelée la couche d'entrée
- La dernière couche est appelée la couche de sortie
- Tous les calques intermédiaires sont appelés calques cachés. Le mot profond signifie que le réseau rejoint les neurones en plus de deux couches.

Chaque couche cachée est composée de neurones. Les neurones sont connectés les uns aux autres. Le neurone traitera puis propagera le signal d’entrée qu’il reçoit dans la couche située au-dessus de lui. La force du signal transmis au neurone de la couche suivante dépend du poids, du biais et de la fonction d'activation.
Le réseau consomme de grandes quantités de données d'entrée et les exploite à travers plusieurs couches ; le réseau peut apprendre des caractéristiques de plus en plus complexes des données à chaque couche.
Processus d'apprentissage en profondeur
Un réseau neuronal profond offre une précision de pointe dans de nombreuses tâches, de la détection d'objets à la reconnaissance vocale. Ils peuvent apprendre automatiquement, sans connaissances prédéfinies explicitement codées par les programmeurs.
Pour saisir l’idée de l’apprentissage profond, imaginez une famille, avec un bébé et ses parents. Le tout-petit pointe des objets avec son petit doigt et prononce toujours le mot « chat ». Comme ses parents s'inquiètent de son éducation, ils n'arrêtent pas de lui dire « Oui, c'est un chat » ou « Non, ce n'est pas un chat ». Le nourrisson persiste à pointer des objets mais devient plus précis avec les « chats ». Le petit, au fond, ne sait pas pourquoi il peut dire que c'est un chat ou pas. Il vient d'apprendre à hiérarchiser les caractéristiques complexes d'un chat en regardant l'animal dans son ensemble et à continuer de se concentrer sur des détails comme la queue ou le nez avant de se décider.
Un réseau de neurones fonctionne à peu près de la même manière. Chaque couche représente un niveau de connaissance plus profond, c'est-à-dire la hiérarchie des connaissances. Un réseau de neurones à quatre couches apprendra des fonctionnalités plus complexes qu'avec deux couches.
L'apprentissage se déroule en deux phases :
Première phase: La première phase consiste à appliquer une transformation non linéaire de l'entrée et à créer un modèle statistique en sortie.
Seconde phase: La deuxième phase vise à améliorer le modèle avec une méthode mathématique dite dérivée.
Le réseau neuronal répète ces deux phases des centaines, voire des milliers de fois jusqu'à atteindre un niveau de précision tolérable. La répétition de ces deux phases s’appelle une itération.
Pour donner un exemple d'apprentissage profond, jetez un œil au mouvement ci-dessous, le modèle essaie d'apprendre à danser. Après 10 minutes d'entraînement, le mannequin ne sait plus danser, et cela ressemble à un gribouillage.
Après 48 heures d'apprentissage, l'ordinateur maîtrise l'art de la danse.
Classification des réseaux de neurones
Réseau neuronal peu profond: Le réseau neuronal Shallow n'a qu'une seule couche cachée entre l'entrée et la sortie.
Réseau neuronal profond: Les réseaux de neurones profonds ont plus d'une couche. Par exemple, le modèle Google LeNet pour la reconnaissance d’images compte 22 couches.
De nos jours, le deep learning est utilisé de nombreuses manières : voiture sans conducteur, téléphone portable, moteur de recherche Google, détection de fraude, télévision, etc.
Types de réseaux d'apprentissage profond
Maintenant, dans ce didacticiel sur les réseaux de neurones profonds, nous allons découvrir les types de réseaux de Deep Learning :
Réseaux de neurones à action directe
Le type le plus simple de réseau neuronal artificiel. Avec ce type d’architecture, les informations circulent dans une seule direction, vers l’avant. Cela signifie que les flux d'informations commencent à la couche d'entrée, se dirigent vers les couches « cachées » et se terminent à la couche de sortie. Le réseau
n'a pas de boucle. Les informations s’arrêtent aux couches de sortie.
Réseaux de neurones récurrents (RNN)
RNN est un réseau neuronal multicouche qui peut stocker des informations dans des nœuds contextuels, lui permettant d'apprendre des séquences de données et de générer un nombre ou une autre séquence. En termes simples, il s'agit d'un réseau de neurones artificiels dont les connexions entre neurones comprennent des boucles. Les RNN sont bien adaptés au traitement de séquences d’entrées.
Par exemple, si la tâche consiste à prédire le mot suivant dans la phrase « Voulez-vous un………… ?
- Les neurones RNN recevront un signal indiquant le début de la phrase.
- Le réseau reçoit le mot « Do » en entrée et produit un vecteur du nombre. Ce vecteur est renvoyé au neurone pour fournir une mémoire au réseau. Cette étape aide le réseau à se souvenir qu'il a reçu « Do » et qu'il l'a reçu en première position.
- Le réseau procédera de la même manière aux mots suivants. Il faut les mots « vous » et « vouloir ». L'état des neurones est mis à jour à la réception de chaque mot.
- La dernière étape se produit après la réception du mot « a ». Le réseau neuronal fournira une probabilité pour chaque mot anglais pouvant être utilisé pour compléter la phrase. Un RNN bien formé attribue probablement une forte probabilité à « café », « boisson », « hamburger », etc.
Utilisations courantes du RNN
- Aider les négociants en valeurs mobilières à générer des rapports analytiques
- Détecter les anomalies dans le contrat d’état financier
- Détecter les transactions frauduleuses par carte de crédit
- Fournir une légende pour les images
- Des chatbots puissants
- Les utilisations standard du RNN se produisent lorsque les praticiens travaillent avec des données ou des séquences de séries chronologiques (par exemple, des enregistrements audio ou du texte).
Réseaux de neurones convolutifs (CNN)
CNN est un réseau neuronal multicouche avec une architecture unique conçue pour extraire des caractéristiques de plus en plus complexes des données à chaque couche afin de déterminer la sortie. Les CNN sont bien adaptés aux tâches de perception.
CNN est principalement utilisé lorsqu'il existe un ensemble de données non structurées (par exemple, des images) et que les praticiens doivent en extraire des informations.
Par exemple, si la tâche consiste à prédire une légende d’image :
- Le CNN reçoit une image disons d'un chat, cette image, en terme informatique, est une collection de pixels. Généralement, un calque pour l'image en niveaux de gris et trois calques pour une image en couleur.
- Au cours de l'apprentissage des caractéristiques (c'est-à-dire les couches cachées), le réseau identifiera des caractéristiques uniques, par exemple la queue du chat, l'oreille, etc.
- Lorsque le réseau a parfaitement appris à reconnaître une image, il peut fournir une probabilité pour chaque image connue. L’étiquette ayant la probabilité la plus élevée deviendra la prédiction du réseau.
Apprentissage par renforcement
Apprentissage par renforcement est un sous-domaine de l'apprentissage automatique dans lequel les systèmes sont formés en recevant des « récompenses » ou des « punitions » virtuelles, essentiellement par essais et erreurs. DeepMind de Google a utilisé l'apprentissage par renforcement pour battre un champion humain dans les jeux Go. L'apprentissage par renforcement est également utilisé dans les jeux vidéo pour améliorer l'expérience de jeu en fournissant des robots plus intelligents.
L'un des algorithmes les plus connus est :
- Q-apprentissage
- Réseau Q profond
- État-Action-Récompense-État-Action (SARSA)
- Gradient politique déterministe profond (DDPG)
Exemples d'applications d'apprentissage profond
Maintenant, dans ce didacticiel Deep Learning pour débutants, découvrons les applications Deep Learning :
L'IA dans la finance
Le secteur des technologies financières a déjà commencé à utiliser l’IA pour gagner du temps, réduire les coûts et ajouter de la valeur. Le deep learning transforme le secteur du crédit en utilisant une notation de crédit plus robuste. Les décideurs en matière de crédit peuvent utiliser l'IA pour des demandes de prêt de crédit robustes afin d'obtenir une évaluation des risques plus rapide et plus précise, en utilisant l'intelligence artificielle pour prendre en compte le caractère et la capacité des candidats.
Underwrite est une société Fintech fournissant une solution d'IA aux sociétés d'octroi de crédit. underwrite.ai utilise l'IA pour détecter quel demandeur est le plus susceptible de rembourser un prêt. Leur approche surpasse radicalement les méthodes traditionnelles.
L'IA en RH
Under Armour, une entreprise de vêtements de sport révolutionne le recrutement et modernise l'expérience candidat avec l'aide de l'IA. En fait, Under Armour réduit de 35 % les délais de recrutement pour ses magasins de détail. Under Armour a fait face à un intérêt de popularité croissant en 2012. Ils avaient en moyenne 30000 CV par mois. Lire toutes ces candidatures et commencer le processus de sélection et d’entretien prenait trop de temps. Le long processus d'embauche et d'intégration des personnes a eu un impact sur la capacité d'Under Armour à disposer de ses magasins de détail dotés d'un effectif complet, d'une montée en puissance et prêts à fonctionner.
À cette époque, Under Armour disposait de toutes les technologies RH indispensables, telles que des solutions transactionnelles pour le sourcing, la candidature, le suivi et l'intégration, mais ces outils n'étaient pas assez utiles. Sous armure choisir HireVue, un fournisseur d'IA pour les solutions RH, pour les entretiens à la demande et en direct. Les résultats étaient bluffants ; ils ont réussi à diminuer de 35% le temps de remplissage. En échange, le personnel embauché est de meilleure qualité.
L'IA en marketing
L'IA est un outil précieux pour les défis de gestion et de personnalisation du service client. L'amélioration de la reconnaissance vocale dans la gestion des centres d'appels et le routage des appels grâce à l'application de techniques d'IA permet une expérience plus transparente pour les clients.
Par exemple, l'analyse approfondie de l'audio permet aux systèmes d'évaluer le ton émotionnel d'un client. Si le client répond mal au AI chatbot, le système peut rediriger la conversation vers de vrais opérateurs humains qui prennent en charge le problème.
Outre les trois exemples de Deep Learning ci-dessus, l’IA est largement utilisée dans d’autres secteurs/industries.
Pourquoi l’apprentissage profond est-il important ?
L’apprentissage profond est un outil puissant pour faire de la prédiction un résultat exploitable. L'apprentissage profond excelle dans la découverte de modèles (apprentissage non supervisé) et la prédiction basée sur les connaissances. Big données est le carburant de l’apprentissage profond. Lorsque les deux sont combinés, une organisation peut obtenir des résultats sans précédent en termes de productivité, de ventes, de gestion et d'innovation.
L’apprentissage profond peut surpasser les méthodes traditionnelles. Par exemple, les algorithmes d’apprentissage profond sont 41 % plus précis que les algorithmes d’apprentissage automatique en matière de classification d’images, 27 % plus précis en reconnaissance faciale et 25 % en reconnaissance vocale.
Limites de l'apprentissage profond
Maintenant, dans ce didacticiel sur les réseaux neuronaux, nous allons découvrir les limites du Deep Learning :
Étiquetage des données
La plupart des modèles d’IA actuels sont formés par « apprentissage supervisé ». Cela signifie que les humains doivent étiqueter et catégoriser les données sous-jacentes, ce qui peut constituer une tâche importante et sujette aux erreurs. Par exemple, les entreprises développant des technologies de voitures autonomes embauchent des centaines de personnes pour annoter manuellement des heures de flux vidéo provenant de prototypes de véhicules afin de contribuer à la formation de ces systèmes.
Obtenez d’énormes ensembles de données de formation
Il a été démontré que de simples techniques d’apprentissage profond comme CNN peuvent, dans certains cas, imiter les connaissances d’experts en médecine et dans d’autres domaines. La vague actuelle de machine learningCependant, cela nécessite des ensembles de données de formation non seulement étiquetés, mais également suffisamment larges et universels.
Les méthodes d’apprentissage en profondeur ont nécessité des milliers d’observations pour que les modèles deviennent relativement performants dans les tâches de classification et, dans certains cas, des millions pour les exécuter au niveau des humains. Sans surprise, l’apprentissage profond est célèbre dans les entreprises technologiques géantes ; ils utilisent le Big Data pour accumuler des pétaoctets de données. Cela leur permet de créer un modèle d’apprentissage profond impressionnant et très précis.
Expliquer un problème
Les modèles vastes et complexes peuvent être difficiles à expliquer, en termes humains. Par exemple, pourquoi une décision particulière a été obtenue. C’est l’une des raisons pour lesquelles l’acceptation de certains outils d’IA est lente dans les domaines d’application où l’interprétabilité est utile, voire requise.
En outre, à mesure que les applications de l’IA se développent, les exigences réglementaires pourraient également nécessiter des modèles d’IA plus explicables.
Résumé
Présentation de l'apprentissage profond: L'apprentissage profond est le nouvel état de l'art pour intelligence artificielle. L'architecture d'apprentissage profond est composée d'une couche d'entrée, de couches cachées et d'une couche de sortie. Le mot profond signifie qu’il y a plus de deux couches entièrement connectées.
Il existe une grande quantité de réseaux de neurones, où chaque architecture est conçue pour effectuer une tâche donnée. Par exemple, CNN fonctionne très bien avec les images, RNN fournit des résultats impressionnants avec les séries chronologiques et l'analyse de texte.
Le deep learning est désormais actif dans différents domaines, de la finance au marketing, en passant par la supply chain et le marketing. Les grandes entreprises sont les premières à utiliser le deep learning car elles disposent déjà d’un large pool de données. L’apprentissage profond nécessite de disposer d’un vaste ensemble de données de formation.