Deep-Learning-Tutorial für Anfänger: Grundlagen neuronaler Netze

Was ist Deep Learning?

Tiefes Lernen ist eine Computersoftware, die das Netzwerk von Neuronen in einem Gehirn nachahmt. Es handelt sich um eine Teilmenge des maschinellen Lernens, die auf künstlichen neuronalen Netzen mit Repräsentationslernen basiert. Es wird Deep Learning genannt, weil es tiefe neuronale Netze nutzt. Dieses Lernen kann überwacht, halbüberwacht oder unbeaufsichtigt erfolgen.

Deep-Learning-Algorithmen werden mit verbundenen Schichten aufgebaut.

  • Die erste Ebene wird Eingabeebene genannt
  • Die letzte Ebene wird als Ausgabeebene bezeichnet
  • Alle dazwischen liegenden Ebenen werden als versteckte Ebenen bezeichnet. Das Wort „tief“ bedeutet, dass das Netzwerk Neuronen in mehr als zwei Schichten verbindet.
Tiefes Lernen
Was ist Deep Learning?

Jede verborgene Schicht besteht aus Neuronen. Die Neuronen sind miteinander verbunden. Das Neuron verarbeitet und leitet dann das Eingangssignal, das es empfängt, an die darüber liegende Schicht weiter. Die Stärke des Signals, das dem Neuron in der nächsten Schicht gegeben wird, hängt von der Gewichtung, der Vorspannung und der Aktivierungsfunktion ab.

Das Netzwerk verarbeitet große Mengen an Eingabedaten und verarbeitet sie über mehrere Schichten. Auf jeder Schicht kann das Netzwerk zunehmend komplexere Merkmale der Daten erlernen.

Deep-Learning-Prozess

Ein tiefes neuronales Netzwerk bietet modernste Genauigkeit bei vielen Aufgaben, von der Objekterkennung bis zur Spracherkennung. Sie können automatisch lernen, ohne dass vordefiniertes Wissen explizit von den Programmierern codiert wird.

Deep-Learning-Prozess
Deep-Learning-Prozess

Um die Idee des Deep Learning zu verstehen, stellen Sie sich eine Familie mit einem Kleinkind und seinen Eltern vor. Das Kleinkind zeigt mit seinem kleinen Finger auf Objekte und sagt immer das Wort „Katze“. Da seine Eltern um seine Bildung besorgt sind, sagen sie ihm ständig „Ja, das ist eine Katze“ oder „Nein, das ist keine Katze“. Das Kleinkind zeigt beharrlich auf Objekte, wird aber bei „Katzen“ genauer. Das kleine Kind weiß tief im Inneren nicht, warum es sagen kann, ob es eine Katze ist oder nicht. Es hat gerade gelernt, komplexe Merkmale zu hierarchisieren und sich eine Katze auszudenken, indem es das Haustier als Ganzes betrachtet und sich weiterhin auf Details wie den Schwanz oder die Nase konzentriert, bevor es sich eine Meinung bildet.

Ein neuronales Netzwerk funktioniert ganz ähnlich. Jede Schicht stellt eine tiefere Wissensebene dar, also die Wissenshierarchie. Ein neuronales Netzwerk mit vier Schichten lernt komplexere Merkmale als ein neuronales Netzwerk mit zwei Schichten.

Das Lernen erfolgt in zwei Phasen:

Erste Phase: Die erste Phase besteht aus der Anwendung einer nichtlinearen Transformation der Eingabe und der Erstellung eines statistischen Modells als Ausgabe.
Zweite Phase: Die zweite Phase zielt darauf ab, das Modell mit einer mathematischen Methode namens Ableitung zu verbessern.

Das neuronale Netzwerk wiederholt diese beiden Phasen hunderte bis tausende Male, bis es ein erträgliches Maß an Genauigkeit erreicht hat. Die Wiederholung dieser zwei Phasen wird als Iteration bezeichnet.

Um ein Deep-Learning-Beispiel zu geben, werfen Sie einen Blick auf die folgende Bewegung: Das Modell versucht zu lernen, wie man tanzt. Nach 10 Minuten Training weiß das Model nicht, wie man tanzt, und es sieht aus wie ein Gekritzel.

Deep-Learning-Prozess

Nach 48 Stunden Lernzeit beherrscht der Computer die Kunst des Tanzens.

Deep-Learning-Prozess

Klassifizierung neuronaler Netze

Flaches neuronales Netzwerk: Das flache neuronale Netzwerk hat nur eine verborgene Schicht zwischen Eingabe und Ausgabe.

Tiefes neuronales Netzwerk: Tiefe neuronale Netze haben mehr als eine Schicht. Beispielsweise zählt das Google LeNet-Modell zur Bilderkennung 22 Schichten.

Heutzutage wird Deep Learning auf vielfältige Weise eingesetzt, beispielsweise in fahrerlosen Autos, Mobiltelefonen, der Google-Suchmaschine, zur Betrugserkennung, im Fernsehen usw.

Arten von Deep-Learning-Netzwerken

In diesem Tutorial zu Deep Neural Networks lernen wir nun die Arten von Deep Learning Networks kennen:

Arten von Deep-Learning-Netzwerken
Arten von Deep-Learning-Netzwerken

Feed-Forward-Neuronale Netze

Die einfachste Art eines künstlichen neuronalen Netzwerks. Bei dieser Art von Architektur fließen Informationen nur in eine Richtung, nämlich vorwärts. Das bedeutet, dass der Informationsfluss auf der Eingabeebene beginnt, zu den „versteckten“ Ebenen geht und auf der Ausgabeebene endet. Das Netzwerk

hat keine Schleife. Informationen enden auf den Ausgabeebenen.

Rekurrente neuronale Netze (RNNs)

RNN ist ein mehrschichtiges neuronales Netzwerk, das Informationen in Kontextknoten speichern kann, wodurch es Datensequenzen lernen und eine Zahl oder eine andere Sequenz ausgeben kann. Einfach ausgedrückt handelt es sich um ein künstliches neuronales Netzwerk, dessen Verbindungen zwischen Neuronen Schleifen umfassen. RNNs eignen sich gut für die Verarbeitung von Eingabesequenzen.

Wiederkehrende neuronale Netze

Wiederkehrende neuronale Netze

Wenn die Aufgabe beispielsweise darin besteht, das nächste Wort im Satz „Willst du…………?“ vorherzusagen.

  • Die RNN-Neuronen empfangen ein Signal, das auf den Satzanfang zeigt.
  • Das Netzwerk empfängt das Wort „Do“ als Eingabe und erzeugt einen Vektor der Zahl. Dieser Vektor wird an das Neuron zurückgekoppelt, um dem Netzwerk einen Speicher bereitzustellen. Diese Phase hilft dem Netzwerk, sich daran zu erinnern, dass es „Do“ erhalten hat, und zwar an erster Stelle.
  • Das Netzwerk wird in ähnlicher Weise mit den nächsten Wörtern fortfahren. Es braucht die Wörter „du“ und „wollen“. Der Zustand der Neuronen wird bei jedem Wortempfang aktualisiert.
  • Die letzte Phase findet nach dem Empfang des Wortes „a“ statt. Das neuronale Netzwerk liefert für jedes englische Wort eine Wahrscheinlichkeit, mit der der Satz vervollständigt werden kann. Ein gut trainiertes RNN weist „Café“, „Getränk“, „Burger“ usw. wahrscheinlich eine hohe Wahrscheinlichkeit zu.

Häufige Verwendungen von RNN

  • Helfen Sie Wertpapierhändlern bei der Erstellung von Analyseberichten
  • Erkennen Sie Auffälligkeiten im Vertrag oder in der Finanzaufstellung
  • Erkennen Sie betrügerische Kreditkartentransaktionen
  • Geben Sie für Bilder eine Bildunterschrift an
  • Leistungsstarke Chatbots
  • Die Standardanwendungen von RNN treten auf, wenn die Praktiker mit Zeitreihendaten oder -sequenzen (z. B. Audioaufzeichnungen oder Text) arbeiten.

Faltungs-Neuronale Netze (CNN)

CNN ist ein mehrschichtiges neuronales Netzwerk mit einer einzigartigen Architektur, die darauf ausgelegt ist, auf jeder Schicht zunehmend komplexere Merkmale der Daten zu extrahieren, um die Ausgabe zu bestimmen. CNNs eignen sich gut für Wahrnehmungsaufgaben.

Faltungs-Neuronales Netz

Faltungs-Neuronales Netz

CNN wird meist verwendet, wenn ein unstrukturierter Datensatz (z. B. Bilder) vorliegt und die Praktiker daraus Informationen extrahieren müssen.

Wenn die Aufgabe beispielsweise darin besteht, eine Bildunterschrift vorherzusagen:

  • Das CNN empfängt ein Bild beispielsweise einer Katze. Dieses Bild ist, in der Computersprache ausgedrückt, eine Sammlung des Pixels. Im Allgemeinen eine Ebene für das Graustufenbild und drei Ebenen für ein Farbbild.
  • Während des Merkmalslernens (d. h. verborgener Schichten) identifiziert das Netzwerk einzigartige Merkmale, beispielsweise den Schwanz der Katze, das Ohr usw.
  • Wenn das Netzwerk gründlich gelernt hat, ein Bild zu erkennen, kann es für jedes ihm bekannte Bild eine Wahrscheinlichkeit angeben. Die Bezeichnung mit der höchsten Wahrscheinlichkeit wird zur Vorhersage des Netzwerks.

Verstärkung lernen

Verstärkung lernen ist ein Teilgebiet des maschinellen Lernens, in dem Systeme durch den Empfang virtueller „Belohnungen“ oder „Strafen“ trainiert werden, also im Wesentlichen durch Versuch und Irrtum. Googles DeepMind hat Reinforcement Learning genutzt, um einen menschlichen Champion in den Go-Spielen zu schlagen. Reinforcement Learning wird auch in Videospielen eingesetzt, um das Spielerlebnis durch die Bereitstellung intelligenterer Bots zu verbessern.

Einige der bekanntesten Algorithmen sind:

  • Q-Learning
  • Deep Q-Netzwerk
  • State-Action-Reward-State-Action (SARSA)
  • Deep Deterministic Policy Gradient (DDPG)

Beispiele für Deep-Learning-Anwendungen

In diesem Tutorial zu Deep Learning für Anfänger lernen wir nun mehr über Deep-Learning-Anwendungen:

KI im Finanzwesen

Der Finanztechnologiesektor hat bereits damit begonnen, KI zu nutzen, um Zeit zu sparen, Kosten zu senken und Mehrwert zu schaffen. Deep Learning verändert die Kreditbranche durch eine robustere Kreditbewertung. Kreditentscheidungsträger können KI für robuste Kreditanträge nutzen, um eine schnellere und genauere Risikobewertung zu erreichen, indem sie maschinelle Intelligenz nutzen, um den Charakter und die Leistungsfähigkeit der Antragsteller zu berücksichtigen.

Underwrite ist ein Fintech-Unternehmen, das eine KI-Lösung für Kreditvergabeunternehmen bereitstellt. underwrite.ai nutzt KI, um zu erkennen, welcher Antragsteller einen Kredit mit größerer Wahrscheinlichkeit zurückzahlen wird. Ihr Ansatz übertrifft traditionelle Methoden radikal.

KI im Personalwesen

Under Armour, ein Sportbekleidungsunternehmen, revolutioniert die Einstellungspraxis und modernisiert die Erfahrung der Bewerber mithilfe von KI. Tatsächlich verkürzt Under Armour die Einstellungszeit für seine Einzelhandelsgeschäfte um 35 %. Under Armour verzeichnete bereits 2012 ein wachsendes Interesse an der Popularität. Sie hatten durchschnittlich 30000 Lebensläufe pro Monat. Das Lesen all dieser Bewerbungen und der Beginn des Auswahl- und Interviewprozesses dauerten zu lange. Der langwierige Prozess, Leute einzustellen und an Bord zu holen, beeinträchtigte Under Armours Fähigkeit, seine Einzelhandelsgeschäfte voll zu besetzen, hochzufahren und betriebsbereit zu halten.

Damals verfügte Under Armour über alle „unverzichtbaren“ HR-Technologien, wie z. B. Transaktionslösungen für Beschaffung, Bewerbung, Nachverfolgung und Onboarding, aber diese Tools waren nicht nützlich genug. Under Armour wählen HireVue, ein KI-Anbieter für HR-Lösungen, sowohl für On-Demand- als auch für Live-Interviews. Die Ergebnisse waren Bluff; Es gelang ihnen, die Füllzeit um 35 % zu verkürzen. Im Gegenzug stellten sie höherqualifizierte Mitarbeiter ein.

KI im Marketing

KI ist ein wertvolles Werkzeug für Herausforderungen im Kundenservicemanagement und bei der Personalisierung. Eine verbesserte Spracherkennung bei der Callcenter-Verwaltung und Anrufweiterleitung durch den Einsatz von KI-Techniken ermöglicht ein nahtloseres Erlebnis für Kunden.

Durch die Deep-Learning-Analyse von Audio können Systeme beispielsweise den emotionalen Ton eines Kunden beurteilen. Wenn der Kunde schlecht darauf reagiert AI Chatbot, kann das System das Gespräch an echte, menschliche Mitarbeiter umleiten, die sich des Anliegens annehmen.

Abgesehen von den drei oben genannten Deep-Learning-Beispielen wird KI auch in anderen Sektoren/Branchen häufig eingesetzt.

Warum ist Deep Learning wichtig?

Deep Learning ist ein leistungsstarkes Werkzeug, um Vorhersagen in umsetzbare Ergebnisse zu verwandeln. Deep Learning zeichnet sich durch Mustererkennung (unüberwachtes Lernen) und wissensbasierte Vorhersage aus. Große Daten ist der Treibstoff für Deep Learning. Wenn beides kombiniert wird, kann ein Unternehmen beispiellose Ergebnisse in Bezug auf Produktivität, Umsatz, Management und Innovation erzielen.

Deep Learning kann traditionelle Methoden übertreffen. Beispielsweise sind Deep-Learning-Algorithmen bei der Bildklassifizierung 41 % genauer als Machine-Learning-Algorithmen, bei der Gesichtserkennung 27 % und bei der Spracherkennung 25 % genauer.

Einschränkungen des Deep Learning

In diesem Tutorial zum neuronalen Netzwerk erfahren wir nun mehr über die Einschränkungen von Deep Learning:

Datenkennzeichnung

Die meisten aktuellen KI-Modelle werden durch „überwachtes Lernen“ trainiert. Das bedeutet, dass Menschen die zugrunde liegenden Daten kennzeichnen und kategorisieren müssen, was eine umfangreiche und fehleranfällige Aufgabe sein kann. Unternehmen, die Technologien für selbstfahrende Autos entwickeln, stellen beispielsweise Hunderte von Mitarbeitern ein, um stundenlange Video-Feeds von Prototyp-Fahrzeugen manuell zu kommentieren und so diese Systeme zu trainieren.

Erhalten Sie riesige Trainingsdatensätze

Es hat sich gezeigt, dass einfache Deep-Learning-Techniken wie CNN in manchen Fällen das Wissen von Experten aus der Medizin und anderen Bereichen imitieren können. Die aktuelle Welle von Maschinelles Lernenerfordert jedoch Trainingsdatensätze, die nicht nur gekennzeichnet, sondern auch ausreichend breit und universell sind.

Deep-Learning-Methoden erforderten Tausende von Beobachtungen, damit Modelle bei Klassifizierungsaufgaben relativ gut werden konnten, und in einigen Fällen Millionen, damit sie auf der Ebene des Menschen funktionieren konnten. Es überrascht nicht, dass Deep Learning in großen Technologieunternehmen berühmt ist; Sie nutzen Big Data, um Petabytes an Daten anzusammeln. Es ermöglicht ihnen, ein beeindruckendes und hochpräzises Deep-Learning-Modell zu erstellen.

Erklären Sie ein Problem

Große und komplexe Modelle können mit menschlichen Worten schwer zu erklären sein. Zum Beispiel, warum eine bestimmte Entscheidung getroffen wurde. Das ist ein Grund dafür, dass die Akzeptanz einiger KI-Tools in Anwendungsbereichen, in denen Interpretierbarkeit nützlich oder sogar erforderlich ist, langsam ist.

Darüber hinaus könnten mit der zunehmenden Anwendung von KI auch regulatorische Anforderungen den Bedarf an besser erklärbaren KI-Modellen erhöhen.

Zusammenfassung

Deep Learning-Übersicht: Deep Learning ist der neue Stand der Technik für künstliche Intelligenz. Die Deep-Learning-Architektur besteht aus einer Eingabeschicht, verborgenen Schichten und einer Ausgabeschicht. Das Wort „tief“ bedeutet, dass es mehr als zwei vollständig verbundene Schichten gibt.

Es gibt eine Vielzahl neuronaler Netzwerke, wobei jede Architektur darauf ausgelegt ist, eine bestimmte Aufgabe zu erfüllen. CNN funktioniert beispielsweise sehr gut mit Bildern, RNN liefert beeindruckende Ergebnisse bei Zeitreihen- und Textanalysen.

Deep Learning ist mittlerweile in verschiedenen Bereichen aktiv, von Finanzen über Marketing bis hin zu Lieferkette und Marketing. Große Unternehmen sind die ersten, die Deep Learning nutzen, da sie bereits über einen großen Datenpool verfügen. Deep Learning erfordert einen umfangreichen Trainingsdatensatz.