Samouczek głębokiego uczenia się dla początkujących: podstawy sieci neuronowych
Co to jest uczenie głębokie?
głęboki Learning to oprogramowanie komputerowe imitujące sieć neuronów w mózgu. Jest to podzbiór uczenia maszynowego opartego na sztucznych sieciach neuronowych z uczeniem reprezentacyjnym. Nazywa się to głębokim uczeniem, ponieważ wykorzystuje głębokie sieci neuronowe. Uczenie się może być nadzorowane, częściowo nadzorowane lub bez nadzoru.
Algorytmy głębokiego uczenia się są konstruowane z połączonych warstw.
- Pierwsza warstwa nazywana jest warstwą wejściową
- Ostatnia warstwa nazywana jest warstwą wyjściową
- Wszystkie warstwy pomiędzy nimi nazywane są warstwami ukrytymi. Słowo „głęboki” oznacza, że sieć łączy neurony w więcej niż dwóch warstwach.

Każda warstwa ukryta składa się z neuronów. Neurony są ze sobą połączone. Neuron przetworzy, a następnie rozpropaguje otrzymany sygnał wejściowy do warstwy znajdującej się nad nim. Siła sygnału przekazanego neuronowi w następnej warstwie zależy od wagi, obciążenia i funkcji aktywacji.
Sieć przetwarza duże ilości danych wejściowych i przetwarza je na wielu warstwach. Sieć może uczyć się coraz bardziej złożonych cech danych na każdej kolejnej warstwie.
Proces głębokiego uczenia się
Głęboka sieć neuronowa zapewnia najnowocześniejszą dokładność w wielu zadaniach, od wykrywania obiektów po rozpoznawanie mowy. Mogą uczyć się automatycznie, bez z góry określonej wiedzy, jawnie zakodowanej przez programistów.
Aby zrozumieć ideę głębokiego uczenia się, wyobraź sobie rodzinę z niemowlęciem i rodzicami. Maluch wskazuje przedmioty małym palcem i zawsze mówi słowo „kot”. Ponieważ jego rodzice martwią się o jego edukację, ciągle mówią mu „Tak, to jest kot” lub „Nie, to nie jest kot”. Niemowlę uparcie wskazuje przedmioty, ale staje się bardziej precyzyjne, gdy mówi „koty”. Małe dziecko, głęboko w środku, nie wie, dlaczego może powiedzieć, że to kot lub nie. Właśnie nauczyło się, jak hierarchizować złożone cechy, wymyślając kota, patrząc na zwierzaka jako całość i nadal skupiać się na szczegółach, takich jak ogon lub nos, zanim podejmie decyzję.
Sieć neuronowa działa w ten sam sposób. Każda warstwa reprezentuje głębszy poziom wiedzy, tj. hierarchię wiedzy. Sieć neuronowa z czterema warstwami nauczy się bardziej złożonych cech niż z dwiema warstwami.
Nauka przebiega w dwóch fazach:
Pierwsza faza: Pierwsza faza polega na zastosowaniu nieliniowej transformacji danych wejściowych i utworzeniu modelu statystycznego jako wyniku.
Druga faza: Druga faza ma na celu ulepszenie modelu za pomocą metody matematycznej zwanej pochodną.
Sieć neuronowa powtarza te dwie fazy setki do tysięcy razy, aż osiągnie akceptowalny poziom dokładności. Powtórzenie tej dwufazy nazywa się iteracją.
Aby podać przykład głębokiego uczenia się, spójrz na ruch poniżej, model próbuje nauczyć się tańczyć. Po 10 minutach treningu modelka nie umie tańczyć, a wygląda jak bazgroły.
Po 48 godzinach nauki komputer opanował sztukę tańca.
Klasyfikacja sieci neuronowych
Płytka sieć neuronowa: Płytka sieć neuronowa ma tylko jedną warstwę ukrytą pomiędzy wejściem i wyjściem.
Głęboka sieć neuronowa: Głębokie sieci neuronowe mają więcej niż jedną warstwę. Na przykład model Google LeNet do rozpoznawania obrazów liczy 22 warstwy.
Obecnie głębokie uczenie się jest wykorzystywane na wiele sposobów, np. w samochodzie autonomicznym, telefonie komórkowym, wyszukiwarce Google, wykrywaniu oszustw, telewizji i tak dalej.
Rodzaje sieci głębokiego uczenia się
W tym samouczku dotyczącym sieci głębokiego neuronu dowiemy się o typach sieci głębokiego uczenia się:
Sieci neuronowe ze sprzężeniem zwrotnym
Najprostszy typ sztucznej sieci neuronowej. W przypadku tego typu architektury informacje płyną tylko w jednym kierunku, do przodu. Oznacza to, że przepływ informacji zaczyna się w warstwie wejściowej, przechodzi do warstw „ukrytych” i kończy się na warstwie wyjściowej. Sieć
nie ma pętli. Informacja zatrzymuje się na warstwach wyjściowych.
Rekurencyjne sieci neuronowe (RNN)
RNN jest wielowarstwową siecią neuronową, która może przechowywać informacje w węzłach kontekstowych, co pozwala jej uczyć się sekwencji danych i wyprowadzać liczbę lub inną sekwencję. Mówiąc prościej, jest to Sztuczna sieć neuronowa, której połączenia między neuronami obejmują pętle. RNN są dobrze przystosowane do przetwarzania sekwencji danych wejściowych.
Na przykład, jeśli zadaniem jest przewidzenie następnego słowa w zdaniu „Czy chcesz …………?
- Neurony RNN otrzymają sygnał wskazujący początek zdania.
- Sieć otrzymuje na wejściu słowo „Do” i tworzy wektor tej liczby. Wektor ten jest przesyłany z powrotem do neuronu, aby zapewnić pamięć sieci. Ten etap pomaga sieci zapamiętać, że otrzymała polecenie „Do” i otrzymała je na pierwszej pozycji.
- Sieć w podobny sposób przejdzie do kolejnych słów. Potrzebne są słowa „ty” i „chcieć”. Stan neuronów jest aktualizowany po odebraniu każdego słowa.
- Ostatni etap następuje po otrzymaniu słowa „a”. Sieć neuronowa obliczy prawdopodobieństwo, że dla każdego angielskiego słowa można dokończyć zdanie. Dobrze wyszkolony RNN prawdopodobnie przypisuje duże prawdopodobieństwo „kawiarni”, „napojowi”, „burgerowi” itp.
Typowe zastosowania RNN
- Pomóż inwestorom zajmującym się obrotem papierami wartościowymi w generowaniu raportów analitycznych
- Wykryj nieprawidłowości w umowie sprawozdania finansowego
- Wykryj oszukańczą transakcję kartą kredytową
- Podaj podpisy do obrazów
- Potężne chat boty
- Standardowe zastosowania RNN mają miejsce, gdy praktycy pracują z danymi lub sekwencjami szeregów czasowych (np. nagraniami dźwiękowymi lub tekstem).
Konwolucyjne sieci neuronowe (CNN)
CNN jest wielowarstwową siecią neuronową o unikalnej architekturze zaprojektowanej do ekstrakcji coraz bardziej złożonych cech danych na każdej warstwie w celu określenia wyjścia. Sieci neuronowe CNN są dobrze przystosowane do zadań percepcyjnych.
CNN jest najczęściej używane, gdy istnieje nieustrukturyzowany zbiór danych (np. obrazy), a praktycy muszą wydobyć z niego informacje.
Na przykład, jeśli zadaniem jest przewidzenie podpisu obrazu:
- CNN otrzymuje obraz, powiedzmy, kota. Obraz ten, w terminologii komputerowej, jest zbiorem pikseli. Ogólnie rzecz biorąc, jedna warstwa dla obrazu w skali szarości i trzy warstwy dla obrazu kolorowego.
- Podczas uczenia się cech (tj. ukrytych warstw) sieć zidentyfikuje unikalne cechy, na przykład ogon kota, ucho itp.
- Kiedy sieć dokładnie nauczy się rozpoznawać obraz, może określić prawdopodobieństwo każdego znanego obrazu. Etykieta z największym prawdopodobieństwem stanie się przewidywaniem sieci.
Uczenie się ze wzmocnieniem
Uczenie się przez wzmocnienie to poddziedzina uczenia maszynowego, w której systemy są szkolone poprzez otrzymywanie wirtualnych „nagród” lub „kar”, zasadniczo ucząc się metodą prób i błędów. Google DeepMind wykorzystał uczenie się przez wzmacnianie, aby pokonać ludzkiego mistrza w grach Go. Uczenie się przez wzmacnianie jest również wykorzystywane w grach wideo w celu poprawy wrażeń z gry poprzez zapewnienie inteligentniejszych botów.
Do najsłynniejszych algorytmów zalicza się:
- Q-uczenie się
- Głęboka sieć Q
- Stan-Działanie-Nagroda-Stan-Działanie (SARSA)
- Głęboko deterministyczny gradient polityki (DDPG)
Przykłady zastosowań głębokiego uczenia się
Teraz, w tym samouczku dotyczącym głębokiego uczenia się dla początkujących, poznajmy aplikacje głębokiego uczenia się:
SI w finansach
Sektor technologii finansowych zaczął już wykorzystywać sztuczną inteligencję do oszczędzania czasu, obniżania kosztów i tworzenia wartości dodanej. Głębokie uczenie się zmienia branżę pożyczkową poprzez zastosowanie solidniejszej punktacji kredytowej. Decydenci kredytowi mogą wykorzystywać sztuczną inteligencję do tworzenia niezawodnych aplikacji kredytowych, aby uzyskać szybszą i dokładniejszą ocenę ryzyka, wykorzystując inteligencję maszyn do uwzględnienia charakteru i możliwości wnioskodawców.
Underwrite to firma z branży Fintech dostarczająca rozwiązanie AI dla firm kredytowych. underwrite.ai wykorzystuje sztuczną inteligencję do wykrywania, który wnioskodawca ma większe szanse na spłatę pożyczki. Ich podejście radykalnie przewyższa tradycyjne metody.
AI w HR
Under Armour, firma produkująca odzież sportową, rewolucjonizuje rekrutację i unowocześnia doświadczenie kandydatów za pomocą sztucznej inteligencji. W rzeczywistości Under Armour skraca czas rekrutacji w swoich sklepach detalicznych o 35%. Under Armour spotkał się z rosnącym zainteresowaniem w 2012 r. Mieli średnio 30000 XNUMX CV miesięcznie. Czytanie wszystkich tych aplikacji i rozpoczęcie procesu selekcji i rozmów kwalifikacyjnych trwało zbyt długo. Długi proces zatrudniania i wdrażania ludzi wpłynął na zdolność Under Armour do pełnego obsadzenia personelu, przygotowania i gotowości do działania swoich sklepów detalicznych.
W tamtym czasie firma Under Armour posiadała wszystkie niezbędne technologie HR, takie jak rozwiązania transakcyjne do pozyskiwania pracowników, stosowania, śledzenia i wdrażania, ale narzędzia te nie były wystarczająco przydatne. Pod zbroją wybierz HireVue, dostawca sztucznej inteligencji dla rozwiązań HR, zarówno do rozmów kwalifikacyjnych na żądanie, jak i na żywo. Wyniki były blefem; udało im się skrócić czas napełniania o 35%. W zamian zatrudniono kadrę wyższej jakości.
AI w marketingu
Sztuczna inteligencja jest cennym narzędziem w zarządzaniu obsługą klienta i wyzwaniami związanymi z personalizacją. Ulepszone rozpoznawanie mowy w zarządzaniu call-center i routingu połączeń w wyniku zastosowania technik AI zapewnia klientom bardziej płynną obsługę.
Na przykład analiza głębokiego uczenia się dźwięku pozwala systemom ocenić ton emocjonalny klienta. Jeśli klient źle reaguje na Chatbot AIsystem może przekierować rozmowę do prawdziwych, ludzkich operatorów, którzy przejmą kontrolę nad sprawą.
Oprócz trzech powyższych przykładów głębokiego uczenia się, AI jest szeroko stosowana w innych sektorach/branżach.
Dlaczego głębokie uczenie się jest ważne?
Głębokie uczenie się to potężne narzędzie umożliwiające przewidywanie wyników, które można wykorzystać. Głębokie uczenie się przoduje w odkrywaniu wzorców (uczeniu się bez nadzoru) i przewidywaniu opartym na wiedzy. Big Data jest paliwem dla głębokiego uczenia się. Gdy oba są połączone, organizacja może zbierać bezprecedensowe rezultaty pod względem produktywności, sprzedaży, zarządzania i innowacji.
Głębokie uczenie może przewyższyć tradycyjną metodę. Na przykład algorytmy głębokiego uczenia są o 41% dokładniejsze niż algorytm uczenia maszynowego w klasyfikacji obrazów, o 27% dokładniejsze w rozpoznawaniu twarzy i o 25% w rozpoznawaniu głosu.
Ograniczenia głębokiego uczenia się
W tym samouczku dotyczącym sieci neuronowej dowiemy się o ograniczeniach głębokiego uczenia się:
Etykietowanie danych
Większość obecnych modeli AI jest trenowana poprzez „nadzorowane uczenie się”. Oznacza to, że ludzie muszą etykietować i kategoryzować podstawowe dane, co może być sporym i podatnym na błędy zadaniem. Na przykład firmy opracowujące technologie samochodów autonomicznych zatrudniają setki osób do ręcznego komentowania godzin nagrań wideo z prototypowych pojazdów, aby pomóc w trenowaniu tych systemów.
Zdobądź ogromne zbiory danych szkoleniowych
Wykazano, że proste techniki głębokiego uczenia się, takie jak CNN, mogą w niektórych przypadkach imitować wiedzę ekspertów z medycyny i innych dziedzin. Obecna fala uczenie maszynowewymaga jednak zestawów danych szkoleniowych, które są nie tylko oznakowane, ale także wystarczająco szerokie i uniwersalne.
Metody głębokiego uczenia się wymagały tysięcy obserwacji, aby modele stały się stosunkowo dobre w zadaniach klasyfikacyjnych, a w niektórych przypadkach milionów obserwacji, aby mogły działać na poziomie człowieka. Bez zaskoczenia głębokie uczenie się jest znane w gigantycznych firmach technologicznych; wykorzystują duże zbiory danych do gromadzenia petabajtów danych. Pozwala im stworzyć imponujący i bardzo dokładny model głębokiego uczenia się.
Wyjaśnij problem
Duże i złożone modele mogą być trudne do wyjaśnienia w kategoriach ludzkich. Na przykład, dlaczego uzyskano konkretną decyzję. To jeden z powodów, dla których akceptacja niektórych narzędzi AI jest powolna w obszarach zastosowań, w których interpretowalność jest przydatna lub wręcz wymagana.
Ponadto w miarę rozszerzania się zastosowania sztucznej inteligencji wymogi regulacyjne mogą również powodować potrzebę opracowania bardziej wyjaśnialnych modeli sztucznej inteligencji.
Podsumowanie
Przegląd głębokiego uczenia się: Głębokie uczenie się to najnowocześniejsza technologia w branży AI. Architektura głębokiego uczenia składa się z warstwy wejściowej, warstw ukrytych i warstwy wyjściowej. Słowo „głęboka” oznacza, że jest więcej niż dwie w pełni połączone warstwy.
Istnieje ogromna ilość sieci neuronowych, w których każda architektura jest zaprojektowana do wykonywania określonego zadania. Na przykład CNN działa bardzo dobrze z obrazami, RNN zapewnia imponujące wyniki w analizie szeregów czasowych i tekstu.
Uczenie głębokie jest obecnie aktywne w różnych dziedzinach, od finansów po marketing, łańcuch dostaw i marketing. Duże firmy jako pierwsze wykorzystują głębokie uczenie się, ponieważ dysponują już dużą pulą danych. Głębokie uczenie się wymaga posiadania obszernego zbioru danych szkoleniowych.