Tutorial de învățare profundă pentru începători: Bazele rețelei neuronale

Ce este Deep Learning?

Invatare profunda este un software de calculator care imită rețeaua de neuroni dintr-un creier. Este un subset de învățare automată bazată pe rețele neuronale artificiale cu învățarea reprezentării. Se numește învățare profundă, deoarece folosește rețele neuronale profunde. Această învățare poate fi supravegheată, semi-supravegheată sau nesupravegheată.

Algoritmii de învățare profundă sunt construiți cu straturi conectate.

Primul strat se numește Stratul de intrare
Ultimul strat se numește Stratul de ieșire
Toate straturile dintre acestea se numesc Straturi ascunse. Cuvântul adânc înseamnă că rețeaua unește neuronii în mai mult de două straturi.

Invatare profunda — Ce este Deep Learning?

Fiecare strat Ascuns este compus din neuroni. Neuronii sunt conectați între ei. Neuronul va procesa și apoi va propaga semnalul de intrare pe care îl primește stratul de deasupra lui. Puterea semnalului dat neuronului din stratul următor depinde de greutatea, părtinirea și funcția de activare.

Rețeaua consumă cantități mari de date de intrare și le operează prin mai multe straturi; rețeaua poate învăța caracteristici din ce în ce mai complexe ale datelor la fiecare strat.

Proces de învățare profundă

O rețea neuronală profundă oferă acuratețe de ultimă generație în multe sarcini, de la detectarea obiectelor până la recunoașterea vorbirii. Ei pot învăța automat, fără cunoștințe predefinite codificate explicit de programatori.

Pentru a înțelege ideea de învățare profundă, imaginați-vă o familie, cu un copil și părinți. Copilul arată obiecte cu degetul mic și spune întotdeauna cuvântul „pisica”. Deoarece părinții lui sunt îngrijorați de educația lui, ei continuă să-i spună „Da, asta este o pisică” sau „Nu, asta nu este o pisică”. Copilul persistă în a arăta obiecte, dar devine mai precis cu „pisici”. Puștiul, în adâncul sufletului, nu știe de ce poate spune că este pisică sau nu. Tocmai a învățat cum să ierarhizeze trăsăturile complexe care vin cu o pisică, uitându-se la animalul de companie în general și să continue să se concentreze asupra detaliilor precum cozile sau nasul înainte de a se decide.

O rețea neuronală funcționează la fel. Fiecare strat reprezintă un nivel mai profund de cunoaștere, adică ierarhia cunoștințelor. O rețea neuronală cu patru straturi va învăța o caracteristică mai complexă decât cu două straturi.

Învățarea are loc în două etape:

Primă fază: Prima fază constă în aplicarea unei transformări neliniare a intrării și crearea unui model statistic ca rezultat.
A doua fază: A doua fază are ca scop îmbunătățirea modelului cu o metodă matematică cunoscută sub numele de derivată.

Rețeaua neuronală repetă aceste două faze de sute până la mii de ori până când atinge un nivel tolerabil de precizie. Repetarea acestei două faze se numește iterație.

Pentru a da un exemplu de învățare profundă, aruncați o privire la mișcarea de mai jos, modelul încearcă să învețe să danseze. După 10 minute de antrenament, modelul nu știe să danseze și arată ca o mâzgălire.

După 48 de ore de învățare, computerul stăpânește arta dansului.

Clasificarea rețelelor neuronale

Rețea neuronală superficială: Rețeaua neuronală Shallow are un singur strat ascuns între intrare și ieșire.

Rețea neuronală profundă: Rețelele neuronale profunde au mai mult de un strat. De exemplu, modelul Google LeNet pentru recunoașterea imaginilor numără 22 de straturi.

În zilele noastre, învățarea profundă este folosită în multe moduri, cum ar fi o mașină fără șofer, un telefon mobil, un motor de căutare Google, detectarea fraudelor, TV și așa mai departe.

Tipuri de rețele de învățare profundă

Acum, în acest tutorial privind rețeaua neuronală profundă, vom afla despre tipurile de rețele de învățare profundă:

Rețele neuronale de tip feed-forward

Cel mai simplu tip de rețea neuronală artificială. Cu acest tip de arhitectură, informațiile circulă într-o singură direcție, înainte. Înseamnă că fluxurile de informații începe la nivelul de intrare, merg la straturile „ascunse” și se termină la nivelul de ieșire. Rețeaua

nu are bucla. Informațiile se opresc la straturile de ieșire.

Rețele neuronale recurente (RNN)

RNN este o rețea neuronală cu mai multe straturi care poate stoca informații în noduri de context, permițându-i să învețe secvențe de date și să scoată un număr sau o altă secvență. Cu cuvinte simple, este o rețele neuronale artificiale ale căror conexiuni între neuroni includ bucle. RNN-urile sunt potrivite pentru procesarea secvențelor de intrări.

De exemplu, dacă sarcina este de a prezice următorul cuvânt din propoziția „Vrei un…………?

Neuronii RNN vor primi un semnal care indică începutul propoziției.
Rețeaua primește cuvântul „Do” ca intrare și produce un vector al numărului. Acest vector este alimentat înapoi neuronului pentru a oferi o memorie rețelei. Această etapă ajută rețeaua să-și amintească că a primit „Do” și a primit-o pe prima poziție.
Rețeaua va trece în mod similar la următoarele cuvinte. Este nevoie de cuvântul „tu” și „vrei”. Starea neuronilor este actualizată la primirea fiecărui cuvânt.
Etapa finală are loc după primirea cuvântului „a”. Rețeaua neuronală va oferi o probabilitate pentru fiecare cuvânt englezesc care poate fi folosit pentru a completa propoziția. Un RNN bine instruit atribuie probabil o mare probabilitate „cafenea”, „băutură”, „burger” etc.

Utilizări comune ale RNN

Ajutați comercianții de valori mobiliare să genereze rapoarte analitice
Detectează anomalii în contractul de situație financiară
Detectați tranzacțiile frauduloase cu cardul de credit
Furnizați o legendă pentru imagini
Chatbot-uri puternice
Utilizările standard ale RNN apar atunci când practicienii lucrează cu date sau secvențe din serii de timp (de exemplu, înregistrări audio sau text).

Rețele neuronale convoluționale (CNN)

CNN este o rețea neuronală cu mai multe straturi, cu o arhitectură unică concepută pentru a extrage caracteristici din ce în ce mai complexe ale datelor la fiecare strat pentru a determina rezultatul. CNN-urile sunt potrivite pentru sarcini perceptuale.

CNN este folosit mai ales atunci când există un set de date nestructurat (de exemplu, imagini) și practicienii trebuie să extragă informații din acesta.

De exemplu, dacă sarcina este de a prezice o legendă a unei imagini:

CNN primește o imagine a unei pisici, să spunem, această imagine, în termeni informatici, este o colecție a pixelului. În general, un strat pentru imaginea în tonuri de gri și trei straturi pentru o imagine color.
În timpul învățării caracteristicilor (adică, straturi ascunse), rețeaua va identifica caracteristici unice, de exemplu, coada pisicii, urechea etc.
Când rețeaua a învățat temeinic cum să recunoască o imagine, poate oferi o probabilitate pentru fiecare imagine pe care o cunoaște. Eticheta cu cea mai mare probabilitate va deveni predicția rețelei.

Consolidarea învățării

Consolidarea învățării este un subdomeniu al învățării automate în care sistemele sunt antrenate prin primirea de „recompense” sau „pedepse” virtuale, în esență învățând prin încercare și eroare. DeepMind de la Google a folosit învățarea prin întărire pentru a învinge un campion uman în jocurile Go. Învățarea prin consolidare este, de asemenea, utilizată în jocurile video pentru a îmbunătăți experiența de joc prin furnizarea de roboți mai inteligenți.

Unul dintre cei mai faimoși algoritmi este:

Q-learning
Rețea Deep Q
Stat-Acțiune-Recompensă-Stat-Acțiune (SARSA)
Gradient de politică deterministă profundă (DDPG)

Exemple de aplicații de deep learning

Acum, în acest tutorial Deep learning pentru începători, să învățăm despre aplicațiile Deep Learning:

AI în finanțe

Sectorul tehnologiei financiare a început deja să folosească AI pentru a economisi timp, a reduce costurile și a adăuga valoare. Învățarea profundă schimbă industria de creditare prin utilizarea unor scoruri de credit mai robuste. Factorii de decizie privind creditele pot folosi AI pentru aplicații robuste de creditare pentru a realiza o evaluare mai rapidă și mai precisă a riscurilor, folosind inteligența mașină pentru a lua în considerare caracterul și capacitatea solicitanților.

Underwrite este o companie Fintech care oferă o soluție AI pentru companiile care fac credit. underwrite.ai folosește AI pentru a detecta care solicitant are mai multe șanse să ramburseze un împrumut. Abordarea lor depășește radical metodele tradiționale.

AI în HR

Under Armour, o companie de îmbrăcăminte sport revoluționează angajarea și modernizează experiența candidaților cu ajutorul AI. De fapt, Under Armour reduce timpul de angajare pentru magazinele sale cu amănuntul cu 35%. Under Armour s-a confruntat cu un interes de popularitate tot mai mare în 2012. Aveau, în medie, 30000 de CV-uri pe lună. Citirea tuturor acestor aplicații și începerea procesului de screening și interviu dura prea mult. Procesul îndelungat de angajare și îmbarcare a oamenilor a afectat capacitatea Under Armour de a avea magazinele cu amănuntul complet personalizate, gata de funcționare.

La acel moment, Under Armour avea în vigoare toată tehnologia HR „must have”, cum ar fi soluții tranzacționale pentru aprovizionare, aplicare, urmărire și integrare, dar acele instrumente nu erau suficient de utile. Under armura alege HireVue, un furnizor de AI pentru soluții de resurse umane, atât pentru interviuri la cerere, cât și în direct. Rezultatele au fost bluff; au reușit să scadă cu 35% timpul de umplere. În schimb, au angajat personal de calitate superioară.

AI în marketing

AI este un instrument valoros pentru gestionarea serviciilor pentru clienți și provocările de personalizare. Recunoașterea vocală îmbunătățită în gestionarea centrului de apeluri și rutarea apelurilor, ca urmare a aplicării tehnicilor AI, permite clienților o experiență mai simplă.

De exemplu, analiza deep-learning a audio permite sistemelor să evalueze tonul emoțional al unui client. Dacă clientul răspunde prost la Chatbot AI, sistemul poate fi redirecționat conversația către operatori reali, umani, care preiau problema.

În afară de cele trei exemple de învățare profundă de mai sus, AI este utilizat pe scară largă în alte sectoare/industrii.

De ce este importantă învățarea profundă?

Învățarea profundă este un instrument puternic pentru a face din predicție un rezultat posibil. Învățarea profundă excelează în descoperirea modelelor (învățare nesupravegheată) și predicția bazată pe cunoștințe. De date de mare este combustibilul pentru învățarea profundă. Când ambele sunt combinate, o organizație poate obține rezultate fără precedent în ceea ce privește productivitatea, vânzările, managementul și inovația.

Învățarea profundă poate depăși metoda tradițională. De exemplu, algoritmii de învățare profundă sunt cu 41% mai precisi decât algoritmii de învățare automată în clasificarea imaginilor, cu 27% mai precisi în recunoașterea facială și 25% în recunoașterea vocii.

Limitele învățării profunde

Acum, în acest tutorial privind rețeaua neuronală, vom afla despre limitările învățării profunde:

Etichetarea datelor

Majoritatea modelelor actuale de IA sunt antrenate prin „învățare supravegheată”. Înseamnă că oamenii trebuie să eticheteze și să clasifice datele subiacente, ceea ce poate fi o corvoadă considerabilă și predispusă la erori. De exemplu, companiile care dezvoltă tehnologii pentru mașini autonome angajează sute de oameni pentru a adnota manual ore de fluxuri video de la vehicule prototip pentru a ajuta la instruirea acestor sisteme.

Obțineți seturi uriașe de date de antrenament

S-a demonstrat că tehnicile simple de învățare profundă precum CNN pot, în unele cazuri, imita cunoștințele experților în medicină și alte domenii. Valul actual de masina de învățare, totuși, necesită seturi de date de instruire care nu sunt doar etichetate, ci și suficient de ample și universale.

Metodele de învățare profundă au necesitat mii de observații pentru ca modelele să devină relativ bune la sarcinile de clasificare și, în unele cazuri, milioane pentru ca acestea să le realizeze la nivelul oamenilor. Fără surpriză, învățarea profundă este renumită în companiile gigantice de tehnologie; folosesc date mari pentru a acumula petaocteți de date. Le permite să creeze un model de învățare profundă impresionant și extrem de precis.

Explicați o problemă

Modelele mari și complexe pot fi greu de explicat, în termeni umani. De exemplu, de ce a fost obținută o anumită decizie. Este unul dintre motivele pentru care acceptarea unor instrumente AI este lentă în domeniile de aplicare în care interpretabilitatea este utilă sau într-adevăr necesară.

În plus, pe măsură ce aplicarea AI se extinde, cerințele de reglementare ar putea, de asemenea, să determine necesitatea unor modele AI mai explicabile.

Rezumat

Prezentare generală a învățării profunde: Învățarea profundă este noua ultimă generație pentru inteligență artificială. Arhitectura de învățare profundă este compusă dintr-un strat de intrare, straturi ascunse și un strat de ieșire. Cuvântul adânc înseamnă că există mai mult de două straturi complet conectate.

Există o cantitate mare de rețele neuronale, în care fiecare arhitectură este proiectată pentru a îndeplini o anumită sarcină. De exemplu, CNN funcționează foarte bine cu imagini, RNN oferă rezultate impresionante cu serii de timp și analize de text.

Învățarea profundă este acum activă în diferite domenii, de la finanțe la marketing, lanț de aprovizionare și marketing. Marile firme sunt primele care folosesc învățarea profundă, deoarece dețin deja un număr mare de date. Învățarea profundă necesită un set extins de date de antrenament.