Tutorial de învățare profundă pentru începători: Bazele rețelei neuronale

Ce este Deep Learning?

Invatare profunda este un software de calculator care imită rețeaua de neuroni dintr-un creier. Este un subset de învățare automată bazată pe rețele neuronale artificiale cu învățarea reprezentării. Se numește învățare profundă, deoarece folosește rețele neuronale profunde. Această învățare poate fi supravegheată, semi-supravegheată sau nesupravegheată.

Algoritmii de învățare profundă sunt construiți cu straturi conectate.

  • Primul strat se numește Stratul de intrare
  • Ultimul strat se numește Stratul de ieșire
  • Toate straturile dintre acestea se numesc Straturi ascunse. Cuvântul adânc înseamnă că rețeaua unește neuronii în mai mult de două straturi.
Invatare profunda
Ce este Deep Learning?

Fiecare strat Ascuns este compus din neuroni. Neuronii sunt conectați între ei. Neuronul va procesa și apoi va propaga semnalul de intrare pe care îl primește stratul de deasupra lui. Puterea semnalului dat neuronului din stratul următor depinde de greutatea, părtinirea și funcția de activare.

Rețeaua consumă cantități mari de date de intrare și le operează prin mai multe straturi; rețeaua poate învăța caracteristici din ce în ce mai complexe ale datelor la fiecare strat.

Proces de învățare profundă

O rețea neuronală profundă oferă acuratețe de ultimă generație în multe sarcini, de la detectarea obiectelor până la recunoașterea vorbirii. Ei pot învăța automat, fără cunoștințe predefinite codificate explicit de programatori.

Proces de învățare profundă
Proces de învățare profundă

Pentru a înțelege ideea de învățare profundă, imaginați-vă o familie, cu un copil și părinți. Copilul arată obiecte cu degetul mic și spune întotdeauna cuvântul „pisica”. Deoarece părinții lui sunt îngrijorați de educația lui, ei continuă să-i spună „Da, asta este o pisică” sau „Nu, asta nu este o pisică”. Copilul persistă în a arăta obiecte, dar devine mai precis cu „pisici”. Puștiul, în adâncul sufletului, nu știe de ce poate spune că este pisică sau nu. Tocmai a învățat cum să ierarhizeze trăsăturile complexe care vin cu o pisică, uitându-se la animalul de companie în general și să continue să se concentreze asupra detaliilor precum cozile sau nasul înainte de a se decide.

O rețea neuronală funcționează la fel. Fiecare strat reprezintă un nivel mai profund de cunoaștere, adică ierarhia cunoștințelor. O rețea neuronală cu patru straturi va învăța o caracteristică mai complexă decât cu două straturi.

Învățarea are loc în două etape:

Primă fază: Prima fază constă în aplicarea unei transformări neliniare a intrării și crearea unui model statistic ca rezultat.
A doua fază: A doua fază are ca scop îmbunătățirea modelului cu o metodă matematică cunoscută sub numele de derivată.

Rețeaua neuronală repetă aceste două faze de sute până la mii de ori până când atinge un nivel tolerabil de precizie. Repetarea acestei două faze se numește iterație.

Pentru a da un exemplu de învățare profundă, aruncați o privire la mișcarea de mai jos, modelul încearcă să învețe să danseze. După 10 minute de antrenament, modelul nu știe să danseze și arată ca o mâzgălire.

Proces de învățare profundă

După 48 de ore de învățare, computerul stăpânește arta dansului.

Proces de învățare profundă

Clasificarea rețelelor neuronale

Rețea neuronală superficială: Rețeaua neuronală Shallow are un singur strat ascuns între intrare și ieșire.

Rețea neuronală profundă: Rețelele neuronale profunde au mai mult de un strat. De exemplu, modelul Google LeNet pentru recunoașterea imaginilor numără 22 de straturi.

În zilele noastre, învățarea profundă este folosită în multe moduri, cum ar fi o mașină fără șofer, un telefon mobil, un motor de căutare Google, detectarea fraudelor, TV și așa mai departe.

Tipuri de rețele de învățare profundă

Acum, în acest tutorial privind rețeaua neuronală profundă, vom afla despre tipurile de rețele de învățare profundă:

Tipuri de rețele de învățare profundă
Tipuri de rețele de învățare profundă

Rețele neuronale de tip feed-forward

Cel mai simplu tip de rețea neuronală artificială. Cu acest tip de arhitectură, informațiile circulă într-o singură direcție, înainte. Înseamnă că fluxurile de informații începe la nivelul de intrare, merg la straturile „ascunse” și se termină la nivelul de ieșire. Rețeaua

nu are bucla. Informațiile se opresc la straturile de ieșire.

Rețele neuronale recurente (RNN)

RNN este o rețea neuronală cu mai multe straturi care poate stoca informații în noduri de context, permițându-i să învețe secvențe de date și să scoată un număr sau o altă secvență. Cu cuvinte simple, este o rețele neuronale artificiale ale căror conexiuni între neuroni includ bucle. RNN-urile sunt potrivite pentru procesarea secvențelor de intrări.

Rețele neuronale recurente

Rețele neuronale recurente

De exemplu, dacă sarcina este de a prezice următorul cuvânt din propoziția „Vrei un…………?

  • Neuronii RNN vor primi un semnal care indică începutul propoziției.
  • Rețeaua primește cuvântul „Do” ca intrare și produce un vector al numărului. Acest vector este alimentat înapoi neuronului pentru a oferi o memorie rețelei. Această etapă ajută rețeaua să-și amintească că a primit „Do” și a primit-o pe prima poziție.
  • Rețeaua va trece în mod similar la următoarele cuvinte. Este nevoie de cuvântul „tu” și „vrei”. Starea neuronilor este actualizată la primirea fiecărui cuvânt.
  • Etapa finală are loc după primirea cuvântului „a”. Rețeaua neuronală va oferi o probabilitate pentru fiecare cuvânt englezesc care poate fi folosit pentru a completa propoziția. Un RNN bine instruit atribuie probabil o mare probabilitate „cafenea”, „băutură”, „burger” etc.

Utilizări comune ale RNN

  • Ajutați comercianții de valori mobiliare să genereze rapoarte analitice
  • Detectează anomalii în contract din situația financiară
  • Detectați tranzacțiile frauduloase cu cardul de credit
  • Furnizați o legendă pentru imagini
  • Chatbot-uri puternice
  • Utilizările standard ale RNN apar atunci când practicienii lucrează cu date sau secvențe din serii de timp (de exemplu, înregistrări audio sau text).

Rețele neuronale convoluționale (CNN)

CNN este o rețea neuronală multistratificată cu o arhitectură unică, concepută pentru a extraccaracteristici din ce în ce mai complexe ale datelor de la fiecare strat pentru a determina rezultatul. CNN-urile sunt foarte potrivite pentru sarcini perceptive.

Rețeaua neuronală convoluțională

Rețeaua neuronală convoluțională

CNN este utilizat mai ales atunci când există un set de date nestructurate (de exemplu, imagini) și practicienii trebuie să exprimetracinformații din acesta.

De exemplu, dacă sarcina este de a prezice o legendă a unei imagini:

  • CNN primește o imagine a unei pisici, să spunem, această imagine, în termeni informatici, este o colecție a pixelului. În general, un strat pentru imaginea în tonuri de gri și trei straturi pentru o imagine color.
  • În timpul învățării caracteristicilor (adică, straturi ascunse), rețeaua va identifica caracteristici unice, de exemplu, coada pisicii, urechea etc.
  • Când rețeaua a învățat temeinic cum să recunoască o imagine, poate oferi o probabilitate pentru fiecare imagine pe care o cunoaște. Eticheta cu cea mai mare probabilitate va deveni predicția rețelei.

Consolidarea învățării

Consolidarea învățării este un subdomeniu al învățării automate în care sistemele sunt antrenate prin primirea de „recompense” sau „pedepse” virtuale, în esență învățând prin încercare și eroare. DeepMind de la Google a folosit învățarea prin întărire pentru a învinge un campion uman în jocurile Go. Învățarea prin consolidare este, de asemenea, utilizată în jocurile video pentru a îmbunătăți experiența de joc prin furnizarea de roboți mai inteligenți.

Unul dintre cei mai faimoși algoritmi este:

  • Q-learning
  • Rețea Deep Q
  • Stat-Acțiune-Recompensă-Stat-Acțiune (SARSA)
  • Gradient de politică deterministă profundă (DDPG)

Exemple de aplicații de deep learning

Acum, în acest tutorial Deep learning pentru începători, să învățăm despre aplicațiile Deep Learning:

AI în finanțe

Sectorul tehnologiei financiare a început deja să folosească AI pentru a economisi timp, a reduce costurile și a adăuga valoare. Învățarea profundă schimbă industria de creditare prin utilizarea unor scoruri de credit mai robuste. Factorii de decizie privind creditele pot folosi AI pentru aplicații robuste de creditare pentru a realiza o evaluare mai rapidă și mai precisă a riscurilor, folosind inteligența mașină pentru a lua în considerare caracterul și capacitatea solicitanților.

Underwrite este o companie Fintech care oferă o soluție AI pentru companiile care fac credit. underwrite.ai folosește AI pentru a detecta care solicitant are mai multe șanse să ramburseze un împrumut. Abordarea lor depășește radical metodele tradiționale.

AI în HR

Under Armour, o companie de îmbrăcăminte sport revolutIonizează angajarea și modernizează experiența candidaților cu ajutorul inteligenței artificiale. De fapt, Under Armour reduce timpul de angajare pentru magazinele sale de retail cu 35%. Under Armour s-a confruntat cu un interes tot mai mare din partea companiilor încă din 2012. Aveau, în medie, 30000 de CV-uri pe lună. Citirea tuturor acelor aplicații și începerea procesului de selecție și interviu dura prea mult. Procesul lung de angajare și integrare a oamenilor a afectat capacitatea Under Armour de a-și avea magazinele de retail complet dotate, funcționale și gata de funcționare.

La acea vreme, Under Armour avea implementată toată tehnologia HR „indispensabilă”, cum ar fi soluții tranzacționale pentru sourcing, aplicare, tracrege și integrare, dar acele instrumente nu au fost suficient de utile. Under Armour alege HireVue, un furnizor de AI pentru soluții de resurse umane, atât pentru interviuri la cerere, cât și în direct. Rezultatele au fost bluff; au reușit să scadă cu 35% timpul de umplere. În schimb, au angajat personal de calitate superioară.

AI în marketing

AI este un instrument valoros pentru gestionarea serviciilor pentru clienți și provocările de personalizare. Recunoașterea vocală îmbunătățită în gestionarea centrului de apeluri și rutarea apelurilor, ca urmare a aplicării tehnicilor AI, permite clienților o experiență mai simplă.

De exemplu, analiza deep-learning a audio permite sistemelor să evalueze tonul emoțional al unui client. Dacă clientul răspunde prost la Chatbot AI, sistemul poate fi redirecționat conversația către operatori reali, umani, care preiau problema.

În afară de cele trei exemple de învățare profundă de mai sus, AI este utilizat pe scară largă în alte sectoare/industrii.

De ce este importantă învățarea profundă?

Învățarea profundă este un instrument puternic pentru a face din predicție un rezultat posibil. Învățarea profundă excelează în descoperirea modelelor (învățare nesupravegheată) și predicția bazată pe cunoștințe. De date de mare este combustibilul pentru învățarea profundă. Când ambele sunt combinate, o organizație poate obține rezultate fără precedent în ceea ce privește productivitatea, vânzările, managementul și inovația.

Învățarea profundă poate depăși metoda tradițională. De exemplu, algoritmii de învățare profundă sunt cu 41% mai precisi decât algoritmii de învățare automată în clasificarea imaginilor, cu 27% mai precisi în recunoașterea facială și 25% în recunoașterea vocii.

Limitele învățării profunde

Acum, în acest tutorial privind rețeaua neuronală, vom afla despre limitările învățării profunde:

Etichetarea datelor

Majoritatea modelelor actuale de inteligență artificială sunt antrenate prin „învățare supravegheată”. Aceasta înseamnă că oamenii trebuie să eticheteze și să categorizeze datele subiacente, ceea ce poate fi o sarcină considerabilă și predispusă la erori. De exemplu, companiile dezvoltăping Tehnologiile pentru mașini autonome angajează sute de oameni pentru a adnota manual ore întregi de fluxuri video de la prototipuri de vehicule, pentru a ajuta la antrenarea acestor sisteme.

Obțineți seturi uriașe de date de antrenament

S-a demonstrat că tehnicile simple de învățare profundă precum CNN pot, în unele cazuri, imita cunoștințele experților în medicină și alte domenii. Valul actual de masina de învățare, totuși, necesită seturi de date de instruire care nu sunt doar etichetate, ci și suficient de ample și universale.

Metodele de învățare profundă au necesitat mii de observații pentru ca modelele să devină relativ bune la sarcinile de clasificare și, în unele cazuri, milioane pentru ca acestea să le realizeze la nivelul oamenilor. Fără surpriză, învățarea profundă este renumită în companiile gigantice de tehnologie; folosesc date mari pentru a acumula petaocteți de date. Le permite să creeze un model de învățare profundă impresionant și extrem de precis.

Explicați o problemă

Modelele mari și complexe pot fi greu de explicat, în termeni umani. De exemplu, de ce a fost obținută o anumită decizie. Este unul dintre motivele pentru care acceptarea unor instrumente AI este lentă în domeniile de aplicare în care interpretabilitatea este utilă sau într-adevăr necesară.

În plus, pe măsură ce aplicarea AI se extinde, cerințele de reglementare ar putea, de asemenea, să determine necesitatea unor modele AI mai explicabile.

Rezumat

Prezentare generală a învățării profunde: Învățarea profundă este noua ultimă generație pentru inteligență artificială. Arhitectura de învățare profundă este compusă dintr-un strat de intrare, straturi ascunse și un strat de ieșire. Cuvântul adânc înseamnă că există mai mult de două straturi complet conectate.

Există o cantitate mare de rețele neuronale, în care fiecare arhitectură este proiectată pentru a îndeplini o anumită sarcină. De exemplu, CNN funcționează foarte bine cu imagini, RNN oferă rezultate impresionante cu serii de timp și analize de text.

Învățarea profundă este acum activă în diferite domenii, de la finanțe la marketing, lanț de aprovizionare și marketing. Marile firme sunt primele care folosesc învățarea profundă, deoarece dețin deja un număr mare de date. Învățarea profundă necesită un set extins de date de antrenament.

Rezumați această postare cu: