Vodič dubokog učenja za početnike: Osnove neuronske mreže
Što je duboko učenje?
Duboko učenje je računalni softver koji oponaša mrežu neurona u mozgu. To je podskup strojnog učenja koji se temelji na umjetnim neuronskim mrežama s učenjem reprezentacije. Naziva se dubokim učenjem jer koristi duboke neuronske mreže. Ovo učenje može biti nadzirano, polusupervizirano ili nenadzirano.
Algoritmi dubokog učenja konstruirani su s povezanim slojevima.
- Prvi sloj naziva se ulazni sloj
- Posljednji sloj naziva se izlazni sloj
- Svi slojevi između nazivaju se skriveni slojevi. Riječ duboko znači da mreža spaja neurone u više od dva sloja.
Svaki skriveni sloj sastoji se od neurona. Neuroni su međusobno povezani. Neuron će obraditi i zatim širiti ulazni signal koji prima u sloj iznad sebe. Snaga signala koju daje neuron u sljedećem sloju ovisi o težini, pristranosti i funkciji aktivacije.
Mreža troši velike količine ulaznih podataka i njima upravlja kroz više slojeva; mreža može naučiti sve složenije značajke podataka na svakom sloju.
Proces dubokog učenja
Duboka neuronska mreža pruža najsuvremeniju točnost u mnogim zadacima, od otkrivanja objekata do prepoznavanja govora. Oni mogu učiti automatski, bez unaprijed definiranog znanja koje su programeri eksplicitno kodirali.
Da biste shvatili ideju dubokog učenja, zamislite obitelj s djetetom i roditeljima. Mališan pokazuje predmete malim prstom i uvijek izgovara riječ "mačka". Kako su njegovi roditelji zabrinuti za njegovo obrazovanje, stalno mu govore 'Da, to je mačka' ili 'Ne, to nije mačka'. Dijete ustraje u pokazivanju predmeta, ali postaje preciznije s 'mačkama'. Malo dijete, duboko u sebi, ne zna zašto može reći da je mačka ili ne. Upravo je naučio kako hijerarhirati složene značajke dolazeći s mačkom gledajući ljubimca u cjelini i nastavivši se fokusirati na detalje kao što su repovi ili nos prije nego što donese odluku.
Neuronska mreža funkcionira sasvim isto. Svaki sloj predstavlja dublju razinu znanja, odnosno hijerarhiju znanja. Neuronska mreža s četiri sloja naučit će složeniju značajku nego s dva sloja.
Učenje se odvija u dvije faze:
Prva faza: Prva faza sastoji se od primjene nelinearne transformacije ulaza i stvaranja statističkog modela kao izlaza.
Druga faza: Druga faza ima za cilj poboljšanje modela matematičkom metodom poznatom kao derivacija.
Neuronska mreža ponavlja ove dvije faze stotine do tisuće puta dok ne postigne podnošljivu razinu točnosti. Ponavljanje ove dvije faze naziva se iteracija.
Za primjer dubokog učenja, pogledajte pokret u nastavku, model pokušava naučiti plesati. Nakon 10 minuta treninga manekenka ne zna plesati, a izgleda kao škrabotina.
Nakon 48 sati učenja, računalo svladava umjetnost plesa.
Klasifikacija neuronskih mreža
Plitka neuronska mreža: Plitka neuronska mreža ima samo jedan skriveni sloj između ulaza i izlaza.
Duboka neuronska mreža: Duboke neuronske mreže imaju više od jednog sloja. Na primjer, Google LeNet model za prepoznavanje slika broji 22 sloja.
Danas se duboko učenje koristi na mnoge načine poput automobila bez vozača, mobilnog telefona, Google tražilice, otkrivanja prijevara, TV-a itd.
Vrste mreža za duboko učenje
Sada ćemo u ovom vodiču za duboke neuronske mreže učiti o vrstama mreža dubokog učenja:
Feed-forward neuronske mreže
Najjednostavniji tip umjetne neuronske mreže. Kod ove vrste arhitekture informacije teku samo u jednom smjeru, prema naprijed. To znači da tokovi informacija počinju na ulaznom sloju, idu do “skrivenih” slojeva i završavaju na izlaznom sloju. Mreža
nema petlju. Informacije se zaustavljaju na izlaznim slojevima.
Ponavljajuće neuronske mreže (RNN)
RNN je višeslojna neuronska mreža koja može pohraniti informacije u čvorove konteksta, omogućujući joj učenje nizova podataka i izlaz broja ili drugog niza. Jednostavnim riječima, to je umjetna neuronska mreža čije veze između neurona uključuju petlje. RNN-ovi su prikladni za obradu nizova ulaza.
Na primjer, ako je zadatak predvidjeti sljedeću riječ u rečenici „Želite li…………?
- RNN neuroni će primiti signal koji pokazuje na početak rečenice.
- Mreža prima riječ "Do" kao ulaz i proizvodi vektor broja. Ovaj se vektor vraća neuronu kako bi osigurao memoriju mreži. Ova faza pomaže mreži da zapamti da je primila "Do" i da ga je primila na prvom mjestu.
- Mreža će na sličan način nastaviti do sljedećih riječi. Potrebne su riječi "ti" i "želim". Stanje neurona ažurira se nakon primanja svake riječi.
- Posljednja faza nastupa nakon primanja riječi "a." Neuronska mreža će dati vjerojatnost za svaku englesku riječ koja se može koristiti za dovršetak rečenice. Dobro uvježban RNN vjerojatno veliku vjerojatnost pripisuje "kafiću", "piću", "hamburgeru" itd.
Uobičajene upotrebe RNN-a
- Pomozite trgovcima vrijednosnim papirima da generiraju analitička izvješća
- Otkrijte abnormalnosti u ugovoru o financijskom izvješću
- Otkrijte lažnu transakciju kreditnom karticom
- Navedite naslov za slike
- Moćni chatbotovi
- Standardna uporaba RNN-a događa se kada praktičari rade s vremenskim serijama podataka ili sekvencama (npr. audio zapisi ili tekst).
Konvolucijske neuronske mreže (CNN)
CNN je višeslojna neuronska mreža s jedinstvenom arhitekturom dizajniranom za izdvajanje sve složenijih značajki podataka na svakom sloju kako bi se odredio izlaz. CNN-ovi su prikladni za perceptivne zadatke.
CNN se uglavnom koristi kada postoji nestrukturirani skup podataka (npr. slike) i praktičari trebaju izvući informacije iz njega.
Na primjer, ako je zadatak predvidjeti naslov slike:
- CNN prima sliku, recimo, mačke, ova slika, računalno rečeno, skup je piksela. Općenito, jedan sloj za sliku u sivim tonovima i tri sloja za sliku u boji.
- Tijekom učenja značajki (tj. skrivenih slojeva), mreža će identificirati jedinstvene značajke, na primjer, mačji rep, uho itd.
- Kada mreža temeljito nauči kako prepoznati sliku, može pružiti vjerojatnost za svaku sliku koju poznaje. Oznaka s najvećom vjerojatnošću postat će predviđanje mreže.
Učenje ojačanja
Ojačavanje učenja je potpolje strojnog učenja u kojem se sustavi obučavaju primanjem virtualnih "nagrada" ili "kazni", u suštini učenje metodom pokušaja i pogreške. Googleov DeepMind upotrijebio je učenje s pojačanjem kako bi pobijedio ljudskog prvaka u igricama Go. Učenje s pojačanjem također se koristi u video igrama za poboljšanje iskustva igranja pružanjem pametnijih robota.
Jedan od najpoznatijih algoritama su:
- Q-učenje
- Duboka Q mreža
- Država-Akcija-Nagrada-Država-Akcija (SARSA)
- Gradijent duboke determinističke politike (DDPG)
Primjeri aplikacija dubokog učenja
Sada u ovom vodiču za duboko učenje za početnike, naučimo o aplikacijama dubokog učenja:
AI u financijama
Sektor financijske tehnologije već je počeo koristiti AI kako bi uštedio vrijeme, smanjio troškove i dodao vrijednost. Duboko učenje mijenja kreditnu industriju upotrebom snažnijeg kreditnog bodovanja. Donositelji kreditnih odluka mogu upotrijebiti umjetnu inteligenciju za robusne aplikacije za kreditiranje kako bi postigli bržu i točniju procjenu rizika, koristeći strojnu inteligenciju kako bi uzeli u obzir karakter i kapacitet podnositelja zahtjeva.
Underwrite je Fintech tvrtka koja pruža AI rješenje za tvrtke koje izdaju kredite. underwrite.ai koristi umjetnu inteligenciju za otkrivanje koji će podnositelj zahtjeva vjerojatnije vratiti zajam. Njihov pristup radikalno nadmašuje tradicionalne metode.
AI u HR
Under Armour, tvrtka za proizvodnju sportske odjeće, revolucionizira zapošljavanje i modernizira iskustvo kandidata uz pomoć umjetne inteligencije. U stvari, Under Armour smanjuje vrijeme zapošljavanja za svoje maloprodajne trgovine za 35%. Under Armour se suočio s rastućim interesom popularnosti još 2012. Imali su u prosjeku 30000 XNUMX životopisa mjesečno. Predugo je trajalo čitanje svih tih prijava i početak procesa provjere i intervjua. Dugotrajan proces zapošljavanja i uključivanja ljudi utjecao je na sposobnost Under Armoura da svoje maloprodajne trgovine u potpunosti popune osobljem, ojačaju i spreme za rad.
U to je vrijeme Under Armour imao svu potrebnu HR tehnologiju kao što su transakcijska rješenja za pronalaženje, prijavu, praćenje i uključivanje, ali ti alati nisu bili dovoljno korisni. Ispod oklopa birajte HireVue, pružatelj AI za HR rješenja, za intervjue na zahtjev i uživo. Rezultati su bili blefirajući; uspjeli su smanjiti za 35% vrijeme potrebno za popunjavanje. Zauzvrat angažirani kvalitetniji kadrovi.
AI u marketingu
AI je vrijedan alat za upravljanje korisničkim uslugama i izazove personalizacije. Poboljšano prepoznavanje govora u upravljanju pozivnim centrom i usmjeravanje poziva kao rezultat primjene AI tehnika omogućuje besprijekornije iskustvo za korisnike.
Na primjer, dubinska analiza zvuka omogućuje sustavima da procijene emocionalni ton korisnika. Ako kupac loše reagira na AI chatbot, sustav može preusmjeriti razgovor na stvarne, ljudske operatere koji preuzimaju problem.
Osim tri gore navedena primjera dubokog učenja, AI se široko koristi u drugim sektorima/industrijama.
Zašto je duboko učenje važno?
Duboko učenje moćan je alat za pretvaranje predviđanja u djelotvoran rezultat. Duboko učenje ističe se u otkrivanju obrazaca (učenje bez nadzora) i predviđanju temeljenom na znanju. Big podataka je gorivo za duboko učenje. Kada se oboje kombinira, organizacija može ostvariti rezultate bez presedana u smislu produktivnosti, prodaje, upravljanja i inovacija.
Duboko učenje može nadmašiti tradicionalnu metodu. Na primjer, algoritmi dubokog učenja 41% su točniji od algoritama strojnog učenja u klasifikaciji slike, 27% točniji u prepoznavanju lica i 25% u prepoznavanju glasa.
Ograničenja dubokog učenja
U ovom vodiču o neuronskim mrežama naučit ćemo o ograničenjima dubokog učenja:
Označavanje podataka
Većina aktualnih AI modela obučava se kroz "nadzirano učenje". To znači da ljudi moraju označiti i kategorizirati temeljne podatke, što može biti velik posao sklon greškama. Na primjer, tvrtke koje razvijaju tehnologije samovozećih automobila zapošljavaju stotine ljudi da ručno bilježe sate video feedova iz prototipova vozila kako bi pomogli u obuci ovih sustava.
Nabavite ogromne skupove podataka za obuku
Pokazalo se da jednostavne tehnike dubinskog učenja poput CNN-a mogu u nekim slučajevima oponašati znanje stručnjaka iz medicine i drugih područja. Sadašnji val stroj za učenje, međutim, zahtijeva skupove podataka za obuku koji nisu samo označeni, već i dovoljno široki i univerzalni.
Metode dubinskog učenja zahtijevale su tisuće promatranja da bi modeli postali relativno dobri u zadacima klasifikacije i, u nekim slučajevima, milijune za izvođenje na razini ljudi. Bez iznenađenja, duboko učenje je poznato u ogromnim tehnološkim tvrtkama; koriste velike podatke kako bi akumulirali petabajte podataka. Omogućuje im stvaranje impresivnog i vrlo preciznog modela dubokog učenja.
Objasnite problem
Velike i složene modele može biti teško objasniti ljudskim pojmovima. Na primjer, zašto je određena odluka dobivena. To je jedan od razloga zašto su neki alati umjetne inteligencije spori u područjima primjene gdje je interpretabilnost korisna ili doista potrebna.
Nadalje, kako se primjena umjetne inteligencije širi, regulatorni zahtjevi također bi mogli potaknuti potrebu za objašnjivijim modelima umjetne inteligencije.
rezime
Pregled dubokog učenja: Duboko učenje je novo stanje umjetnosti za umjetna inteligencija. Arhitektura dubokog učenja sastoji se od ulaznog sloja, skrivenih slojeva i izlaznog sloja. Riječ duboko znači da postoji više od dva potpuno povezana sloja.
Postoji ogromna količina neuronskih mreža, gdje je svaka arhitektura dizajnirana za obavljanje određenog zadatka. Na primjer, CNN vrlo dobro radi sa slikama, RNN daje impresivne rezultate s vremenskim serijama i analizom teksta.
Duboko učenje sada je aktivno u različitim područjima, od financija do marketinga, opskrbnog lanca i marketinga. Velike tvrtke su prve koje koriste dubinsko učenje jer već imaju veliki skup podataka. Duboko učenje zahtijeva opsežan skup podataka za obuku.