Süvaõppe õpetus algajatele: närvivõrgu põhitõed

Mis on süvaõpe?

Sügav õppimine on arvutitarkvara, mis jäljendab aju neuronite võrku. See on masinõppe alamhulk, mis põhineb esitusõppega tehisnärvivõrkudel. Seda nimetatakse sügavaks õppimiseks, kuna see kasutab sügavaid närvivõrke. See õpe võib olla juhendatud, pooleldi juhendatud või ilma juhendamiseta.

Süvaõppe algoritmid on konstrueeritud ühendatud kihtidega.

  • Esimest kihti nimetatakse sisendkihiks
  • Viimast kihti nimetatakse väljundkihiks
  • Kõiki vahepealseid kihte nimetatakse peidetud kihtideks. Sõna sügav tähendab, et võrk ühendab neuroneid rohkem kui kahes kihis.
Sügav õppimine
Mis on süvaõpe?

Iga peidetud kiht koosneb neuronitest. Neuronid on omavahel ühendatud. Neuron töötleb ja seejärel levitab sisendsignaali, mille ta saab selle kohal oleva kihi. Neuronile antud signaali tugevus järgmises kihis oleneb kaalust, kallutatusest ja aktiveerimisfunktsioonist.

Võrk tarbib suurel hulgal sisendandmeid ja opereerib neid mitme kihi kaudu; võrk saab õppida iga kihi andmete üha keerukamaid funktsioone.

Süvaõppe protsess

Sügav närvivõrk tagab tipptasemel täpsuse paljudes ülesannetes, alates objekti tuvastamisest kuni kõnetuvastuseni. Nad saavad õppida automaatselt, ilma programmeerijate poolt selgesõnaliselt kodeeritud eelnevalt määratletud teadmisteta.

Süvaõppe protsess
Süvaõppe protsess

Sügava õppimise idee mõistmiseks kujutage ette perekonda, kus on imik ja vanemad. Väikelaps näitab väikese sõrmega esemeid ja ütleb alati sõna "kass". Kuna tema vanemad on mures tema hariduse pärast, ütlevad nad talle pidevalt: "Jah, see on kass" või "Ei, see pole kass." Laps jätkab esemetele osutamist, kuid muutub täpsemaks "kasside" puhul. Sisimas olev väike laps ei tea, miks ta võib öelda, et see on kass või mitte. Ta on just õppinud, kuidas hierarhia kassiga kaasnevaid keerulisi omadusi, vaadates lemmiklooma üldjoont, ja keskendub enne otsuse langetamiseks sellistele detailidele nagu sabad või nina.

Närvivõrk töötab üsna samamoodi. Iga kiht esindab sügavamat teadmiste taset, st teadmiste hierarhiat. Nelja kihiga närvivõrk õpib keerukama funktsiooni kui kahekihiline.

Õppimine toimub kahes etapis:

Esimene etapp: Esimene faas seisneb sisendi mittelineaarse teisenduse rakendamises ja statistilise mudeli loomises väljundina.
Teine faas: Teise etapi eesmärk on mudeli täiustamine tuletisena tuntud matemaatilise meetodiga.

Närvivõrk kordab neid kahte faasi sadu kuni tuhandeid kordi, kuni on saavutanud talutava täpsustaseme. Selle kahefaasi kordamist nimetatakse iteratsiooniks.

Sügava õppimise näite toomiseks vaadake allolevat liikumist, modell püüab õppida tantsima. Pärast 10-minutilist treeningut ei oska modell tantsida ja see näeb välja nagu kritseldus.

Süvaõppe protsess

Pärast 48 tundi õppimist omandab arvuti tantsukunsti.

Süvaõppe protsess

Närvivõrkude klassifikatsioon

Madal närvivõrk: Shallow närvivõrgul on sisendi ja väljundi vahel ainult üks peidetud kiht.

Sügav närvivõrk: sügavatel närvivõrkudel on rohkem kui üks kiht. Näiteks Google LeNeti piltide tuvastamise mudel loeb 22 kihti.

Tänapäeval kasutatakse süvaõpet mitmel viisil, nagu juhita auto, mobiiltelefon, Google'i otsingumootor, pettuste tuvastamine, teler jne.

Süvaõppevõrgustike tüübid

Nüüd selles Deep Neural Networki õpetuses õpime tundma süvaõppevõrkude tüüpe:

Süvaõppevõrgustike tüübid
Süvaõppevõrgustike tüübid

Edasisuunalised närvivõrgud

Lihtsaim kunstliku närvivõrgu tüüp. Seda tüüpi arhitektuuri puhul liigub teave ainult ühes suunas, edasi. See tähendab, et teabevood algavad sisendkihist, lähevad "peidetud" kihtidesse ja lõpevad väljundkihiga. Võrk

silmust pole. Teave peatub väljundkihtidel.

Korduvad närvivõrgud (RNN)

RNN on mitmekihiline närvivõrk, mis suudab salvestada teavet kontekstisõlmedesse, võimaldades tal õppida andmejadasid ja väljastada arv või mõni muu jada. Lihtsamalt öeldes on see kunstlik närvivõrk, mille neuronite vahelised ühendused hõlmavad silmuseid. RNN-id sobivad hästi sisendite jadade töötlemiseks.

Korduvad närvivõrgud

Korduvad närvivõrgud

Näiteks kui ülesanne on ennustada järgmist sõna lauses "Kas soovite…………?

  • RNN-i neuronid saavad signaali, mis osutab lause algusesse.
  • Võrk saab sisendiks sõna "Do" ja loob arvu vektori. See vektor suunatakse tagasi neuronile, et anda võrku mälu. See etapp aitab võrgul meeles pidada, et ta sai "Tee" ja sai selle esimesel kohal.
  • Võrk jätkab samamoodi järgmiste sõnadega. See võtab sõna "sina" ja "tahan". Neuronite olekut värskendatakse iga sõna saamisel.
  • Viimane etapp toimub pärast sõna "a" saamist. Närvivõrk annab tõenäosuse iga ingliskeelse sõna jaoks, mida saab kasutada lause lõpetamiseks. Hästi koolitatud RNN määrab tõenäoliselt suure tõenäosuse “kohvikule”, “joogile”, “burgerile” jne.

RNN-i levinud kasutusalad

  • Aidake väärtpaberitega kauplejatel koostada analüütilisi aruandeid
  • Tuvastage finantsaruande lepingus kõrvalekalded
  • Tuvastage petturlik krediitkaarditehing
  • Lisage piltidele pealkiri
  • Võimsad vestlusrobotid
  • RNN-i standardkasutus toimub siis, kui praktikud töötavad aegridade andmete või jadadega (nt helisalvestised või tekst).

Konvolutsioonilised närvivõrgud (CNN)

CNN on unikaalse arhitektuuriga mitmekihiline närvivõrk, mis on loodud väljundi määramiseks iga kihi andmete üha keerukamate funktsioonide eraldamiseks. CNN-id sobivad hästi tajumisülesanneteks.

Konvolutsiooniline närvivõrk

Konvolutsiooniline närvivõrk

CNN-i kasutatakse enamasti siis, kui on olemas struktureerimata andmekogum (nt pildid) ja praktikud peavad sellest teavet hankima.

Näiteks kui ülesanne on ennustada pildi pealkirja:

  • CNN saab näiteks kassi kujutise, arvuti mõistes on see pilt pikslite kogum. Üldjuhul üks kiht halltoonide pildi jaoks ja kolm kihti värvilise pildi jaoks.
  • Funktsioonide (st peidetud kihtide) õppimise ajal tuvastab võrk ainulaadsed omadused, näiteks kassi saba, kõrv jne.
  • Kui võrk õppis põhjalikult pilti ära tundma, võib see anda tõenäosuse iga pildi jaoks, mida ta teab. Suurima tõenäosusega märgist saab võrgu ennustus.

Tugevdusõpe

Tugevdusõpe on masinõppe alamvaldkond, milles süsteeme treenitakse virtuaalse "preemia" või "karistuse" saamisega, mis on sisuliselt katse-eksituse meetodil õppimine. Google'i DeepMind on kasutanud tugevdamisõpet, et võita Go-mängudes inimtšempion. Tugevdusõpet kasutatakse ka videomängudes, et parandada mängukogemust, pakkudes nutikamaid roboteid.

Üks kuulsamaid algoritme on:

  • Q-õpe
  • Sügav Q võrk
  • State-Action-Reward-State-Action (SARSA)
  • Deep Deterministic Policy Gradient (DDPG)

Süvaõppe rakenduste näited

Nüüd selles algajatele mõeldud süvaõppe õpetuses tutvume süvaõppe rakendustega.

AI rahanduses

Finantstehnoloogia sektor on juba hakanud kasutama tehisintellekti, et säästa aega, vähendada kulusid ja lisada väärtust. Sügav õppimine muudab laenusektorit, kasutades tugevamat krediidiskoori. Krediidiotsuste langetajad saavad kasutada tehisintellekti tugevate laenutaotluste jaoks, et saavutada kiirem ja täpsem riskihindamine, kasutades taotlejate iseloomu ja suutlikkuse arvessevõtmiseks masintarkvara.

Underwrite on Fintech-ettevõte, mis pakub AI-lahendust krediiditootjatele. Underwrite.ai kasutab tehisintellekti tuvastamaks, milline taotleja maksab suurema tõenäosusega laenu tagasi. Nende lähenemine ületab radikaalselt traditsioonilisi meetodeid.

AI HR-is

Armouri all valmistab spordirõivaste ettevõte tehisintellekti abil värbamise revolutsiooni ja ajakohastab kandidaatide kogemust. Tegelikult vähendab Under Armour oma jaekauplustes töölevõtmise aega 35%. Under Armouri vastu kasvas huvi juba 2012. aastal. Neil oli keskmiselt 30000 XNUMX CV-d kuus. Kõigi nende taotluste lugemine ning sõelumis- ja intervjuuprotsessi alustamine võttis liiga kaua aega. Pikaajaline inimeste palkamise ja pardale võtmise protsess mõjutas Under Armouri suutlikkust tagada, et jaemüügikauplused oleksid täielikult varustatud, kallutatud ja töövalmis.

Sel ajal oli Under Armouril olemas kõik kohustuslikud personalitehnoloogiad, nagu tehingulahendused hankimiseks, rakendamiseks, jälgimiseks ja sisseviimiseks, kuid need tööriistad ei olnud piisavalt kasulikud. Soomuste all vali HireVue, AI pakkuja personalilahenduste jaoks nii tellitavate kui ka reaalajas intervjuude jaoks. Tulemuseks oli bluffimine; neil õnnestus täitmise aega vähendada 35%. Vastutasuks palgatud kvaliteetsemad töötajad.

AI turunduses

AI on väärtuslik tööriist klienditeeninduse haldamiseks ja isikupärastamiseks. Kõnekeskuse halduse ja kõnede suunamise täiustatud kõnetuvastus tänu tehisintellekti tehnikate rakendamisele võimaldab klientidele sujuvamat kogemust.

Näiteks heli süvaõppe analüüs võimaldab süsteemidel hinnata kliendi emotsionaalset tooni. Kui klient reageerib halvasti AI vestlusrobot, saab süsteemi vestluse ümber suunata tegelikele inimoperaatoritele, kes probleemi üle võtavad.

Lisaks kolmele ülaltoodud süvaõppe näitele kasutatakse tehisintellekti laialdaselt ka teistes sektorites/tööstustes.

Miks on süvaõpe oluline?

Sügav õppimine on võimas vahend, et muuta ennustamine teostatavaks tulemuseks. Süvaõpe paistab silma mustrite avastamise (juhendamata õppimine) ja teadmistepõhise ennustamisega. Big andmed on sügava õppimise kütus. Kui mõlemad on ühendatud, võib organisatsioon saada enneolematuid tulemusi tootlikkuse, müügi, juhtimise ja innovatsiooni vallas.

Sügav õppimine võib ületada traditsioonilist meetodit. Näiteks on süvaõppe algoritmid piltide klassifitseerimisel 41% täpsemad kui masinõppealgoritmid, näotuvastuses 27% ja hääletuvastuses 25% täpsemad.

Süvaõppe piirangud

Nüüd selles närvivõrgu õpetuses õpime tundma süvaõppe piiranguid:

Andmete märgistamine

Enamikku praeguseid tehisintellekti mudeleid koolitatakse juhendatud õppe kaudu. See tähendab, et inimesed peavad aluseks olevad andmed märgistama ja kategoriseerima, mis võib olla suur ja vigaderikas töö. Näiteks isejuhtivate autode tehnoloogiaid arendavad ettevõtted palkavad sadu inimesi prototüüpsõidukitelt saadud videovoogudele käsitsi märkuste tegemiseks, et aidata neid süsteeme koolitada.

Hankige tohutuid koolitusandmekogumeid

On näidatud, et lihtsad süvaõppe tehnikad, nagu CNN, võivad mõnel juhul jäljendada meditsiini- ja muude valdkondade ekspertide teadmisi. Praegune laine masinõpenõuab aga koolitusandmekogumeid, mis pole mitte ainult märgistatud, vaid ka piisavalt laiad ja universaalsed.

Süvaõppemeetodid nõudsid tuhandeid vaatlusi, et mudelid saaksid klassifitseerimisülesannetes suhteliselt headeks, ja mõnel juhul miljoneid, et need saaksid inimeste tasemel sooritada. Ilma üllatuseta on sügav õppimine kuulus hiiglaslikes tehnoloogiaettevõtetes; nad kasutavad suurandmeid petabaitide andmete kogumiseks. See võimaldab neil luua muljetavaldava ja ülitäpse süvaõppe mudeli.

Selgitage probleemi

Suuri ja keerulisi mudeleid võib olla inimlikult raske seletada. Näiteks miks konkreetne otsus tehti. See on üks põhjus, miks mõnede tehisintellekti tööriistade aktsepteerimine on aeglane rakendusvaldkondades, kus tõlgendatavus on kasulik või nõutav.

Lisaks võivad tehisintellekti kohaldamise laienedes regulatiivsed nõuded põhjustada ka vajadust paremini seletatavate tehisintellekti mudelite järele.

kokkuvõte

Süvaõppe ülevaade: Süvaõpe on uus tipptasemel tehnoloogia tehisintellekti. Süvaõppe arhitektuur koosneb sisendkihist, peidetud kihtidest ja väljundkihist. Sõna sügav tähendab, et on rohkem kui kaks täielikult ühendatud kihti.

On olemas tohutul hulgal närvivõrke, kus iga arhitektuur on loodud teatud ülesande täitmiseks. Näiteks CNN töötab piltidega väga hästi, RNN annab muljetavaldavaid tulemusi aegridade ja tekstianalüüsiga.

Süvaõpe on praegu aktiivne erinevates valdkondades, alates rahandusest kuni turunduse, tarneahela ja turunduseni. Suured ettevõtted on esimesed, kes kasutavad süvaõpet, kuna neil on juba suur andmekogum. Sügav õppimine nõuab ulatuslikku koolitusandmestikku.