Självstudie för djupinlärning för nybörjare: Grundläggande om neurala nätverk
Vad är Deep Learning?
Deep Learning är ett datorprogram som efterliknar nätverket av nervceller i en hjärna. Det är en undergrupp av maskininlärning baserad på artificiella neurala nätverk med representationsinlärning. Det kallas djupinlärning eftersom det använder sig av djupa neurala nätverk. Denna inlärning kan vara övervakad, semi-övervakad eller oövervakad.
Algoritmer för djupinlärning är konstruerade med sammankopplade lager.
- Det första lagret kallas Input Layer
- Det sista lagret kallas Output Layer
- Alla lager däremellan kallas dolda lager. Ordet djup betyder att nätverket sammanfogar neuroner i mer än två lager.
Varje gömt lager består av neuroner. Neuronerna är kopplade till varandra. Neuronen kommer att bearbeta och sedan sprida insignalen som den tar emot lagret ovanför. Styrkan på signalen som ges till neuronen i nästa lager beror på vikten, bias och aktiveringsfunktionen.
Nätverket förbrukar stora mängder indata och driver dem genom flera lager; nätverket kan lära sig allt mer komplexa egenskaper hos data på varje lager.
Deep learning process
Ett djupt neuralt nätverk ger toppmodern noggrannhet i många uppgifter, från objektdetektering till taligenkänning. De kan lära sig automatiskt, utan fördefinierade kunskaper som uttryckligen kodats av programmerarna.
För att förstå idén om djup inlärning, föreställ dig en familj, med ett spädbarn och föräldrar. Småbarnet pekar på föremål med lillfingret och säger alltid ordet "katt". Eftersom hans föräldrar är oroliga över hans utbildning, säger de hela tiden till honom "Ja, det är en katt" eller "Nej, det är inte en katt." Spädbarnet fortsätter att peka föremål men blir mer exakt med "katter". Den lilla ungen vet innerst inne inte varför han kan säga att det är en katt eller inte. Han har precis lärt sig att hierarkiera komplexa egenskaper som kommer upp med en katt genom att titta på husdjuret överlag och fortsätta att fokusera på detaljer som svansar eller näsan innan för att bestämma sig.
Ett neuralt nätverk fungerar ungefär likadant. Varje lager representerar en djupare kunskapsnivå, dvs kunskapshierarkin. Ett neuralt nätverk med fyra lager kommer att lära sig mer komplexa egenskaper än med två lager.
Lärandet sker i två faser:
Första fasen: Den första fasen består av att tillämpa en icke-linjär transformation av input och skapa en statistisk modell som output.
Andra fas: Den andra fasen syftar till att förbättra modellen med en matematisk metod som kallas derivata.
Det neurala nätverket upprepar dessa två faser hundratals till tusentals gånger tills det har nått en acceptabel nivå av noggrannhet. Upprepningen av denna tvåfas kallas en iteration.
För att ge ett exempel på djupinlärning, ta en titt på rörelsen nedan, modellen försöker lära sig att dansa. Efter 10 minuters träning vet modellen inte hur man dansar, och det ser ut som en kladdkaka.
Efter 48 timmars lärande bemästrar datorn konsten att dansa.
Klassificering av neurala nätverk
Grunt neuralt nätverk: Det Shallow neurala nätverket har bara ett dolt lager mellan input och output.
Djupt neurala nätverk: Djupa neurala nätverk har mer än ett lager. Till exempel räknar Google LeNet-modellen för bildigenkänning 22 lager.
Nuförtiden används djupinlärning på många sätt som en förarlös bil, mobiltelefon, Googles sökmotor, bedrägeriupptäckt, TV och så vidare.
Typer av nätverk för djupinlärning
Nu i denna självstudie för Deep Neural Network kommer vi att lära oss om typer av Deep Learning Networks:
Mata framåt neurala nätverk
Den enklaste typen av konstgjorda neurala nätverk. Med denna typ av arkitektur flyter information bara i en riktning, framåt. Det betyder att informationens flöden börjar vid ingångslagret, går till de "dolda" lagren och slutar vid utlagret. Nätverket
har ingen slinga. Information stannar vid utgångsskikten.
Återkommande neurala nätverk (RNN)
RNN är ett flerskiktigt neuralt nätverk som kan lagra information i kontextnoder, vilket gör att det kan lära sig datasekvenser och mata ut ett nummer eller en annan sekvens. Med enkla ord är det ett artificiellt neuralt nätverk vars kopplingar mellan neuroner inkluderar loopar. RNN är väl lämpade för bearbetning av sekvenser av ingångar.
Till exempel, om uppgiften är att förutsäga nästa ord i meningen “Vill du ha en …………?
- RNN-neuronerna kommer att få en signal som pekar mot början av meningen.
- Nätverket tar emot ordet "Do" som indata och producerar en vektor av numret. Denna vektor matas tillbaka till neuronen för att tillhandahålla ett minne till nätverket. Detta steg hjälper nätverket att komma ihåg att det tog emot "Do" och det fick det i första positionen.
- Nätverket fortsätter på samma sätt till nästa ord. Det tar ordet "du" och "vill". Neuronernas tillstånd uppdateras vid mottagande av varje ord.
- Det sista steget inträffar efter att ha fått ordet "a." Det neurala nätverket kommer att ge en sannolikhet för varje engelskt ord som kan användas för att slutföra meningen. En vältränad RNN tilldelar förmodligen en hög sannolikhet till "café", "dryck", "burgare" etc.
Vanliga användningar av RNN
- Hjälp värdepappershandlare att generera analytiska rapporter
- Upptäck avvikelser i bokslutsavtalet
- Upptäck bedräglig kreditkortstransaktion
- Ge en bildtext för bilder
- Power chatbots
- Standardanvändning av RNN sker när utövarna arbetar med tidsseriedata eller sekvenser (t.ex. ljudinspelningar eller text).
Konvolutionella neurala nätverk (CNN)
CNN är ett flerskiktigt neuralt nätverk med en unik arkitektur utformad för att extrahera allt mer komplexa egenskaper hos data vid varje lager för att bestämma utdata. CNN är väl lämpade för perceptuella uppgifter.
CNN används mest när det finns en ostrukturerad datamängd (t.ex. bilder) och utövarna behöver extrahera information från den.
Om uppgiften till exempel är att förutsäga en bildtext:
- CNN får en bild av låt oss säga en katt, den här bilden, i datorterm, är en samling av pixeln. I allmänhet ett lager för gråskalebilden och tre lager för en färgbild.
- Under funktionsinlärningen (dvs dolda lager) kommer nätverket att identifiera unika egenskaper, till exempel kattens svans, örat, etc.
- När nätverket grundligt lärt sig hur man känner igen en bild kan det ge en sannolikhet för varje bild det känner till. Etiketten med högst sannolikhet kommer att bli nätverkets förutsägelse.
Förstärkningslärande
Förstärkningslärande är ett underområde av maskininlärning där system tränas genom att ta emot virtuella "belöningar" eller "straff", i huvudsak inlärning genom försök och misstag. Googles DeepMind har använt förstärkningsinlärning för att slå en mänsklig mästare i Go-spelen. Förstärkningsinlärning används också i videospel för att förbättra spelupplevelsen genom att tillhandahålla smartare bots.
En av de mest kända algoritmerna är:
- Q-lärande
- Djupt Q-nätverk
- State-Action-Reward-State-Action (SARSA)
- Deep Deterministic Policy Gradient (DDPG)
Exempel på tillämpningar för djupinlärning
Låt oss nu i den här självstudien för djupinlärning för nybörjare lära oss om applikationer för djupinlärning:
AI inom finans
Den finansiella tekniksektorn har redan börjat använda AI för att spara tid, minska kostnaderna och skapa värde. Deep learning förändrar lånebranschen genom att använda mer robust kreditvärdering. Kreditbeslutsfattare kan använda AI för robusta kreditansökningar för att uppnå snabbare och mer exakt riskbedömning, genom att använda maskinell intelligens för att ta hänsyn till de sökandes karaktär och kapacitet.
Underwrite är ett Fintech-företag som tillhandahåller en AI-lösning för kreditgivare. underwrite.ai använder AI för att upptäcka vilken sökande som är mer benägen att betala tillbaka ett lån. Deras tillvägagångssätt överträffar radikalt traditionella metoder.
AI i HR
Under Armour, ett sportklädesföretag revolutionerar anställning och moderniserar kandidatupplevelsen med hjälp av AI. Faktum är att Under Armour minskar anställningstiden för sina butiker med 35 %. Under Armour möttes av ett växande popularitetsintresse redan 2012. De hade i genomsnitt 30000 XNUMX meritförteckningar i månaden. Det tog för lång tid att läsa alla dessa ansökningar och påbörja screening- och intervjuprocessen. Den långa processen för att få folk att anställa och komma ombord påverkade Under Armours förmåga att ha sina butiker fullt bemannade, rampade och redo att användas.
Vid den tiden hade Under Armour all "måste ha" HR-teknik på plats, såsom transaktionslösningar för inköp, applicering, spårning och onboarding, men dessa verktyg var inte tillräckligt användbara. Välj under pansar HireVue, en AI-leverantör för HR-lösning, för både on-demand och liveintervjuer. Resultaten var bluffande; de lyckades minska med 35 % tiden att fylla. I gengäld anställde de personal av högre kvalitet.
AI i marknadsföring
AI är ett värdefullt verktyg för kundtjänsthantering och personaliseringsutmaningar. Förbättrad taligenkänning i callcenterhantering och samtalsdirigering som ett resultat av tillämpningen av AI-tekniker möjliggör en mer sömlös upplevelse för kunderna.
Till exempel, djupinlärningsanalys av ljud gör att system kan bedöma en kunds känslomässiga ton. Om kunden svarar dåligt på AI chatbot, kan systemet omdirigera samtalet till verkliga, mänskliga operatörer som tar över problemet.
Bortsett från de tre Deep learning-exemplen ovan, används AI flitigt i andra sektorer/branscher.
Varför är djupinlärning viktigt?
Deep learning är ett kraftfullt verktyg för att göra förutsägelse till ett genomförbart resultat. Deep learning utmärker sig i mönsterupptäckt (oövervakat lärande) och kunskapsbaserad förutsägelse. Stora data är bränslet för djupinlärning. När båda kombineras kan en organisation skörda oöverträffade resultat när det gäller produktivitet, försäljning, ledning och innovation.
Deep learning kan överträffa traditionell metod. Till exempel är algoritmer för djupinlärning 41 % mer exakta än maskininlärningsalgoritmer i bildklassificering, 27 % mer exakta i ansiktsigenkänning och 25 % i röstigenkänning.
Begränsningar av djupinlärning
Nu i den här självstudien för neurala nätverk kommer vi att lära oss om begränsningar av djupinlärning:
Datamärkning
De flesta nuvarande AI-modeller tränas genom "övervakat lärande". Det betyder att människor måste märka och kategorisera de underliggande data, vilket kan vara en ansenlig och felbenägen syssla. Till exempel anställer företag som utvecklar teknik för självkörande bilar hundratals personer för att manuellt kommentera timmar av videoflöden från prototypfordon för att hjälpa till att träna dessa system.
Skaffa enorma utbildningsdatauppsättningar
Det har visat sig att enkla tekniker för djupinlärning som CNN i vissa fall kan imitera kunskapen hos experter inom medicin och andra områden. Den nuvarande vågen av maskininlärning, kräver dock utbildningsdatauppsättningar som inte bara är märkta utan också tillräckligt breda och universella.
Metoder för djupinlärning krävde tusentals observationer för att modeller skulle bli relativt bra på klassificeringsuppgifter och, i vissa fall, miljoner för att de skulle utföra på människans nivå. Utan överraskning är djupinlärning känt i gigantiska teknikföretag; de använder big data för att samla petabyte med data. Det låter dem skapa en imponerande och mycket exakt modell för djupinlärning.
Förklara ett problem
Stora och komplexa modeller kan vara svåra att förklara i mänskliga termer. Till exempel varför ett visst beslut togs. Det är en anledning till att acceptansen av vissa AI-verktyg är långsam i tillämpningsområden där tolkningsbarhet är användbar eller faktiskt krävs.
Dessutom, när tillämpningen av AI expanderar, kan regulatoriska krav också driva på behovet av mer förklarliga AI-modeller.
Sammanfattning
Översikt över djupinlärning: Deep learning är det nya toppmoderna för artificiell intelligens. Arkitektur för djupinlärning består av ett indatalager, dolda lager och ett utdatalager. Ordet djup betyder att det finns mer än två helt sammankopplade lager.
Det finns en stor mängd neurala nätverk, där varje arkitektur är designad för att utföra en given uppgift. Till exempel fungerar CNN mycket bra med bilder, RNN ger imponerande resultat med tidsserier och textanalys.
Deep learning är nu aktivt inom olika områden, från ekonomi till marknadsföring, supply chain och marknadsföring. Stora företag är de första som använder djupinlärning eftersom de redan har en stor mängd data. Deep learning kräver att du har en omfattande utbildningsdatauppsättning.