Deep Learning Tutorial for begyndere: Neural Network Basics
Hvad er Deep Learning?
Deep Learning er en computersoftware, der efterligner netværket af neuroner i en hjerne. Det er en undergruppe af maskinlæring baseret på kunstige neurale netværk med repræsentationslæring. Det kaldes deep learning, fordi det gør brug af dybe neurale netværk. Denne læring kan være superviseret, semi-superviseret eller uovervåget.
Deep learning algoritmer er konstrueret med forbundne lag.
- Det første lag kaldes Input Layer
- Det sidste lag kaldes Output Layer
- Alle lag derimellem kaldes skjulte lag. Ordet dyb betyder, at netværket forbinder neuroner i mere end to lag.

Hvert skjult lag er sammensat af neuroner. Neuronerne er forbundet med hinanden. Neuronet vil behandle og derefter udbrede inputsignalet, det modtager laget over det. Styrken af signalet givet neuronen i det næste lag afhænger af vægten, bias og aktiveringsfunktionen.
Netværket bruger store mængder inputdata og driver dem gennem flere lag; netværket kan lære mere og mere komplekse funktioner i dataene på hvert lag.
Dyb læringsproces
Et dybt neuralt netværk giver state-of-the-art nøjagtighed i mange opgaver, fra objektgenkendelse til talegenkendelse. De kan lære automatisk uden foruddefineret viden eksplicit kodet af programmørerne.
For at forstå ideen om dyb læring, forestil dig en familie med et spædbarn og forældre. Det lille barn peger på genstande med sin lillefinger og siger altid ordet 'kat'. Da hans forældre er bekymrede for hans uddannelse, bliver de ved med at fortælle ham 'Ja, det er en kat' eller 'Nej, det er ikke en kat.' Spædbarnet bliver ved med at pege på genstande, men bliver mere præcist med 'katte'. Den lille knægt ved inderst inde ikke, hvorfor han kan sige, at det er en kat eller ej. Han har lige lært, hvordan man hierarkierer komplekse træk, der kommer med en kat, ved at se på kæledyret overordnet og fortsætte med at fokusere på detaljer såsom halerne eller næsen før for at bestemme sig.
Et neuralt netværk fungerer ganske det samme. Hvert lag repræsenterer et dybere niveau af viden, dvs. videnshierarkiet. Et neuralt netværk med fire lag vil lære mere komplekse funktioner end med to lag.
Læringen foregår i to faser:
Første fase: Den første fase består i at anvende en ikke-lineær transformation af input og skabe en statistisk model som output.
Anden fase: Den anden fase sigter mod at forbedre modellen med en matematisk metode kendt som afledt.
Det neurale netværk gentager disse to faser hundreder til tusindvis af gange, indtil det har nået et acceptabelt niveau af nøjagtighed. Gentagelsen af denne to-fase kaldes en iteration.
For at give et Deep learning-eksempel, tag et kig på bevægelsen nedenfor, modellen forsøger at lære at danse. Efter 10 minutters træning ved modellen ikke, hvordan man danser, og det ligner en skribleri.
Efter 48 timers læring mestrer computeren kunsten at danse.
Klassificering af neurale netværk
Overfladisk neuralt netværk: Det Shallow neurale netværk har kun ét skjult lag mellem input og output.
Dybt neuralt netværk: Dybe neurale netværk har mere end ét lag. For eksempel tæller Google LeNet-model til billedgenkendelse 22 lag.
I dag bruges deep learning på mange måder som en førerløs bil, mobiltelefon, Google-søgemaskine, svindeldetektion, tv og så videre.
Typer af dybe læringsnetværk
Nu i denne Deep Neural Network tutorial vil vi lære om typer af Deep Learning Networks:
Feed-forward neurale netværk
Den enkleste type kunstigt neurale netværk. Med denne type arkitektur flyder information kun i én retning, fremad. Det betyder, at informationsstrømmene starter ved inputlaget, går til de "skjulte" lag og slutter ved outputlaget. Netværket
har ikke en løkke. Information stopper ved outputlagene.
Tilbagevendende neurale netværk (RNN'er)
RNN er et flerlags neuralt netværk, der kan gemme information i kontekstknuder, så det kan lære datasekvenser og udlæse et tal eller en anden sekvens. Med enkle ord er det et kunstigt neuralt netværk, hvis forbindelser mellem neuroner inkluderer sløjfer. RNN'er er velegnede til behandling af sekvenser af input.
For eksempel, hvis opgaven er at forudsige det næste ord i sætningen “Vil du have en…………?
- RNN-neuronerne vil modtage et signal, der peger på begyndelsen af sætningen.
- Netværket modtager ordet "Do" som input og producerer en vektor af tallet. Denne vektor føres tilbage til neuronet for at give en hukommelse til netværket. Dette trin hjælper netværket med at huske, at det modtog "Do", og det modtog det i den første position.
- Netværket vil på samme måde fortsætte til de næste ord. Det tager ordet "du" og "vil." Neuronernes tilstand opdateres ved modtagelse af hvert ord.
- Den sidste fase opstår efter at have modtaget ordet "a." Det neurale netværk vil give en sandsynlighed for hvert engelsk ord, der kan bruges til at fuldføre sætningen. En veltrænet RNN tildeler sandsynligvis en stor sandsynlighed til "café", "drikke", "burger" osv.
Almindelige anvendelser af RNN
- Hjælp værdipapirhandlere med at generere analytiske rapporter
- Opdag abnormiteter i kontrakten for regnskabet
- Opdag svigagtig kreditkorttransaktion
- Angiv en billedtekst til billeder
- Power chatbots
- Standardanvendelser af RNN forekommer, når praktikerne arbejder med tidsseriedata eller sekvenser (f.eks. lydoptagelser eller tekst).
Convolutionsneurale netværk (CNN)
CNN er et flerlags neuralt netværk med en unik arkitektur designet til at udtrække stadigt mere komplekse funktioner i dataene på hvert lag for at bestemme outputtet. CNN'er er velegnede til perceptuelle opgaver.
CNN bruges mest, når der er et ustruktureret datasæt (f.eks. billeder), og praktiserende læger skal udtrække information fra det.
For eksempel, hvis opgaven er at forudsige en billedtekst:
- CNN modtager et billede af lad os sige en kat, dette billede er i computertermer en samling af pixlen. Generelt et lag til gråtonebilledet og tre lag til et farvebillede.
- Under funktionsindlæringen (dvs. skjulte lag) vil netværket identificere unikke funktioner, for eksempel kattens hale, øret osv.
- Når netværket grundigt lærte at genkende et billede, kan det give en sandsynlighed for hvert billede, det kender. Etiketten med størst sandsynlighed bliver netværkets forudsigelse.
Forstærkningslæring
Forstærkning læring er et underområde af maskinlæring, hvor systemer trænes ved at modtage virtuelle "belønninger" eller "straffe", i det væsentlige læring ved forsøg og fejl. Googles DeepMind har brugt forstærkningslæring til at slå en menneskelig mester i Go-spillene. Forstærkende læring bruges også i videospil for at forbedre spiloplevelsen ved at levere smartere bots.
En af de mest kendte algoritmer er:
- Q-læring
- Dybt Q-netværk
- State-Action-Reward-State-Action (SARSA)
- Deep Deterministic Policy Gradient (DDPG)
Eksempler på deep learning-applikationer
Lad os nu i denne Deep Learning for begyndere-tutorial lære om Deep Learning-applikationer:
AI i finans
Den finansielle teknologisektor er allerede begyndt at bruge kunstig intelligens til at spare tid, reducere omkostninger og tilføje værdi. Deep learning ændrer lånebranchen ved at bruge mere robust kreditvurdering. Kreditbeslutningstagere kan bruge AI til robuste kreditlånsansøgninger for at opnå hurtigere og mere præcis risikovurdering ved at bruge maskinel intelligens til at tage hensyn til ansøgernes karakter og kapacitet.
Underwrite er en Fintech-virksomhed, der leverer en kunstig intelligens-løsning til kreditskabende virksomheder. underwrite.ai bruger AI til at opdage, hvilken ansøger der er mere tilbøjelig til at betale et lån tilbage. Deres tilgang overgår radikalt traditionelle metoder.
AI i HR
Under Armour, et sportstøjsfirma revolutionerer ansættelser og moderniserer kandidatoplevelsen ved hjælp af kunstig intelligens. Faktisk reducerer Under Armour ansættelsestiden til sine detailbutikker med 35 %. Under Armour stod over for en voksende popularitet tilbage i 2012. De havde i gennemsnit 30000 CV'er om måneden. Det tog for lang tid at læse alle disse ansøgninger og begynde at starte screening- og interviewprocessen. Den langvarige proces for at få folk ansat og ombord påvirkede Under Armours evne til at have deres detailbutikker fuldt bemandet, rampet og klar til drift.
På det tidspunkt havde Under Armour al den "must have" HR-teknologi på plads, såsom transaktionsløsninger til sourcing, applicering, sporing og onboarding, men disse værktøjer var ikke nyttige nok. Vælg under rustning HireVue, en AI-udbyder til HR-løsning, til både on-demand og live interviews. Resultaterne var bluffende; de formåede at reducere med 35 % af tiden til at fylde. Til gengæld hyrede de ansatte af højere kvalitet.
AI i marketing
AI er et værdifuldt værktøj til kundeservicestyring og personaliseringsudfordringer. Forbedret talegenkendelse i callcenterstyring og opkaldsdirigering som et resultat af anvendelsen af AI-teknikker giver kunderne en mere problemfri oplevelse.
For eksempel giver deep-learning-analyse af lyd systemerne mulighed for at vurdere en kundes følelsesmæssige tone. Hvis kunden reagerer dårligt på AI chatbot, kan systemet omdirigeres samtalen til rigtige, menneskelige operatører, der overtager problemet.
Bortset fra de tre Deep learning-eksempler ovenfor, er AI meget brugt i andre sektorer/industrier.
Hvorfor er Deep Learning vigtigt?
Deep learning er et kraftfuldt værktøj til at gøre forudsigelse til et brugbart resultat. Dyb læring udmærker sig ved mønsteropdagelse (uovervåget læring) og vidensbaseret forudsigelse. Big data er brændstoffet til dyb læring. Når begge er kombineret, kan en organisation høste hidtil usete resultater med hensyn til produktivitet, salg, ledelse og innovation.
Dyb læring kan overgå traditionel metode. For eksempel er deep learning-algoritmer 41 % mere nøjagtige end maskinlæringsalgoritmer i billedklassificering, 27 % mere præcise i ansigtsgenkendelse og 25 % i stemmegenkendelse.
Begrænsninger ved dyb læring
Nu i denne Neurale netværk tutorial, vil vi lære om begrænsninger af Deep Learning:
Datamærkning
De fleste nuværende AI-modeller trænes gennem "overvåget læring". Det betyder, at mennesker skal mærke og kategorisere de underliggende data, hvilket kan være en betydelig og fejltilbøjelig opgave. For eksempel ansætter virksomheder, der udvikler selvkørende bilteknologier, hundredvis af mennesker til manuelt at kommentere timevis af videofeeds fra prototypebiler for at hjælpe med at træne disse systemer.
Få enorme træningsdatasæt
Det har vist sig, at simple deep learning-teknikker som CNN i nogle tilfælde kan efterligne viden fra eksperter inden for medicin og andre områder. Den nuværende bølge af machine learningkræver dog træningsdatasæt, der ikke kun er mærket, men også er tilstrækkeligt brede og universelle.
Dyblæringsmetoder krævede tusindvis af observationer, for at modeller kunne blive relativt gode til klassificeringsopgaver, og i nogle tilfælde millioner for dem at udføre på menneskers niveau. Uden overraskelse er deep learning berømt i gigantiske teknologivirksomheder; de bruger big data til at akkumulere petabytes af data. Det giver dem mulighed for at skabe en imponerende og meget præcis dyb læringsmodel.
Forklar et problem
Store og komplekse modeller kan være svære at forklare i menneskelige termer. For eksempel hvorfor en bestemt beslutning blev opnået. Det er en grund til, at accepten af nogle AI-værktøjer er langsom i applikationsområder, hvor fortolkning er nyttig eller faktisk påkrævet.
Ydermere, efterhånden som anvendelsen af AI udvides, kan regulatoriske krav også drive behovet for mere forklarlige AI-modeller.
Resumé
Overblik over dyb læring: Dyb læring er det nye state-of-the-art til kunstig intelligens. Deep learning-arkitektur er sammensat af et inputlag, skjulte lag og et outputlag. Ordet dyb betyder, at der er mere end to fuldt forbundne lag.
Der er en stor mængde neurale netværk, hvor hver arkitektur er designet til at udføre en given opgave. For eksempel fungerer CNN meget godt med billeder, RNN giver imponerende resultater med tidsserier og tekstanalyse.
Deep learning er nu aktiv inden for forskellige områder, fra økonomi til marketing, forsyningskæde og marketing. Store virksomheder er de første til at bruge deep learning, fordi de allerede har en stor pulje af data. Dyb læring kræver at have et omfattende træningsdatasæt.