Deep Learning-tutorial voor beginners: basisprincipes van neurale netwerken
Wat is diep leren?
Diepe leren is computersoftware die het netwerk van neuronen in de hersenen nabootst. Het is een subset van machinaal leren gebaseerd op kunstmatige neurale netwerken met representatieleren. Het wordt deep learning genoemd omdat het gebruik maakt van diepe neurale netwerken. Dit leren kan onder toezicht, semi-onder toezicht of zonder toezicht plaatsvinden.
Deep learning-algoritmen zijn opgebouwd uit verbonden lagen.
- De eerste laag wordt de invoerlaag genoemd
- De laatste laag wordt de uitvoerlaag genoemd
- Alle lagen ertussen worden verborgen lagen genoemd. Het woord diep betekent dat het netwerk neuronen in meer dan twee lagen verbindt.

Elke verborgen laag bestaat uit neuronen. De neuronen zijn met elkaar verbonden. Het neuron zal het ingangssignaal dat het ontvangt, verwerken en vervolgens voortplanten naar de laag erboven. De sterkte van het signaal dat het neuron in de volgende laag krijgt, hangt af van het gewicht, de bias en de activeringsfunctie.
Het netwerk verbruikt grote hoeveelheden invoergegevens en verwerkt deze via meerdere lagen. Het netwerk kan steeds complexere kenmerken van de gegevens op elke laag leren.
Diep leerproces
Een diep neuraal netwerk biedt ultramoderne nauwkeurigheid bij veel taken, van objectdetectie tot spraakherkenning. Ze kunnen automatisch leren, zonder vooraf gedefinieerde kennis die expliciet door de programmeurs is gecodeerd.
Om het idee van deep learning te begrijpen, stel je een gezin voor met een baby en ouders. De peuter wijst met zijn pink naar voorwerpen en zegt altijd het woord 'kat'. Omdat zijn ouders zich zorgen maken over zijn opleiding, blijven ze hem vertellen 'Ja, dat is een kat' of 'Nee, dat is geen kat'. De baby blijft voorwerpen aanwijzen, maar wordt nauwkeuriger met 'katten'. Het kleine kind weet diep van binnen niet waarom hij kan zeggen dat het een kat is of niet. Hij heeft net geleerd hoe hij complexe kenmerken moet hiërarchiseren door naar het huisdier in zijn geheel te kijken en zich te blijven concentreren op details zoals de staarten of de neus voordat hij een beslissing neemt.
Een neuraal netwerk werkt vrijwel hetzelfde. Elke laag vertegenwoordigt een dieper niveau van kennis, d.w.z. de hiërarchie van kennis. Een neuraal netwerk met vier lagen zal complexere kenmerken leren dan met twee lagen.
Het leren vindt plaats in twee fasen:
Eerste fase: De eerste fase bestaat uit het toepassen van een niet-lineaire transformatie van de invoer en het creëren van een statistisch model als uitvoer.
Tweede fase: De tweede fase is gericht op het verbeteren van het model met een wiskundige methode die bekend staat als afgeleide.
Het neurale netwerk herhaalt deze twee fasen honderden tot duizenden keren totdat het een aanvaardbaar nauwkeurigheidsniveau heeft bereikt. De herhaling van deze twee fasen wordt een iteratie genoemd.
Om een voorbeeld van Deep Learning te geven, kijk eens naar de onderstaande beweging, het model probeert te leren dansen. Na 10 minuten training weet het model niet hoe te dansen, en het ziet eruit als een krabbel.
Na 48 uur leren beheerst de computer de kunst van het dansen.
Classificatie van neurale netwerken
Ondiep neuraal netwerk: Het ondiepe neurale netwerk heeft slechts één verborgen laag tussen de invoer en uitvoer.
Diep neuraal netwerk: Diepe neurale netwerken hebben meer dan één laag. Het Google LeNet-model voor beeldherkenning telt bijvoorbeeld 22 lagen.
Tegenwoordig wordt deep learning op veel manieren gebruikt, zoals een zelfrijdende auto, mobiele telefoon, Google-zoekmachine, fraudedetectie, tv, enzovoort.
Soorten deep learning-netwerken
In deze Deep Neural Network-tutorial zullen we nu leren over soorten Deep Learning Networks:
Feed-forward neurale netwerken
Het eenvoudigste type kunstmatige neurale netwerken. Met dit type architectuur stroomt informatie slechts in één richting, voorwaarts. Dat betekent dat de informatiestromen beginnen bij de invoerlaag, naar de "verborgen" lagen gaan en eindigen bij de uitvoerlaag. Het netwerk
heeft geen lus. Informatie stopt bij de uitvoerlagen.
Terugkerende neurale netwerken (RNN's)
RNN is een meerlagig neuraal netwerk dat informatie kan opslaan in contextknooppunten, waardoor het datareeksen kan leren en een nummer of een andere reeks kan uitvoeren. Simpel gezegd is het een kunstmatig neuraal netwerk waarvan de verbindingen tussen neuronen lussen omvatten. RNN's zijn zeer geschikt voor het verwerken van reeksen invoer.
Als het bijvoorbeeld de taak is om het volgende woord in de zin te voorspellen: 'Wil je een…………?
- De RNN-neuronen ontvangen een signaal dat naar het begin van de zin verwijst.
- Het netwerk ontvangt het woord “Do” als invoer en produceert een vector van het getal. Deze vector wordt teruggevoerd naar het neuron om geheugen aan het netwerk te verschaffen. Deze fase helpt het netwerk te onthouden dat het “Do” heeft ontvangen en dat het deze op de eerste positie heeft ontvangen.
- Het netwerk gaat op dezelfde manier verder met de volgende woorden. Er zijn de woorden ‘jij’ en ‘willen’ voor nodig. De toestand van de neuronen wordt bijgewerkt bij ontvangst van elk woord.
- De laatste fase vindt plaats na ontvangst van het woord ‘a’. Het neurale netwerk geeft voor elk Engels woord een waarschijnlijkheid die kan worden gebruikt om de zin af te maken. Een goed opgeleide RNN kent waarschijnlijk een grote waarschijnlijkheid toe aan ‘café’, ‘drankje’, ‘burger’, enz.
Veelvoorkomend gebruik van RNN
- Help effectenhandelaren analytische rapporten te genereren
- Detecteer afwijkingen in het contract of de financiële overzichten
- Detecteer frauduleuze creditcardtransacties
- Geef een bijschrift voor afbeeldingen
- Krachtige chatbots
- Het standaardgebruik van RNN vindt plaats wanneer de beoefenaars werken met tijdreeksgegevens of reeksen (bijvoorbeeld audio-opnamen of tekst).
Convolutionele neurale netwerken (CNN)
CNN is een meerlagig neuraal netwerk met een unieke architectuur die is ontworpen om steeds complexere kenmerken van de data op elke laag te extraheren om de output te bepalen. CNN's zijn zeer geschikt voor perceptuele taken.
CNN wordt meestal gebruikt als er sprake is van een ongestructureerde dataset (bijvoorbeeld afbeeldingen) en de praktijkmensen hieruit informatie moeten halen.
Als het bijvoorbeeld de taak is om een onderschrift bij een afbeelding te voorspellen:
- De CNN ontvangt een afbeelding van bijvoorbeeld een kat. Deze afbeelding is, in computertermen, een verzameling van de pixel. Over het algemeen één laag voor de grijswaardenafbeelding en drie lagen voor een kleurenafbeelding.
- Tijdens het leren van kenmerken (dat wil zeggen verborgen lagen) zal het netwerk unieke kenmerken identificeren, bijvoorbeeld de staart van de kat, het oor, enz.
- Wanneer het netwerk grondig heeft geleerd hoe het een afbeelding moet herkennen, kan het een waarschijnlijkheid geven voor elke afbeelding die het kent. Het label met de hoogste waarschijnlijkheid wordt de voorspelling van het netwerk.
Versterking leren
Versterking leren is een deelgebied van machinaal leren waarin systemen worden getraind door virtuele ‘beloningen’ of ‘straffen’ te ontvangen, waarbij ze in wezen met vallen en opstaan leren. Google's DeepMind heeft versterkend leren gebruikt om een menselijke kampioen in de Go-games te verslaan. Reinforcement learning wordt ook gebruikt in videogames om de game-ervaring te verbeteren door slimmere bots aan te bieden.
Een van de bekendste algoritmen zijn:
- Q-leren
- Deep Q-netwerk
- Staatsactie-beloning-staatsactie (SARSA)
- Diepe deterministische beleidsgradiënt (DDPG)
Voorbeelden van deep learning-toepassingen
Laten we nu in deze Deep Learning voor beginners-tutorial meer leren over Deep Learning-toepassingen:
AI in Financiën
De financiële technologiesector is al begonnen met het gebruik van AI om tijd te besparen, kosten te verlagen en waarde toe te voegen. Deep learning verandert de kredietsector door gebruik te maken van robuustere kredietscores. Kredietbeslissers kunnen AI gebruiken voor robuuste kredietverleningsaanvragen om een snellere, nauwkeurigere risicobeoordeling te realiseren, waarbij machine-intelligentie wordt gebruikt om rekening te houden met het karakter en de capaciteiten van aanvragers.
Underwrite is een Fintech-bedrijf dat een AI-oplossing levert voor kredietverstrekkers. underwrite.ai gebruikt AI om te detecteren welke aanvrager het waarschijnlijkst een lening terugbetaalt. Hun aanpak presteert radicaal beter dan traditionele methoden.
AI in HR
Under Armour, een sportkledingbedrijf, revolutioneert het aannemen van personeel en moderniseert de kandidaatervaring met behulp van AI. Under Armour verkort de aannametijd voor zijn winkels met 35%. Under Armour kreeg in 2012 te maken met een groeiende populariteit. Ze hadden gemiddeld 30000 cv's per maand. Het lezen van al die sollicitaties en het starten van het screening- en interviewproces duurde te lang. Het langdurige proces om mensen aan te nemen en aan boord te krijgen, had invloed op het vermogen van Under Armour om hun winkels volledig bemand, opgeschaald en klaar voor gebruik te hebben.
Op dat moment beschikte Under Armour over alle noodzakelijke HR-technologie, zoals transactionele oplossingen voor sourcing, sollicitatie, tracking en onboarding, maar die tools waren niet nuttig genoeg. Kies onder pantser HireVue, een AI-aanbieder voor HR-oplossingen, voor zowel on-demand als live interviews. De resultaten waren bluffen; ze slaagden erin de invultijd met 35% te verminderen. In ruil daarvoor huurden ze personeel van hogere kwaliteit in.
AI in marketing
AI is een waardevol hulpmiddel voor uitdagingen op het gebied van klantenservicebeheer en personalisatie. Verbeterde spraakherkenning in callcenterbeheer en oproeproutering als resultaat van de toepassing van AI-technieken zorgt voor een meer naadloze ervaring voor klanten.
Dankzij diepgaande analyse van audio kunnen systemen bijvoorbeeld de emotionele toon van een klant beoordelen. Als de klant slecht reageert op de AI chatbotkan het systeem het gesprek omleiden naar echte, menselijke operators die het probleem overnemen.
Naast de drie bovenstaande Deep Learning-voorbeelden wordt AI veel gebruikt in andere sectoren/industrieën.
Waarom is diep leren belangrijk?
Deep learning is een krachtig hulpmiddel om van voorspellingen een bruikbaar resultaat te maken. Deep learning blinkt uit in het ontdekken van patronen (leren zonder toezicht) en op kennis gebaseerde voorspellingen. Big data is de brandstof voor deep learning. Wanneer beide worden gecombineerd, kan een organisatie ongekende resultaten behalen op het gebied van productiviteit, verkoop, management en innovatie.
Deep learning kan traditionele methoden overtreffen. Deep learning-algoritmen zijn bijvoorbeeld 41% nauwkeuriger dan machine learning-algoritmen bij beeldclassificatie, 27% nauwkeuriger bij gezichtsherkenning en 25% bij spraakherkenning.
Beperkingen van diep leren
In deze tutorial over neurale netwerken zullen we nu leren over de beperkingen van Deep Learning:
Gegevensetikettering
De meeste huidige AI-modellen worden getraind via 'supervised learning'. Dat betekent dat mensen de onderliggende data moeten labelen en categoriseren, wat een behoorlijke en foutgevoelige klus kan zijn. Bedrijven die zelfrijdende autotechnologieën ontwikkelen, huren bijvoorbeeld honderden mensen in om handmatig uren aan videofeeds van prototypevoertuigen te annoteren om deze systemen te helpen trainen.
Verkrijg enorme trainingsdatasets
Het is aangetoond dat eenvoudige deep learning-technieken zoals CNN in sommige gevallen de kennis van experts in de geneeskunde en andere vakgebieden kunnen imiteren. De huidige golf van machine learningvereist echter trainingsdatasets die niet alleen gelabeld zijn, maar ook voldoende breed en universeel zijn.
Bij deep learning-methoden waren duizenden observaties nodig voordat modellen relatief goed konden worden in classificatietaken, en in sommige gevallen zelfs miljoenen om ze op het niveau van mensen te kunnen uitvoeren. Het zal geen verrassing zijn dat deep learning beroemd is bij gigantische technologiebedrijven; ze gebruiken big data om petabytes aan gegevens te verzamelen. Het stelt hen in staat een indrukwekkend en zeer nauwkeurig deep learning-model te creëren.
Leg een probleem uit
Grote en complexe modellen kunnen moeilijk uit te leggen zijn, in menselijke termen. Bijvoorbeeld, waarom een bepaalde beslissing is genomen. Het is een reden dat de acceptatie van sommige AI-tools traag is in toepassingsgebieden waar interpreteerbaarheid nuttig of zelfs vereist is.
Bovendien kunnen, naarmate de toepassing van AI zich uitbreidt, ook de eisen van regelgeving de behoefte aan beter verklaarbare AI-modellen vergroten.
Samenvatting
Overzicht van diepgaand leren: Deep learning is de nieuwe state-of-the-art voor kunstmatige intelligentie. Deep learning-architectuur bestaat uit een invoerlaag, verborgen lagen en een uitvoerlaag. Het woord deep betekent dat er meer dan twee volledig verbonden lagen zijn.
Er is een enorme hoeveelheid neurale netwerken, waarbij elke architectuur is ontworpen om een bepaalde taak uit te voeren. CNN werkt bijvoorbeeld heel goed met afbeeldingen, RNN levert indrukwekkende resultaten met tijdreeksen en tekstanalyse.
Deep learning is nu actief op verschillende gebieden, van financiën tot marketing, supply chain en marketing. Grote bedrijven zijn de eersten die deep learning gebruiken, omdat ze al over een grote hoeveelheid gegevens beschikken. Voor deep learning is een uitgebreide trainingsdataset vereist.