Ero koneoppimisen ja syväoppimisen välillä

Keskeinen ero koneoppimisen ja syväoppimisen välillä

Tärkeimmät erot koneoppimisen ja syväoppimisen välillä ovat:

  • Koneoppiminen tarjoaa erinomaisen suorituskyvyn pienessä/keskikokoisessa tietojoukossa, kun taas Deep Learning tarjoaa erinomaisen suorituskyvyn suuressa tietojoukossa
  • ML toimii halvemmalla koneella, kun taas DL vaatii tehokkaan koneen, mieluiten GPU:lla.
  • Koneoppimisen suoritusaika muutamasta minuutista tunteihin, kun taas syväoppiminen kestää jopa viikkoja.
  • Koneoppimisen avulla tarvitset vähemmän dataa algoritmin opettamiseen kuin syväoppimisen. Syväoppiminen vaatii laajan ja monipuolisen tietojoukon taustarakenteen tunnistamiseksi.
Ero ML:n ja DL:n välillä
Ero ML:n ja DL:n välillä

Mikä on AI?

AI (tekoäly) on tietojenkäsittelytieteen ala, jossa koneita ohjelmoidaan ja niille annetaan kognitiivinen kyky ajatella ja matkia toimia, kuten ihmisiä ja eläimiä. Tekoälyn vertailukohtana on ihmisen älykkyys päättelyn, puheen, oppimisen, näkemisen ja ongelmanratkaisun suhteen, mikä on kaukana tulevaisuudessa.

Tekoälyllä on kolme eri tasoa

1) Kapea tekoäly: Tekoälyn sanotaan olevan kapea, kun kone pystyy suorittamaan tietyn tehtävän paremmin kuin ihminen. Nykyinen tekoälytutkimus on nyt täällä
2) Yleinen AI: Tekoäly saavuttaa yleisen tilan, kun se pystyy suorittamaan minkä tahansa älyllisen tehtävän samalla tarkkuudella kuin ihminen
3) Aktiivinen AI: Tekoäly on aktiivinen, kun se voi voittaa ihmiset monissa tehtävissä

Varhaiset tekoälyjärjestelmät käyttivät kuvioiden sovittamista ja asiantuntijajärjestelmät.

Tekoälyjärjestelmän yleiskatsaus
Tekoälyjärjestelmän yleiskatsaus

Mikä on koneoppiminen (ML)?

ML (Koneen oppiminen) on tekoälytyyppi, jossa tietokone on koulutettu automatisoimaan tehtäviä, jotka ovat tyhjentäviä tai mahdottomia ihmisille. Se on paras työkalu analysoida, ymmärtää ja tunnistaa datassa olevia malleja tietokonealgoritmien tutkimukseen perustuen. Koneoppiminen voi tehdä päätöksiä minimaalisella ihmisen väliintulolla.

Vertaamalla Tekoäly Vs. koneoppiminen, koneoppiminen käyttää dataa syöttämään algoritmia, joka voi ymmärtää syötteen ja lähdön välisen suhteen. Kun kone on lopettanut oppimisen, se voi ennustaa uuden datapisteen arvon tai luokan.

Mitä on syväoppiminen (DL)?

Deep learning on tietokoneohjelmisto, joka jäljittelee aivojen neuronien verkkoa. Se on koneoppimisen osajoukko, ja sitä kutsutaan syväoppimiseksi, koska se hyödyntää syviä hermoverkkoja. Kone käyttää eri tasoja oppiakseen tiedoista. Mallin syvyyttä edustaa mallin kerrosten lukumäärä. Syväoppiminen on tekoälyn uusinta huippua. Syväoppimisessa oppimisvaihe tapahtuu hermoverkon kautta. Neuraaliverkko on arkkitehtuuri, jossa kerrokset on pinottu päällekkäin

Syväoppiminen (DL)

Koneoppimisen ja syväoppimisen välinen ero

Alla on keskeinen ero syvän oppimisen ja koneoppimisen välillä

Parametri Koneen oppiminen Deep Learning
Tietojen riippuvuudet Erinomaiset suorituskyvyt pienessä/keskikokoisessa tietojoukossa Erinomainen suorituskyky suuressa tietojoukossa
Laitteistoriippuvuudet Työskentele halvemmalla koneella. Vaatii tehokkaan koneen, mieluiten GPU:lla: DL suorittaa huomattavan määrän matriisin kertolaskua
Ominaisuuksien suunnittelu On ymmärrettävä tietoja edustavat ominaisuudet Sinun ei tarvitse ymmärtää parasta ominaisuutta, joka edustaa tietoja
Toteutusaika Muutamasta minuutista tunteihin Jopa viikkoja. Neuroverkon on laskettava huomattava määrä painotuksia
tulkittavuutta Jotkut algoritmit ovat helppoja tulkita (logistiikka, päätöspuu), jotkut ovat lähes mahdottomia (SVM, XGBoost) Vaikeasta mahdottomaan

Milloin käyttää ML tai DL?

Alla olevassa taulukossa teemme yhteenvedon eroista koneoppiminen ja syvä oppiminen esimerkkien avulla.

Parametri Koneen oppiminen Deep Learning
Koulutuksen tietojoukko Pieni Suuri
Valitse ominaisuuksia Kyllä Ei
Algoritmien määrä Paljon Harvat
Harjoitteluaika Lyhyt Pitkät

Koneoppimisen avulla tarvitset vähemmän dataa algoritmin opettamiseen kuin syväoppimisen. Syväoppiminen vaatii laajan ja monipuolisen tietojoukon taustarakenteen tunnistamiseksi. Lisäksi koneoppiminen tarjoaa nopeammin koulutetun mallin. Edistyneemmän syväoppimisen arkkitehtuurin harjoittelu voi kestää päivistä viikkoon. Syväoppimisen etuna koneoppimiseen verrattuna on se, että se on erittäin tarkka. Sinun ei tarvitse ymmärtää, mitkä ominaisuudet edustavat tietoja parhaiten; hermoverkko oppi valitsemaan kriittisiä ominaisuuksia. Koneoppimisessa sinun tulee itse valita, mitä ominaisuuksia malliin sisällyttää.

Deep Learning vs. Koneoppiminen vs. AI

Koneoppimisprosessi

Kuvittele, että sinun on tarkoitus rakentaa ohjelma, joka tunnistaa objektit. Mallin kouluttamiseen käytät a luokitella. Luokitin käyttää kohteen ominaisuuksia yrittääkseen tunnistaa luokan, johon se kuuluu.

Esimerkissä luokittelija opetetaan havaitsemaan, onko kuva:

  • Polkupyörä
  • Vene
  • Auto
  • Kone

Neljä yllä olevaa objektia ovat luokka, joka luokittelijan on tunnistettava. Luokittelijan rakentamiseksi sinun on syötettävä tietoja ja määritettävä sille nimike. Algoritmi ottaa nämä tiedot, löytää kuvion ja luokittelee sen sitten vastaavaan luokkaan.

Tämä tehtävä on ns valvottu oppiminen. Valvotussa oppimisessa algoritmiin syöttämäsi harjoitustiedot sisältävät tunnisteen.

Algoritmin opettaminen edellyttää muutaman vakiovaiheen noudattamista:

  • Kerää tiedot
  • Harjoittele luokittelijaa
  • Tehdä ennustuksia

Ensimmäinen askel on välttämätön, oikeiden tietojen valitseminen tekee algoritmista onnistuneen tai epäonnistuneen. Mallin kouluttamiseen valitsemiasi tietoja kutsutaan a ominaisuus. Kohdeesimerkissä piirteet ovat kuvien pikseleitä.

Jokainen kuva on rivi tiedoissa, kun taas jokainen pikseli on sarake. Jos kuvasi koko on 28×28, tietojoukko sisältää 784 saraketta (28×28). Alla olevassa kuvassa jokainen kuva on muunnettu piirrevektoriksi. Tarra kertoo tietokoneelle, mikä objekti kuvassa on.

Koneoppimisprosessi
Koneoppimisprosessi

Tavoitteena on käyttää näitä harjoitustietoja objektityypin luokitteluun. Ensimmäinen vaihe koostuu ominaisuussarakkeiden luomisesta. Sitten toinen vaihe sisältää algoritmin valitsemisen mallin kouluttamiseksi. Kun koulutus on suoritettu, malli ennustaa, mikä kuva vastaa mitäkin esinettä.

Sen jälkeen mallin avulla on helppo ennustaa uusia kuvia. Jokaisella malliin syötetyllä uudella kuvalla kone ennustaa luokan, johon se kuuluu. Esimerkiksi kokonaan uusi kuva ilman tarraa käy mallin läpi. Ihmiselle on triviaalia visualisoida kuva autona. Kone käyttää aikaisempaa tietoaan ennustaakseen, että kuva on myös auto.

Syväoppimisprosessi

Syväoppimisessa oppimisvaihe tapahtuu hermoverkon kautta. Neuraaliverkko on arkkitehtuuri, jossa kerrokset on pinottu päällekkäin.

Harkitse samaa kuvaesimerkkiä yllä. Harjoitussarja syötettäisiin hermoverkkoon

Jokainen syöte menee neuroniin ja kerrotaan painolla. Kertomisen tulos virtaa seuraavaan kerrokseen ja siitä tulee syöte. Tämä prosessi toistetaan jokaiselle verkon kerrokselle. Viimeinen kerros on nimeltään tulostuskerros; se antaa todellisen arvon regressiotehtävälle ja kunkin luokan todennäköisyyden luokitustehtävälle. Neuraaliverkko käyttää matemaattista algoritmia päivittääkseen kaikkien neuronien painot. Neuraaliverkko on täysin koulutettu, kun painojen arvo antaa lähelle todellisuutta. Esimerkiksi hyvin koulutettu hermoverkko voi tunnistaa kohteen kuvassa perinteistä hermoverkkoa tarkemmalla tarkkuudella.

Syväoppimisprosessi

Syväoppimisprosessi

Automatisoi ominaisuuksien purkaminen DL:n avulla

Tietojoukko voi sisältää kymmeniä tai satoja ominaisuuksia. Järjestelmä oppii näiden ominaisuuksien merkityksestä. Kaikki ominaisuudet eivät kuitenkaan ole algoritmin kannalta merkityksellisiä. Koneoppimisen tärkeä osa on löytää asiaankuuluvat ominaisuudet, jotta järjestelmä oppii jotain.

Yksi tapa suorittaa tämä osa koneoppimisessa on käyttää ominaisuuksien purkamista. Ominaisuuksien poiminta yhdistää olemassa olevat ominaisuudet luodakseen osuvamman joukon ominaisuuksia. Se voidaan tehdä PCA:lla, T-SNE:llä tai millä tahansa muulla ulottuvuuden vähentämisalgoritmeilla.

Esimerkiksi kuvankäsittelyssä ammatinharjoittajan on poistettava kuvasta käsin piirre, kuten silmät, nenä, huulet ja niin edelleen. Nämä poimitut ominaisuudet syötetään luokitusmalliin.

Syväoppiminen ratkaisee tämän ongelman, erityisesti konvoluutiohermoverkossa. Neuroverkon ensimmäinen kerros oppii pienet yksityiskohdat kuvasta; seuraavat kerrokset yhdistävät aiemman tiedon monimutkaisemman tiedon saamiseksi. Konvoluutiohermoverkossa piirteiden poimiminen tehdään suodattimen avulla. Verkko käyttää suodatinta kuvaan nähdäkseen, onko siinä täsmää, eli piirteen muoto on identtinen kuvan osan kanssa. Jos osuma löytyy, verkko käyttää tätä suodatinta. Ominaisuuden poiminta tapahtuu siten automaattisesti.

Perinteinen koneoppiminen vs. syväoppiminen
Perinteinen koneoppiminen vs. syväoppiminen

Yhteenveto

Tekoäly antaa koneelle kognitiivisen kyvyn. Tekoälyä ja koneoppimista verrattaessa varhaiset tekoälyjärjestelmät käyttivät mallinsovitus- ja asiantuntijajärjestelmiä.

Koneoppimisen ideana on, että kone voi oppia ilman ihmisen väliintuloa. Koneen on löydettävä tapa oppia ratkaisemaan tehtävä datan perusteella.

Syväoppiminen on läpimurto tekoälyn alalla. Kun koulutusta varten on riittävästi dataa, syväoppiminen saavuttaa vaikuttavia tuloksia erityisesti kuvantunnistuksessa ja tekstin kääntämisessä. Pääsyynä on, että ominaisuuksien purkaminen tapahtuu automaattisesti verkon eri kerroksissa.