Erinevus masinõppe ja süvaõppe vahel

Peamised erinevused masinõppe ja süvaõppe vahel

Peamised erinevused masinõppe ja süvaõppe vahel on järgmised:

  • Masinõpe pakub suurepärast jõudlust väikese/keskmise andmestiku puhul, samas kui süvaõpe pakub suurepärast jõudlust suure andmestiku puhul
  • ML töötab madala kvaliteediga masinatel, samas kui DL nõuab võimsat masinat, eelistatavalt GPU-ga.
  • Masinõppe täitmisaeg mõnest minutist tundideni, süvaõppeks aga kuni nädalaid.
  • Masinõppe puhul vajate algoritmi treenimiseks vähem andmeid kui süvaõppe puhul. Süvaõpe nõuab põhjaliku struktuuri tuvastamiseks ulatuslikku ja mitmekesist andmekogumit.
Erinevus ML ja DL vahel
Erinevus ML ja DL vahel

Mis on AI?

AI (tehisintellekt) on arvutiteaduse haru, milles masinad on programmeeritud ja neile antakse kognitiivne võime mõelda ja jäljendada tegevusi nagu inimesed ja loomad. Tehisintellekti etaloniks on inimese intelligentsus arutlemise, kõne, õppimise, nägemise ja probleemide lahendamise osas, mis on kaugel tulevikus.

AI-l on kolm erinevat taset

1) Kitsas AI: Tehisintellekti kohta öeldakse kitsas, kui masin suudab konkreetset ülesannet paremini täita kui inimene. Praegune tehisintellekti uurimine on nüüd käes
2) Üldine AI: tehisintellekt jõuab üldisesse olekusse, kui see suudab täita mis tahes intellektuaalset ülesannet sama täpsusega kui inimene
3) Aktiivne AI: AI on aktiivne, kui see suudab paljudes ülesannetes inimesi ületada

Varajased AI süsteemid kasutasid mustrite sobitamist ja ekspertsüsteemid.

Tehisintellekti süsteemi ülevaade
Tehisintellekti süsteemi ülevaade

Mis on masinõpe (ML)?

ML (Masinõpe) on tehisintellekti tüüp, mille puhul arvutit õpetatakse automatiseerima ülesandeid, mis on inimese jaoks ammendavad või võimatud. See on parim tööriist arvutialgoritmide uurimisel põhinevate andmete mustrite analüüsimiseks, mõistmiseks ja tuvastamiseks. Masinõpe võib teha otsuseid minimaalse inimese sekkumisega.

Võrreldes Tehisintellekt vs masinõpe, masinõpe kasutab andmeid, et edastada algoritmi, mis suudab mõista sisendi ja väljundi vahelist seost. Kui masin on õppimise lõpetanud, suudab see ennustada uue andmepunkti väärtuse või klassi.

Mis on süvaõpe (DL)?

Süvaõpe on arvutitarkvara, mis jäljendab aju neuronite võrku. See on masinõppe alamhulk ja seda nimetatakse sügavaks õppimiseks, kuna see kasutab sügavaid närvivõrke. Masin kasutab andmetest õppimiseks erinevaid kihte. Mudeli sügavust väljendab mudeli kihtide arv. Süvaõpe on tehisintellekti mõistes uus tipptase. Süvaõppe puhul toimub õppimisfaas läbi närvivõrgu. Närvivõrk on arhitektuur, kus kihid on virnastatud üksteise peale

Süvaõpe (DL)

Erinevus masinõppe ja süvaõppe vahel

Allpool on peamine erinevus süvaõppe ja masinõppe vahel

Parameeter Masinõpe Sügav õppimine
Andmesõltuvused Suurepärased jõudlused väikeses/keskmises andmestikus Suurepärane jõudlus suure andmekogumi puhul
Riistvara sõltuvused Töötage madala kvaliteediga masinaga. Nõuab võimsat masinat, eelistatavalt GPU-ga: DL teostab märkimisväärsel hulgal maatriksikorrutamist
Funktsioonide projekteerimine Peate mõistma funktsioone, mis andmeid esindavad Pole vaja mõista parimat funktsiooni, mis andmeid esindab
Täitmise aeg Mõnest minutist kuni tunnini Kuni nädalaid. Närvivõrk peab arvutama märkimisväärse arvu kaalusid
Tõlgendatavus Mõnda algoritmi on lihtne tõlgendada (logistika, otsustuspuu), mõnda on peaaegu võimatu (SVM, XGBoost) Raske kuni võimatu

Millal kasutada ML-i või DL-i?

Allolevas tabelis võtame kokku erinevuse masinõpe ja sügav õpe näidetega.

Parameeter Masinõpe Sügav õppimine
Koolituse andmestik väike Suur
Valige funktsioonid Jah Ei
Algoritmide arv Palju Vähe
Treeningu aeg Lühike Pikk

Masinõppe puhul vajate algoritmi treenimiseks vähem andmeid kui süvaõppe puhul. Süvaõpe nõuab põhjaliku struktuuri tuvastamiseks ulatuslikku ja mitmekesist andmekogumit. Lisaks pakub masinõpe kiiremini koolitatud mudelit. Enamiku arenenud süvaõppe arhitektuuri koolitamiseks võib kuluda päevi kuni nädal. Süvaõppe eelis masinõppe ees on see, et see on väga täpne. Te ei pea mõistma, millised funktsioonid on andmete parim esitus; närvivõrk õppis, kuidas valida kriitilisi funktsioone. Masinõppes peate ise valima, milliseid funktsioone mudelisse lisada.

Süvaõpe vs. Masinõpe vs. AI

Masinõppeprotsess

Kujutage ette, et teie eesmärk on luua programm, mis tuvastab objekte. Modelli koolitamiseks kasutate a klassifikaator. Klassifikaator kasutab objekti tunnuseid, et proovida tuvastada klassi, kuhu see kuulub.

Näites koolitatakse klassifikaatorit tuvastama, kas pilt on:

  • Jalgratas
  • paat
  • auto
  • Lennuk

Neli ülaltoodud objekti on klass, mille klassifikaator peab ära tundma. Klassifikaatori koostamiseks peavad teil olema sisendandmed ja need peavad määrama sellele sildi. Algoritm võtab need andmed, leiab mustri ja klassifitseerib selle seejärel vastavasse klassi.

Seda ülesannet nimetatakse juhendatud õppimine. Juhendatud õppe puhul sisaldavad algoritmile sisestatavad treeningandmed silti.

Algoritmi väljaõpetamiseks tuleb järgida mõnda standardset sammu:

  • Koguge andmeid
  • Treenige klassifikaatorit
  • Tehke ennustusi

Esimene samm on vajalik, õigete andmete valimine muudab algoritmi edukaks või ebaõnnestumiseks. Andmeid, mille valite mudeli koolitamiseks, nimetatakse a funktsioon. Objekti näites on tunnusteks piltide pikslid.

Iga pilt on andmete rida, samas kui iga piksel on veerg. Kui teie pildi suurus on 28 × 28, sisaldab andmestik 784 veergu (28 × 28). Alloleval pildil on iga pilt teisendatud tunnusvektoriks. Silt ütleb arvutile, milline objekt on pildil.

Masinõppeprotsess
Masinõppeprotsess

Eesmärk on kasutada neid koolitusandmeid objekti tüübi klassifitseerimiseks. Esimene samm seisneb funktsioonide veergude loomises. Seejärel hõlmab teine ​​samm mudeli treenimiseks algoritmi valimist. Kui koolitus on tehtud, ennustab modell, milline pilt millisele objektile vastab.

Pärast seda on mudelit lihtne kasutada uute piltide ennustamiseks. Iga mudelisse sisestatava uue pildi puhul ennustab masin, millisesse klassi see kuulub. Näiteks läbib mudeli täiesti uus sildita pilt. Inimese jaoks on triviaalne kujutada pilti autona. Masin kasutab oma varasemaid teadmisi, et ennustada, et pilt on auto.

Süvaõppe protsess

Süvaõppe puhul toimub õppimisfaas läbi närvivõrgu. Närvivõrk on arhitektuur, kus kihid on virnastatud üksteise peale.

Vaatleme sama ülaltoodud pildi näidet. Treeningkomplekt suunataks närvivõrku

Iga sisend siseneb neuronisse ja korrutatakse kaaluga. Korrutamise tulemus liigub järgmisse kihti ja sellest saab sisend. Seda protsessi korratakse võrgu iga kihi jaoks. Viimase kihi nimi on väljundkiht; see annab regressiooniülesande tegeliku väärtuse ja klassifitseerimisülesande iga klassi tõenäosuse. Närvivõrk kasutab kõigi neuronite kaalu värskendamiseks matemaatilist algoritmi. Närvivõrk on täielikult treenitud, kui kaalude väärtus annab tegelikkusele lähedase väljundi. Näiteks suudab hästi koolitatud närvivõrk ära tunda pildil oleva objekti suurema täpsusega kui traditsiooniline närvivõrk.

Süvaõppe protsess

Süvaõppe protsess

Funktsioonide ekstraheerimise automatiseerimine DL-i abil

Andmekogum võib sisaldada tosinat kuni sadu funktsioone. Süsteem õpib nende funktsioonide asjakohasusest. Kuid mitte kõik funktsioonid pole algoritmi jaoks olulised. Masinõppe oluline osa on leida asjakohane funktsioonide komplekt, et süsteem saaks midagi õppida.

Üks viis selle osa teostamiseks masinõppes on funktsioonide ekstraktsiooni kasutamine. Funktsioonide eraldamine ühendab olemasolevad funktsioonid, et luua asjakohasem funktsioonide komplekt. Seda saab teha PCA, T-SNE või mõne muu mõõtmete vähendamise algoritmiga.

Näiteks pilditöötluse puhul peab arst pildist käsitsi eraldama funktsiooni, nagu silmad, nina, huuled ja nii edasi. Need eraldatud funktsioonid suunatakse klassifitseerimismudelisse.

Sügav õppimine lahendab selle probleemi, eriti konvolutsioonilise närvivõrgu puhul. Närvivõrgu esimene kiht õpib pildilt väikseid detaile; järgmised kihid ühendavad varasemad teadmised, et saada keerulisem teave. Konvolutsioonilises närvivõrgus toimub funktsioonide eraldamine filtri abil. Võrk rakendab pildile filtri, et näha, kas see on sobiv, st funktsiooni kuju on identne pildi osaga. Kui on sobivus, kasutab võrk seda filtrit. Funktsioonide eraldamise protsess toimub seetõttu automaatselt.

Traditsiooniline masinõpe vs süvaõpe
Traditsiooniline masinõpe vs süvaõpe

kokkuvõte

Tehisintellekt annab masinale kognitiivse võime. Tehisintellekti ja masinõppe võrdlemisel kasutasid varased AI-süsteemid mustrite sobitamise ja ekspertsüsteeme.

Masinõppe idee seisneb selles, et masin saab õppida ilma inimese sekkumiseta. Masin peab leidma viisi, kuidas õppida, kuidas andmete alusel ülesannet lahendada.

Süvaõpe on tehisintellekti valdkonna läbimurre. Kui treenimiseks on piisavalt andmeid, saavutab sügavõpe muljetavaldavaid tulemusi, eriti pildituvastuse ja teksti tõlkimise osas. Peamine põhjus on see, et funktsioonide ekstraheerimine toimub võrgu erinevates kihtides automaatselt.

Võta see postitus kokku järgmiselt: