Razlika između strojnog učenja i dubokog učenja

Ključna razlika između strojnog učenja i dubokog učenja

Glavne razlike između strojnog učenja i dubokog učenja su:

  • Strojno učenje pruža izvrsne performanse na malom/srednjem skupu podataka, dok duboko učenje pruža izvrsne performanse na velikom skupu podataka
  • ML radi na nižem stroju, dok DL zahtijeva moćan stroj, po mogućnosti s GPU-om.
  • Vrijeme izvršenja strojnog učenja od nekoliko minuta do sati, dok duboko učenje traje do tjedana.
  • Uz strojno učenje potrebno vam je manje podataka za treniranje algoritma nego kod dubokog učenja. Duboko učenje zahtijeva opsežan i raznolik skup podataka za prepoznavanje temeljne strukture.
Razlika između ML i DL
Razlika između ML i DL

Što je AI?

AI (umjetna inteligencija) je grana računalne znanosti u kojoj se strojevi programiraju i dobivaju kognitivnu sposobnost razmišljanja i oponašanja radnji poput ljudi i životinja. Mjerilo za umjetnu inteligenciju je ljudska inteligencija u pogledu razmišljanja, govora, učenja, vizije i rješavanja problema, što je daleko u budućnosti.

AI ima tri različite razine

1) Uska AI: Kaže se da je umjetna inteligencija ograničena kada stroj može izvršiti određeni zadatak bolje od čovjeka. Aktualno istraživanje umjetne inteligencije je sada ovdje
2) Opći AI: Umjetna inteligencija doseže opće stanje kada može izvršiti bilo koji intelektualni zadatak s istom razinom točnosti kao što bi to učinio čovjek
3) Aktivna umjetna inteligencija: AI je aktivan kada može pobijediti ljude u mnogim zadacima

Rani AI sustavi koristili su podudaranje uzoraka i ekspertni sustavi.

Pregled sustava umjetne inteligencije
Pregled sustava umjetne inteligencije

Što je strojno učenje (ML)?

ML (Strojno učenje) je vrsta umjetne inteligencije u kojoj je računalo osposobljeno za automatizaciju zadataka koji su iscrpljujući ili nemogući za ljudska bića. To je najbolji alat za analizu, razumijevanje i prepoznavanje uzoraka u podacima na temelju proučavanja računalnih algoritama. Strojno učenje može donositi odluke uz minimalnu ljudsku intervenciju.

Uspoređujući Umjetna inteligencija naspram strojnog učenja, strojno učenje koristi podatke za unos algoritma koji može razumjeti odnos između ulaza i izlaza. Kada stroj završi učenje, može predvidjeti vrijednost ili klasu nove podatkovne točke.

Što je duboko učenje (DL)?

Duboko učenje je računalni softver koji oponaša mrežu neurona u mozgu. To je podskup strojnog učenja i naziva se dubokim učenjem jer koristi duboke neuronske mreže. Stroj koristi različite slojeve za učenje iz podataka. Dubina modela je predstavljena brojem slojeva u modelu. Duboko učenje je novo stanje umjetnosti u smislu umjetne inteligencije. U dubokom učenju, faza učenja odvija se putem neuronske mreže. Neuronska mreža je arhitektura u kojoj su slojevi naslagani jedan na drugi

Duboko učenje (DL)

Razlika između strojnog učenja i dubokog učenja

Ispod je ključna razlika između dubokog učenja i strojnog učenja

Parametar Strojno učenje Duboko učenje
Ovisnosti podataka Izvrsne performanse na malom/srednjem skupu podataka Izvrsna izvedba na velikom skupu podataka
Hardverske ovisnosti Radite na jeftinijem stroju. Zahtijeva snažan stroj, po mogućnosti s GPU-om: DL izvodi značajnu količinu množenja matrice
Inženjering značajki Potrebno je razumjeti značajke koje predstavljaju podatke Ne morate razumjeti najbolju značajku koja predstavlja podatke
Vrijeme izvršavanja Od nekoliko minuta do sati Do tjedana. Neuronska mreža mora izračunati značajan broj težina
Interpretabilnost Neke algoritme je lako interpretirati (logistika, stablo odlučivanja), neki su gotovo nemogući (SVM, XGBoost) Teško do nemogućeg

Kada koristiti ML ili DL?

U tablici u nastavku rezimiramo razliku između stroj za učenje i duboko učenje s primjerima.

Parametar Strojno učenje Duboko učenje
Skup podataka za obuku Mali Veliki
Odaberite značajke Da Ne
Broj algoritama Mnogi Malo
Vrijeme treniranja Kratak Dug

Uz strojno učenje potrebno vam je manje podataka za treniranje algoritma nego kod dubokog učenja. Duboko učenje zahtijeva opsežan i raznolik skup podataka za prepoznavanje temeljne strukture. Osim toga, strojno učenje pruža model koji se brže obučava. Uvježbavanje najnaprednije arhitekture dubokog učenja može trajati od dana do tjedan dana. Prednost dubinskog učenja u odnosu na strojno učenje je njegova velika preciznost. Ne morate razumjeti koja su obilježja najbolji prikaz podataka; neuronska mreža je naučila kako odabrati kritične značajke. U strojnom učenju morate sami odabrati koje ćete značajke uključiti u model.

Duboko učenje vs. Strojno učenje vs. AI

Proces strojnog učenja

Zamislite da trebate izgraditi program koji prepoznaje objekte. Za treniranje modela upotrijebit ćete a razvrstati. Klasifikator koristi značajke objekta kako bi pokušao identificirati klasu kojoj pripada.

U primjeru, klasifikator će biti uvježban da otkrije je li slika:

  • Bicikl
  • Brod
  • Automobil
  • Avion

Četiri gornja objekta su klasa koju klasifikator mora prepoznati. Da biste izradili klasifikator, morate imati neke podatke kao ulaz i dodijeliti im oznaku. Algoritam će uzeti te podatke, pronaći uzorak i zatim ga klasificirati u odgovarajuću klasu.

Ovaj zadatak se zove nadzirano učenje. U nadziranom učenju, podaci o obuci koje unesete u algoritam uključuju oznaku.

Uvježbavanje algoritma zahtijeva slijedenje nekoliko standardnih koraka:

  • Prikupite podatke
  • Obučite klasifikatora
  • Izradite predviđanja

Prvi korak je neophodan, odabir pravih podataka će učiniti algoritam uspjehom ili neuspjehom. Podaci koje odaberete za obuku modela nazivaju se a značajka. U primjeru objekta, značajke su pikseli slika.

Svaka slika je red u podacima dok je svaki piksel stupac. Ako je vaša slika veličine 28×28, skup podataka sadrži 784 stupca (28×28). Na donjoj slici svaka je slika transformirana u vektor obilježja. Oznaka govori računalu koji je objekt na slici.

Proces strojnog učenja
Proces strojnog učenja

Cilj je koristiti te podatke o obuci za klasificiranje vrste objekta. Prvi korak sastoji se od stvaranja stupaca značajki. Zatim, drugi korak uključuje odabir algoritma za obuku modela. Kada je obuka gotova, model će predvidjeti koja slika odgovara kojem objektu.

Nakon toga, lako je koristiti model za predviđanje novih slika. Za svaku novu sliku unesenu u model, stroj će predvidjeti klasi kojoj pripada. Na primjer, potpuno nova slika bez oznake prolazi kroz model. Za čovjeka je trivijalno vizualizirati sliku kao automobil. Stroj koristi svoje prethodno znanje kako bi predvidio i sliku automobila.

Proces dubokog učenja

U dubokom učenju, faza učenja odvija se putem neuronske mreže. Neuronska mreža je arhitektura u kojoj su slojevi naslagani jedan na drugi.

Razmotrite isti primjer slike iznad. Skup za obuku bi se hranio neuronskom mrežom

Svaki ulaz ulazi u neuron i množi se težinom. Rezultat množenja teče na sljedeći sloj i postaje ulaz. Ovaj proces se ponavlja za svaki sloj mreže. Završni sloj se naziva izlazni sloj; pruža stvarnu vrijednost za zadatak regresije i vjerojatnost svake klase za zadatak klasifikacije. Neuronska mreža koristi matematički algoritam za ažuriranje težine svih neurona. Neuronska mreža je potpuno istrenirana kada vrijednost pondera daje izlaz blizak stvarnosti. Na primjer, dobro uvježbana neuronska mreža može prepoznati objekt na slici s većom točnošću od tradicionalne neuronske mreže.

Proces dubokog učenja

Proces dubokog učenja

Automatizirajte ekstrakciju značajki pomoću DL-a

Skup podataka može sadržavati desetak do stotina značajki. Sustav će učiti iz relevantnosti ovih značajki. Međutim, nisu sve značajke značajne za algoritam. Ključni dio strojnog učenja je pronaći relevantan skup značajki kako bi sustav naučio nešto.

Jedan od načina za izvođenje ovog dijela u strojnom učenju je korištenje ekstrakcije značajki. Ekstrakcija značajki kombinira postojeće značajke za stvaranje relevantnijeg skupa značajki. To se može učiniti pomoću PCA, T-SNE ili bilo kojeg drugog algoritma za smanjenje dimenzionalnosti.

Na primjer, prilikom obrade slike, stručnjak treba ručno izdvojiti značajku na slici kao što su oči, nos, usne i tako dalje. Te izdvojene značajke unose se u klasifikacijski model.

Duboko učenje rješava ovaj problem, posebno za konvolucijske neuronske mreže. Prvi sloj neuronske mreže naučit će male detalje iz slike; sljedeći slojevi će kombinirati prethodno znanje kako bi napravili složenije informacije. U konvolucijskoj neuronskoj mreži ekstrakcija značajki se vrši pomoću filtra. Mreža primjenjuje filtar na sliku kako bi vidjela postoji li podudaranje, tj. je li oblik značajke identičan dijelu slike. Ako postoji podudaranje, mreža će koristiti ovaj filtar. Proces izdvajanja značajki se stoga obavlja automatski.

Tradicionalno strojno učenje protiv dubokog učenja
Tradicionalno strojno učenje protiv dubokog učenja

rezime

Umjetna inteligencija prenosi kognitivnu sposobnost stroju. Uspoređujući AI i strojno učenje, rani AI sustavi koristili su podudaranje uzoraka i ekspertne sustave.

Ideja iza strojnog učenja jest da stroj može učiti bez ljudske intervencije. Stroj mora pronaći način da nauči kako riješiti zadatak s obzirom na podatke.

Duboko učenje je iskorak u području umjetne inteligencije. Kada postoji dovoljno podataka za vježbanje, duboko učenje postiže impresivne rezultate, posebno za prepoznavanje slika i prijevod teksta. Glavni razlog je što se izdvajanje značajki vrši automatski u različitim slojevima mreže.