Diferența dintre învățarea automată și învățarea profundă
Diferența cheie între învățarea automată și învățarea profundă
Principalele diferențe dintre Machine Learning și Deep Learning sunt:
- Machine Learning oferă performanțe excelente pe un set de date mic/mediu, în timp ce Deep Learning oferă performanțe excelente pe un set de date mare
- ML funcționează pe o mașină low-end, în timp ce DL necesită o mașină puternică, de preferință cu GPU.
- Timpul de execuție a învățării automate de la câteva minute la ore, în timp ce învățarea profundă durează până la săptămâni.
- Cu învățarea automată, aveți nevoie de mai puține date pentru a antrena algoritmul decât învățarea profundă. Învățarea profundă necesită un set extins și divers de date pentru a identifica structura de bază.
Ce este AI?
AI (Inteligenta artificiala) este o ramură a informaticii în care mașinile sunt programate și li se oferă o capacitate cognitivă de a gândi și de a imita acțiuni precum oamenii și animalele. Criteriul de referință pentru AI este inteligența umană în ceea ce privește raționamentul, vorbirea, învățarea, viziunea și rezolvarea problemelor, care este departe în viitor.
AI are trei niveluri diferite
1) AI îngustă: Se spune că o inteligență artificială este îngustă atunci când mașina poate îndeplini o anumită sarcină mai bine decât un om. Cercetarea actuală a AI este aici acum
2) AI generală: O inteligență artificială ajunge la starea generală când poate îndeplini orice sarcină intelectuală cu același nivel de precizie ca și un om.
3) AI activă: O IA este activă atunci când poate învinge oamenii în multe sarcini
Sistemele AI timpurii foloseau potrivirea modelelor și sistem expert.
Ce este Machine Learning (ML)?
ML (Invatare mecanica) este un tip de IA în care un computer este antrenat să automatizeze sarcini care sunt exhaustive sau imposibile pentru ființe umane. Este cel mai bun instrument pentru a analiza, înțelege și identifica modele în date bazate pe studiul algoritmilor de computer. Învățarea automată poate lua decizii cu o intervenție umană minimă.
Comparând Inteligența artificială vs. Machine Learning, Machine Learning folosește date pentru a alimenta un algoritm care poate înțelege relația dintre intrare și ieșire. Când mașina a terminat de învățat, poate prezice valoarea sau clasa unui nou punct de date.
Ce este Deep Learning (DL)?
Învățarea profundă este un software de calculator care imită rețeaua de neuroni dintr-un creier. Este un subset al învățării automate și se numește învățare profundă deoarece folosește rețele neuronale profunde. Aparatul folosește diferite straturi pentru a învăța din date. Adâncimea modelului este reprezentată de numărul de straturi din model. Învățarea profundă este noul stadiu al tehnicii în ceea ce privește inteligența artificială. În deep learning, faza de învățare se face printr-o rețea neuronală. O rețea neuronală este o arhitectură în care straturile sunt stivuite unul peste altul
Diferența dintre Machine Learning și Deep Learning
Mai jos este o diferență cheie între Deep Learning și Machine Learning
Parametru | Invatare mecanica | Invatare profunda |
---|---|---|
Dependențe de date | Performanțe excelente pe un set de date mic/mediu | Performanță excelentă pe un set de date mare |
Dependențe hardware | Lucrați la o mașină de calitate scăzută. | Necesită o mașină puternică, de preferință cu GPU: DL efectuează o cantitate semnificativă de multiplicare a matricei |
Ingineria caracteristicilor | Trebuie să înțelegeți caracteristicile care reprezintă datele | Nu este nevoie să înțelegeți cea mai bună caracteristică care reprezintă datele |
Timpul de execuție | De la câteva minute la ore | Până la săptămâni. Rețeaua neuronală trebuie să calculeze un număr semnificativ de greutăți |
interpretabilitate | Unii algoritmi sunt ușor de interpretat (logistici, arbore de decizie), alții sunt aproape imposibili (SVM, XGBoost) | Din greu spre imposibil |
Când să folosiți ML sau DL?
În tabelul de mai jos, rezumăm diferența dintre masina de învățare si învățare profundă cu exemple.
Parametru | Invatare mecanica | Invatare profunda |
---|---|---|
Set de date de antrenament | Mic | Mare |
Alegeți caracteristicile | Da | Nu |
Numărul de algoritmi | Multe | Puţini |
Timpul antrenamentului | Pantaloni scurți | Lung |
Cu învățarea automată, aveți nevoie de mai puține date pentru a antrena algoritmul decât învățarea profundă. Învățarea profundă necesită un set extins și divers de date pentru a identifica structura de bază. În plus, învățarea automată oferă un model mai rapid antrenat. Cea mai avansată arhitectură de învățare profundă poate dura câteva zile până la o săptămână pentru a se antrena. Avantajul învățării profunde față de învățarea automată este că este foarte precisă. Nu trebuie să înțelegeți ce caracteristici reprezintă cea mai bună reprezentare a datelor; rețeaua neuronală a învățat cum să selecteze caracteristicile critice. În învățarea automată, trebuie să alegeți singur ce caracteristici să includeți în model.
Procesul de învățare automată
Imaginează-ți că ești menit să construiești un program care recunoaște obiectele. Pentru a antrena modelul, veți folosi a clasifica. Un clasificator folosește caracteristicile unui obiect pentru a încerca să identifice clasa căreia îi aparține.
În exemplu, clasificatorul va fi antrenat să detecteze dacă imaginea este:
- bicicletă
- Barcă
- Mașină
- Plan
Cele patru obiecte de mai sus sunt clasa pe care trebuie să o recunoască clasificatorul. Pentru a construi un clasificator, trebuie să aveți câteva date ca intrare și să îi atribuiți o etichetă. Algoritmul va prelua aceste date, va găsi un model și apoi îl va clasifica în clasa corespunzătoare.
Această sarcină se numește învățare supravegheată. În învățarea supravegheată, datele de antrenament pe care le furnizați algoritmului includ o etichetă.
Antrenarea unui algoritm necesită să urmați câțiva pași standard:
- Colectați datele
- Antrenează clasificatorul
- A face predictii
Primul pas este necesar, alegerea datelor potrivite va face ca algoritmul să fie un succes sau un eșec. Datele pe care le alegeți pentru a antrena modelul se numesc a caracteristică. În exemplul de obiect, caracteristicile sunt pixelii imaginilor.
Fiecare imagine este un rând în date, în timp ce fiecare pixel este o coloană. Dacă imaginea dvs. are o dimensiune de 28×28, setul de date conține 784 de coloane (28×28). În imaginea de mai jos, fiecare imagine a fost transformată într-un vector caracteristic. Eticheta îi spune computerului ce obiect se află în imagine.
Obiectivul este de a utiliza aceste date de antrenament pentru a clasifica tipul de obiect. Primul pas constă în crearea coloanelor de caracteristici. Apoi, al doilea pas implică alegerea unui algoritm care să antreneze modelul. Când antrenamentul este încheiat, modelul va prezice ce imagine corespunde cu ce obiect.
După aceea, este ușor să utilizați modelul pentru a prezice imagini noi. Pentru fiecare nouă imagine introdusă în model, aparatul va prezice clasa căreia îi aparține. De exemplu, o imagine complet nouă, fără etichetă, trece prin model. Pentru o ființă umană, este banal să vizualizeze imaginea ca pe o mașină. Mașina își folosește cunoștințele anterioare pentru a prezice și imaginea este o mașină.
Proces de învățare profundă
În deep learning, faza de învățare se face printr-o rețea neuronală. O rețea neuronală este o arhitectură în care straturile sunt stivuite unul peste altul.
Luați în considerare același exemplu de imagine de mai sus. Setul de antrenament va fi alimentat către o rețea neuronală
Fiecare intrare intră într-un neuron și este înmulțită cu o greutate. Rezultatul înmulțirii curge la stratul următor și devine intrarea. Acest proces se repetă pentru fiecare strat al rețelei. Stratul final este numit stratul de ieșire; oferă o valoare reală pentru sarcina de regresie și o probabilitate a fiecărei clase pentru sarcina de clasificare. Rețeaua neuronală folosește un algoritm matematic pentru a actualiza greutățile tuturor neuronilor. Rețeaua neuronală este complet antrenată atunci când valoarea ponderilor oferă o ieșire apropiată de realitate. De exemplu, o rețea neuronală bine antrenată poate recunoaște obiectul dintr-o imagine cu o precizie mai mare decât rețeaua neuronală tradițională.
Automatizați extragerea caracteristicilor folosind DL
Un set de date poate conține de la duzină la sute de caracteristici. Sistemul va învăța din relevanța acestor caracteristici. Cu toate acestea, nu toate caracteristicile sunt semnificative pentru algoritm. O parte esențială a învățării automate este găsirea unui set relevant de caracteristici pentru ca sistemul să învețe ceva.
O modalitate de a efectua această parte în învățarea automată este utilizarea extragerii caracteristicilor. Extragerea caracteristicilor combină caracteristicile existente pentru a crea un set mai relevant de caracteristici. Se poate face cu PCA, T-SNE sau orice alți algoritmi de reducere a dimensionalității.
De exemplu, o prelucrare a imaginii, practicantul trebuie să extragă manual caracteristica din imagine, cum ar fi ochii, nasul, buzele și așa mai departe. Aceste caracteristici extrase sunt transmise modelului de clasificare.
Învățarea profundă rezolvă această problemă, în special pentru o rețea neuronală convoluțională. Primul strat al unei rețele neuronale va învăța mici detalii din imagine; straturile următoare vor combina cunoștințele anterioare pentru a face informații mai complexe. În rețeaua neuronală convoluțională, extragerea caracteristicilor se face cu utilizarea filtrului. Rețeaua aplică un filtru imaginii pentru a vedea dacă există o potrivire, adică forma caracteristicii este identică cu o parte a imaginii. Dacă există o potrivire, rețeaua va folosi acest filtru. Prin urmare, procesul de extragere a caracteristicilor se face automat.
Rezumat
Inteligența artificială conferă o abilitate cognitivă unei mașini. Comparând AI vs Machine Learning, sistemele AI timpurii au folosit potrivirea modelelor și sisteme expert.
Ideea din spatele învățării automate este că mașina poate învăța fără intervenția umană. Mașina trebuie să găsească o modalitate de a învăța cum să rezolve o sarcină având în vedere datele.
Învățarea profundă este o descoperire în domeniul inteligenței artificiale. Când există suficiente date pentru antrenament, învățarea profundă obține rezultate impresionante, în special pentru recunoașterea imaginilor și traducerea textului. Motivul principal este că extragerea caracteristicilor se face automat în diferitele straturi ale rețelei.