Învățare supravegheată vs. nesupravegheată: diferența dintre ele
Diferența cheie între învățarea supravegheată și nesupravegheată
- În învățarea supravegheată, antrenați mașina folosind date care sunt bine „etichetate”.
- Învățarea nesupravegheată este o tehnică de învățare automată, în care nu trebuie să supravegheați modelul.
- Învățarea supravegheată vă permite să colectați date sau să produceți o ieșire de date din experiența anterioară.
- Învățarea automată nesupravegheată vă ajută să găsiți tot felul de modele necunoscute în date.
- Regresia și clasificarea sunt două tipuri de tehnici de învățare automată supravegheată.
- Clustering și asociere sunt două tipuri de învățare nesupravegheată.
- Într-un model de învățare supravegheată, variabilele de intrare și de ieșire vor fi date, în timp ce în cazul modelului de învățare nesupravegheată, vor fi date numai datele de intrare
Ce este învățarea automată supravegheată?
În învățarea supravegheată, antrenați mașina folosind date care sunt bune „etichetat.” Înseamnă că unele date sunt deja etichetate cu răspunsul corect. Poate fi comparat cu învățarea care are loc în prezența unui supervizor sau a unui profesor.
Un algoritm de învățare supravegheat învață din datele de antrenament etichetate, vă ajută să preziceți rezultatele pentru datele neprevăzute. Construirea, scalarea și implementarea cu succes a modelului de învățare automată supravegheată precisă a științei datelor necesită timp și expertiză tehnică de la o echipă de oameni de știință de date cu înaltă calificare. În plus, Data Scientist trebuie să reconstruiască modele pentru a se asigura că informațiile oferite rămân adevărate până când datele sale se schimbă.
Ce este învățarea nesupravegheată?
Învățarea nesupravegheată este o tehnică de învățare automată, în care nu trebuie să supravegheați modelul. În schimb, trebuie să permiteți modelului să funcționeze singur pentru a descoperi informații. Se ocupă în principal de datele neetichetate.
Algoritmii de învățare nesupravegheată vă permit să efectuați sarcini de procesare mai complexe în comparație cu învățarea supravegheată. Deși, învățarea nesupravegheată poate fi mai imprevizibilă în comparație cu alte metode de învățare profundă și de învățare prin întărire naturală.
De ce învățare supravegheată?
- Învățarea supravegheată vă permite să colectați date sau să produceți o ieșire de date din experiența anterioară.
- Vă ajută să optimizați criteriile de performanță folosind experiența
- Învățarea automată supravegheată vă ajută să rezolvați diferite tipuri de probleme de calcul din lumea reală.
De ce învățare nesupravegheată?
Iată principalele motive pentru a utiliza învățarea nesupravegheată:
- Învățarea automată nesupravegheată găsește tot felul de modele necunoscute în date.
- Metodele nesupravegheate vă ajută să găsiți caracteristici care pot fi utile pentru clasificare.
- Are loc în timp real, astfel încât toate datele de intrare să fie analizate și etichetate în prezența cursanților.
- Este mai ușor să obțineți date neetichetate de la un computer decât date etichetate, care necesită intervenție manuală.
Cum funcționează învățarea supravegheată?
De exemplu, vrei să antrenezi o mașină care să te ajute să prezici cât timp îți va dura să conduci acasă de la locul de muncă. Aici, începeți prin a crea un set de date etichetate. Aceste date includ
- Conditiile meteo
- Timpul zilei
- Concediu
Toate aceste detalii sunt contribuțiile dvs. Ieșirea este timpul necesar pentru a ajunge acasă în ziua respectivă.
Știi din instinct că dacă afară plouă, atunci îți va lua mai mult timp să conduci acasă. Dar mașina are nevoie de date și statistici.
Să vedem acum cum puteți dezvolta un model de învățare supravegheat din acest exemplu, care să ajute utilizatorul să determine timpul de navetă. Primul lucru de care aveți nevoie pentru a crea este un set de date de antrenament. Acest set de antrenament va conține timpul total de navetă și factorii corespunzători, cum ar fi vremea, ora etc. Pe baza acestui set de antrenament, mașina dvs. poate vedea că există o relație directă între cantitatea de ploaie și timpul pe care îl veți lua pentru a ajunge acasă.
Deci, se constată că, cu cât plouă mai mult, cu atât vei conduce mai mult pentru a te întoarce acasă. S-ar putea să vadă, de asemenea, legătura dintre momentul în care părăsiți serviciul și momentul în care veți fi pe drum.
Cu cât te apropii de ora 6, cu atât îți ia mai mult timp până ajungi acasă. Aparatul dvs. poate găsi unele dintre relațiile cu datele dvs. etichetate.
Acesta este începutul modelului dvs. de date. Începe să influențeze modul în care ploaia afectează modul în care oamenii conduc. De asemenea, începe să se vadă că mai mulți oameni călătoresc într-un anumit moment al zilei.
Cum funcționează învățarea nesupravegheată?
Să luăm cazul unui copil și al câinelui familiei ei.
Ea cunoaște și identifică acest câine. Câteva săptămâni mai târziu, un prieten de familie aduce un câine și încearcă să se joace cu copilul.
Bebeluşul nu a văzut acest câine mai devreme. Dar recunoaște că multe trăsături (2 urechi, ochi, mers pe 4 picioare) sunt ca și câinele ei de companie. Ea identifică un nou animal ca un câine. Aceasta este o învățare nesupravegheată, în care nu ești învățat, dar înveți din date (în acest caz date despre un câine). Dacă ar fi fost învățare supravegheată, prietenul de familie i-ar fi spus bebelușului că este un câine.
Tipuri de tehnici de învățare automată supravegheată
Regres
Tehnica de regresie prezice o singură valoare de ieșire folosind datele de antrenament.
Exemplu: puteți folosi regresia pentru a estima prețul casei din datele de instruire. Variabilele de intrare vor fi localitatea, dimensiunea unei case etc.
Clasificare
Clasificare înseamnă gruparea rezultatelor în interiorul unei clase. Dacă algoritmul încearcă să eticheteze intrarea în două clase distincte, se numește clasificare binară. Selectarea între mai mult de două clase este denumită clasificare multiclasă.
Exemplu: Stabilirea dacă cineva va fi sau nu debitor al împrumutului.
Atuuri: Ieșirile au întotdeauna o interpretare probabilistică, iar algoritmul poate fi regularizat pentru a evita supraadaptarea.
Puncte slabe: Regresia logistică poate avea performanțe slabe atunci când există limite de decizie multiple sau neliniare. Această metodă nu este flexibilă, deci nu surprinde relații mai complexe.
Tipuri de tehnici de învățare automată nesupravegheată
Probleme de învățare nesupravegheate grupate în continuare în probleme de grupare și asociere.
ClusterING
Clustering este un concept important atunci când vine vorba de învățare nesupravegheată. Se ocupă în principal cu găsirea unei structuri sau a unui model într-o colecție de date necategorizate. Clusteralgoritmii de operare vă vor procesa datele și vor găsi clustere (grupuri) naturale dacă acestea există în date. De asemenea, puteți modifica câte clustere ar trebui să identifice algoritmii dvs. Vă permite să ajustați granularitatea acestor grupuri.
Asociație
Regulile de asociere vă permit să stabiliți asocieri între obiectele de date din bazele de date mari. Această tehnică nesupravegheată este despre descoperirea unor relații interesante între variabilele din bazele de date mari. De exemplu, persoanele care cumpără o casă nouă cel mai probabil să cumpere mobilier nou.
Alte exemple:
- Un subgrup de pacienți cu cancer grupați după măsurătorile expresiei genice
- Grupuri de cumpărători pe baza istoricului lor de navigare și cumpărare
- Gruparea de filme în funcție de ratingul acordat de spectatorii de filme
Diferența dintre învățarea supravegheată și nesupravegheată
parametrii | Tehnica de învățare automată supravegheată | Tehnica de învățare automată nesupravegheată |
---|---|---|
Proces | Într-un model de învățare supravegheată, vor fi date variabilele de intrare și de ieșire. | În modelul de învățare nesupravegheat, vor fi date numai datele de intrare |
Date de intrare | Algorithms sunt instruiți folosind date etichetate. | Algorithms sunt utilizate împotriva datelor care nu sunt etichetate |
Algorithms ECHIPAMENTE | Sprijină mașină vectorială, rețea neuronală, regresie liniară și logistică, pădure aleatoare și arbori de clasificare. | Algoritmii nesupravegheați pot fi împărțiți în diferite categorii: like Cluster algoritmi, K-means, clustering ierarhic etc. |
Complexitatea computațională | Învățarea supravegheată este o metodă mai simplă. | Învățarea nesupravegheată este complexă din punct de vedere computațional |
Utilizarea datelor | Modelul de învățare supravegheată utilizează datele de instruire pentru a afla o legătură între intrare și ieșire. | Învățarea nesupravegheată nu utilizează date de ieșire. |
Precizia rezultatelor | Metodă extrem de precisă și de încredere. | Less metoda corecta si de incredere. |
Învățare în timp real | Metoda de învățare are loc offline. | Metoda de învățare are loc în timp real. |
Număr de clase | Numărul de clase este cunoscut. | Numărul de clase nu este cunoscut. |
Principalul dezavantaj | Clasificarea datelor mari poate fi o adevărată provocare în învățarea supravegheată. | Nu puteți obține informații precise cu privire la sortarea datelor, iar rezultatul ca date utilizate în învățarea nesupravegheată este etichetat și nu este cunoscut. |