Învățare automată supravegheată: ce este, Algorithms cu Exemple

Ce este învățarea automată supravegheată?

Învățare automată supravegheată este un algoritm care învață din datele de antrenament etichetate pentru a vă ajuta să preziceți rezultatele pentru datele neprevăzute. În învățarea supravegheată, antrenați mașina folosind date care sunt bine „etichetate”. Înseamnă că unele date sunt deja etichetate cu răspunsuri corecte. Poate fi comparat cu învățarea în prezența unui supervizor sau a unui profesor.

Construire, scalare și implementare cu succes precis modelele de învățare automată supravegheate necesită timp și expertiză tehnică de la o echipă de oameni de știință de date cu înaltă calificare. În plus, Date omul de știință trebuie să reconstruiască Modele pentru a vă asigura că informațiile oferite rămân adevărate până când datele sale se schimbă.

Cum funcționează învățarea supravegheată

Învățarea automată supravegheată utilizează seturi de date de antrenament pentru a obține rezultatele dorite. Aceste seturi de date conțin intrări și ieșirea corectă care ajută modelul să învețe mai rapid. De exemplu, vrei să antrenezi o mașină care să te ajute să prezici cât timp îți va dura să conduci acasă de la locul de muncă.

Aici, începeți prin a crea un set de date etichetate. Aceste date includ:

  • Conditiile meteo
  • Timpul zilei
  • Concediu

Toate aceste detalii sunt intrările dvs. în acest exemplu de învățare supravegheată. Ieșirea este timpul necesar pentru a ajunge acasă în ziua respectivă.

Cum funcționează învățarea automată supravegheată

Știi din instinct că dacă afară plouă, atunci îți va lua mai mult timp să conduci acasă. Dar mașina are nevoie de date și statistici.

Să vedem câteva exemple de învățare supravegheată despre cum puteți dezvolta un model de învățare supravegheat din acest exemplu, care ajută utilizatorul să determine timpul de navetă. Primul lucru de care aveți nevoie pentru a crea este un set de antrenament. Acest set de antrenament va conține timpul total de navetă și factorii corespunzători, cum ar fi vremea, ora etc. Pe baza acestui set de antrenament, mașina dvs. poate vedea că există o relație directă între cantitatea de ploaie și timpul pe care îl veți lua pentru a ajunge acasă.

Deci, se constată că, cu cât plouă mai mult, cu atât vei conduce mai mult pentru a te întoarce acasă. S-ar putea să vadă, de asemenea, legătura dintre momentul în care părăsiți serviciul și momentul în care veți fi pe drum.

Cu cât te apropii de ora 6, cu atât îți ia mai mult până acasă. Aparatul dvs. poate găsi unele dintre relațiile cu datele dvs. etichetate.

Funcționarea învățării automate supravegheate
Funcționarea învățării automate supravegheate

Acesta este începutul modelului dvs. de date. Începe să influențeze modul în care ploaia afectează modul în care oamenii conduc. De asemenea, începe să se vadă că mai mulți oameni călătoresc într-un anumit moment al zilei.

Tipuri de învățare automată supravegheată Algorithms

Următoarele sunt tipurile de algoritmi de învățare automată supravegheată:

Regres

Tehnica de regresie prezice o singură valoare de ieșire folosind datele de antrenament.

Exemplu: Puteți utiliza regresia pentru a estima prețul casei din datele de instruire. Variabilele de intrare vor fi localitatea, dimensiunea unei case etc.

Atuuri: Ieșirile au întotdeauna o interpretare probabilistică, iar algoritmul poate fi regularizat pentru a evita supraadaptarea.

Puncte slabe: Regresia logistică poate avea performanțe slabe atunci când există limite de decizie multiple sau neliniare. Această metodă nu este flexibilă, deci nu surprinde relații mai complexe.

Regresie logistică:

Metoda de regresie logistică utilizată pentru a estima valori discrete pe baza unui set dat de variabile independente. Vă ajută să preziceți probabilitatea de apariție a unui eveniment prin potrivirea datelor la o funcție logit. Prin urmare, este cunoscută și sub numele de regresie logistică. Așa cum prezice probabilitatea, valoarea sa de ieșire se află între 0 și 1.

Iată câteva tipuri de regresie Algorithms

Clasificare

Clasificare înseamnă gruparea rezultatelor în interiorul unei clase. Dacă algoritmul încearcă să eticheteze intrarea în două clase distincte, se numește clasificare binară. Selectarea între mai mult de două clase este denumită clasificare multiclasă.

Exemplu: Stabilirea dacă cineva va fi sau nu debitor al împrumutului.

Atuuri: Arborele de clasificare funcționează foarte bine în practică

Puncte slabe: Neconstrânși, copacii individuali sunt predispuși la supraadaptare.

Iată câteva tipuri de clasificare Algorithms

Clasificatori naivi Bayes

Modelul naiv Bayesian (NBN) este ușor de construit și foarte util pentru seturi mari de date. Această metodă este compusă din grafice aciclice directe cu un părinte și mai mulți copii. Aceasta presupune independență între nodurile copil separate de părintele lor.

Arbori de decizie

Arborele de decizii clasifică instanța prin sortarea lor în funcție de valoarea caracteristicii. În această metodă, fiecare mod este caracteristica unei instanțe. Ar trebui clasificat, iar fiecare ramură reprezintă o valoare pe care nodul o poate asuma. Este o tehnică utilizată pe scară largă pentru clasificare. În această metodă, clasificarea este un arbore care este cunoscut ca arbore de decizie.

Vă ajută să estimați valori reale (costul achiziției unei mașini, numărul de apeluri, vânzările lunare totale etc.).

Suport Vector Machine

Support vector machine (SVM) este un tip de algoritm de învățare dezvoltat în 1990. Această metodă se bazează pe rezultatele teoriei învățării statistice introduse de Vap Nik.

Mașinile SVM sunt, de asemenea, strâns legate de funcțiile kernelului, care este un concept central pentru majoritatea sarcinilor de învățare. Cadrul nucleului și SVM sunt utilizate într-o varietate de domenii. Include regăsirea informațiilor multimedia, bioinformatica și recunoașterea modelelor.

Tehnici de învățare automată supravegheată versus nesupravegheată

Bazat pe Tehnica de învățare automată supravegheată Tehnica de învățare automată nesupravegheată
Date de intrare Algorithms sunt instruiți folosind date etichetate. Algorithms sunt utilizate împotriva datelor care nu sunt etichetate
Complexitatea computațională Învățarea supravegheată este o metodă mai simplă. Învățarea nesupravegheată este complexă din punct de vedere computațional
Acuratete Metodă extrem de precisă și de încredere. Less metoda corecta si de incredere.

Provocări în învățarea automată supravegheată

Iată provocările cu care se confruntă învățarea automată supravegheată:

  • Caracteristicile de intrare irelevante prezente datele de antrenament ar putea da rezultate inexacte
  • Pregătirea și preprocesarea datelor reprezintă întotdeauna o provocare.
  • Precizia are de suferit atunci când au fost introduse valori imposibile, improbabile și incomplete ca date de antrenament
  • Dacă expertul în cauză nu este disponibil, atunci cealaltă abordare este „forța brută”. Înseamnă că trebuie să vă gândiți că funcțiile potrivite (variabilele de intrare) pentru a antrena mașina. Ar putea fi inexact.

Avantajele învățării supravegheate

Iată avantajele învățării automate supravegheate:

  • Învățare supravegheată în Invatare mecanica vă permite să colectați date sau să produceți o ieșire de date din experiența anterioară
  • Vă ajută să optimizați criteriile de performanță folosind experiența
  • Învățarea automată supravegheată vă ajută să rezolvați diferite tipuri de probleme de calcul din lumea reală.

Dezavantajele învățării supravegheate

Mai jos sunt dezavantajele învățării automate supravegheate:

  • Limita de decizie ar putea fi supraantrenată dacă setul de antrenament care nu are exemple pe care doriți să le aveți într-o clasă
  • Trebuie să selectați o mulțime de exemple bune din fiecare clasă în timp ce antrenați clasificatorul.
  • Clasificarea Datele mari poate fi o adevărată provocare.
  • Instruirea pentru învățarea supravegheată necesită mult timp de calcul.

Cele mai bune practici pentru învățarea supravegheată

  • Înainte de a face orice altceva, trebuie să decideți ce fel de date vor fi folosite ca set de antrenament
  • Trebuie să decideți structura funcției învățate și algoritmul de învățare.
  • Adunați rezultate corespunzătoare fie de la experți umani, fie din măsurători

Rezumat

  • În algoritmii de învățare supravegheată, antrenați mașina folosind date care sunt bine „etichetate”.
  • Doriți să antrenezi o mașină care să te ajute să prezici cât timp îți va dura să conduci acasă de la locul de muncă este un exemplu de învățare supravegheată.
  • Regresia și clasificarea sunt două dimensiuni ale unui algoritm de învățare automată supravegheată.
  • Învățare supravegheată este o metodă mai simplă, în timp ce învățarea nesupravegheată este o metodă complexă.
  • Cea mai mare provocare în învățarea supravegheată este că datele de antrenament prezente ale caracteristicilor de intrare irelevante ar putea da rezultate inexacte.
  • Principalul avantaj al învățării supravegheate este că vă permite să colectați date sau să produceți o ieșire de date din experiența anterioară.
  • Dezavantajul acestui model este că limita de decizie ar putea fi suprasolicitată dacă setul dvs. de antrenament nu are exemple pe care doriți să le aveți într-o clasă.
  • Ca cea mai bună practică de supraveghere a învățării, mai întâi trebuie să decideți ce fel de date ar trebui folosite ca set de antrenament.