Juhendatud masinõpe: mis on Algorithms koos näidetega

Mis on juhendatud masinõpe?

Juhendatud masinõpe on algoritm, mis õpib märgistatud treeningandmetest, et aidata teil ennustada ettenägematute andmete tulemusi. Järelevalveõppes treenite masinat hästi märgistatud andmete abil. See tähendab, et mõned andmed on juba õigete vastustega märgistatud. Seda võib võrrelda juhendaja või õpetaja juuresolekul õppimisega.

Edukas loomine, skaleerimine ja juurutamine täpne juhendatud masinõppemudelid nõuavad kõrgelt kvalifitseeritud andmeteadlaste meeskonnalt aega ja tehnilisi teadmisi. Lisaks kuupäev teadlane peab uuesti üles ehitama mudelid veendumaks, et antud statistika jääb tõeseks, kuni selle andmed muutuvad.

Kuidas juhendatud õpe toimib

Järelevalvega masinõpe kasutab soovitud tulemuste saavutamiseks koolituse andmekogumeid. Need andmekogumid sisaldavad sisendeid ja õiget väljundit, mis aitavad mudelil kiiremini õppida. Näiteks soovite õpetada masinat, et aidata teil ennustada, kui kaua teil töökohalt koju sõitmiseks kulub.

Siin alustate märgistatud andmete komplekti loomisega. Need andmed hõlmavad järgmist:

  • Ilmastikutingimused
  • Kellaaeg
  • Holidays

Kõik need üksikasjad on teie sisendid selles juhendatud õppe näites. Väljund on aeg, mis kulus sellel konkreetsel päeval koju tagasi sõitmiseks.

Kuidas juhendatud masinõpe töötab

Sa tead instinktiivselt, et kui väljas sajab vihma, võtab kojusõit kauem aega. Aga masin vajab andmeid ja statistikat.

Vaatame mõningaid juhendatud õppimise näiteid selle kohta, kuidas saate selle näite järgi välja töötada juhendatud õppe mudeli, mis aitab kasutajal määrata edasi-tagasi reisimise aega. Esimene asi, mida peate looma, on treeningkomplekt. See treeningkomplekt sisaldab kogu edasi-tagasi sõitmise aega ja vastavaid tegureid, nagu ilm, aeg jne. Selle treeningkomplekti põhjal võib teie masin näha, et vihma ja koju jõudmiseks kuluva aja vahel on otsene seos.

Seega teeb see kindlaks, et mida rohkem sajab, seda kauem sõidate, et koju tagasi jõuda. Samuti võib see näha seost töölt lahkumise ja teeloleku aja vahel.

Mida lähemale kella 6-le, seda kauem kulub koju jõudmiseks. Teie masin võib leida mõningaid seoseid teie märgistatud andmetega.

Juhendatud masinõppe töö
Juhendatud masinõppe töö

See on teie andmemudeli algus. See hakkab mõjutama seda, kuidas vihm mõjutab inimeste sõiduviisi. Samuti hakkab ilmnema, et rohkem inimesi reisib teatud kellaajal.

Juhendatud masinõppe tüübid Algorithms

Järgmised on juhendatud masinõppe algoritmide tüübid.

Regressioon

Regressioonitehnika ennustab treeningandmeid kasutades ühe väljundi väärtuse.

Näide: Regressiooni abil saate koolitusandmete põhjal ennustada maja hinda. Sisendmuutujateks on asukoht, maja suurus jne.

Tugevused: Väljunditel on alati tõenäosuslik tõlgendus ja algoritmi saab reguleerida, et vältida ülepaigutamist.

Nõrkused: Logistiline regressioon võib halvemini toimida, kui on mitu või mittelineaarset otsustuspiiri. See meetod ei ole paindlik, seega ei hõlma see keerulisemaid suhteid.

Logistiline regressioon:

Logistilise regressiooni meetod, mida kasutatakse diskreetsete väärtuste hindamiseks antud sõltumatute muutujate komplekti alusel. See aitab teil prognoosida sündmuse esinemise tõenäosust, sobitades andmed logit-funktsiooniga. Seetõttu nimetatakse seda ka logistiliseks regressiooniks. Kuna see ennustab tõenäosust, jääb selle väljundväärtus 0 ja 1 vahele.

Siin on mõned regressiooni tüübid Algorithms

Klassifikatsioon

Klassifitseerimine tähendab väljundi rühmitamist klassi sees. Kui algoritm püüab märgistada sisendit kahte erinevasse klassi, nimetatakse seda binaarseks klassifikatsiooniks. Rohkem kui kahe klassi vahel valimist nimetatakse mitme klassi klassifikatsiooniks.

Näide: selle kindlaksmääramine, kas keegi jääb laenu rikkujaks või mitte.

Tugevused: Klassifikatsioonipuu toimib praktikas väga hästi

Nõrkused: Piiramatult üksikud puud kipuvad üle istuma.

Siin on mõned klassifikatsiooni tüübid Algorithms

Naiivsed Bayesi klassifikaatorid

Naiivset Bayesi mudelit (NBN) on lihtne ehitada ja see on väga kasulik suurte andmekogumite jaoks. See meetod koosneb otsestest atsüklilistest graafikutest, millel on üks vanem ja mitu last. See eeldab vanematest eraldatud alamsõlmede sõltumatust.

Otsustuspuud

Otsuste puud klassifitseerivad eksemplari, sorteerides need funktsiooni väärtuse alusel. Selle meetodi puhul on iga režiim eksemplari omadus. See tuleks klassifitseerida ja iga haru tähistab väärtust, mille sõlm võib eeldada. See on klassifitseerimiseks laialdaselt kasutatav tehnika. Selle meetodi puhul on klassifikatsioon puu, mida tuntakse otsustuspuuna.

See aitab teil hinnata tegelikke väärtusi (auto ostmise maksumus, kõnede arv, igakuine kogumüük jne).

Toetage vektormasinat

Tugivektormasin (SVM) on 1990. aastal välja töötatud õppealgoritmi tüüp. See meetod põhineb Vap Niki juurutatud statistilise õppimisteooria tulemustel.

SVM-masinad on samuti tihedalt seotud kerneli funktsioonidega, mis on enamiku õppeülesannete keskne kontseptsioon. Kerneli raamistikku ja SVM-i kasutatakse erinevates valdkondades. See hõlmab multimeedia teabeotsingut, bioinformaatika ja mustrituvastust.

Juhendatud vs. järelevalveta masinõppetehnikad

Põhineb Juhendatud masinõppe tehnika Järelevalveta masinõppe tehnika
Sisendandmed Algorithms on koolitatud märgistatud andmete abil. Algorithms kasutatakse andmete vastu, mis pole märgistatud
Arvutuslik keerukus Juhendatud õpe on lihtsam meetod. Juhendajata õppimine on arvutuslikult keeruline
Täpsus Väga täpne ja usaldusväärne meetod. Less täpne ja usaldusväärne meetod.

Väljakutsed juhendatud masinõppes

Siin on järelevalvega masinõppega seotud väljakutsed.

  • Treeninguandmete ebaoluline sisendfunktsioon võib anda ebatäpseid tulemusi
  • Andmete ettevalmistamine ja eeltöötlus on alati väljakutse.
  • Täpsus kannatab, kui treeningandmetena on sisestatud võimatud, ebatõenäolised ja mittetäielikud väärtused
  • Kui asjaomane ekspert ei ole kättesaadav, on teine ​​​​lähenemine "toores jõus". See tähendab, et peate mõtlema õigetele funktsioonidele (sisendmuutujatele), mille abil masinat treenida. See võib olla ebatäpne.

Juhendatud õppimise eelised

Siin on juhendatud masinõppe eelised:

  • Juhendatud õpe sisse Masinõpe võimaldab teil koguda andmeid või toota andmeväljundit eelmisest kogemusest
  • Aitab teil kogemusi kasutades optimeerida jõudluskriteeriume
  • Järelevalvega masinõpe aitab teil lahendada erinevat tüüpi reaalmaailma arvutusprobleeme.

Juhendatud õppe puudused

Allpool on juhendatud masinõppe puudused:

  • Otsustuspiir võib olla ületreenitud, kui teie treeningkomplektis pole näiteid, mida soovite klassis kasutada
  • Klassifikaatori treenimise ajal peate valima igast klassist palju häid näiteid.
  • Liigitamine suur andmed võib olla tõeline väljakutse.
  • Juhendatud õppimise koolitus nõuab palju arvutusaega.

Juhendatud õppe parimad tavad

  • Enne millegi muu tegemist peate otsustama, milliseid andmeid treeningkomplektina kasutada
  • Peate otsustama õpitud funktsiooni struktuuri ja õppimisalgoritmi.
  • Koguge vastavad väljundid kas inimekspertidelt või mõõtmistest

kokkuvõte

  • Järelevalvega õppealgoritmide puhul treenite masinat andmete abil, mis on hästi märgistatud.
  • Kui soovite treenida masinat, mis aitab teil ennustada, kui kaua teil töökohalt koju sõitmiseks kulub, on näide juhendatud õppimisest.
  • Regressioon ja klassifikatsioon on juhendatud masinõppe algoritmi kaks mõõdet.
  • Juhendatud õppimine on lihtsam meetod, samas kui järelevalveta õppimine on keeruline meetod.
  • Suurim väljakutse juhendatud õppes on see, et koolitusandmete ebaoluline sisendfunktsioon võib anda ebatäpseid tulemusi.
  • Juhendatud õppimise peamine eelis on see, et see võimaldab teil koguda andmeid või toota varasemast kogemusest saadud andmeid.
  • Selle mudeli puuduseks on see, et otsustuspiir võib olla üle pingutatud, kui teie treeningkomplektis pole näiteid, mida soovite klassis kasutada.
  • Õppimise juhendamise parima tavana peate esmalt otsustama, milliseid andmeid koolituskomplektina kasutada.