Juhendatud masinõpe: mis on Algorithms koos näidetega

Mis on juhendatud masinõpe?

Juhendatud masinõpe on algoritm, mis õpib märgistatud treeningandmetest, et aidata teil ennustada ettenägematute andmete tulemusi. Järelevalveõppes treenite masinat hästi märgistatud andmete abil. See tähendab, et mõned andmed on juba õigete vastustega märgistatud. Seda võib võrrelda juhendaja või õpetaja juuresolekul õppimisega.

Edukas loomine, skaleerimine ja juurutamine täpne juhendatud masinõppemudelid nõuavad kõrgelt kvalifitseeritud andmeteadlaste meeskonnalt aega ja tehnilisi teadmisi. Lisaks kuupäev teadlane peab uuesti üles ehitama mudelid veendumaks, et antud statistika jääb tõeseks, kuni selle andmed muutuvad.

Kuidas juhendatud õpe toimib

Järelevalvega masinõpe kasutab soovitud tulemuste saavutamiseks koolituse andmekogumeid. Need andmekogumid sisaldavad sisendeid ja õiget väljundit, mis aitavad mudelil kiiremini õppida. Näiteks soovite õpetada masinat, et aidata teil ennustada, kui kaua teil töökohalt koju sõitmiseks kulub.

Siin alustate märgistatud andmete komplekti loomisega. Need andmed hõlmavad järgmist:

Ilmastikutingimused
Kellaaeg
Holidays

Kõik need üksikasjad on teie sisendid selles juhendatud õppe näites. Väljund on aeg, mis kulus sellel konkreetsel päeval koju tagasi sõitmiseks.

Sa tead instinktiivselt, et kui väljas sajab vihma, võtab kojusõit kauem aega. Aga masin vajab andmeid ja statistikat.

Vaatame mõningaid juhendatud õppimise näiteid selle kohta, kuidas saate selle näite järgi välja töötada juhendatud õppe mudeli, mis aitab kasutajal määrata edasi-tagasi reisimise aega. Esimene asi, mida peate looma, on treeningkomplekt. See treeningkomplekt sisaldab kogu edasi-tagasi sõitmise aega ja vastavaid tegureid, nagu ilm, aeg jne. Selle treeningkomplekti põhjal võib teie masin näha, et vihma ja koju jõudmiseks kuluva aja vahel on otsene seos.

Seega teeb see kindlaks, et mida rohkem sajab, seda kauem sõidate, et koju tagasi jõuda. Samuti võib see näha seost töölt lahkumise ja teeloleku aja vahel.

Mida lähemale kella 6-le, seda kauem kulub koju jõudmiseks. Teie masin võib leida mõningaid seoseid teie märgistatud andmetega.

See on teie andmemudeli algus. See hakkab mõjutama seda, kuidas vihm mõjutab inimeste sõiduviisi. Samuti hakkab ilmnema, et rohkem inimesi reisib teatud kellaajal.

Juhendatud masinõppe tüübid Algorithms

Järgmised on juhendatud masinõppe algoritmide tüübid.

Regressioon

Regressioonitehnika ennustab treeningandmeid kasutades ühe väljundi väärtuse.

Näide: Regressiooni abil saate koolitusandmete põhjal ennustada maja hinda. Sisendmuutujateks on asukoht, maja suurus jne.

Tugevused: Väljunditel on alati tõenäosuslik tõlgendus ja algoritmi saab reguleerida, et vältida ülepaigutamist.

Nõrkused: Logistiline regressioon võib halvemini toimida, kui on mitu või mittelineaarset otsustuspiiri. See meetod ei ole paindlik, seega ei hõlma see keerulisemaid suhteid.

Logistiline regressioon:

Logistilise regressiooni meetod, mida kasutatakse diskreetsete väärtuste hindamiseks antud sõltumatute muutujate komplekti alusel. See aitab teil prognoosida sündmuse esinemise tõenäosust, sobitades andmed logit-funktsiooniga. Seetõttu nimetatakse seda ka logistiliseks regressiooniks. Kuna see ennustab tõenäosust, jääb selle väljundväärtus 0 ja 1 vahele.

Siin on mõned regressiooni tüübid Algorithms

Klassifikatsioon

Klassifitseerimine tähendab väljundi rühmitamist klassi sees. Kui algoritm püüab märgistada sisendit kahte erinevasse klassi, nimetatakse seda binaarseks klassifikatsiooniks. Rohkem kui kahe klassi vahel valimist nimetatakse mitme klassi klassifikatsiooniks.

Näide: selle kindlaksmääramine, kas keegi jääb laenu rikkujaks või mitte.

Tugevused: Klassifikatsioonipuu toimib praktikas väga hästi

Nõrkused: Piiramatult üksikud puud kipuvad üle istuma.

Siin on mõned klassifikatsiooni tüübid Algorithms

Naiivsed Bayesi klassifikaatorid

Naiivset Bayesi mudelit (NBN) on lihtne ehitada ja see on väga kasulik suurte andmekogumite jaoks. See meetod koosneb otsestest atsüklilistest graafikutest, millel on üks vanem ja mitu last. See eeldab vanematest eraldatud alamsõlmede sõltumatust.

Otsustuspuud

Otsuste puud klassifitseerivad eksemplari, sorteerides need funktsiooni väärtuse alusel. Selle meetodi puhul on iga režiim eksemplari omadus. See tuleks klassifitseerida ja iga haru tähistab väärtust, mille sõlm võib eeldada. See on klassifitseerimiseks laialdaselt kasutatav tehnika. Selle meetodi puhul on klassifikatsioon puu, mida tuntakse otsustuspuuna.

See aitab teil hinnata tegelikke väärtusi (auto ostmise maksumus, kõnede arv, igakuine kogumüük jne).

Toetage vektormasinat

Tugivektormasin (SVM) on 1990. aastal välja töötatud õppealgoritmi tüüp. See meetod põhineb Vap Niki juurutatud statistilise õppimisteooria tulemustel.

SVM-masinad on samuti tihedalt seotud kerneli funktsioonidega, mis on enamiku õppeülesannete keskne kontseptsioon. Kerneli raamistikku ja SVM-i kasutatakse erinevates valdkondades. See hõlmab multimeedia teabeotsingut, bioinformaatika ja mustrituvastust.

Juhendatud vs. järelevalveta masinõppetehnikad

Põhineb	Juhendatud masinõppe tehnika	Järelevalveta masinõppe tehnika
Sisendandmed	Algorithms on koolitatud märgistatud andmete abil.	Algorithms kasutatakse andmete vastu, mis pole märgistatud
Arvutuslik keerukus	Juhendatud õpe on lihtsam meetod.	Juhendajata õppimine on arvutuslikult keeruline
Täpsus	Väga täpne ja usaldusväärne meetod.	Less täpne ja usaldusväärne meetod.

Väljakutsed juhendatud masinõppes

Siin on järelevalvega masinõppega seotud väljakutsed.

Treeninguandmete ebaoluline sisendfunktsioon võib anda ebatäpseid tulemusi
Andmete ettevalmistamine ja eeltöötlus on alati väljakutse.
Täpsus kannatab, kui treeningandmetena on sisestatud võimatud, ebatõenäolised ja mittetäielikud väärtused
Kui asjaomane ekspert ei ole kättesaadav, on teine lähenemine "toores jõus". See tähendab, et peate mõtlema õigetele funktsioonidele (sisendmuutujatele), mille abil masinat treenida. See võib olla ebatäpne.

Juhendatud õppimise eelised

Siin on juhendatud masinõppe eelised:

Juhendatud õpe sisse Masinõpe võimaldab teil koguda andmeid või toota andmeväljundit eelmisest kogemusest
Aitab teil kogemusi kasutades optimeerida jõudluskriteeriume
Järelevalvega masinõpe aitab teil lahendada erinevat tüüpi reaalmaailma arvutusprobleeme.

Juhendatud õppe puudused

Allpool on juhendatud masinõppe puudused:

Otsustuspiir võib olla ületreenitud, kui teie treeningkomplektis pole näiteid, mida soovite klassis kasutada
Klassifikaatori treenimise ajal peate valima igast klassist palju häid näiteid.
Liigitamine suur andmed võib olla tõeline väljakutse.
Juhendatud õppimise koolitus nõuab palju arvutusaega.

Juhendatud masinõpe: mis on Algorithms koos näidetega

Mis on juhendatud masinõpe?

Kuidas juhendatud õpe toimib

Juhendatud masinõppe tüübid Algorithms

Regressioon

Logistiline regressioon:

Klassifikatsioon

Naiivsed Bayesi klassifikaatorid

Otsustuspuud

Toetage vektormasinat

Juhendatud vs. järelevalveta masinõppetehnikad

Väljakutsed juhendatud masinõppes

Juhendatud õppimise eelised

Juhendatud õppe puudused

Juhendatud õppe parimad tavad

kokkuvõte

Tellige uudiskiri

Mis on juhendatud masinõpe?

Kuidas juhendatud õpe toimib

SEOTUD ARTIKLID

Juhendatud masinõppe tüübid Algorithms

Regressioon

Logistiline regressioon:

Klassifikatsioon

Naiivsed Bayesi klassifikaatorid

Otsustuspuud

Toetage vektormasinat

Juhendatud vs. järelevalveta masinõppetehnikad

Väljakutsed juhendatud masinõppes

Juhendatud õppimise eelised

Juhendatud õppe puudused

Juhendatud õppe parimad tavad

kokkuvõte

Tellige uudiskiri