Valvottu koneoppiminen: mikä on Algorithms esimerkkien kanssa
Mitä on valvottu koneoppiminen?
Valvottu koneoppiminen on algoritmi, joka oppii merkityistä harjoitustiedoista auttaakseen sinua ennustamaan odottamattomien tietojen tuloksia. Valvotussa oppimisessa konetta koulutetaan käyttämällä dataa, joka on hyvin "merkitty". Se tarkoittaa, että osa tiedoista on jo merkitty oikeilla vastauksilla. Sitä voidaan verrata oppimiseen ohjaajan tai opettajan läsnä ollessa.
Onnistunut rakentaminen, skaalaus ja käyttöönotto tarkka valvotut koneoppimismallit vaativat aikaa ja teknistä asiantuntemusta korkeasti koulutetulta datatieteilijältä. Lisäksi, Päiväys tiedemiehen on rakennettava uudelleen mallit varmistaaksesi, että annetut oivallukset pysyvät todenmukaisina, kunnes niiden tiedot muuttuvat.
Kuinka ohjattu oppiminen toimii
Valvottu koneoppiminen käyttää harjoitustietojoukkoja haluttujen tulosten saavuttamiseksi. Nämä tietojoukot sisältävät syötteitä ja oikean tulosteen, joka auttaa mallia oppimaan nopeammin. Haluat esimerkiksi kouluttaa koneen auttamaan sinua ennustamaan, kuinka kauan kestää ajaa kotiin työpaikaltasi.
Tässä aloitat luomalla joukon merkittyjä tietoja. Nämä tiedot sisältävät:
- Sääolosuhteet
- Kellonaika
- Juhlapyhät
Kaikki nämä tiedot ovat syötteitäsi tässä valvotussa oppimisesimerkissä. Tulos on aika, joka kului kotiin ajamiseen kyseisenä päivänä.
Tiedät vaistomaisesti, että jos ulkona sataa vettä, kotiin ajaminen kestää kauemmin. Mutta kone tarvitsee dataa ja tilastoja.
Katsotaanpa joitain esimerkkejä ohjatusta oppimisesta, kuinka voit kehittää tämän esimerkin ohjatun oppimismallin, joka auttaa käyttäjää määrittämään työmatka-ajan. Ensimmäinen asia, jonka sinun on luotava, on harjoitussarja. Tämä harjoitussarja sisältää koko työmatka-ajan ja vastaavat tekijät, kuten sää, aika jne. Tämän harjoitussarjan perusteella koneesi saattaa nähdä, että sateen määrän ja kotiin pääsemiseen kuluvan ajan välillä on suora yhteys.
Joten se varmistaa, että mitä enemmän sataa, sitä pidempään ajat kotiin palataksesi. Se saattaa myös nähdä yhteyden töistä lähtemisen ja tien päällä olemisen välillä.
Mitä lähempänä olet kello 6, sitä kauemmin pääset kotiin. Koneesi saattaa löytää joitakin suhteita merkittyjen tietojen kanssa.
Tämä on tietomallisi alku. Se alkaa vaikuttaa siihen, miten sade vaikuttaa ihmisten ajamiseen. Alkaa myös nähdä, että enemmän ihmisiä matkustaa tiettyyn aikaan vuorokaudesta.
Ohjatun koneoppimisen tyypit Algorithms
Seuraavat ovat valvottujen koneoppimisalgoritmien tyypit:
Regressio
Regressiotekniikka ennustaa yhden lähtöarvon harjoitusdatan avulla.
esimerkki: Regression avulla voit ennustaa asunnon hinnan koulutustiedoista. Syöttömuuttujat ovat paikkakunta, talon koko jne.
Vahvuudet: Lähdöillä on aina todennäköisyyspohjainen tulkinta, ja algoritmia voidaan säätää ylisovituksen välttämiseksi.
heikkoudet: Logistinen regressio voi toimia huonommin, jos päätösrajoja on useita tai ei-lineaarisia. Tämä menetelmä ei ole joustava, joten se ei kaappaa monimutkaisempia suhteita.
Logistinen regressio:
Logistinen regressiomenetelmä, jota käytetään diskreettien arvojen arvioimiseen perustuen annettuun riippumattomien muuttujien joukkoon. Se auttaa sinua ennustamaan tapahtuman todennäköisyyden sovittamalla tiedot logit-funktioon. Siksi se tunnetaan myös nimellä logistinen regressio. Koska se ennustaa todennäköisyyttä, sen lähtöarvo on välillä 0 ja 1.
Tässä on muutamia regressiotyyppejä Algorithms
Luokittelu
Luokittelu tarkoittaa tulosten ryhmittelyä luokan sisällä. Jos algoritmi yrittää nimetä syötteen kahteen erilliseen luokkaan, sitä kutsutaan binääriluokitukseksi. Valintaa useamman kuin kahden luokan välillä kutsutaan moniluokkaluokitukseksi.
esimerkki: Sen määrittäminen, laiminlyökö joku lainan vai ei.
Vahvuudet: Luokittelupuu toimii erittäin hyvin käytännössä
heikkoudet: Pakotteeton, yksittäiset puut ovat alttiita liikaistutuksille.
Tässä on muutamia luokittelutyyppejä Algorithms
Naiivit Bayes-luokittelut
Naiivi Bayesian malli (NBN) on helppo rakentaa ja erittäin hyödyllinen suurille tietojoukoille. Tämä menetelmä koostuu suorista asyklisistä kaavioista, joissa on yksi vanhempi ja useita lapsia. Se olettaa riippumattomuutta vanhemmistaan erotettujen lapsisolmujen välillä.
Päätöspuut
Päätöspuut luokittelevat ilmentymät lajittelemalla ne ominaisuuden arvon perusteella. Tässä menetelmässä jokainen tila on ilmentymän ominaisuus. Se on luokiteltava, ja jokainen haara edustaa arvoa, jonka solmu voi olettaa. Se on laajalti käytetty luokittelutekniikka. Tässä menetelmässä luokitus on puu, joka tunnetaan päätöspuuna.
Se auttaa sinua arvioimaan todellisia arvoja (auton ostokustannukset, puheluiden määrä, kuukausittainen kokonaismyynti jne.).
Tuki Vector Machine
Tukivektorikone (SVM) on eräänlainen oppimisalgoritmi, joka kehitettiin vuonna 1990. Tämä menetelmä perustuu Vap Nikin käyttöön ottaman tilastollisen oppimisteorian tuloksiin.
SVM-koneet ovat myös kiinteästi yhteydessä ytimen toimintoihin, mikä on keskeinen käsite useimmissa oppimistehtävissä. Ydinkehystä ja SVM:ää käytetään useilla aloilla. Se sisältää multimedian tiedonhaun, bioinformatiikan ja hahmontunnistuksen.
Valvotut vs. valvomattomat koneoppimistekniikat
Perustuen | Valvottu koneoppimistekniikka | Valvomaton koneoppimistekniikka |
---|---|---|
Tulotiedot | Algorithms on koulutettu käyttäen merkittyjä tietoja. | Algorithms käytetään sellaisia tietoja vastaan, joita ei ole merkitty |
Laskennallinen monimutkaisuus | Ohjattu oppiminen on yksinkertaisempi menetelmä. | Ohjaamaton oppiminen on laskennallisesti monimutkaista |
tarkkuus | Erittäin tarkka ja luotettava menetelmä. | Less tarkka ja luotettava menetelmä. |
Valvotun koneoppimisen haasteita
Ohessa on haasteita, joita ohjatussa koneoppimisessa kohtaat:
- Harjoitustietojen epäolennainen syöttöominaisuus voi antaa epätarkkoja tuloksia
- Tietojen valmistelu ja esikäsittely on aina haaste.
- Tarkkuus kärsii, kun harjoitustietoina on syötetty mahdottomia, epätodennäköisiä ja epätäydellisiä arvoja
- Jos asianomainen asiantuntija ei ole käytettävissä, toinen lähestymistapa on "raaka voima". Se tarkoittaa, että sinun on mietittävä oikeat ominaisuudet (syöttömuuttujat) koneen kouluttamiseen. Se voi olla epätarkka.
Ohjatun oppimisen edut
Tässä ovat valvotun koneoppimisen edut:
- Ohjattua oppimista sisään Koneen oppiminen voit kerätä tietoja tai tuottaa datatulosteen aiemmasta kokemuksesta
- Auttaa optimoimaan suorituskykykriteerit kokemuksen avulla
- Valvottu koneoppiminen auttaa sinua ratkaisemaan erilaisia reaalimaailman laskentaongelmia.
Ohjatun oppimisen haitat
Alla on valvotun koneoppimisen haitat:
- Päätösraja voi olla ylikoulutettu, jos harjoitussarjassasi ei ole esimerkkejä, joita haluaisit olla luokassa
- Sinun on valittava jokaisesta luokasta paljon hyviä esimerkkejä, kun harjoitat luokittelijaa.
- luokittelulohko big data voi olla todellinen haaste.
- Ohjatun oppimisen koulutus vaatii paljon laskenta-aikaa.
Parhaat käytännöt ohjattuun oppimiseen
- Ennen kuin teet mitään muuta, sinun on päätettävä, millaista dataa käytetään harjoitussarjana
- Sinun on päätettävä opitun funktion rakenne ja oppimisalgoritmi.
- Kerää vastaavat tulokset joko ihmisasiantuntijoilta tai mittauksista
Yhteenveto
- Valvotuissa oppimisalgoritmeissa konetta koulutetaan käyttämällä dataa, joka on hyvin "merkitty".
- Jos haluat kouluttaa koneen, jonka avulla voit ennustaa, kuinka kauan sinulla kestää ajaa kotiin työpaikaltasi, on esimerkki ohjatusta oppimisesta.
- Regressio ja luokittelu ovat valvotun koneoppimisalgoritmin kaksi ulottuvuutta.
- Valvottu oppiminen on yksinkertaisempi menetelmä, kun taas ohjaamaton oppiminen on monimutkainen menetelmä.
- Suurin haaste ohjatussa oppimisessa on se, että irrelevant input -ominaisuus esittää harjoitustiedot voivat antaa virheellisiä tuloksia.
- Ohjatun oppimisen tärkein etu on, että sen avulla voit kerätä tietoja tai tuottaa datatulosteita aiemmasta kokemuksesta.
- Tämän mallin haittapuolena on, että päätösraja voi olla ylikuormitettu, jos harjoitussarjassasi ei ole esimerkkejä, joita haluat olla luokassa.
- Parhaana käytäntönä ohjata oppimista, sinun on ensin päätettävä, millaista dataa tulisi käyttää harjoitussarjana.