Koneoppimisen opetusohjelma aloittelijoille: Mikä on, ML:n perusteet
Mikä on koneoppiminen?
Koneen oppiminen on tietokonealgoritmien järjestelmä, joka voi oppia esimerkistä itsensä kehittämisen kautta ilman, että ohjelmoija koodaa niitä erikseen. Koneoppiminen on osa tekoälyä, joka yhdistää datan tilastollisiin työkaluihin, jotta voidaan ennustaa tulos, jota voidaan käyttää hyödyllisten oivallusten tekemiseen.
Läpimurto tulee siitä ajatuksesta, että kone voi yksinään oppia tiedoista (eli esimerkistä) tuottaakseen tarkkoja tuloksia. Koneoppiminen liittyy läheisesti tiedon louhintaan ja Bayesin ennustavaan mallinnukseen. Kone vastaanottaa dataa syötteenä ja käyttää algoritmia vastausten muotoiluun.
Tyypillisiä koneoppimistehtäviä ovat suosituksen antaminen. Niille, joilla on a Netflix Kaikki elokuvien tai sarjojen suositukset perustuvat käyttäjän historiallisiin tietoihin. Tekniset yritykset käyttävät ohjaamaton oppiminen parantaa käyttökokemusta personointisuositusten avulla.
Koneoppimista käytetään myös erilaisiin tehtäviin, kuten petosten havaitsemiseen, ennakoivaan ylläpitoon, portfolion optimointiin, tehtävien automatisointiin ja niin edelleen.
Koneoppiminen vs. perinteinen ohjelmointi
Perinteinen ohjelmointi eroaa huomattavasti koneoppimisesta. Perinteisessä ohjelmoinnissa ohjelmoija koodaa kaikki säännöt yhteistyössä alan asiantuntijan kanssa, jolle ohjelmistoa kehitetään. Jokainen sääntö perustuu loogiseen perustaan; kone suorittaa tulosteen loogisen käskyn jälkeen. Kun järjestelmä monimutkaistuu, on kirjoitettava lisää sääntöjä. Sen ylläpitäminen voi nopeasti muuttua kestämättömäksi.
Koneoppimisen pitäisi ratkaista tämä ongelma. Kone oppii kuinka tulo- ja lähtötiedot korreloivat ja kirjoittaa säännön. Ohjelmoijien ei tarvitse kirjoittaa uusia sääntöjä joka kerta, kun on uutta tietoa. Algoritmit mukautuvat uusiin tietoihin ja kokemuksiin parantaakseen tehokkuutta ajan myötä.
Miten koneoppiminen toimii?
Nyt tässä koneoppimisen perusteet aloittelijoille -opetusohjelmassa opimme, kuinka koneoppiminen (ML) toimii:
Koneoppiminen on aivot, joissa kaikki oppiminen tapahtuu. Tapa, jolla kone oppii, on samanlainen kuin ihminen. Ihminen oppii kokemuksesta. Mitä enemmän tiedämme, sitä helpommin voimme ennustaa. Analogisesti, kun kohtaamme tuntemattoman tilanteen, onnistumisen todennäköisyys on pienempi kuin tunnettu tilanne. Koneet on koulutettu samalla tavalla. Tarkan ennusteen tekemiseksi kone näkee esimerkin. Kun annamme koneelle samanlaisen esimerkin, se voi selvittää lopputuloksen. Kuitenkin, kuten ihmisellä, jos se ruokkii aiemmin näkemätöntä esimerkkiä, koneella on vaikeuksia ennustaa.
Koneoppimisen ydintavoite on oppiminen ja päättely. Ensinnäkin kone oppii kuvioiden löytämisen kautta. Tämä löytö on tehty kiitos tiedot. Yksi datatieteilijän keskeinen osa on valita huolellisesti, mitä dataa koneelle toimittaa. Luettelo attribuuteista, joita käytetään ongelman ratkaisemiseen, on nimeltään a piirrevektori. Voit ajatella piirrevektoria datan osajoukona, jota käytetään ongelman ratkaisemiseen.
Kone käyttää joitain hienoja algoritmeja yksinkertaistaakseen todellisuutta ja muuttaakseen tämän löydön a malli. Siksi oppimisvaihetta käytetään tietojen kuvaamiseen ja tiivistämiseen malliksi.
Kone yrittää esimerkiksi ymmärtää suhdetta yksilön palkan ja todennäköisyyden välillä mennä hienoon ravintolaan. Osoittautuu, että kone löytää positiivisen suhteen palkan ja huippuluokan ravintolaan menemisen välillä: Tämä on malli
Päätellen
Kun mallia rakennetaan, on mahdollista testata sen tehokkuutta ennennäkemättömällä tiedolla. Uusi data muunnetaan piirrevektoriksi, käy mallin läpi ja antaa ennusteen. Tämä kaikki on koneoppimisen kaunis osa. Sääntöjä ei tarvitse päivittää tai mallia kouluttaa uudelleen. Voit käyttää aiemmin koulutettua mallia tehdäksesi johtopäätöksiä uusista tiedoista.
Koneoppimisohjelmien käyttöikä on suoraviivaista, ja se voidaan tiivistää seuraaviin kohtiin:
- Määrittele kysymys
- Kerätä dataa
- Visualisoi tiedot
- Juna-algoritmi
- Testaa algoritmia
- Kerää palautetta
- Tarkenna algoritmia
- Kierrä 4-7, kunnes tulokset ovat tyydyttäviä
- Käytä mallia ennusteen tekemiseen
Kun algoritmi osaa tehdä oikeat johtopäätökset, se soveltaa tätä tietoa uusiin tietokokonaisuuksiin.
Koneen oppiminen Algorithms ja missä niitä käytetään?
Nyt tässä koneoppimisohjeessa aloittelijoille opimme, missä koneoppimisalgoritmeja (ML) käytetään:
Koneoppiminen voidaan ryhmitellä kahteen laajaan oppimistehtävään: Valvottu ja Ohjaamaton. On monia muitakin algoritmeja
Valvottu oppiminen
Algoritmi käyttää koulutusdataa ja ihmisiltä saatua palautetta oppiakseen annettujen syötteiden suhteen tiettyyn ulostuloon. Ammatinharjoittaja voi esimerkiksi käyttää markkinointikuluja ja sääennusteita syöttötietoina ennustaakseen tölkkien myyntiä.
Voit käyttää ohjattua oppimista, kun lähtötiedot ovat tiedossa. Algoritmi ennustaa uusia tietoja.
On olemassa kaksi luokkaa valvottu oppiminen:
- Luokittelutehtävä
- Regressiotehtävä
Luokittelu
Kuvittele, että haluat ennustaa mainoksen asiakkaan sukupuolen. Aloitat asiakastietokannastasi tietojen keräämisen pituudesta, painosta, työstä, palkasta, ostokorista jne. Tiedät jokaisen asiakkaasi sukupuolen, se voi olla vain mies tai nainen. Luokittajan tavoitteena on määrittää todennäköisyys olla mies tai nainen (eli etiketti) tietojen (eli keräämiesi ominaisuuksien) perusteella. Kun malli oppi tunnistamaan miehen tai naisen, voit käyttää uutta tietoa ennusteen tekemiseen. Esimerkiksi, olet juuri saanut uutta tietoa tuntemattomalta asiakkaalta ja haluat tietää, onko kyseessä mies vai nainen. Jos luokitin ennustaa miehen = 70 %, se tarkoittaa, että algoritmi on varma 70 %:lla, että tämä asiakas on mies ja 30 %:lla nainen.
Etiketti voi olla kahta tai useampaa luokkaa. Yllä olevassa koneoppimisesimerkissä on vain kaksi luokkaa, mutta jos luokitin tarvitsee ennustaa objektia, siinä on kymmeniä luokkia (esim. lasi, pöytä, kengät jne. jokainen objekti edustaa luokkaa)
Regressio
Kun tulos on jatkuva arvo, tehtävä on regressio. Esimerkiksi rahoitusanalyytikko saattaa joutua ennustamaan osakkeen arvon useiden ominaisuuksien, kuten osakepääoman, aiempien osakekehityksen tai makrotalouden indeksin, perusteella. Järjestelmä koulutetaan arvioimaan osakkeiden hinta mahdollisimman pienellä virheellä.
algoritmi | Tuotetiedot | Tyyppi |
---|---|---|
Lineaarinen regressio | Löytää tavan korreloida jokainen ominaisuus tulosteen tulevien arvojen ennustamiseksi. | Regressio |
Logistinen regressio | Lineaarisen regression laajennus, jota käytetään luokitustehtävissä. Tulosmuuttuja 3 on binäärinen (esim. vain musta tai valkoinen) eikä jatkuva (esim. ääretön luettelo mahdollisista väreistä) | Luokittelu |
Päätöspuu | Hyvin tulkittavissa oleva luokitus- tai regressiomalli, joka jakaa tieto-ominaisuusarvot haaroihin päätössolmuissa (esim. jos ominaisuus on väri, jokaisesta mahdollisesta väristä tulee uusi haara), kunnes lopullinen päätöstulos on tehty | Regressio Luokittelu |
Naiivi Bayes | Bayesin menetelmä on luokittelumenetelmä, joka hyödyntää Bayesin lausetta. Lause päivittää aikaisemman tiedon tapahtumasta kunkin tapahtumaan vaikuttavan ominaisuuden riippumattomalla todennäköisyydellä. | Regressio Luokittelu |
Tuki vektorikoneelle |
Luokittelutehtävään käytetään yleensä tukivektorikonetta tai SVM:ää. SVM-algoritmi löytää hypertason, joka jakaa luokat optimaalisesti. Sitä käytetään parhaiten epälineaarisen ratkaisijan kanssa. |
Regressio (ei kovin yleinen) Luokittelu |
Satunnainen metsä | Algoritmi on rakennettu päätöspuuhun, joka parantaa tarkkuutta huomattavasti. Satunnainen metsä tuottaa monta kertaa yksinkertaisia päätöspuita ja käyttää enemmistöäänestysmenetelmää päättääkseen, minkä etiketin palautetaan. Luokittelutehtävän lopullinen ennuste on se, joka saa eniten ääniä; kun taas regressiotehtävässä kaikkien puiden keskimääräinen ennuste on lopullinen ennuste. | Regressio Luokittelu |
AdaBoost | Luokittelu- tai regressiotekniikka, joka käyttää lukuisia malleja päätöksen tekemiseen, mutta punnitsee niitä niiden tarkkuuden perusteella ennustaessaan lopputulosta | Regressio Luokittelu |
Gradienttia lisäävät puut | Gradienttia tehostavat puut on huippuluokan luokitus/regressiotekniikka. Se keskittyy edellisten puiden tekemiin virheisiin ja yrittää korjata sen. | Regressio Luokittelu |
Valvomaton oppiminen
Valvomattomassa oppimisessa algoritmi tutkii syöttödataa antamatta sille nimenomaista lähtömuuttujaa (esim. tutkii asiakkaiden demografisia tietoja kuvioiden tunnistamiseksi)
Voit käyttää sitä, kun et osaa luokitella dataa ja haluat algoritmin löytävän malleja ja luokittavan tiedot puolestasi
Algoritmin nimi | Tuotetiedot | Tyyppi |
---|---|---|
K tarkoittaa ryhmittelyä | Sijoittaa tiedot joihinkin ryhmiin (k), joista jokainen sisältää tietoja, joilla on samanlaiset ominaisuudet (mallin määrittämänä, ei ihmisten etukäteen määrittämänä) | Clusterta |
Gaussin sekoitusmalli | K-keskiarvoklusteroinnin yleistys, joka tarjoaa enemmän joustavuutta ryhmien (klustereiden) koossa ja muodossa | Clusterta |
Hierarkkinen klusterointi | Jakaa klusterit hierarkkista puuta pitkin luokittelujärjestelmän muodostamiseksi.
Voidaan käyttää Cluster kanta-asiakas |
Clusterta |
Recommender-järjestelmä | Auta määrittämään suosituksen tekemiseen tarvittavat tiedot. | Clusterta |
PCA/T-SNE | Käytetään enimmäkseen tietojen mittasuhteiden vähentämiseen. Algoritmit vähentävät piirteiden määrän 3 tai 4 vektoriin, joilla on suurimmat varianssit. | Ulottuvuuden pienennys |
Kuinka valita koneoppimisalgoritmi
Nyt tässä koneoppimisen perusteiden opetusohjelmassa opimme valitsemaan koneoppimisalgoritmin (ML):
Koneoppimisalgoritmeja on paljon. Algoritmin valinta perustuu tavoitteeseen.
Alla olevassa koneoppimisesimerkissä tehtävänä on ennustaa kukkatyyppi kolmen lajikkeen joukosta. Ennusteet perustuvat terälehden pituuteen ja leveyteen. Kuvassa on kymmenen eri algoritmin tulokset. Vasemmassa yläkulmassa oleva kuva on tietojoukko. Tiedot luokitellaan kolmeen luokkaan: punainen, vaaleansininen ja tummansininen. On joitain ryhmittymiä. Esimerkiksi toisesta kuvasta kaikki vasemmassa yläkulmassa oleva kuuluu punaiseen kategoriaan, keskiosassa on sekoitus epävarmuutta ja vaaleansinistä, kun taas alaosa vastaa tummaa luokkaa. Muut kuvat näyttävät erilaisia algoritmeja ja kuinka ne yrittävät luokitella dataa.
Koneoppimisen haasteet ja rajoitukset
Nyt tässä koneoppimisoppaassa opimme koneoppimisen rajoituksista:
Koneoppimisen ensisijainen haaste on datan puute tai tietojoukon monimuotoisuus. Kone ei voi oppia, jos tietoja ei ole saatavilla. Lisäksi tietojoukko, jossa ei ole monipuolisuutta, vaikeuttaa konetta. Koneessa on oltava heterogeeninen, jotta se oppii merkityksellisen näkemyksen. On harvinaista, että algoritmi voi poimia tietoa, kun muunnelmia ei ole tai niitä on vähän. On suositeltavaa tehdä vähintään 20 havaintoa ryhmää kohden, jotta kone oppii. Tämä rajoitus johtaa huonoon arviointiin ja ennustamiseen.
Koneoppimisen soveltaminen
Nyt tässä koneoppimisoppaassa opitaan koneoppimisen sovelluksia:
lisääminen:
- Koneoppiminen, joka auttaa ihmisiä heidän päivittäisessä työssään joko henkilökohtaisesti tai kaupallisesti ilman, että heillä on täydellinen tulosten hallinta. Tällaista koneoppimista käytetään eri tavoilla, kuten Virtual Assistant, Data-analyysi, ohjelmistoratkaisut. Ensisijainen käyttäjä on vähentää virheitä, jotka johtuvat inhimillisestä harhasta.
Automaatio:
- Koneoppiminen, joka toimii täysin itsenäisesti millä tahansa alalla ilman ihmisen väliintuloa. Esimerkiksi robotit suorittavat olennaisia prosessivaiheita tuotantolaitoksissa.
Rahoitusala
- Koneoppimisen suosio kasvaa finanssialalla. Pankit käyttävät pääasiassa ML:ää löytääkseen kuvioita tiedoista, mutta myös estääkseen petoksia.
Hallituksen organisaatio
- Hallitus käyttää ML:ää yleisen turvallisuuden ja laitosten hallintaan. Otetaan esimerkki Kiinasta massiivisella kasvojentunnistuksella. Hallitus käyttää Tekoäly jaywalkerin estämiseksi.
Terveydenhuollon teollisuus
- Terveydenhuolto oli yksi ensimmäisistä toimialoista, joka käytti koneoppimista kuvantunnistuksen kanssa.
Marketing
- Tekoälyä käytetään laajasti markkinoinnissa runsaan datan saatavuuden ansiosta. Ennen massadatan aikakautta tutkijat kehittävät edistyneitä matemaattisia työkaluja, kuten Bayesin analyysiä asiakkaan arvon arvioimiseksi. Databuumin myötä markkinointiosasto luottaa tekoälyyn asiakassuhteen ja markkinointikampanjan optimoinnissa.
Esimerkki koneoppimisen soveltamisesta toimitusketjussa
Koneoppiminen antaa loistavia tuloksia visuaaliseen kuvioiden tunnistamiseen, mikä avaa monia mahdollisia sovelluksia fyysisessä tarkastuksessa ja kunnossapidossa koko toimitusketjun verkossa.
Valvomaton oppiminen voi nopeasti etsiä vertailukelpoisia malleja monipuolisesta tietojoukosta. Kone voi puolestaan suorittaa laaduntarkastuksen koko logistiikkakeskuksessa, kuljetuksessa vaurioituneena ja kuluneena.
Esimerkiksi IBMWatson-alusta voi määrittää kuljetuskontin vauriot. Watson yhdistää visuaaliset ja järjestelmäpohjaiset tiedot seuratakseen, raportoidakseen ja antaakseen suosituksia reaaliajassa.
Kuluneen vuoden varastonhoitaja luottaa laajasti ensisijaiseen menetelmään varaston arvioinnissa ja ennustamisessa. Big datan ja koneoppimisen yhdistämisessä on otettu käyttöön parempia ennustetekniikoita (parannus 20-30 % perinteisiin ennustetyökaluihin verrattuna). Myynnin kannalta se tarkoittaa 2-3 % kasvua varastokustannusten mahdollisen alenemisen vuoksi.
Esimerkki koneoppimisesta Google Car
Kaikki tuntevat esimerkiksi Google-auton. Auto on täynnä lasereita katolla, jotka kertovat sille missä se on ympäröivästä alueesta. Sen edessä on tutka, joka ilmoittaa autolle kaikkien ympärillä olevien autojen nopeudesta ja liikkeestä. Se käyttää kaikkia näitä tietoja selvittääkseen paitsi kuinka autoa ajaa, myös selvittääkseen ja ennustaakseen, mitä potentiaaliset kuljettajat auton ympärillä aikovat tehdä. Vaikuttavaa on, että auto käsittelee lähes gigatavua sekunnissa dataa.
Miksi koneoppiminen on tärkeää?
Koneoppiminen on tähän mennessä paras työkalu datan kuvion analysointiin, ymmärtämiseen ja tunnistamiseen. Yksi koneoppimisen pääajatuksista on, että tietokone voidaan kouluttaa automatisoimaan tehtäviä, jotka olisivat tyhjentäviä tai mahdottomia ihmiselle. Selvä rikkomus perinteiseen analyysiin on se, että koneoppiminen voi tehdä päätöksiä minimaalisella ihmisen väliintulolla.
Otetaan seuraava esimerkki tästä ML-opetusohjelmasta; välittäjä osaa arvioida asunnon hinnan oman kokemuksensa ja markkinatuntemuksensa perusteella.
Kone voidaan kouluttaa muuttamaan asiantuntijan tietämystä ominaisuuksiksi. Ominaisuudet ovat kaikki talon, kaupunginosan, taloudellisen ympäristön jne. ominaisuudet, jotka vaikuttavat hintaan. Asiantuntijalta kesti luultavasti vuosia hallita talon hinnan arvioinnin taitoa. Hänen asiantuntemuksensa paranee ja paranee jokaisen myynnin jälkeen.
Koneelta tarvitaan miljoonia tietoja (eli esimerkiksi) tämän taiteen hallitsemiseen. Heti oppimisensa alussa kone tekee virheen, jotenkin kuin nuorempi myyjä. Kun kone näkee kaiken esimerkin, se sai tarpeeksi tietoa tehdäkseen arvionsa. Samaan aikaan uskomattomalla tarkkuudella. Kone pystyy myös korjaamaan virheensä vastaavasti.
Suurin osa suuryrityksestä on ymmärtänyt koneoppimisen ja datan säilyttämisen arvon. McKinsey on arvioinut, että analytiikan arvo vaihtelee $9.5 biljoonaa $15.4 biljoonaa aikaa $5–7 biljoonaa voidaan lukea edistyneimpien tekoälytekniikoiden ansioksi.
Lue myös Mikä on sumea logiikka? Archirakenne, sovellus ja esimerkki: Klikkaa tästä