Koneoppimisen opetusohjelma aloittelijoille: Mikä on, ML:n perusteet

Mikä on koneoppiminen?

Koneen oppiminen on tietokonealgoritmien järjestelmä, joka voi oppia esimerkistä itsensä kehittämisen kautta ilman, että ohjelmoija koodaa niitä erikseen. Koneoppiminen on osa tekoälyä, joka yhdistää datan tilastollisiin työkaluihin, jotta voidaan ennustaa tulos, jota voidaan käyttää hyödyllisten oivallusten tekemiseen.

Läpimurto tulee siitä ajatuksesta, että kone voi yksinään oppia tiedoista (eli esimerkistä) tuottaakseen tarkkoja tuloksia. Koneoppiminen liittyy läheisesti tiedon louhintaan ja Bayesin ennustavaan mallinnukseen. Kone vastaanottaa dataa syötteenä ja käyttää algoritmia vastausten muotoiluun.

Tyypillisiä koneoppimistehtäviä ovat suosituksen antaminen. Niille, joilla on a Netflix Kaikki elokuvien tai sarjojen suositukset perustuvat käyttäjän historiallisiin tietoihin. Tekniset yritykset käyttävät ohjaamaton oppiminen parantaa käyttökokemusta personointisuositusten avulla.

Koneoppimista käytetään myös erilaisiin tehtäviin, kuten petosten havaitsemiseen, ennakoivaan ylläpitoon, portfolion optimointiin, tehtävien automatisointiin ja niin edelleen.

Koneoppiminen vs. perinteinen ohjelmointi

Perinteinen ohjelmointi eroaa huomattavasti koneoppimisesta. Perinteisessä ohjelmoinnissa ohjelmoija koodaa kaikki säännöt yhteistyössä alan asiantuntijan kanssa, jolle ohjelmistoa kehitetään. Jokainen sääntö perustuu loogiseen perustaan; kone suorittaa tulosteen loogisen käskyn jälkeen. Kun järjestelmä monimutkaistuu, on kirjoitettava lisää sääntöjä. Sen ylläpitäminen voi nopeasti muuttua kestämättömäksi.

Koneoppimisen pitäisi ratkaista tämä ongelma. Kone oppii kuinka tulo- ja lähtötiedot korreloivat ja kirjoittaa säännön. Ohjelmoijien ei tarvitse kirjoittaa uusia sääntöjä joka kerta, kun on uutta tietoa. Algoritmit mukautuvat uusiin tietoihin ja kokemuksiin parantaakseen tehokkuutta ajan myötä.

Miten koneoppiminen toimii?

Nyt tässä koneoppimisen perusteet aloittelijoille -opetusohjelmassa opimme, kuinka koneoppiminen (ML) toimii:

Koneoppiminen on aivot, joissa kaikki oppiminen tapahtuu. Tapa, jolla kone oppii, on samanlainen kuin ihminen. Ihminen oppii kokemuksesta. Mitä enemmän tiedämme, sitä helpommin voimme ennustaa. Analogisesti, kun kohtaamme tuntemattoman tilanteen, onnistumisen todennäköisyys on pienempi kuin tunnettu tilanne. Koneet on koulutettu samalla tavalla. Tarkan ennusteen tekemiseksi kone näkee esimerkin. Kun annamme koneelle samanlaisen esimerkin, se voi selvittää lopputuloksen. Kuitenkin, kuten ihmisellä, jos se ruokkii aiemmin näkemätöntä esimerkkiä, koneella on vaikeuksia ennustaa.

Koneoppimisen ydintavoite on oppiminen ja päättely. Ensinnäkin kone oppii kuvioiden löytämisen kautta. Tämä löytö on tehty kiitos tiedot. Yksi datatieteilijän keskeinen osa on valita huolellisesti, mitä dataa koneelle toimittaa. Luettelo attribuuteista, joita käytetään ongelman ratkaisemiseen, on nimeltään a piirrevektori. Voit ajatella piirrevektoria datan osajoukona, jota käytetään ongelman ratkaisemiseen.

Kone käyttää joitain hienoja algoritmeja yksinkertaistaakseen todellisuutta ja muuttaakseen tämän löydön a malli. Siksi oppimisvaihetta käytetään tietojen kuvaamiseen ja tiivistämiseen malliksi.

Kone yrittää esimerkiksi ymmärtää suhdetta yksilön palkan ja todennäköisyyden välillä mennä hienoon ravintolaan. Osoittautuu, että kone löytää positiivisen suhteen palkan ja huippuluokan ravintolaan menemisen välillä: Tämä on malli

Päätellen

Kun mallia rakennetaan, on mahdollista testata sen tehokkuutta ennennäkemättömällä tiedolla. Uusi data muunnetaan piirrevektoriksi, käy mallin läpi ja antaa ennusteen. Tämä kaikki on koneoppimisen kaunis osa. Sääntöjä ei tarvitse päivittää tai mallia kouluttaa uudelleen. Voit käyttää aiemmin koulutettua mallia tehdäksesi johtopäätöksiä uusista tiedoista.

Koneoppimisohjelmien käyttöikä on suoraviivaista, ja se voidaan tiivistää seuraaviin kohtiin:

Määrittele kysymys
Kerätä dataa
Visualisoi tiedot
Juna-algoritmi
Testaa algoritmia
Kerää palautetta
Tarkenna algoritmia
Kierrä 4-7, kunnes tulokset ovat tyydyttäviä
Käytä mallia ennusteen tekemiseen

Kun algoritmi osaa tehdä oikeat johtopäätökset, se soveltaa tätä tietoa uusiin tietokokonaisuuksiin.

Koneen oppiminen Algorithms ja missä niitä käytetään?

Nyt tässä koneoppimisohjeessa aloittelijoille opimme, missä koneoppimisalgoritmeja (ML) käytetään:

Koneoppiminen voidaan ryhmitellä kahteen laajaan oppimistehtävään: Valvottu ja Ohjaamaton. On monia muitakin algoritmeja

Valvottu oppiminen

Algoritmi käyttää koulutusdataa ja ihmisiltä saatua palautetta oppiakseen annettujen syötteiden suhteen tiettyyn ulostuloon. Ammatinharjoittaja voi esimerkiksi käyttää markkinointikuluja ja sääennusteita syöttötietoina ennustaakseen tölkkien myyntiä.

Voit käyttää ohjattua oppimista, kun lähtötiedot ovat tiedossa. Algoritmi ennustaa uusia tietoja.

On olemassa kaksi luokkaa valvottu oppiminen:

Luokittelutehtävä
Regressiotehtävä

Luokittelu

Kuvittele, että haluat ennustaa mainoksen asiakkaan sukupuolen. Aloitat asiakastietokannastasi tietojen keräämisen pituudesta, painosta, työstä, palkasta, ostokorista jne. Tiedät jokaisen asiakkaasi sukupuolen, se voi olla vain mies tai nainen. Luokittajan tavoitteena on määrittää todennäköisyys olla mies tai nainen (eli etiketti) tietojen (eli keräämiesi ominaisuuksien) perusteella. Kun malli oppi tunnistamaan miehen tai naisen, voit käyttää uutta tietoa ennusteen tekemiseen. Esimerkiksi, olet juuri saanut uutta tietoa tuntemattomalta asiakkaalta ja haluat tietää, onko kyseessä mies vai nainen. Jos luokitin ennustaa miehen = 70 %, se tarkoittaa, että algoritmi on varma 70 %:lla, että tämä asiakas on mies ja 30 %:lla nainen.

Etiketti voi olla kahta tai useampaa luokkaa. Yllä olevassa koneoppimisesimerkissä on vain kaksi luokkaa, mutta jos luokitin tarvitsee ennustaa objektia, siinä on kymmeniä luokkia (esim. lasi, pöytä, kengät jne. jokainen objekti edustaa luokkaa)

Regressio

Kun tulos on jatkuva arvo, tehtävä on regressio. Esimerkiksi rahoitusanalyytikko saattaa joutua ennustamaan osakkeen arvon useiden ominaisuuksien, kuten osakepääoman, aiempien osakekehityksen tai makrotalouden indeksin, perusteella. Järjestelmä koulutetaan arvioimaan osakkeiden hinta mahdollisimman pienellä virheellä.

algoritmi	Tuotetiedot	Tyyppi
Lineaarinen regressio	Löytää tavan korreloida jokainen ominaisuus tulosteen tulevien arvojen ennustamiseksi.	Regressio
Logistinen regressio	Lineaarisen regression laajennus, jota käytetään luokitustehtävissä. Tulosmuuttuja 3 on binäärinen (esim. vain musta tai valkoinen) eikä jatkuva (esim. ääretön luettelo mahdollisista väreistä)	Luokittelu
Päätöspuu	Hyvin tulkittavissa oleva luokitus- tai regressiomalli, joka jakaa tieto-ominaisuusarvot haaroihin päätössolmuissa (esim. jos ominaisuus on väri, jokaisesta mahdollisesta väristä tulee uusi haara), kunnes lopullinen päätöstulos on tehty	Regressio Luokittelu
Naiivi Bayes	Bayesin menetelmä on luokittelumenetelmä, joka hyödyntää Bayesin lausetta. Lause päivittää aikaisemman tiedon tapahtumasta kunkin tapahtumaan vaikuttavan ominaisuuden riippumattomalla todennäköisyydellä.	Regressio Luokittelu
Tuki vektorikoneelle	Luokittelutehtävään käytetään yleensä tukivektorikonetta tai SVM:ää. SVM-algoritmi löytää hypertason, joka jakaa luokat optimaalisesti. Sitä käytetään parhaiten epälineaarisen ratkaisijan kanssa.	Regressio (ei kovin yleinen) Luokittelu
Satunnainen metsä	Algoritmi on rakennettu päätöspuuhun, joka parantaa tarkkuutta huomattavasti. Satunnainen metsä tuottaa monta kertaa yksinkertaisia päätöspuita ja käyttää enemmistöäänestysmenetelmää päättääkseen, minkä etiketin palautetaan. Luokittelutehtävän lopullinen ennuste on se, joka saa eniten ääniä; kun taas regressiotehtävässä kaikkien puiden keskimääräinen ennuste on lopullinen ennuste.	Regressio Luokittelu
AdaBoost	Luokittelu- tai regressiotekniikka, joka käyttää lukuisia malleja päätöksen tekemiseen, mutta punnitsee niitä niiden tarkkuuden perusteella ennustaessaan lopputulosta	Regressio Luokittelu
Gradienttia lisäävät puut	Gradienttia tehostavat puut on huippuluokan luokitus/regressiotekniikka. Se keskittyy edellisten puiden tekemiin virheisiin ja yrittää korjata sen.	Regressio Luokittelu

Valvomaton oppiminen

Valvomattomassa oppimisessa algoritmi tutkii syöttödataa antamatta sille nimenomaista lähtömuuttujaa (esim. tutkii asiakkaiden demografisia tietoja kuvioiden tunnistamiseksi)

Voit käyttää sitä, kun et osaa luokitella dataa ja haluat algoritmin löytävän malleja ja luokittavan tiedot puolestasi

Algoritmin nimi	Tuotetiedot	Tyyppi
K tarkoittaa ryhmittelyä	Sijoittaa tiedot joihinkin ryhmiin (k), joista jokainen sisältää tietoja, joilla on samanlaiset ominaisuudet (mallin määrittämänä, ei ihmisten etukäteen määrittämänä)	Clusterta
Gaussin sekoitusmalli	K-keskiarvoklusteroinnin yleistys, joka tarjoaa enemmän joustavuutta ryhmien (klustereiden) koossa ja muodossa	Clusterta
Hierarkkinen klusterointi	Jakaa klusterit hierarkkista puuta pitkin luokittelujärjestelmän muodostamiseksi. Voidaan käyttää Cluster kanta-asiakas	Clusterta
Recommender-järjestelmä	Auta määrittämään suosituksen tekemiseen tarvittavat tiedot.	Clusterta
PCA/T-SNE	Käytetään enimmäkseen tietojen mittasuhteiden vähentämiseen. Algoritmit vähentävät piirteiden määrän 3 tai 4 vektoriin, joilla on suurimmat varianssit.	Ulottuvuuden pienennys

Kuinka valita koneoppimisalgoritmi

Nyt tässä koneoppimisen perusteiden opetusohjelmassa opimme valitsemaan koneoppimisalgoritmin (ML):

Koneoppimisalgoritmeja on paljon. Algoritmin valinta perustuu tavoitteeseen.

Alla olevassa koneoppimisesimerkissä tehtävänä on ennustaa kukan tyyppi kolmesta lajikkeesta. Ennusteet perustuvat terälehden pituuteen ja leveyteen. Kuvassa näkyy kymmenen eri algoritmin tulokset. Vasemmassa yläkulmassa oleva kuva on datajoukko. Data on luokiteltu kolmeen luokkaan: punainen, vaaleansininen ja tummansininen. On olemassa joitakin ryhmiäpings. Esimerkiksi toisessa kuvassa kaikki vasemmassa yläkulmassa kuuluu punaiseen kategoriaan, keskiosassa on sekoitus epävarmuutta ja vaaleansinistä, kun taas alaosa vastaa tummaa kategoriaa. Muut kuvat näyttävät erilaisia algoritmeja ja sitä, miten ne yrittävät luokitella dataa.

Koneoppimisen haasteet ja rajoitukset

Nyt tässä koneoppimisoppaassa opimme koneoppimisen rajoituksista:

Koneoppimisen ensisijainen haaste on datan puute tai datajoukon monimuotoisuus. Kone ei voi oppia, jos dataa ei ole saatavilla. Lisäksi datajoukko, jossa ei ole monimuotoisuutta, on koneelle vaikea. Koneen on oltava heterogeeninen oppiakseen merkityksellistä tietoa. On harvinaista, että algoritmi pystyy...tract-tietoa, kun variaatioita ei ole tai niitä on vähän. On suositeltavaa, että ryhmää kohden on vähintään 20 havaintoa koneoppimisen helpottamiseksi. Tämä rajoitus johtaa huonoon arviointiin ja ennustamiseen.

Koneoppimisen soveltaminen

Nyt tässä koneoppimisoppaassa opitaan koneoppimisen sovelluksia:

lisääminen:

Koneoppiminen, joka auttaa ihmisiä heidän päivittäisessä työssään joko henkilökohtaisesti tai kaupallisesti ilman, että heillä on täydellinen tulosten hallinta. Tällaista koneoppimista käytetään eri tavoilla, kuten Virtual Assistant, Data-analyysi, ohjelmistoratkaisut. Ensisijainen käyttäjä on vähentää virheitä, jotka johtuvat inhimillisestä harhasta.

Automaatio:

Koneoppiminen, joka toimii täysin itsenäisesti millä tahansa alalla ilman ihmisen väliintuloa. Esimerkiksi robotit suorittavat olennaisia prosessivaiheita tuotantolaitoksissa.

Rahoitusala

Koneoppimisen suosio kasvaa finanssialalla. Pankit käyttävät pääasiassa ML:ää löytääkseen kuvioita tiedoista, mutta myös estääkseen petoksia.

Hallituksen organisaatio

Hallitus käyttää ML:ää yleisen turvallisuuden ja laitosten hallintaan. Otetaan esimerkki Kiinasta massiivisella kasvojentunnistuksella. Hallitus käyttää Tekoäly jaywalkerin estämiseksi.

Terveydenhuollon teollisuus

Terveydenhuolto oli yksi ensimmäisistä toimialoista, joka käytti koneoppimista kuvantunnistuksen kanssa.

Marketing

Tekoälyä käytetään laajasti markkinoinnissa runsaan datan saatavuuden ansiosta. Ennen massadatan aikakautta tutkijat kehittävät edistyneitä matemaattisia työkaluja, kuten Bayesin analyysiä asiakkaan arvon arvioimiseksi. Databuumin myötä markkinointiosasto luottaa tekoälyyn asiakassuhteen ja markkinointikampanjan optimoinnissa.

Esimerkki koneoppimisen soveltamisesta toimitusketjussa

Koneoppiminen antaa loistavia tuloksia visuaaliseen kuvioiden tunnistamiseen, mikä avaa monia mahdollisia sovelluksia fyysisessä tarkastuksessa ja kunnossapidossa koko toimitusketjun verkossa.

Valvomaton oppiminen voi nopeasti etsiä vertailukelpoisia malleja monipuolisesta tietojoukosta. Kone voi puolestaan suorittaa laaduntarkastuksen koko logistiikkakeskuksessa, kuljetuksessa vaurioituneena ja kuluneena.

Esimerkiksi IBMWatson-alusta pystyy määrittämään aluksenping konttivaurioita. Watson yhdistää visuaalista ja järjestelmäpohjaista dataa track, raportoi ja tee suosituksia reaaliajassa.

Kuluneen vuoden varastonhoitaja luottaa laajasti ensisijaiseen menetelmään varaston arvioinnissa ja ennustamisessa. Big datan ja koneoppimisen yhdistämisessä on otettu käyttöön parempia ennustetekniikoita (parannus 20-30 % perinteisiin ennustetyökaluihin verrattuna). Myynnin kannalta se tarkoittaa 2-3 % kasvua varastokustannusten mahdollisen alenemisen vuoksi.

Esimerkki koneoppimisesta Google Auto

Esimerkiksi kaikki tietävät, Google auto. Auton katolla on lasereita, jotka kertovat sille sen sijainnin ympäröivään alueeseen nähden. Sen edessä on tutka, joka ilmoittaa autolle kaikkien ympärillä olevien autojen nopeuden ja liikkeen. Se käyttää kaikkia näitä tietoja paitsi selvittääkseen, miten autoa tulisi ajaa, myös selvittääkseen ja ennustaakseen, mitä auton ympärillä olevat mahdolliset kuljettajat aikovat tehdä. Vaikuttavaa on, että auto käsittelee lähes gigatavun sekunnissa dataa.

Miksi koneoppiminen on tärkeää?

Koneoppiminen on tähän mennessä paras työkalu datan kuvion analysointiin, ymmärtämiseen ja tunnistamiseen. Yksi koneoppimisen pääajatuksista on, että tietokone voidaan kouluttaa automatisoimaan tehtäviä, jotka olisivat tyhjentäviä tai mahdottomia ihmiselle. Selvä rikkomus perinteiseen analyysiin on se, että koneoppiminen voi tehdä päätöksiä minimaalisella ihmisen väliintulolla.

Otetaan seuraava esimerkki tästä ML-opetusohjelmasta; välittäjä osaa arvioida asunnon hinnan oman kokemuksensa ja markkinatuntemuksensa perusteella.

Kone voidaan kouluttaa muuttamaan asiantuntijan tietämystä ominaisuuksiksi. Ominaisuudet ovat kaikki talon, kaupunginosan, taloudellisen ympäristön jne. ominaisuudet, jotka vaikuttavat hintaan. Asiantuntijalta kesti luultavasti vuosia hallita talon hinnan arvioinnin taitoa. Hänen asiantuntemuksensa paranee ja paranee jokaisen myynnin jälkeen.

Koneelta tarvitaan miljoonia tietoja (eli esimerkiksi) tämän taiteen hallitsemiseen. Heti oppimisensa alussa kone tekee virheen, jotenkin kuin nuorempi myyjä. Kun kone näkee kaiken esimerkin, se sai tarpeeksi tietoa tehdäkseen arvionsa. Samaan aikaan uskomattomalla tarkkuudella. Kone pystyy myös korjaamaan virheensä vastaavasti.

Suurin osa suuryrityksestä on ymmärtänyt koneoppimisen ja datan säilyttämisen arvon. McKinsey on arvioinut, että analytiikan arvo vaihtelee $9.5 biljoonaa $15.4 biljoonaa aikaa $5–7 biljoonaa voidaan lukea edistyneimpien tekoälytekniikoiden ansioksi.

Lue myös Mikä on sumea logiikka? Archirakenne, sovellus ja esimerkki: Klikkaa tästä

Koneoppimisen opetusohjelma aloittelijoille: Mikä on, ML:n perusteet

Mikä on koneoppiminen?

Koneoppiminen vs. perinteinen ohjelmointi