Felügyelt gépi tanulás: mi az, Algorithms példákkal

Mi az a felügyelt gépi tanulás?

Felügyelt gépi tanulás egy olyan algoritmus, amely a felcímkézett edzésadatokból tanul, hogy segítsen előre megjósolni az előre nem látható adatok kimenetelét. A felügyelt tanulás során jól „felcímkézett” adatok felhasználásával betanítja a gépet. Ez azt jelenti, hogy bizonyos adatok már meg vannak jelölve a helyes válaszokkal. Összehasonlítható a felügyelő vagy tanár jelenlétében történő tanulással.

Sikeres felépítés, méretezés és telepítés pontos A felügyelt gépi tanulási modellekhez időre és műszaki szakértelmre van szükség egy magasan képzett adattudós csapattól. Ráadásul, dátum a tudósnak újjá kell építenie modellek hogy a megadott betekintések igazak maradjanak mindaddig, amíg az adatok meg nem változnak.

Hogyan működik a felügyelt tanulás

A felügyelt gépi tanulás tanítási adatkészleteket használ a kívánt eredmények elérése érdekében. Ezek az adatkészletek olyan bemeneteket és helyes kimenetet tartalmaznak, amelyek elősegítik a modell gyorsabb tanulását. Például egy gépet szeretne betanítani, hogy segítsen megjósolni, mennyi ideig tart hazafelé a munkahelyéről.

Itt először egy címkézett adatkészletet hoz létre. Ezek az adatok a következőket tartalmazzák:

  • Időjárási viszonyok
  • A nap ideje
  • Ünnepek

Mindezek a részletek az Ön által megadott adatok ebben a felügyelt tanulási példában. A kimenet az az idő, ameddig az adott napon hazautazni kellett.

Hogyan működik a felügyelt gépi tanulás

Ösztönösen tudod, hogy ha kint esik az eső, akkor tovább tart, amíg hazafelé tartasz. De a gépnek adatokra és statisztikákra van szüksége.

Nézzünk néhány felügyelt tanulási példát arra vonatkozóan, hogyan fejleszthet ki egy felügyelt tanulási modellt ebben a példában, amely segít a felhasználónak az ingázási idő meghatározásában. Az első dolog, amit létre kell hoznia, egy edzőkészlet. Ez az edzéskészlet tartalmazza a teljes ingázási időt és a megfelelő tényezőket, például időjárást, időt stb. Az edzéskészlet alapján a gépe láthatja, hogy közvetlen kapcsolat van az eső mennyisége és a hazaérkezéshez szükséges idő között.

Tehát megbizonyosodik arról, hogy minél többet esik, annál tovább fog vezetni, hogy visszatérjen otthonába. Azt is láthatja, hogy van kapcsolat a munkából való távozás és az úton töltött idő között.

Minél közelebb van este 6-hoz, annál tovább tart, amíg hazaér. Előfordulhat, hogy a készülék talál néhány kapcsolatot a címkézett adatokkal.

Felügyelt gépi tanulás működése
Felügyelt gépi tanulás működése

Ez az adatmodell kezdete. Kezdi befolyásolni, hogy az eső hogyan befolyásolja az emberek vezetési módját. Azt is kezdi látni, hogy többen utaznak egy adott napszakban.

A felügyelt gépi tanulás típusai Algorithms

A felügyelt gépi tanulási algoritmusok típusai a következők:

Regresszió

A regressziós technika egyetlen kimeneti értéket jósol meg a betanítási adatok felhasználásával.

Példa: A regresszió segítségével megjósolhatja a ház árát a képzési adatokból. A bemeneti változók a helység, a ház mérete stb.

Erősségek: A kimeneteknek mindig van valószínűségi értelmezése, és az algoritmus szabályosítható a túlillesztés elkerülése érdekében.

Hiányosságok: A logisztikai regresszió alulteljesíthet, ha több vagy nem lineáris döntési határ van. Ez a módszer nem rugalmas, így nem ragad meg bonyolultabb kapcsolatokat.

Logisztikus regresszió:

Logisztikus regressziós módszer, amellyel diszkrét értékeket becsülnek meg adott független változókészlet alapján. Segít előre megjósolni egy esemény bekövetkezésének valószínűségét azáltal, hogy adatokat illeszt egy logit függvénybe. Ezért logisztikus regressziónak is nevezik. Ahogy előrejelzi a valószínűséget, a kimeneti értéke 0 és 1 között van.

Íme néhány regressziótípus Algorithms

Osztályozás

Az osztályozás a kimenet osztályon belüli csoportosítását jelenti. Ha az algoritmus két különböző osztályba próbálja felcímkézni a bemenetet, azt bináris osztályozásnak nevezzük. A kettőnél több osztály közötti választást többosztályos osztályozásnak nevezzük.

Példa: Annak meghatározása, hogy valaki késedelmes lesz-e a kölcsönnel.

Erősségek: Az osztályozási fa nagyon jól teljesít a gyakorlatban

Hiányosságok: A kötetlen, egyedi fák hajlamosak a túlillesztésre.

Íme néhány osztályozási típus Algorithms

Naiv Bayes osztályozók

A naiv Bayes-modellt (NBN) könnyű felépíteni, és nagyon hasznos nagy adathalmazokhoz. Ez a módszer közvetlen aciklikus gráfokból áll, egy szülővel és több gyermekkel. Függetlenséget feltételez a szülőtől elválasztott gyermek csomópontok között.

Döntési fák

A döntési fák osztályozzák a példányokat a jellemzőérték alapján rendezve. Ebben a módszerben minden mód egy példány jellemzője. Osztályozni kell, és minden ág olyan értéket képvisel, amelyet a csomópont fel tud venni. Ez egy széles körben használt osztályozási technika. Ebben a módszerben az osztályozás egy döntési faként ismert fa.

Segít megbecsülni a valós értékeket (autóvásárlás költsége, hívások száma, teljes havi eladások stb.).

Támogatja a vektoros gépet

A támogatási vektorgép (SVM) egy 1990-ben kifejlesztett tanulási algoritmus. Ez a módszer a Vap Nik által bevezetett statisztikai tanuláselmélet eredményein alapul.

Az SVM-gépek is szorosan kapcsolódnak a kernel függvényeihez, ami a legtöbb tanulási feladat központi fogalma. A kernel keretrendszert és az SVM-et számos területen használják. Tartalmazza a multimédiás információkeresést, a bioinformatikát és a mintafelismerést.

Felügyelt és nem felügyelt gépi tanulási technikák

Alapján Felügyelt gépi tanulási technika Felügyelet nélküli gépi tanulási technika
Beviteli adat Algorithms címkézett adatok felhasználásával képezik ki. Algorithms nem címkézett adatok ellen használják
Számítási komplexitás A felügyelt tanulás egyszerűbb módszer. A felügyelet nélküli tanulás számítási szempontból bonyolult
Pontosság Rendkívül pontos és megbízható módszer. Less pontos és megbízható módszer.

Kihívások a felügyelt gépi tanulásban

Íme a felügyelt gépi tanulás során felmerülő kihívások:

  • A képzési adatok nem releváns bemeneti jellemzői pontatlan eredményeket adhatnak
  • Az adatok előkészítése és előfeldolgozása mindig kihívást jelent.
  • A pontosság csorbul, ha lehetetlen, valószínűtlen és hiányos értékeket adtak meg tanítási adatként
  • Ha az érintett szakértő nem elérhető, akkor a másik megközelítés a „brute-force”. Ez azt jelenti, hogy gondolkodnia kell a megfelelő tulajdonságokról (bemeneti változókról), amelyekre a gépet betanítja. Lehet, hogy pontatlan.

A felügyelt tanulás előnyei

Íme a felügyelt gépi tanulás előnyei:

  • Felügyelt tanulás be Gépi tanulás lehetővé teszi adatok gyűjtését vagy adatkimenetek előállítását a korábbi tapasztalatokból
  • Segít optimalizálni a teljesítménykritériumokat a tapasztalatok felhasználásával
  • A felügyelt gépi tanulás segít különféle típusú valós számítási problémák megoldásában.

A felügyelt tanulás hátrányai

Az alábbiakban felsoroljuk a felügyelt gépi tanulás hátrányait:

  • A döntési határ túlképzett lehet, ha a képzési készletében nincs olyan példa, amelyet szeretne egy osztályban
  • Az osztályozó képzése során minden osztályból sok jó példát kell kiválasztania.
  • Osztályozás big adatok igazi kihívás lehet.
  • A felügyelt tanuláshoz szükséges képzés sok számítási időt igényel.

A felügyelt tanulás legjobb gyakorlatai

  • Mielőtt bármi mást tenne, el kell döntenie, hogy milyen adatokat használjon edzéskészletként
  • El kell döntenie a tanult függvény és a tanulási algoritmus szerkezetét.
  • Gyűjtsön össze megfelelő eredményeket humán szakértőktől vagy mérésekből

Összegzésként

  • A felügyelt tanulási algoritmusokban jól „felcímkézett” adatok felhasználásával betanítja a gépet.
  • A felügyelt tanulás egyik példája, ha olyan gépet szeretne betanítani, amely segít megjósolni, hogy mennyi ideig tart haza autózni a munkahelyéről.
  • A regresszió és az osztályozás a felügyelt gépi tanulási algoritmus két dimenziója.
  • Felügyelt tanulás egyszerűbb módszer, míg a felügyelet nélküli tanulás összetett módszer.
  • A felügyelt tanulásban a legnagyobb kihívás az, hogy a képzési adatok irreleváns bemeneti jellemzői pontatlan eredményeket adhatnak.
  • A felügyelt tanulás fő előnye, hogy lehetővé teszi adatok gyűjtését vagy adatkimenetek előállítását a korábbi tapasztalatokból.
  • Ennek a modellnek az a hátránya, hogy a döntési határ túlfeszített lehet, ha a képzési készletben nincsenek olyan példák, amelyeket szeretne egy osztályban.
  • A tanulás felügyeletének bevált gyakorlataként először el kell döntenie, hogy milyen adatokat használjon képzési készletként.