Felügyelt gépi tanulás: mi az, Algorithms példákkal
Mi az a felügyelt gépi tanulás?
Felügyelt gépi tanulás egy olyan algoritmus, amely a felcímkézett edzésadatokból tanul, hogy segítsen előre megjósolni az előre nem látható adatok kimenetelét. A felügyelt tanulás során jól „felcímkézett” adatok felhasználásával betanítja a gépet. Ez azt jelenti, hogy bizonyos adatok már meg vannak jelölve a helyes válaszokkal. Összehasonlítható a felügyelő vagy tanár jelenlétében történő tanulással.
Sikeres felépítés, méretezés és telepítés pontos A felügyelt gépi tanulási modellekhez időre és műszaki szakértelmre van szükség egy magasan képzett adattudós csapattól. Ráadásul, dátum a tudósnak újjá kell építenie modellek hogy a megadott betekintések igazak maradjanak mindaddig, amíg az adatok meg nem változnak.
Hogyan működik a felügyelt tanulás
A felügyelt gépi tanulás tanítási adatkészleteket használ a kívánt eredmények elérése érdekében. Ezek az adatkészletek olyan bemeneteket és helyes kimenetet tartalmaznak, amelyek elősegítik a modell gyorsabb tanulását. Például egy gépet szeretne betanítani, hogy segítsen megjósolni, mennyi ideig tart hazafelé a munkahelyéről.
Itt először egy címkézett adatkészletet hoz létre. Ezek az adatok a következőket tartalmazzák:
- Időjárási viszonyok
- A nap ideje
- Ünnepek
Mindezek a részletek az Ön által megadott adatok ebben a felügyelt tanulási példában. A kimenet az az idő, ameddig az adott napon hazautazni kellett.
Ösztönösen tudod, hogy ha kint esik az eső, akkor tovább tart, amíg hazafelé tartasz. De a gépnek adatokra és statisztikákra van szüksége.
Nézzünk néhány felügyelt tanulási példát arra vonatkozóan, hogyan fejleszthet ki egy felügyelt tanulási modellt ebben a példában, amely segít a felhasználónak az ingázási idő meghatározásában. Az első dolog, amit létre kell hoznia, egy edzőkészlet. Ez az edzéskészlet tartalmazza a teljes ingázási időt és a megfelelő tényezőket, például időjárást, időt stb. Az edzéskészlet alapján a gépe láthatja, hogy közvetlen kapcsolat van az eső mennyisége és a hazaérkezéshez szükséges idő között.
Tehát megbizonyosodik arról, hogy minél többet esik, annál tovább fog vezetni, hogy visszatérjen otthonába. Azt is láthatja, hogy van kapcsolat a munkából való távozás és az úton töltött idő között.
Minél közelebb van este 6-hoz, annál tovább tart, amíg hazaér. Előfordulhat, hogy a készülék talál néhány kapcsolatot a címkézett adatokkal.

Ez az adatmodell kezdete. Kezdi befolyásolni, hogy az eső hogyan befolyásolja az emberek vezetési módját. Azt is kezdi látni, hogy többen utaznak egy adott napszakban.
A felügyelt gépi tanulás típusai Algorithms
A felügyelt gépi tanulási algoritmusok típusai a következők:
Regresszió
A regressziós technika egyetlen kimeneti értéket jósol meg a betanítási adatok felhasználásával.
Példa: A regresszió segítségével megjósolhatja a ház árát a képzési adatokból. A bemeneti változók a helység, a ház mérete stb.
Erősségek: A kimeneteknek mindig van valószínűségi értelmezése, és az algoritmus szabályosítható a túlillesztés elkerülése érdekében.
Hiányosságok: A logisztikai regresszió alulteljesíthet, ha több vagy nem lineáris döntési határ van. Ez a módszer nem rugalmas, így nem ragad meg bonyolultabb kapcsolatokat.
Logisztikus regresszió:
Logisztikus regressziós módszer, amellyel diszkrét értékeket becsülnek meg adott független változókészlet alapján. Segít előre megjósolni egy esemény bekövetkezésének valószínűségét azáltal, hogy adatokat illeszt egy logit függvénybe. Ezért logisztikus regressziónak is nevezik. Ahogy előrejelzi a valószínűséget, a kimeneti értéke 0 és 1 között van.
Íme néhány regressziótípus Algorithms
Osztályozás
Az osztályozás a kimenet osztályon belüli csoportosítását jelenti. Ha az algoritmus két különböző osztályba próbálja felcímkézni a bemenetet, azt bináris osztályozásnak nevezzük. A kettőnél több osztály közötti választást többosztályos osztályozásnak nevezzük.
Példa: Annak meghatározása, hogy valaki késedelmes lesz-e a kölcsönnel.
Erősségek: Az osztályozási fa nagyon jól teljesít a gyakorlatban
Hiányosságok: A kötetlen, egyedi fák hajlamosak a túlillesztésre.
Íme néhány osztályozási típus Algorithms
Naiv Bayes osztályozók
A naiv Bayes-modellt (NBN) könnyű felépíteni, és nagyon hasznos nagy adathalmazokhoz. Ez a módszer közvetlen aciklikus gráfokból áll, egy szülővel és több gyermekkel. Függetlenséget feltételez a szülőtől elválasztott gyermek csomópontok között.
Döntési fák
A döntési fák osztályozzák a példányokat a jellemzőérték alapján rendezve. Ebben a módszerben minden mód egy példány jellemzője. Osztályozni kell, és minden ág olyan értéket képvisel, amelyet a csomópont fel tud venni. Ez egy széles körben használt osztályozási technika. Ebben a módszerben az osztályozás egy döntési faként ismert fa.
Segít megbecsülni a valós értékeket (autóvásárlás költsége, hívások száma, teljes havi eladások stb.).
Támogatja a vektoros gépet
A támogatási vektorgép (SVM) egy 1990-ben kifejlesztett tanulási algoritmus. Ez a módszer a Vap Nik által bevezetett statisztikai tanuláselmélet eredményein alapul.
Az SVM-gépek is szorosan kapcsolódnak a kernel függvényeihez, ami a legtöbb tanulási feladat központi fogalma. A kernel keretrendszert és az SVM-et számos területen használják. Tartalmazza a multimédiás információkeresést, a bioinformatikát és a mintafelismerést.
Felügyelt és nem felügyelt gépi tanulási technikák
Alapján | Felügyelt gépi tanulási technika | Felügyelet nélküli gépi tanulási technika |
---|---|---|
Beviteli adat | Algorithms címkézett adatok felhasználásával képezik ki. | Algorithms nem címkézett adatok ellen használják |
Számítási komplexitás | A felügyelt tanulás egyszerűbb módszer. | A felügyelet nélküli tanulás számítási szempontból bonyolult |
Pontosság | Rendkívül pontos és megbízható módszer. | Less pontos és megbízható módszer. |
Kihívások a felügyelt gépi tanulásban
Íme a felügyelt gépi tanulás során felmerülő kihívások:
- A képzési adatok nem releváns bemeneti jellemzői pontatlan eredményeket adhatnak
- Az adatok előkészítése és előfeldolgozása mindig kihívást jelent.
- A pontosság csorbul, ha lehetetlen, valószínűtlen és hiányos értékeket adtak meg tanítási adatként
- Ha az érintett szakértő nem elérhető, akkor a másik megközelítés a „brute-force”. Ez azt jelenti, hogy gondolkodnia kell a megfelelő tulajdonságokról (bemeneti változókról), amelyekre a gépet betanítja. Lehet, hogy pontatlan.
A felügyelt tanulás előnyei
Íme a felügyelt gépi tanulás előnyei:
- Felügyelt tanulás be Gépi tanulás lehetővé teszi adatok gyűjtését vagy adatkimenetek előállítását a korábbi tapasztalatokból
- Segít optimalizálni a teljesítménykritériumokat a tapasztalatok felhasználásával
- A felügyelt gépi tanulás segít különféle típusú valós számítási problémák megoldásában.
A felügyelt tanulás hátrányai
Az alábbiakban felsoroljuk a felügyelt gépi tanulás hátrányait:
- A döntési határ túlképzett lehet, ha a képzési készletében nincs olyan példa, amelyet szeretne egy osztályban
- Az osztályozó képzése során minden osztályból sok jó példát kell kiválasztania.
- Osztályozás big adatok igazi kihívás lehet.
- A felügyelt tanuláshoz szükséges képzés sok számítási időt igényel.
A felügyelt tanulás legjobb gyakorlatai
- Mielőtt bármi mást tenne, el kell döntenie, hogy milyen adatokat használjon edzéskészletként
- El kell döntenie a tanult függvény és a tanulási algoritmus szerkezetét.
- Gyűjtsön össze megfelelő eredményeket humán szakértőktől vagy mérésekből
Összegzésként
- A felügyelt tanulási algoritmusokban jól „felcímkézett” adatok felhasználásával betanítja a gépet.
- A felügyelt tanulás egyik példája, ha olyan gépet szeretne betanítani, amely segít megjósolni, hogy mennyi ideig tart haza autózni a munkahelyéről.
- A regresszió és az osztályozás a felügyelt gépi tanulási algoritmus két dimenziója.
- Felügyelt tanulás egyszerűbb módszer, míg a felügyelet nélküli tanulás összetett módszer.
- A felügyelt tanulásban a legnagyobb kihívás az, hogy a képzési adatok irreleváns bemeneti jellemzői pontatlan eredményeket adhatnak.
- A felügyelt tanulás fő előnye, hogy lehetővé teszi adatok gyűjtését vagy adatkimenetek előállítását a korábbi tapasztalatokból.
- Ennek a modellnek az a hátránya, hogy a döntési határ túlfeszített lehet, ha a képzési készletben nincsenek olyan példák, amelyeket szeretne egy osztályban.
- A tanulás felügyeletének bevált gyakorlataként először el kell döntenie, hogy milyen adatokat használjon képzési készletként.