Felügyelt vs felügyelet nélküli tanulás: különbség köztük

Főbb különbség a felügyelt és a nem felügyelt tanulás között

  • A felügyelt tanulás során a gépet jól „felcímkézett” adatok felhasználásával betanítja.
  • A felügyelet nélküli tanulás egy gépi tanulási technika, ahol nem kell felügyelnie a modellt.
  • A felügyelt tanulás lehetővé teszi, hogy adatokat gyűjtsön, vagy adatkimenetet állítson elő a korábbi tapasztalatokból.
  • A felügyelet nélküli gépi tanulás segít mindenféle ismeretlen minta megtalálásában az adatokban.
  • A regresszió és az osztályozás a felügyelt gépi tanulási technikák két típusa.
  • ClusterAz ing és az asszociáció a felügyelet nélküli tanulás két típusa.
  • Felügyelt tanulási modellben a bemeneti és kimeneti változók, míg a nem felügyelt tanulási modellben csak bemeneti adatok kerülnek megadásra.

Mi az a felügyelt gépi tanulás?

A felügyelt tanulás során a gépet olyan adatok felhasználásával oktatja, amelyek megfelelőek „felcímkézve.” Ez azt jelenti, hogy bizonyos adatok már meg vannak címkézve a helyes válasszal. Összehasonlítható a tanulással, amely egy felügyelő vagy egy tanár jelenlétében zajlik.

A felügyelt tanulási algoritmus a felcímkézett edzésadatokból tanul, és segít előre jelezni az előre nem látható adatok kimenetelét. A pontos, felügyelt gépi tanulás sikeres felépítése, méretezése és üzembe helyezése Az adattudományi modell időt és technikai szakértelmet igényel egy magasan képzett adattudós csapattól. Ezenkívül az adattudósnak újjá kell építenie a modelleket, hogy megbizonyosodjon arról, hogy a megadott betekintések igazak maradnak mindaddig, amíg az adatok meg nem változnak.

Mi az a felügyelet nélküli tanulás?

A felügyelet nélküli tanulás egy gépi tanulási technika, ahol nem kell felügyelnie a modellt. Ehelyett engedélyeznie kell a modellnek, hogy önállóan működjön az információk felderítéséhez. Főleg a címkézetlen adatokkal foglalkozik.

A felügyelt tanulási algoritmusok lehetővé teszik a felügyelt tanuláshoz képest összetettebb feldolgozási feladatok elvégzését. Bár a felügyelet nélküli tanulás kiszámíthatatlanabb lehet más természetes tanulási mélytanulási és megerősítő tanulási módszerekkel összehasonlítva.

Miért a felügyelt tanulás?

  • A felügyelt tanulás lehetővé teszi, hogy adatokat gyűjtsön, vagy adatkimenetet állítson elő a korábbi tapasztalatokból.
  • Segít optimalizálni a teljesítménykritériumokat a tapasztalatok felhasználásával
  • A felügyelt gépi tanulás segít különféle típusú valós számítási problémák megoldásában.

Miért a felügyelet nélküli tanulás?

Íme a fő okok a felügyelet nélküli tanulás használatára:

  • A felügyelet nélküli gépi tanulás mindenféle ismeretlen mintát talál az adatokban.
  • A nem felügyelt módszerek segítenek megtalálni azokat a funkciókat, amelyek hasznosak lehetnek a kategorizáláshoz.
  • Valós időben zajlik, így az összes bemeneti adatot a tanulók jelenlétében kell elemezni és címkézni.
  • Könnyebb a címkézetlen adatok beszerzése a számítógépről, mint a címkézett adatok, amelyek kézi beavatkozást igényelnek.

Hogyan működik a felügyelt tanulás?

Például egy gépet szeretne betanítani, hogy segítsen megjósolni, mennyi ideig tart hazafelé a munkahelyéről. Itt először egy címkézett adatkészletet hoz létre. Ezek az adatok magukban foglalják

  • Időjárási viszonyok
  • A nap ideje
  • Ünnepek

Mindezek a részletek az Ön által megadott adatok. A kimenet az az idő, ameddig az adott napon hazautazni kellett.

Hogyan működik a felügyelt tanulás
Hogyan működik a felügyelt tanulás

Ösztönösen tudod, hogy ha kint esik az eső, akkor tovább tart, amíg hazafelé tartasz. De a gépnek adatokra és statisztikákra van szüksége.

Lássuk most, hogyan fejleszthet ki egy felügyelt tanulási modellt a példában, amely segít a felhasználónak az ingázási idő meghatározásában. Az első dolog, amit létre kell hoznia, egy képzési adatkészlet. Ez az edzéskészlet tartalmazza a teljes ingázási időt és a megfelelő tényezőket, például időjárást, időt stb. Az edzéskészlet alapján a gépe láthatja, hogy közvetlen kapcsolat van az eső mennyisége és a hazaérkezéshez szükséges idő között.

Tehát megbizonyosodik arról, hogy minél többet esik, annál tovább fog vezetni, hogy visszatérjen otthonába. Azt is láthatja, hogy van kapcsolat a munkából való távozás és az úton töltött idő között.

Minél közelebb van este 6-hoz, annál hosszabb ideig tart, amíg hazaér. Előfordulhat, hogy a készülék talál néhány kapcsolatot a címkézett adatokkal.

Tanulási fázis
Tanulási fázis

Ez az adatmodell kezdete. Kezdi befolyásolni, hogy az eső hogyan befolyásolja az emberek vezetési módját. Azt is kezdi látni, hogy többen utaznak egy adott napszakban.

Hogyan működik a felügyelet nélküli tanulás?

Vegyük egy baba és a családi kutyája esetét.

Hogyan működik a felügyelet nélküli tanulás
Hogyan működik a felügyelet nélküli tanulás

Ismeri és azonosítja ezt a kutyát. Néhány héttel később egy család barátja hoz egy kutyát, és megpróbál játszani a babával.

Hogyan működik a felügyelet nélküli tanulás

A baba még nem látta ezt a kutyát. De felismeri, hogy sok jellemzője (2 fül, szem, 4 lábon járás) olyan, mint a kutyája. Egy új állatot azonosít, mint egy kutyát. Ez egy felügyelet nélküli tanulás, ahol nem tanítanak, hanem az adatokból (jelen esetben egy kutyáról szóló adatokból) tanulsz. Ha ez felügyelt tanulás lett volna, a család barátja azt mondta volna a babának, hogy ez egy kutya.

A felügyelt gépi tanulási technikák típusai

A felügyelt gépi tanulási technikák típusai
A felügyelt gépi tanulási technikák típusai

Regresszió

A regressziós technika egyetlen kimeneti értéket jósol meg a betanítási adatok felhasználásával.

Példa: A regresszió segítségével megjósolhatja a ház árát a képzési adatokból. A bemeneti változók a helység, a ház mérete stb.

Osztályozás

Az osztályozás a kimenet osztályon belüli csoportosítását jelenti. Ha az algoritmus két különböző osztályba próbálja felcímkézni a bemenetet, azt bináris osztályozásnak nevezzük. A kettőnél több osztály közötti választást többosztályos osztályozásnak nevezzük.

Példa: Annak meghatározása, hogy valaki késedelmes lesz-e a kölcsönnel.

Erősségek: A kimeneteknek mindig van valószínűségi értelmezése, és az algoritmus szabályosítható a túlillesztés elkerülése érdekében.

Hiányosságok: A logisztikai regresszió alulteljesíthet, ha több vagy nem lineáris döntési határ van. Ez a módszer nem rugalmas, így nem ragad meg bonyolultabb kapcsolatokat.

A felügyelet nélküli gépi tanulási technikák típusai

A nem felügyelt tanulási problémák csoportosítási és asszociációs problémákra csoportosulnak.

ClusterING

ClusterING

ClusterAz ing fontos fogalom, amikor a felügyelet nélküli tanulásról van szó. Főleg egy struktúra vagy minta megtalálásával foglalkozik kategorizálatlan adatok gyűjteményében. ClusterAz algoritmusok feldolgozzák az Ön adatait, és természetes klasztereket (csoportokat) találnak, ha vannak az adatokban. Azt is módosíthatja, hogy az algoritmusok hány fürtöt azonosítsanak. Lehetővé teszi a csoportok részletességének beállítását.

Egyesület

Az asszociációs szabályok lehetővé teszik a nagy adatbázisokon belüli adatobjektumok közötti kapcsolatok létrehozását. Ez a felügyelet nélküli technika a változók közötti izgalmas kapcsolatok felfedezéséről szól nagy adatbázisokban. Például azok, akik új lakást vásárolnak, nagy valószínűséggel új bútorokat vásárolnak.

Egyéb példák:

  • A rákos betegek egy alcsoportja génexpressziós méréseik alapján csoportosítva
  • Vásárlói csoportok böngészési és vásárlási előzményeik alapján
  • Filmcsoport a filmnézők által adott értékelés alapján

Különbség a felügyelt és a nem felügyelt tanulás között

Felügyelt és nem felügyelt tanulás
Felügyelt és nem felügyelt tanulás
paraméterek Felügyelt gépi tanulási technika Felügyelet nélküli gépi tanulási technika
folyamat A felügyelt tanulási modellben a bemeneti és kimeneti változók kerülnek megadásra. A nem felügyelt tanulási modellben csak bemeneti adatok kerülnek megadásra
Beviteli adat Algorithms címkézett adatok felhasználásával képezik ki. Algorithms nem címkézett adatok ellen használják
Algorithms Használt Támogatja a vektorgépet, a neurális hálózatot, a lineáris és logisztikai regressziót, a véletlenszerű erdőt és az osztályozási fákat. A nem felügyelt algoritmusok különböző kategóriákra oszthatók: mint Cluster algoritmusok, K-középek, hierarchikus klaszterezés stb.
Számítási komplexitás A felügyelt tanulás egyszerűbb módszer. A felügyelet nélküli tanulás számítási szempontból bonyolult
Az adatok használata A felügyelt tanulási modell a képzési adatokat használja a bemenet és a kimenet közötti kapcsolat megismerésére. A felügyelet nélküli tanulás nem használ kimeneti adatokat.
Az eredmények pontossága Rendkívül pontos és megbízható módszer. Less pontos és megbízható módszer.
Valós idejű tanulás A tanulási módszer offline módban történik. A tanulási módszer valós időben történik.
Osztályok száma Az osztályok száma ismert. Az osztályok száma nem ismert.
Fő hátránya A nagy adatok osztályozása igazi kihívást jelenthet a felügyelt tanulásban. Az adatok rendezéséről nem lehet pontos információt kapni, és a kimenet, mint a felügyelet nélküli tanulás során használt adat, címkézett és nem ismert.