Učení pod dohledem vs. učení bez dozoru: Rozdíl mezi nimi

Klíčový rozdíl mezi učením pod dohledem a učením bez dozoru

  • V řízeném učení trénujete stroj pomocí dat, která jsou dobře „označená“.
  • Unsupervised learning je technika strojového učení, kde nepotřebujete dohlížet na model.
  • Řízené učení vám umožňuje shromažďovat data nebo vytvářet datový výstup z předchozí zkušenosti.
  • Strojové učení bez dozoru vám pomůže najít všechny druhy neznámých vzorců v datech.
  • Regrese a klasifikace jsou dva typy technik strojového učení pod dohledem.
  • Clustering a Association jsou dva typy učení bez dozoru.
  • V modelu učení pod dohledem budou zadány vstupní a výstupní proměnné, zatímco u modelu učení bez dozoru budou dána pouze vstupní data.

Co je strojové učení pod dohledem?

V řízeném učení trénujete stroj pomocí dat, která jsou dobrá "označený.“ To znamená, že některá data jsou již označena správnou odpovědí. Lze to přirovnat k učení, které probíhá za přítomnosti vedoucího nebo učitele.

Řízený učební algoritmus se učí z označených tréninkových dat a pomáhá vám předvídat výsledky pro nepředvídaná data. Úspěšné vytvoření, škálování a nasazení přesného modelu strojového učení pod dohledem vyžaduje čas a technické znalosti týmu vysoce kvalifikovaných datových vědců. Kromě toho musí Data scientist přestavět modely, aby se ujistil, že poskytnuté poznatky zůstanou pravdivé, dokud se jeho data nezmění.

Co je učení bez dozoru?

Unsupervised learning je technika strojového učení, kde nepotřebujete dohlížet na model. Namísto toho musíte modelu umožnit, aby sám pracoval na objevování informací. Zabývá se především neoznačenými daty.

Algoritmy učení bez dozoru vám umožňují provádět složitější úlohy zpracování ve srovnání s učením pod dohledem. Učení bez dohledu však může být nepředvídatelnější ve srovnání s jinými metodami hlubokého učení a posilování učení.

Proč řízené učení?

  • Řízené učení vám umožňuje shromažďovat data nebo vytvářet datový výstup z předchozí zkušenosti.
  • Pomáhá vám optimalizovat kritéria výkonu pomocí zkušeností
  • Strojové učení pod dohledem vám pomůže vyřešit různé typy reálných výpočetních problémů.

Proč učení bez dozoru?

Zde jsou hlavní důvody pro používání nekontrolovaného učení:

  • Strojové učení bez dohledu najde v datech všechny druhy neznámých vzorců.
  • Metody bez dozoru vám pomohou najít funkce, které mohou být užitečné pro kategorizaci.
  • Probíhá v reálném čase, takže všechna vstupní data musí být analyzována a označena za přítomnosti studentů.
  • Je snazší získat neoznačená data z počítače než označená data, která vyžadují ruční zásah.

Jak supervizované učení funguje?

Chcete například vycvičit stroj, který vám pomůže předpovědět, jak dlouho vám bude trvat cesta domů z vašeho pracoviště. Zde začnete vytvořením sady označených dat. Tato data zahrnují

  • Povětrnostní podmínky
  • Denní čas
  • Dovolená

Všechny tyto podrobnosti jsou vaše vstupy. Výstupem je doba, kterou zabrala cesta domů v daný den.

Jak funguje supervizované učení
Jak funguje supervizované učení

Instinktivně víte, že když venku prší, bude vám cesta domů trvat déle. Ale stroj potřebuje data a statistiky.

Podívejme se nyní, jak můžete vytvořit model učení pod dohledem tohoto příkladu, který uživateli pomůže určit dobu dojíždění. První věc, kterou musíte vytvořit, je soubor tréninkových dat. Tato tréninková sada bude obsahovat celkovou dobu dojíždění a odpovídající faktory, jako je počasí, čas atd. Na základě této tréninkové sady může váš stroj vidět, že existuje přímý vztah mezi množstvím deště a časem, který budete potřebovat na cestu domů.

Zjistí tedy, že čím více prší, tím déle pojedete autem, abyste se vrátili domů. Může také vidět souvislost mezi časem, kdy odcházíte z práce, a časem, kdy budete na cestě.

Čím blíže jste k 6:XNUMX, tím déle trvá, než se dostanete domů. Váš počítač může najít některé vztahy s vašimi označenými daty.

Fáze učení
Fáze učení

Toto je začátek vašeho datového modelu. Začíná to mít vliv na to, jak déšť ovlivňuje způsob, jakým lidé jezdí. Začíná také vidět, že v určitou denní dobu cestuje více lidí.

Jak funguje učení bez dozoru?

Vezměme si případ dítěte a jejího rodinného psa.

Jak funguje učení bez dozoru
Jak funguje učení bez dozoru

Zná a identifikuje tohoto psa. O několik týdnů později si rodinný přítel přivede psa a snaží se hrát si s dítětem.

Jak funguje učení bez dozoru

Dítě tohoto psa dříve nevidělo. Ale pozná mnoho rysů (2 uši, oči, chůze po 4 nohách) jsou jako její psí mazlíček. Identifikuje nové zvíře, jako je pes. Jedná se o učení bez dozoru, kde se neučíte, ale učíte se z údajů (v tomto případě údajů o psu). Kdyby to bylo učení pod dozorem, rodinný přítel by dítěti řekl, že je to pes.

Typy technik strojového učení pod dohledem

Typy technik strojového učení pod dohledem
Typy technik strojového učení pod dohledem

Regrese

Regresní technika předpovídá jedinou výstupní hodnotu pomocí tréninkových dat.

Příklad: Pomocí regrese můžete předpovědět cenu domu z tréninkových dat. Vstupními proměnnými budou lokalita, velikost domu atd.

Klasifikace

Klasifikace znamená seskupit výstup uvnitř třídy. Pokud se algoritmus pokouší označit vstup do dvou odlišných tříd, nazývá se to binární klasifikace. Výběr mezi více než dvěma třídami se nazývá vícetřídní klasifikace.

Příklad: Určení, zda někdo bude či nebude neplatičem úvěru.

Silné: Výstupy mají vždy pravděpodobnostní interpretaci a algoritmus lze regulovat, aby se předešlo nadměrnému přizpůsobení.

Slabé stránky: Logistická regrese může mít nedostatečnou výkonnost, pokud existují vícenásobné nebo nelineární hranice rozhodování. Tato metoda není flexibilní, takže nezachycuje složitější vztahy.

Typy technik strojového učení bez dozoru

Problémy s učením bez dozoru se dále seskupují do problémů se shlukováním a asociací.

Clustering.

Clustering.

Clustering je důležitý koncept, pokud jde o učení bez dozoru. Zabývá se především hledáním struktury nebo vzoru ve sbírce nekategorizovaných dat. ClusterAlgoritmy zpracují vaše data a najdou přirozené shluky (skupiny), pokud v datech existují. Můžete také upravit, kolik klastrů by měly vaše algoritmy identifikovat. Umožňuje vám upravit granularitu těchto skupin.

Sdružení

Pravidla přidružení umožňují vytvořit přidružení mezi datovými objekty ve velkých databázích. Tato technika bez dozoru je o objevování vzrušujících vztahů mezi proměnnými ve velkých databázích. Například lidé, kteří si kupují nový domov, si s největší pravděpodobností koupí nový nábytek.

Další příklady:

  • Podskupina pacientů s rakovinou seskupená podle měření jejich genové exprese
  • Skupiny nakupujících na základě jejich procházení a historie nákupů
  • Skupina filmů podle hodnocení diváků filmů

Rozdíl mezi řízeným a nekontrolovaným učením

Učení pod dohledem vs. učení bez dohledu
Učení pod dohledem vs. učení bez dohledu
parametry Technika strojového učení pod dohledem Technika strojového učení bez dozoru
Proces V modelu učení pod dohledem budou zadány vstupní a výstupní proměnné. V modelu učení bez dozoru budou zadána pouze vstupní data
Vstupní data Algorithms jsou trénováni pomocí označených dat. Algorithms se používají proti údajům, které nejsou označeny
Algorithms Použitý Podporujte vektorový stroj, neuronovou síť, lineární a logistickou regresi, náhodný les a klasifikační stromy. Algoritmy bez dozoru lze rozdělit do různých kategorií: jako Cluster algoritmy, K-means, Hierarchické shlukování atd.
Výpočetní složitost Učení pod dohledem je jednodušší metoda. Učení bez dozoru je výpočetně složité
Použití dat Model kontrolovaného učení využívá tréninková data k tomu, aby se naučil propojení mezi vstupy a výstupy. Učení bez dozoru nepoužívá výstupní data.
Přesnost výsledků Vysoce přesná a důvěryhodná metoda. Less přesná a důvěryhodná metoda.
Učení v reálném čase Metoda učení probíhá offline. Metoda učení probíhá v reálném čase.
Počet tříd Počet tříd je znám. Počet tříd není znám.
Hlavní nevýhoda Klasifikace velkých dat může být v Supervised Learning skutečnou výzvou. Nemůžete získat přesné informace týkající se třídění dat a výstup jako data použitá při učení bez dozoru je označen a není znám.