Uczenie się nadzorowane i nienadzorowane: różnica między nimi

Kluczowa różnica między uczeniem się pod nadzorem i bez nadzoru

  • W uczeniu nadzorowanym szkolisz maszynę, korzystając z dobrze „oznaczonych” danych.
  • Uczenie się bez nadzoru to technika uczenia maszynowego, w której nie trzeba nadzorować modelu.
  • Uczenie się pod nadzorem umożliwia gromadzenie danych lub wytwarzanie danych wyjściowych z poprzedniego doświadczenia.
  • Uczenie maszynowe bez nadzoru pomaga znaleźć wszelkiego rodzaju nieznane wzorce w danych.
  • Regresja i klasyfikacja to dwa rodzaje nadzorowanych technik uczenia maszynowego.
  • ClusterUczenie się i skojarzenie to dwa rodzaje uczenia się bez nadzoru.
  • W modelu uczenia się nadzorowanego podawane będą zmienne wejściowe i wyjściowe, natomiast w modelu uczenia się bez nadzoru podawane będą tylko dane wejściowe

Co to jest nadzorowane uczenie maszynowe?

W uczeniu nadzorowanym szkolisz maszynę, korzystając z danych, które są dobre „oznaczone.” Oznacza to, że niektóre dane są już oznaczone poprawną odpowiedzią. Można to porównać do uczenia się, które odbywa się w obecności przełożonego lub nauczyciela.

Algorytm uczenia się nadzorowanego uczy się na podstawie oznaczonych danych szkoleniowych i pomaga przewidzieć wyniki w przypadku nieprzewidzianych danych. Pomyślne budowanie, skalowanie i wdrażanie dokładnego nadzorowanego modelu nauki maszynowej wymaga czasu i wiedzy technicznej zespołu wysoko wykwalifikowanych analityków danych. Co więcej, analityk danych musi przebudować modele, aby mieć pewność, że przekazane spostrzeżenia pozostaną prawdziwe do czasu zmiany danych.

Co to jest uczenie się bez nadzoru?

Uczenie się bez nadzoru to technika uczenia maszynowego, w której nie trzeba nadzorować modelu. Zamiast tego należy pozwolić modelowi na samodzielną pracę w celu odkrycia informacji. Dotyczy głównie danych nieoznakowanych.

Algorytmy uczenia bez nadzoru pozwalają na wykonywanie bardziej złożonych zadań przetwarzania w porównaniu z uczeniem nadzorowanym. Chociaż uczenie bez nadzoru może być bardziej nieprzewidywalne w porównaniu z innymi metodami uczenia się głębokiego i wzmacniania naturalnego.

Dlaczego nauka nadzorowana?

  • Uczenie się pod nadzorem umożliwia gromadzenie danych lub wytwarzanie danych wyjściowych z poprzedniego doświadczenia.
  • Pomaga zoptymalizować kryteria wydajności, korzystając z doświadczenia
  • Nadzorowane uczenie maszynowe pomaga rozwiązywać różnego rodzaju problemy obliczeniowe w świecie rzeczywistym.

Dlaczego uczenie się bez nadzoru?

Oto główne powody stosowania uczenia się bez nadzoru:

  • Uczenie maszynowe bez nadzoru znajduje w danych wszelkiego rodzaju nieznane wzorce.
  • Metody nienadzorowane pomagają znaleźć funkcje, które mogą być przydatne do kategoryzacji.
  • Odbywa się w czasie rzeczywistym, więc wszystkie dane wejściowe muszą być analizowane i oznaczane w obecności uczniów.
  • Łatwiej jest uzyskać z komputera dane nieoznakowane niż dane opatrzone etykietą, które wymagają ręcznej interwencji.

Jak działa nauka nadzorowana?

Na przykład chcesz przeszkolić maszynę, aby pomogła Ci przewidzieć, ile czasu zajmie Ci dotarcie z miejsca pracy do domu. Tutaj zaczynasz od utworzenia zestawu oznaczonych etykietami danych. Dane te obejmują

  • Warunki pogodowe
  • Pora dnia
  • Wakacje

Wszystkie te szczegóły to Twoje dane wejściowe. Dane wyjściowe to ilość czasu, jaką zajęło Ci dojechanie do domu w danym dniu.

Jak działa uczenie się nadzorowane
Jak działa uczenie się nadzorowane

Instynktownie wiesz, że jeśli na zewnątrz pada deszcz, podróż do domu zajmie Ci więcej czasu. Ale maszyna potrzebuje danych i statystyk.

Zobaczmy teraz, jak na podstawie tego przykładu opracować model uczenia się nadzorowanego, który pomoże użytkownikowi określić czas dojazdu. Pierwszą rzeczą, którą należy utworzyć, jest zestaw danych szkoleniowych. Ten zestaw treningowy będzie zawierał całkowity czas dojazdu i odpowiednie czynniki, takie jak pogoda, czas itp. Na podstawie tego zestawu treningowego Twoja maszyna może wykryć bezpośredni związek między ilością deszczu a czasem potrzebnym na powrót do domu.

Ustala więc, że im bardziej pada deszcz, tym dłużej będziesz jechał, aby wrócić do domu. Może również wykryć związek między czasem, w którym wychodzisz z pracy, a czasem, w którym będziesz w drodze.

Im bliżej 6:XNUMX, tym dłużej trwa powrót do domu. Twoja maszyna może znaleźć niektóre powiązania z danymi oznaczonymi etykietami.

Faza uczenia się
Faza uczenia się

To jest początek Twojego modelu danych. Zaczyna wpływać na to, jak deszcz wpływa na sposób jazdy ludzi. Zaczyna również zauważać, że więcej osób podróżuje o określonej porze dnia.

Jak działa uczenie się bez nadzoru?

Weźmy przypadek dziecka i jego psa rodzinnego.

Jak działa uczenie się bez nadzoru
Jak działa uczenie się bez nadzoru

Ona zna i identyfikuje tego psa. Kilka tygodni później przyjaciel rodziny przyprowadza psa i próbuje bawić się z dzieckiem.

Jak działa uczenie się bez nadzoru

Dziecko nie widziało wcześniej tego psa. Ale rozpoznaje wiele cech (dwoje uszu, oczy, chodzenie na 2 nogach) przypomina jej psa. Identyfikuje nowe zwierzę, takie jak pies. Jest to uczenie się bez nadzoru, podczas którego nie jesteś uczony, ale uczysz się na podstawie danych (w tym przypadku danych dotyczących psa). Gdyby było to uczenie się pod nadzorem, przyjaciel rodziny powiedziałby dziecku, że to pies.

Rodzaje technik nadzorowanego uczenia maszynowego

Rodzaje technik nadzorowanego uczenia maszynowego
Rodzaje technik nadzorowanego uczenia maszynowego

Regresja

Technika regresji przewiduje pojedynczą wartość wyjściową na podstawie danych szkoleniowych.

Przykład: możesz użyć regresji, aby przewidzieć cenę domu na podstawie danych szkoleniowych. Zmiennymi wejściowymi będą: lokalizacja, wielkość domu itp.

Klasyfikacja

Klasyfikacja oznacza grupowanie danych wyjściowych w obrębie klasy. Jeśli algorytm próbuje przyporządkować dane wejściowe do dwóch odrębnych klas, nazywa się to klasyfikacją binarną. Wybór pomiędzy więcej niż dwiema klasami nazywany jest klasyfikacją wieloklasową.

Przykład: Ustalenie, czy dana osoba nie spłaci pożyczki.

Silne strony: Wyniki zawsze mają interpretację probabilistyczną, a algorytm można uregulować, aby uniknąć nadmiernego dopasowania.

Słabości:Regresja logistyczna może nie działać prawidłowo, gdy istnieją liczne lub nieliniowe granice decyzyjne. Ta metoda nie jest elastyczna, więc nie obejmuje bardziej złożonych relacji.

Rodzaje technik nienadzorowanego uczenia maszynowego

Problemy uczenia się bez nadzoru można dalej podzielić na problemy klasteryzacji i problemy asocjacji.

ClusterING

ClusterING

ClusterNauczanie to ważna koncepcja, jeśli chodzi o uczenie się bez nadzoru. Zajmuje się głównie znajdowaniem struktury lub wzorca w zbiorze nieskategoryzowanych danych. ClusterAlgorytmy ing przetworzą Twoje dane i znajdą naturalne klastry (grupy), jeśli istnieją w danych. Możesz również zmodyfikować liczbę klastrów, które Twoje algorytmy powinny zidentyfikować. Pozwala to dostosować granularność tych grup.

Stowarzyszenie

Reguły asocjacyjne umożliwiają ustanawianie powiązań pomiędzy obiektami danych w dużych bazach danych. Ta technika bez nadzoru polega na odkrywaniu ekscytujących relacji między zmiennymi w dużych bazach danych. Na przykład osoby, które kupują nowy dom, najprawdopodobniej kupią nowe meble.

Inne przykłady:

  • Podgrupa pacjentów chorych na raka pogrupowana według pomiarów ekspresji genów
  • Grupy kupujących na podstawie ich historii przeglądania i zakupów
  • Grupa filmów według ocen wystawionych przez widzów

Różnica między uczeniem się nadzorowanym i bez nadzoru

Uczenie się nadzorowane a nienadzorowane
Uczenie się nadzorowane a nienadzorowane
parametry Technika uczenia maszynowego pod nadzorem Technika uczenia maszynowego bez nadzoru
Przetwarzanie W modelu uczenia się nadzorowanego podane zostaną zmienne wejściowe i wyjściowe. W modelu uczenia się bez nadzoru podawane będą jedynie dane wejściowe
Dane wejściowe Algorithms są szkolone przy użyciu oznakowanych danych. Algorithms są używane w odniesieniu do danych, które nie są oznaczone
Algorithms Używany Maszyna wektorów nośnych, sieć neuronowa, regresja liniowa i logistyczna, las losowy i drzewa klasyfikacyjne. Algorytmy nienadzorowane można podzielić na różne kategorie: Cluster algorytmy, k-means, klasteryzacja hierarchiczna, itp.
Złożoność obliczeniowa Uczenie się pod nadzorem jest prostszą metodą. Uczenie się bez nadzoru jest obliczeniowo złożone
Wykorzystanie danych Model uczenia się nadzorowanego wykorzystuje dane szkoleniowe do poznania powiązania między danymi wejściowymi i wynikami. Uczenie się bez nadzoru nie wykorzystuje danych wyjściowych.
Dokładność wyników Metoda bardzo dokładna i godna zaufania. Less metoda dokładna i wiarygodna.
Nauka w czasie rzeczywistym Metoda nauki odbywa się w trybie offline. Metoda nauki odbywa się w czasie rzeczywistym.
Liczba klas Liczba klas jest znana. Liczba klas nie jest znana.
Główna wada Klasyfikacja dużych zbiorów danych może być prawdziwym wyzwaniem w uczeniu nadzorowanym. Nie można uzyskać dokładnych informacji dotyczących sortowania danych, a dane wyjściowe, ponieważ dane wykorzystywane w uczeniu się bez nadzoru są oznaczone i nieznane.