Навчання під контролем і без нього: різниця між ними

Ключова різниця між контрольованим і неконтрольованим навчанням

  • Під час навчання під наглядом ви навчаєте машину, використовуючи дані, які добре «марковані».
  • Навчання без нагляду — це техніка машинного навчання, де вам не потрібно контролювати модель.
  • Контрольоване навчання дозволяє збирати дані або створювати вихідні дані з попереднього досвіду.
  • Машинне навчання без нагляду допомагає вам знаходити всі види невідомих шаблонів у даних.
  • Регресія та класифікація — це два типи контрольованих методів машинного навчання.
  • Clusterнавчання та асоціація — це два типи неконтрольованого навчання.
  • У моделі навчання під наглядом будуть надані вхідні та вихідні змінні, тоді як у моделі навчання без нагляду нададуться лише вхідні дані

Що таке кероване машинне навчання?

Під час навчання під наглядом ви навчаєте машину за допомогою даних, що добре «позначений.” Це означає, що деякі дані вже позначено правильною відповіддю. Це можна порівняти з навчанням, яке відбувається в присутності керівника або вчителя.

Алгоритм навчання під наглядом навчається на основі позначених навчальних даних і допомагає передбачити результати для непередбачених даних. Успішне створення, масштабування та розгортання точної контрольованої моделі машинного навчання Data science потребує часу та технічних знань від команди висококваліфікованих спеціалістів з обробки даних. Крім того, Data Scientist повинен перебудувати моделі, щоб переконатися, що надана інформація залишається вірною, доки її дані не зміняться.

Що таке неконтрольоване навчання?

Навчання без нагляду — це техніка машинного навчання, де вам не потрібно контролювати модель. Натомість вам потрібно дозволити моделі працювати самостійно, щоб знайти інформацію. Це в основному стосується немаркованих даних.

Алгоритми неконтрольованого навчання дозволяють виконувати більш складні завдання обробки порівняно з контрольованим навчанням. Хоча навчання без нагляду може бути більш непередбачуваним порівняно з іншими методами глибокого навчання та навчання з підкріпленням природного навчання.

Чому контрольоване навчання?

  • Контрольоване навчання дозволяє збирати дані або створювати вихідні дані з попереднього досвіду.
  • Допомагає оптимізувати критерії ефективності, використовуючи досвід
  • Контрольоване машинне навчання допомагає вирішувати різні типи обчислювальних проблем у реальному світі.

Чому навчання без нагляду?

Ось головні причини використання неконтрольованого навчання:

  • Машинне навчання без нагляду знаходить усі види невідомих шаблонів у даних.
  • Неконтрольовані методи допомагають вам знайти функції, які можуть бути корисними для категоризації.
  • Це відбувається в режимі реального часу, тому всі вхідні дані аналізуються та маркуються у присутності учнів.
  • Нерозмічені дані легше отримати з комп’ютера, ніж розмічені дані, які потребують ручного втручання.

Як працює контрольоване навчання?

Наприклад, ви хочете навчити машину, яка допоможе вам передбачити, скільки часу вам знадобиться, щоб доїхати додому з робочого місця. Тут ви починаєте зі створення набору позначених даних. Ці дані включають

  • Метеорологічні умови
  • Час доби
  • Канікули

Усі ці деталі — ваші дані. Результат — це кількість часу, який знадобився, щоб повернутися додому в цей конкретний день.

Як працює контрольоване навчання
Як працює контрольоване навчання

Ви інстинктивно розумієте, що якщо надворі йде дощ, вам знадобиться більше часу, щоб доїхати додому. Але машині потрібні дані та статистика.

Тепер давайте подивимося, як можна розробити модель навчання під наглядом у цьому прикладі, яка допоможе користувачеві визначити час на дорогу. Перше, що вам потрібно створити, це навчальний набір даних. Цей тренувальний набір міститиме загальний час поїздки на роботу й роботу та відповідні фактори, як-от погода, час тощо. На основі цього навчального набору ваша машина може побачити наявність прямого зв’язку між кількістю дощу та часом, який вам знадобиться, щоб дістатися додому.

Таким чином, він встановлює, що чим більше йде дощ, тим довше вам доведеться їхати, щоб повернутися додому. Він також може побачити зв’язок між часом, коли ви йдете з роботи, і часом, коли ви будете в дорозі.

Чим ближче до шостої вечора, тим більше часу потрібно, щоб повернутися додому. Ваша машина може виявити деякі зв’язки з вашими позначеними даними.

Фаза навчання
Фаза навчання

Це початок вашої моделі даних. Це починає впливати на те, як дощ впливає на те, як люди керують автомобілем. Він також починає бачити, що більше людей подорожують у певний час доби.

Як працює неконтрольоване навчання?

Давайте візьмемо випадок дитини та її сімейної собаки.

Як працює неконтрольоване навчання
Як працює неконтрольоване навчання

Вона знає і впізнає цю собаку. Через кілька тижнів друг сім'ї бере з собою собаку і намагається пограти з дитиною.

Як працює неконтрольоване навчання

Малюк раніше не бачив цю собаку. Але вона розпізнає багато рис (2 вуха, очі, ходьба на 4 ногах) схожі на її собаку. Вона ідентифікує нову тварину, наприклад собаку. Це навчання без нагляду, де вас не навчають, а ви вчитеся на даних (у цьому випадку даних про собаку). Якби це було навчання під наглядом, друг сім’ї сказав би дитині, що це собака.

Типи контрольованих методів машинного навчання

Типи контрольованих методів машинного навчання
Типи контрольованих методів машинного навчання

Регресія

Техніка регресії передбачає окреме вихідне значення з використанням навчальних даних.

Приклад. Ви можете використовувати регресію, щоб передбачити ціну будинку на основі даних навчання. Вхідними змінними будуть місцевість, розмір будинку тощо.

Класифікація

Класифікація означає групування результатів у класі. Якщо алгоритм намагається позначити вхідні дані двома різними класами, це називається бінарною класифікацією. Вибір між більш ніж двома класами називається багатокласовою класифікацією.

Приклад: Визначення того, чи буде хтось неплатником кредиту.

Сильні: Виходи завжди мають імовірнісну інтерпретацію, і алгоритм можна впорядкувати, щоб уникнути переобладнання.

Слабкі сторони: Логістична регресія може бути недостатньою за наявності кількох або нелінійних меж рішень. Цей метод не є гнучким, тому він не охоплює більш складні відносини.

Типи неконтрольованих методів машинного навчання

Проблеми з навчанням без контролю, далі згруповані в проблеми кластеризації та асоціації.

ClusterІНГ

ClusterІНГ

Clustering є важливою концепцією, коли йдеться про навчання без нагляду. В основному це стосується пошуку структури або шаблону в колекції некатегоризованих даних. ClusterАлгоритми оброблятимуть ваші дані та знайдуть природні кластери (групи), якщо вони існують у даних. Ви також можете змінити кількість кластерів, які мають ідентифікувати ваші алгоритми. Це дозволяє регулювати деталізацію цих груп.

Асоціація

Правила асоціації дозволяють вам встановлювати асоціації між об’єктами даних у великих базах даних. Цей неконтрольований метод спрямований на виявлення захоплюючих зв’язків між змінними у великих базах даних. Наприклад, люди, які купують новий будинок, швидше за все, купуватимуть нові меблі.

Інші приклади:

  • Підгрупа хворих на рак, згрупованих за результатами вимірювань експресії генів
  • Групи покупців на основі їхніх історій перегляду та покупок
  • Група фільмів за рейтингом глядачів

Різниця між навчанням під контролем і без нього

Навчання під контролем проти неконтрольованого
Навчання під контролем проти неконтрольованого
Параметри Керована техніка машинного навчання Техніка машинного навчання без нагляду
Процес У моделі навчання під наглядом будуть задані вхідні та вихідні змінні. У моделі неконтрольованого навчання будуть надані лише вхідні дані
Вхідні дані Algorithms навчаються з використанням позначених даних. Algorithms використовуються проти даних, які не позначені
Algorithms Використаний Машина опорних векторів, нейронна мережа, лінійна та логістична регресія, випадковий ліс та дерева класифікації. Неконтрольовані алгоритми можна розділити на різні категорії: як Cluster алгоритми, K-середні, ієрархічна кластеризація тощо.
Обчислювальна складність Навчання під наглядом є простішим методом. Навчання без контролю є обчислювально складним
Використання даних Модель навчання під наглядом використовує навчальні дані, щоб дізнатися про зв’язок між входом і виходом. Неконтрольоване навчання не використовує вихідні дані.
Точність результатів Дуже точний і надійний метод. Less точний і надійний метод.
Навчання в реальному часі Метод навчання відбувається офлайн. Метод навчання відбувається в режимі реального часу.
Кількість класів Кількість класів відома. Кількість класів невідома.
Головний недолік Класифікація великих даних може бути справжньою проблемою під час навчання під керівництвом. Ви не можете отримати точну інформацію щодо сортування даних, а вихідні дані, які використовуються в неконтрольованому навчанні, позначаються та невідомі.