Контрольоване машинне навчання: що таке Algorithms з прикладами
Що таке кероване машинне навчання?
Машинне навчання під керівництвом це алгоритм, який навчається на основі позначених навчальних даних, щоб допомогти вам передбачити результати для непередбачених даних. Під час навчання під наглядом ви навчаєте машину, використовуючи дані, які добре «марковані». Це означає, що деякі дані вже позначені правильними відповідями. Це можна порівняти з навчанням у присутності керівника чи вчителя.
Успішне створення, масштабування та розгортання точний Керовані моделі машинного навчання вимагають часу та технічних знань від команди висококваліфікованих спеціалістів із обробки даних. Крім того, дані вчений повинен перебудувати Моделі щоб переконатися, що надана інформація залишається правдивою, доки її дані не зміняться.
Як працює контрольоване навчання
Контрольоване машинне навчання використовує навчальні набори даних для досягнення бажаних результатів. Ці набори даних містять вхідні та правильні вихідні дані, які допомагають моделі навчатися швидше. Наприклад, ви хочете навчити машину, яка допоможе вам передбачити, скільки часу вам знадобиться, щоб доїхати додому з робочого місця.
Тут ви починаєте зі створення набору позначених даних. Ці дані включають:
- Метеорологічні умови
- Час доби
- Канікули
Усі ці деталі є вашими введеннями в цьому прикладі навчання під контролем. Результатом є кількість часу, який знадобився, щоб повернутися додому в той конкретний день.
Ви інстинктивно розумієте, що якщо надворі йде дощ, вам знадобиться більше часу, щоб доїхати додому. Але машині потрібні дані та статистика.
Давайте розглянемо деякі приклади навчання під наглядом, щоб розробити модель навчання під наглядом, яка допоможе користувачеві визначити час на дорогу. Перше, що вам потрібно створити, це навчальний набір. Цей тренувальний набір міститиме загальний час поїздки на роботу й роботу та відповідні фактори, як-от погода, час тощо. На основі цього навчального набору ваша машина може побачити наявність прямого зв’язку між кількістю дощу та часом, який вам знадобиться, щоб дістатися додому.
Таким чином, він встановлює, що чим більше йде дощ, тим довше вам доведеться їхати, щоб повернутися додому. Він також може побачити зв’язок між часом, коли ви йдете з роботи, і часом, коли ви будете в дорозі.
Чим ближче до шостої години вечора, тим більше часу потрібно, щоб повернутися додому. Ваша машина може виявити деякі зв’язки з вашими позначеними даними.
Це початок вашої моделі даних. Це починає впливати на те, як дощ впливає на те, як люди керують автомобілем. Він також починає бачити, що більше людей подорожують у певний час доби.
Типи керованого машинного навчання Algorithms
Нижче наведено типи алгоритмів керованого машинного навчання:
Регресія
Техніка регресії передбачає окреме вихідне значення з використанням навчальних даних.
Приклад: Ви можете використовувати регресію, щоб передбачити ціну будинку на основі даних навчання. Вхідними змінними будуть місцевість, розмір будинку тощо.
Сильні: Виходи завжди мають імовірнісну інтерпретацію, і алгоритм можна впорядкувати, щоб уникнути переобладнання.
Слабкі сторони: Логістична регресія може бути недостатньою за наявності кількох або нелінійних меж рішень. Цей метод не є гнучким, тому він не охоплює більш складні відносини.
Логістична регресія:
Метод логістичної регресії, який використовується для оцінки дискретних значень на основі заданого набору незалежних змінних. Це допомагає передбачити ймовірність настання події шляхом підгонки даних до функції logit. Тому вона також відома як логістична регресія. Оскільки він передбачає ймовірність, його вихідне значення лежить між 0 і 1.
Ось кілька типів регресії Algorithms
Класифікація
Класифікація означає групування результатів у класі. Якщо алгоритм намагається позначити вхідні дані двома різними класами, це називається бінарною класифікацією. Вибір між більш ніж двома класами називається багатокласовою класифікацією.
Приклад: Визначення того, чи буде хтось неплатником кредиту.
Сильні: Дерево класифікації дуже добре працює на практиці
Слабкі сторони: Невимушені, окремі дерева схильні до переобладнання.
Ось кілька типів класифікації Algorithms
Наївні байєсівські класифікатори
Наївна байєсовська модель (NBN) проста у створенні та дуже корисна для великих наборів даних. Цей метод складається з прямих ациклічних графів з одним батьківським і кількома дочірніми. Він передбачає незалежність серед дочірніх вузлів, відокремлених від батьківського.
Дерева рішень
Дерева рішень класифікують екземпляри, сортуючи їх на основі значення ознаки. У цьому методі кожен режим є властивістю екземпляра. Його слід класифікувати, і кожна гілка представляє значення, яке може приймати вузол. Це широко використовуваний метод класифікації. У цьому методі класифікація є деревом, яке відоме як дерево рішень.
Допомагає оцінити реальні значення (вартість придбання автомобіля, кількість дзвінків, загальний місячний обсяг продажів тощо).
Підтримка векторної машини
Машина опорних векторів (SVM) — це тип алгоритму навчання, розроблений у 1990 році. Цей метод базується на результатах статистичної теорії навчання, представленої Вапом Ніком.
Машини SVM також тісно пов’язані з функціями ядра, що є центральною концепцією для більшості завдань навчання. Інфраструктура ядра та SVM використовуються в різних сферах. Він включає пошук мультимедійної інформації, біоінформатику та розпізнавання образів.
Контрольовані проти неконтрольованих методів машинного навчання
На основі | Керована техніка машинного навчання | Техніка машинного навчання без нагляду |
---|---|---|
Вхідні дані | Algorithms навчаються з використанням позначених даних. | Algorithms використовуються проти даних, які не позначені |
Обчислювальна складність | Навчання під наглядом є простішим методом. | Навчання без контролю є обчислювально складним |
Точність | Дуже точний і надійний метод. | Less точний і надійний метод. |
Проблеми в керованому машинному навчанні
Ось проблеми, з якими стикаються під час керованого машинного навчання:
- Нерелевантна вхідна функція, наявні навчальні дані, може дати неточні результати
- Підготовка та попередня обробка даних завжди викликають труднощі.
- Точність страждає, коли неможливі, малоймовірні та неповні значення вводяться як навчальні дані
- Якщо зацікавлений експерт недоступний, то іншим підходом є «груба сила». Це означає, що вам потрібно подумати про правильні функції (вхідні змінні), на яких можна навчити машину. Це може бути неточно.
Переваги навчання під наглядом
Ось переваги керованого машинного навчання:
- Контрольоване навчання в машинне навчання дозволяє збирати дані або виводити дані з попереднього досвіду
- Допомагає оптимізувати критерії ефективності, використовуючи досвід
- Контрольоване машинне навчання допомагає вирішувати різні типи обчислювальних проблем у реальному світі.
Недоліки контрольованого навчання
Нижче наведено недоліки керованого машинного навчання:
- Межа прийняття рішень може бути перенапрацьовано, якщо у вашому навчальному наборі немає прикладів, які ви хочете мати в класі
- Ви повинні вибрати багато хороших прикладів з кожного класу під час навчання класифікатора.
- Класифікація великих даних може стати справжнім викликом.
- Навчання під наглядом вимагає багато обчислювального часу.
Найкращі практики навчання під наглядом
- Перш ніж робити щось інше, вам потрібно вирішити, які дані використовуватимуться як навчальний набір
- Вам потрібно визначити структуру вивченої функції та алгоритм навчання.
- Зберіть відповідні результати або від експертів-людей, або від вимірювань
Підсумки
- В алгоритмах керованого навчання ви навчаєте машину, використовуючи дані, які добре «марковані».
- Ви хочете навчити машину, яка допоможе вам передбачити, скільки часу вам знадобиться, щоб доїхати додому з вашого робочого місця, є прикладом навчання під наглядом.
- Регресія та класифікація — це два виміри алгоритму керованого машинного навчання.
- Контрольоване навчання є простішим методом, тоді як неконтрольоване навчання є складним методом.
- Найбільша проблема в навчанні під наглядом полягає в тому, що нерелевантні вхідні функції, які представляють навчальні дані, можуть дати неточні результати.
- Основна перевага навчання під наглядом полягає в тому, що воно дозволяє збирати дані або виводити дані з попереднього досвіду.
- Недоліком цієї моделі є те, що межі прийняття рішень можуть бути перенапруженими, якщо у вашому навчальному наборі немає прикладів, які ви хочете мати в класі.
- Згідно з найкращою практикою навчання під наглядом, вам спочатку потрібно вирішити, які дані слід використовувати як навчальний набір.