Контролируемое машинное обучение: что такое, алгоритмы с примерами

Что такое контролируемое машинное обучение?

Машинное обучение с учителем — это алгоритм, который учится на помеченных обучающих данных, чтобы помочь вам предсказать результаты для непредвиденных данных. При обучении с учителем вы обучаете машину, используя данные, которые хорошо «помечены». Это означает, что некоторые данные уже отмечены правильными ответами. Это можно сравнить с обучением в присутствии руководителя или учителя.

Успешное создание, масштабирование и развертывание точный Модели машинного обучения с учителем требуют времени и технических знаний от команды высококвалифицированных специалистов по обработке данных. Более того, Данные ученый должен восстановить Модели чтобы убедиться, что предоставленная информация остается верной до тех пор, пока ее данные не изменятся.

Как работает контролируемое обучение

Контролируемое машинное обучение использует наборы обучающих данных для достижения желаемых результатов. Эти наборы данных содержат входные данные и правильные выходные данные, которые помогают модели быстрее обучаться. Например, вы хотите научить машину прогнозировать, сколько времени вам понадобится, чтобы доехать до дома с работы.

Здесь вы начинаете с создания набора помеченных данных. Эти данные включают в себя:

  • Погодные условия
  • Время суток
  • Каникулы

Все эти деtails ваш вклад в этот пример контролируемого обучения. Результатом является количество времени, которое потребовалось, чтобы вернуться домой в этот конкретный день.

Как работает контролируемое машинное обучение

Инстинктивно понимаешь, что если на улице дождь, то дорога домой займет больше времени. Но машине нужны данные и статистика.

Давайте рассмотрим несколько примеров обучения с учителем о том, как можно разработать модель обучения с учителем, которая поможет пользователю определить время в пути. Первое, что вам необходимо создать, — это обучающий набор. Этот обучающий набор будет содержать общее время в пути и соответствующие факторы, такие как погода, время и т. д. На основе этого обучающего набора ваша машина может обнаружить прямую зависимость между количеством дождя и временем, которое вам понадобится, чтобы добраться домой.

Таким образом, он устанавливает, что чем сильнее идет дождь, тем дольше вам придется ехать, чтобы вернуться домой. Он также может увидеть связь между временем, когда вы уходите с работы, и временем, когда вы будете в дороге.

Чем ближе вы к 6:XNUMX, тем больше времени вам понадобится, чтобы добраться домой. Ваша машина может обнаружить некоторые взаимосвязи с помеченными вами данными.

Работа контролируемого машинного обучения
Работа контролируемого машинного обучения

Это начало вашей модели данных. Это начинает влиять на то, как дождь влияет на то, как люди водят машину. Также становится заметно, что все больше людей путешествуют в определенное время суток.

Типы контролируемых алгоритмов машинного обучения

Фоллоwing типы алгоритмов контролируемого машинного обучения:

Регрессия

Метод регрессии прогнозирует одно выходное значение с использованием обучающих данных.

Пример: вы можете использовать регрессию, чтобы спрогнозировать цену дома на основе обучающих данных. Входными переменными будут населенный пункт, размер дома и т. д.

Сильные стороны: выходные данные всегда имеют вероятностную интерпретацию, и алгоритм можно регуляризовать, чтобы избежать переобучения.

Слабые стороны: Логистическая регрессия может работать неэффективно при наличии нескольких или нелинейных границ принятия решений. Этот метод не является гибким, поэтому он не позволяет захватывать больше данных.plex отношения.

Логистическая регрессия:

Метод логистической регрессии, используемый для оценки дискретных значений на основе заданного набора независимых переменных. Это помогает вам предсказать вероятность возникновения события путем сопоставления данных с логит-функцией. Поэтому его также называют логистической регрессией. Поскольку он предсказывает вероятность, его выходное значение лежит между 0 и 1.

Вот несколько типов алгоритмов регрессии.

классификация

Классификация означает группировку вывода внутри класса. Если алгоритм пытается разбить входные данные на два разных класса, это называется бинарной классификацией. Выбор между более чем двумя классами называется многоклассовой классификацией.

Пример: Определение того, будет ли кто-то неплательщиком по кредиту.

Сильные стороны: Дерево классификации очень хорошо работает на практике.

Слабые стороны: без ограничений, отдельные деревья склонны к переобучению.

Вот несколько типов алгоритмов классификации.

Наивные байесовские классификаторы

Наивная байесовская модель (NBN) проста в построении и очень полезна для больших наборов данных. Этот метод состоит из прямых ациклических графов с одним родителем и несколькими дочерними элементами. Он предполагает независимость дочерних узлов, отделенных от родительского.

Деревья решений

Деревья решений классифицируют экземпляры, сортируя их по значению признака. В этом методе каждый режим является особенностью экземпляра. Он должен быть классифицирован, и каждая ветвь представляет собой значение, которое может принять узел. Это широко используемый метод классификации. В этом методе классификация представляет собой дерево, известное как дерево решений.

Это помогает оценить реальные значения (стоимость покупки автомобиля, количество звонков, общий объем продаж за месяц и т. д.).

Машина опорных векторов

Машина опорных векторов (SVM) — это тип алгоритма обучения, разработанный в 1990 году. Этот метод основан на результатах статистической теории обучения, представленной Вап Ником.

Машины SVM также тесно связаны с функциями ядра, которые являются центральной концепцией для большинства задач обучения. Фреймворк ядра и SVM используются в самых разных областях. Сюда входят поиск мультимедийной информации, биоинформатика и распознавание образов.

Контролируемые и неконтролируемые методы машинного обучения

Основано на Метод контролируемого машинного обучения Техника машинного обучения без учителя
Входные данные Алгоритмы обучаются с использованием размеченных данных. Алгоритмы используются с данными, которые не помечены.
Вычислительный Комplexность Обучение под присмотром – более простой метод. Обучение без учителя осуществляется с помощью вычислений.plex
точность Очень точный и надежный метод. Менее точный и надежный метод.

Проблемы в контролируемом машинном обучении

Вот проблемы, с которыми сталкиваются при контролируемом машинном обучении:

  • Нерелевантная входная функция, присутствующая в обучающих данных, может дать неточные результаты.
  • Подготовка и предварительная обработка данных всегда представляют собой сложную задачу.
  • Точность страдает, когда в качестве обучающих данных вводятся невозможные, маловероятные и неполные значения.
  • Если заинтересованный эксперт недоступен, тогда другой подход — «грубая сила». Это означает, что вам нужно подумать о правильных функциях (входных переменных) для обучения машины. Это может быть неточно.

Преимущества контролируемого обучения

Вот преимущества контролируемого машинного обучения:

  • Обучение под наблюдением в Машинное обучение позволяет собирать данные или производить вывод данных на основе предыдущего опыта
  • Помогает оптимизировать критерии производительности, используя опыт.
  • Контролируемое машинное обучение помогает решать различные типы реальных вычислительных задач.

Недостатки контролируемого обучения

Ниже приведены недостатки контролируемого машинного обучения:

  • Граница принятия решения может быть переобучена, если в вашем обучающем наборе нет примеров, которые вы хотите иметь в классе.
  • Во время обучения классификатора вам нужно выбрать множество хороших примеров из каждого класса.
  • сортировка большие данные может стать настоящим испытанием.
  • Обучение контролируемому обучению требует много вычислительного времени.

Лучшие практики контролируемого обучения

  • Прежде чем делать что-либо еще, вам необходимо решить, какие данные будут использоваться в качестве обучающего набора.
  • Вам необходимо определиться со структурой изучаемой функции и алгоритмом обучения.
  • Соберите соответствующие результаты либо от экспертов, либо в результате измерений.

Итоги

  • В алгоритмах контролируемого обучения вы обучаете машину, используя данные, которые хорошо «помечены».
  • Вы хотите обучить машину, которая поможет вам предсказать, сколько времени вам понадобится, чтобы доехать до дома с работы, — это пример контролируемого обучения.
  • Регрессия и классификация — это два измерения алгоритма контролируемого машинного обучения.
  • Контролируемое обучение это более простой метод, в то время как обучение без учителя является комplex метод.
  • Самая большая проблема в контролируемом обучении заключается в том, что нерелевантные входные данные, присутствующие в обучающих данных, могут дать неточные результаты.
  • Основное преимущество обучения с учителем заключается в том, что оно позволяет собирать данные или выводить данные на основе предыдущего опыта.
  • Недостаток этой модели заключается в том, что границы принятия решений могут быть перенапряжены, если в вашем обучающем наборе нет примеров, которые вы хотели бы иметь в классе.
  • Рекомендуется сначала решить, какие данные следует использовать в качестве обучающего набора.