Контролируемое машинное обучение: что это такое? Algorithms с примерами
Что такое контролируемое машинное обучение?
Машинное обучение с учителем — это алгоритм, который учится на помеченных обучающих данных, чтобы помочь вам предсказать результаты для непредвиденных данных. При обучении с учителем вы обучаете машину, используя данные, которые хорошо «помечены». Это означает, что некоторые данные уже отмечены правильными ответами. Это можно сравнить с обучением в присутствии руководителя или учителя.
Успешное создание, масштабирование и развертывание точный Модели машинного обучения с учителем требуют времени и технических знаний от команды высококвалифицированных специалистов по обработке данных. Более того, Данные ученый должен восстановить ухода чтобы убедиться, что предоставленная информация остается верной до тех пор, пока ее данные не изменятся.
Как работает контролируемое обучение
Контролируемое машинное обучение использует наборы обучающих данных для достижения желаемых результатов. Эти наборы данных содержат входные данные и правильные выходные данные, которые помогают модели быстрее обучаться. Например, вы хотите научить машину прогнозировать, сколько времени вам понадобится, чтобы доехать до дома с работы.
Здесь вы начинаете с создания набора помеченных данных. Эти данные включают в себя:
- Погодные условия
- Время суток
- Каникулы
Все эти детали являются вашими входными данными в этом примере контролируемого обучения. Результатом является количество времени, которое потребовалось, чтобы вернуться домой в этот конкретный день.
Инстинктивно понимаешь, что если на улице дождь, то дорога домой займет больше времени. Но машине нужны данные и статистика.
Давайте рассмотрим несколько примеров обучения с учителем о том, как можно разработать модель обучения с учителем, которая поможет пользователю определить время в пути. Первое, что вам необходимо создать, — это обучающий набор. Этот обучающий набор будет содержать общее время в пути и соответствующие факторы, такие как погода, время и т. д. На основе этого обучающего набора ваша машина может обнаружить прямую зависимость между количеством дождя и временем, которое вам понадобится, чтобы добраться домой.
Таким образом, он устанавливает, что чем сильнее идет дождь, тем дольше вам придется ехать, чтобы вернуться домой. Он также может увидеть связь между временем, когда вы уходите с работы, и временем, когда вы будете в дороге.
Чем ближе вы к 6:XNUMX, тем больше времени вам понадобится, чтобы добраться домой. Ваша машина может обнаружить некоторые взаимосвязи с помеченными вами данными.
Это начало вашей модели данных. Это начинает влиять на то, как дождь влияет на то, как люди водят машину. Также становится заметно, что все больше людей путешествуют в определенное время суток.
Типы контролируемого машинного обучения Algorithms
Ниже приведены типы алгоритмов контролируемого машинного обучения:
Регрессия
Метод регрессии прогнозирует одно выходное значение с использованием обучающих данных.
Пример: вы можете использовать регрессию, чтобы спрогнозировать цену дома на основе обучающих данных. Входными переменными будут населенный пункт, размер дома и т. д.
Сильные стороны: выходные данные всегда имеют вероятностную интерпретацию, и алгоритм можно регуляризовать, чтобы избежать переобучения.
Слабые стороны: Логистическая регрессия может работать неэффективно при наличии нескольких или нелинейных границ принятия решений. Этот метод не является гибким, поэтому он не фиксирует более сложные отношения.
Логистическая регрессия:
Метод логистической регрессии, используемый для оценки дискретных значений на основе заданного набора независимых переменных. Это помогает вам предсказать вероятность возникновения события путем сопоставления данных с логит-функцией. Поэтому его также называют логистической регрессией. Поскольку он предсказывает вероятность, его выходное значение лежит между 0 и 1.
Вот несколько типов регрессии Algorithms
классификация
Классификация означает группировку вывода внутри класса. Если алгоритм пытается разбить входные данные на два разных класса, это называется бинарной классификацией. Выбор между более чем двумя классами называется многоклассовой классификацией.
Пример: Определение того, будет ли кто-то неплательщиком по кредиту.
Сильные стороны: Дерево классификации очень хорошо работает на практике.
Слабые стороны: без ограничений, отдельные деревья склонны к переобучению.
Вот несколько типов классификации Algorithms
Наивные байесовские классификаторы
Наивная байесовская модель (NBN) проста в построении и очень полезна для больших наборов данных. Этот метод состоит из прямых ациклических графов с одним родителем и несколькими дочерними элементами. Он предполагает независимость дочерних узлов, отделенных от родительского.
Деревья решений
Деревья решений классифицируют экземпляры, сортируя их по значению признака. В этом методе каждый режим является особенностью экземпляра. Он должен быть классифицирован, и каждая ветвь представляет собой значение, которое может принять узел. Это широко используемый метод классификации. В этом методе классификация представляет собой дерево, известное как дерево решений.
Это помогает оценить реальные значения (стоимость покупки автомобиля, количество звонков, общий объем продаж за месяц и т. д.).
Машина опорных векторов
Машина опорных векторов (SVM) — это тип алгоритма обучения, разработанный в 1990 году. Этот метод основан на результатах статистической теории обучения, представленной Вап Ником.
Машины SVM также тесно связаны с функциями ядра, которые являются центральной концепцией для большинства задач обучения. Фреймворк ядра и SVM используются в самых разных областях. Сюда входят поиск мультимедийной информации, биоинформатика и распознавание образов.
Контролируемые и неконтролируемые методы машинного обучения
Основано на | Метод контролируемого машинного обучения | Техника машинного обучения без учителя |
---|---|---|
Входные данные | Algorithms обучаются с использованием размеченных данных. | Algorithms используются для данных, которые не помечены |
Вычислительная сложность | Обучение под присмотром – более простой метод. | Обучение без учителя является вычислительно сложным |
точность | Очень точный и надежный метод. | Less точный и надежный метод. |
Проблемы в контролируемом машинном обучении
Вот проблемы, с которыми сталкиваются при контролируемом машинном обучении:
- Нерелевантная входная функция, присутствующая в обучающих данных, может дать неточные результаты.
- Подготовка и предварительная обработка данных всегда представляют собой сложную задачу.
- Точность страдает, когда в качестве обучающих данных вводятся невозможные, маловероятные и неполные значения.
- Если заинтересованный эксперт недоступен, тогда другой подход — «грубая сила». Это означает, что вам нужно подумать о правильных функциях (входных переменных) для обучения машины. Это может быть неточно.
Преимущества контролируемого обучения
Вот преимущества контролируемого машинного обучения:
- Обучение под наблюдением в Машинное обучение позволяет собирать данные или производить вывод данных на основе предыдущего опыта
- Помогает оптимизировать критерии производительности, используя опыт.
- Контролируемое машинное обучение помогает решать различные типы реальных вычислительных задач.
Недостатки контролируемого обучения
Ниже приведены недостатки контролируемого машинного обучения:
- Граница принятия решения может быть переобучена, если в вашем обучающем наборе нет примеров, которые вы хотите иметь в классе.
- Во время обучения классификатора вам нужно выбрать множество хороших примеров из каждого класса.
- сортировка большие данные может стать настоящим испытанием.
- Обучение контролируемому обучению требует много вычислительного времени.
лучшие практики контролируемого обучения
- Прежде чем делать что-либо еще, вам необходимо решить, какие данные будут использоваться в качестве обучающего набора.
- Вам необходимо определиться со структурой изучаемой функции и алгоритмом обучения.
- Соберите соответствующие результаты либо от экспертов, либо в результате измерений.
Резюме
- В алгоритмах контролируемого обучения вы обучаете машину, используя данные, которые хорошо «помечены».
- Вы хотите обучить машину, которая поможет вам предсказать, сколько времени вам понадобится, чтобы доехать до дома с работы, — это пример контролируемого обучения.
- Регрессия и классификация — это два измерения алгоритма контролируемого машинного обучения.
- Контролируемое обучение — более простой метод, тогда как неконтролируемое обучение — сложный метод.
- Самая большая проблема в контролируемом обучении заключается в том, что нерелевантные входные данные, присутствующие в обучающих данных, могут дать неточные результаты.
- Основное преимущество обучения с учителем заключается в том, что оно позволяет собирать данные или выводить данные на основе предыдущего опыта.
- Недостаток этой модели заключается в том, что границы принятия решений могут быть перенапряжены, если в вашем обучающем наборе нет примеров, которые вы хотели бы иметь в классе.
- Рекомендуется сначала решить, какие данные следует использовать в качестве обучающего набора.