Обучение под присмотром и без присмотра: разница между ними

Ключевая разница между обучением под присмотром и без присмотра

При обучении с учителем вы обучаете машину, используя данные, которые хорошо «помечены».
Обучение без учителя — это метод машинного обучения, при котором вам не нужно контролировать модель.
Обучение под учителем позволяет собирать данные или выводить данные на основе предыдущего опыта.
Машинное обучение без учителя помогает вам находить в данных всевозможные неизвестные закономерности.
Регрессия и классификация — это два типа методов контролируемого машинного обучения.
ClusterОбучение и ассоциация — это два типа обучения без учителя.
В модели обучения с учителем будут заданы входные и выходные переменные, а в модели обучения без учителя будут предоставлены только входные данные.

Что такое контролируемое машинное обучение?

При обучении с учителем вы обучаете машину, используя данные, которые хорошо «помеченный». Это означает, что некоторые данные уже отмечены правильным ответом. Это можно сравнить с обучением, которое происходит в присутствии руководителя или учителя.

Алгоритм контролируемого обучения учится на помеченных обучающих данных и помогает прогнозировать результаты для непредвиденных данных. Успешное создание, масштабирование и развертывание точной контролируемой модели машинного обучения требует времени и технических знаний от команды высококвалифицированных специалистов по данным. Более того, специалист по данным должен перестроить модели, чтобы убедиться, что полученные идеи остаются верными до тех пор, пока данные не изменятся.

Что такое неконтролируемое обучение?

Обучение без учителя — это метод машинного обучения, при котором вам не нужно контролировать модель. Вместо этого вам нужно позволить модели работать самостоятельно для поиска информации. В основном это касается немаркированных данных.

Алгоритмы обучения без учителя позволяют выполнять более сложные задачи обработки по сравнению с обучением с учителем. Однако обучение без учителя может быть более непредсказуемым по сравнению с другими методами естественного обучения, глубокого обучения и обучения с подкреплением.

Почему контролируемое обучение?

Обучение под учителем позволяет собирать данные или выводить данные на основе предыдущего опыта.
Помогает оптимизировать критерии производительности, используя опыт.
Контролируемое машинное обучение помогает решать различные типы реальных вычислительных задач.

Почему обучение без учителя?

Вот основные причины использования обучения без учителя:

Машинное обучение без учителя находит в данных всевозможные неизвестные закономерности.
Неконтролируемые методы помогают найти функции, которые могут быть полезны для категоризации.
Оно происходит в режиме реального времени, поэтому все входные данные анализируются и маркируются в присутствии обучающихся.
Легче получить неразмеченные данные с компьютера, чем помеченные данные, которые требуют ручного вмешательства.

Как работает контролируемое обучение?

Например, вы хотите научить машину прогнозировать, сколько времени вам понадобится, чтобы доехать до дома с работы. Здесь вы начинаете с создания набора помеченных данных. Эти данные включают в себя

Погодные условия
Время суток
Праздники

Все эти детали являются вашим вкладом. Результатом является количество времени, которое потребовалось, чтобы вернуться домой в этот конкретный день.

Инстинктивно понимаешь, что если на улице дождь, то дорога домой займет больше времени. Но машине нужны данные и статистика.

Давайте теперь посмотрим, как можно разработать модель обучения с учителем на основе этого примера, которая поможет пользователю определить время в пути. Первое, что вам нужно создать, — это набор обучающих данных. Этот обучающий набор будет содержать общее время в пути и соответствующие факторы, такие как погода, время и т. д. На основе этого обучающего набора ваша машина может обнаружить прямую зависимость между количеством дождя и временем, которое вам понадобится, чтобы добраться домой.

Таким образом, он устанавливает, что чем сильнее идет дождь, тем дольше вам придется ехать, чтобы вернуться домой. Он также может увидеть связь между временем, когда вы уходите с работы, и временем, когда вы будете в дороге.

Чем ближе вы к 6:XNUMX, тем больше времени вам понадобится, чтобы добраться домой. Ваша машина может обнаружить некоторые взаимосвязи с помеченными вами данными.

Это начало вашей модели данных. Это начинает влиять на то, как дождь влияет на то, как люди водят машину. Также становится заметно, что все больше людей путешествуют в определенное время суток.

Как работает обучение без учителя?

Давайте возьмем случай с ребенком и его домашней собакой.

Она знает и идентифицирует эту собаку. Несколько недель спустя друг семьи приводит с собой собаку и пытается поиграть с малышом.

Малыш не видел эту собаку раньше. Но она признает, что многие черты (2 уха, глаза, хождение на 4 ногах) похожи на ее домашнюю собаку. Она идентифицирует новое животное, например собаку. Это обучение без присмотра, когда вас не учат, а вы учитесь на основе данных (в данном случае данных о собаке). Если бы это было обучение под присмотром, друг семьи сказал бы ребенку, что это собака.

Типы методов контролируемого машинного обучения

Регрессия

Метод регрессии прогнозирует одно выходное значение с использованием обучающих данных.

Пример. Вы можете использовать регрессию, чтобы спрогнозировать цену дома на основе обучающих данных. Входными переменными будут населенный пункт, размер дома и т. д.

классификация

Классификация означает группировку вывода внутри класса. Если алгоритм пытается разбить входные данные на два разных класса, это называется бинарной классификацией. Выбор между более чем двумя классами называется многоклассовой классификацией.

Пример: Определение того, будет ли кто-то неплательщиком по кредиту.

Сильные стороны: выходные данные всегда имеют вероятностную интерпретацию, и алгоритм можно регуляризовать, чтобы избежать переобучения.

Слабые стороны: Логистическая регрессия может работать неэффективно при наличии нескольких или нелинейных границ принятия решений. Этот метод не является гибким, поэтому он не фиксирует более сложные отношения.

Типы методов машинного обучения без учителя

Проблемы обучения без учителя далее группируются в проблемы кластеризации и ассоциации.

ClusterИНГ

ClusterОбучение является важной концепцией, когда речь идет об обучении без присмотра. В основном он занимается поиском структуры или шаблона в коллекции неклассифицированных данных. Clustering алгоритмы обработают ваши данные и найдут естественные кластеры (группы), если они существуют в данных. Вы также можете изменить количество кластеров, которые должны идентифицировать ваши алгоритмы. Это позволяет вам настроить гранулярность этих групп.

Фонды и ассоциации

Правила ассоциации позволяют устанавливать ассоциации между объектами данных внутри больших баз данных. Этот неконтролируемый метод предназначен для обнаружения интересных взаимосвязей между переменными в больших базах данных. Например, люди, покупающие новый дом, скорее всего, купят новую мебель.

Другие примеры:

Подгруппа больных раком, сгруппированная по показателям экспрессии генов.
Группы покупателей на основе их истории посещений и покупок.
Группа фильмов по рейтингу зрителей

Разница между обучением под присмотром и без присмотра

Контролируемое и неконтролируемое обучение

Параметры	Метод контролируемого машинного обучения	Техника машинного обучения без учителя
Разработка	В модели обучения с учителем будут заданы входные и выходные переменные.	В модели обучения без учителя будут предоставлены только входные данные.
Входные данные	Algorithms обучаются с использованием размеченных данных.	Algorithms используются для данных, которые не помечены
Algorithms Не новая	Машина опорных векторов, нейронная сеть, линейная и логистическая регрессия, случайный лес и деревья классификации.	Неконтролируемые алгоритмы можно разделить на разные категории: например Cluster алгоритмы, K-средние, иерархическая кластеризация и т. д.
Вычислительная сложность	Обучение под присмотром – более простой метод.	Обучение без учителя является вычислительно сложным
Использование данных	Модель обучения с учителем использует данные обучения для изучения связи между входными и выходными данными.	Обучение без учителя не использует выходные данные.
Точность результатов	Очень точный и надежный метод.	Less точный и надежный метод.
Обучение в режиме реального времени	Метод обучения происходит офлайн.	Обучение методу происходит в режиме реального времени.
Количество классов	Количество классов известно.	Количество классов неизвестно.
Главный недостаток	Классификация больших данных может стать настоящей проблемой в контролируемом обучении.	Вы не можете получить точную информацию о сортировке данных, а выходные данные, используемые при обучении без учителя, помечены и неизвестны.