Обучение под присмотром и без присмотра: разница между ними

Ключевая разница между обучением под присмотром и без присмотра

  • При обучении с учителем вы обучаете машину, используя данные, которые хорошо «помечены».
  • Обучение без учителя — это метод машинного обучения, при котором вам не нужно контролировать модель.
  • Обучение под учителем позволяет собирать данные или выводить данные на основе предыдущего опыта.
  • Машинное обучение без учителя помогает вам находить в данных всевозможные неизвестные закономерности.
  • Регрессия и классификация — это два типа методов контролируемого машинного обучения.
  • Кластеризация и ассоциация — это два типа обучения без учителя.
  • В модели обучения с учителем будут заданы входные и выходные переменные, а в модели обучения без учителя будут предоставлены только входные данные.

Что такое контролируемое машинное обучение?

При обучении с учителем вы обучаете машину, используя данные, которые хорошо «помеченный». Это означает, что некоторые данные уже отмечены правильным ответом. Это можно сравнить с обучением, которое происходит в присутствии руководителя или учителя.

Алгоритм контролируемого обучения учится на помеченных обучающих данных и помогает прогнозировать результаты для непредвиденных данных. Успешное создание, масштабирование и развертывание точной контролируемой модели машинного обучения требует времени и технических знаний от команды высококвалифицированных специалистов по данным. Более того, специалист по данным должен перестроить модели, чтобы убедиться, что полученные идеи остаются верными до тех пор, пока данные не изменятся.

Что такое неконтролируемое обучение?

Обучение без учителя — это метод машинного обучения, при котором вам не нужно контролировать модель. Вместо этого вам нужно позволить модели работать самостоятельно для поиска информации. В основном это касается немаркированных данных.

Алгоритмы обучения без учителя позволяют выполнять больше задач.plex задачи обработки по сравнению с обучением с учителем. Однако обучение без учителя может быть более непредсказуемым по сравнению с другими методами естественного обучения, глубокого обучения и обучения с подкреплением.

Почему контролируемое обучение?

  • Обучение под учителем позволяет собирать данные или выводить данные на основе предыдущего опыта.
  • Помогает оптимизировать критерии производительности, используя опыт.
  • Контролируемое машинное обучение помогает решать различные типы реальных вычислительных задач.

Почему обучение без учителя?

Вот основные причины использования обучения без учителя:

  • Машинное обучение без учителя находит в данных всевозможные неизвестные закономерности.
  • Неконтролируемые методы помогают найти функции, которые могут быть полезны для категоризации.
  • Оно происходит в режиме реального времени, поэтому все входные данные анализируются и маркируются в присутствии обучающихся.
  • Легче получить неразмеченные данные с компьютера, чем помеченные данные, которые требуют ручного вмешательства.

Как работает контролируемое обучение?

Например, вы хотите научить машину прогнозировать, сколько времени вам понадобится, чтобы доехать до дома с работы. Здесь вы начинаете с создания набора помеченных данных. Эти данные включают в себя

  • Погодные условия
  • Время суток
  • Каникулы

Все эти деtails ваши входные данные. Результатом является количество времени, которое потребовалось, чтобы вернуться домой в этот конкретный день.

Как работает контролируемое обучение
Как работает контролируемое обучение

Инстинктивно понимаешь, что если на улице дождь, то дорога домой займет больше времени. Но машине нужны данные и статистика.

Давайте теперь посмотрим, как можно разработать модель обучения с учителем на основе этого примера, которая поможет пользователю определить время в пути. Первое, что вам нужно создать, — это набор обучающих данных. Этот обучающий набор будет содержать общее время в пути и соответствующие факторы, такие как погода, время и т. д. На основе этого обучающего набора ваша машина может обнаружить прямую зависимость между количеством дождя и временем, которое вам понадобится, чтобы добраться домой.

Таким образом, он устанавливает, что чем сильнее идет дождь, тем дольше вам придется ехать, чтобы вернуться домой. Он также может увидеть связь между временем, когда вы уходите с работы, и временем, когда вы будете в дороге.

Чем ближе вы к 6:XNUMX, тем больше времени вам понадобится, чтобы добраться домой. Ваша машина может обнаружить некоторые взаимосвязи с помеченными вами данными.

Этап обучения
Этап обучения

Это начало вашей модели данных. Это начинает влиять на то, как дождь влияет на то, как люди водят машину. Также становится заметно, что все больше людей путешествуют в определенное время суток.

Как работает обучение без учителя?

Давайте возьмем случай с ребенком и его домашней собакой.

Как работает обучение без учителя
Как работает обучение без учителя

Она знает и идентифицирует эту собаку. Несколько недель later друг семьи приводит с собой собаку и пытается поиграть с ребенком.

Как работает обучение без учителя

Малыш не видел эту собаку раньше. Но она признает, что многие черты (2 уха, глаза, хождение на 4 ногах) похожи на ее домашнюю собаку. Она идентифицирует новое животное, например собаку. Это обучение без присмотра, когда вас не учат, а вы учитесь на основе данных (в данном случае данных о собаке). Если бы это было обучение под присмотром, друг семьи сказал бы ребенку, что это собака.

Типы методов контролируемого машинного обучения

Типы методов контролируемого машинного обучения
Типы методов контролируемого машинного обучения

Регрессия

Метод регрессии прогнозирует одно выходное значение с использованием обучающих данных.

Пример. Вы можете использовать регрессию, чтобы спрогнозировать цену дома на основе обучающих данных. Входными переменными будут населенный пункт, размер дома и т. д.

классификация

Классификация означает группировку вывода внутри класса. Если алгоритм пытается разбить входные данные на два разных класса, это называется бинарной классификацией. Выбор между более чем двумя классами называется многоклассовой классификацией.

Пример: Определение того, будет ли кто-то неплательщиком по кредиту.

Сильные стороны: выходные данные всегда имеют вероятностную интерпретацию, и алгоритм можно регуляризовать, чтобы избежать переобучения.

Слабые стороны: Логистическая регрессия может работать неэффективно при наличии нескольких или нелинейных границ принятия решений. Этот метод не является гибким, поэтому он не позволяет захватывать больше данных.plex отношения.

Типы методов машинного обучения без учителя

Проблемы обучения без учителя далее группируются в проблемы кластеризации и ассоциации.

Кластеризация

Кластеризация

Кластеризация является важной концепцией, когда речь идет об обучении без учителя. В основном он занимается поиском структуры или шаблона в коллекции неклассифицированных данных. Алгоритмы кластеризации будут обрабатывать ваши данные и находить естественные кластеры (группы), если они существуют в данных. Вы также можете изменить количество кластеров, которые должны идентифицировать ваши алгоритмы. Это позволяет регулировать степень детализации этих групп.

Объединение

Правила ассоциации позволяют устанавливать ассоциации между объектами данных внутри больших баз данных. Этот неконтролируемый метод предназначен для обнаружения интересных взаимосвязей между переменными в больших базах данных. Например, люди, покупающие новый дом, скорее всего, купят новую мебель.

Другие примеры:

  • Подгруппа больных раком, сгруппированная по показателям экспрессии генов.
  • Группы покупателей на основе их истории посещений и покупок.
  • Группа фильмов по рейтингу зрителей

Разница между обучением под присмотром и без присмотра

Контролируемое и неконтролируемое обучение
Контролируемое и неконтролируемое обучение
параметры Метод контролируемого машинного обучения Техника машинного обучения без учителя
Обработка В модели обучения с учителем будут заданы входные и выходные переменные. В модели обучения без учителя будут предоставлены только входные данные.
Входные данные Алгоритмы обучаются с использованием размеченных данных. Алгоритмы используются с данными, которые не помечены.
Используемые алгоритмы Машина опорных векторов, нейронная сеть, линейная и логистическая регрессия, случайный лес и деревья классификации. Неконтролируемые алгоритмы можно разделить на разные категории: например, кластерные алгоритмы, K-средние, Hier.archiкалибровочная кластеризация и т. д.
Вычислительный Комplexность Обучение под присмотром – более простой метод. Обучение без учителя осуществляется с помощью вычислений.plex
Использование данных Модель обучения с учителем использует данные обучения для изучения связи между входными и выходными данными. Обучение без учителя не использует выходные данные.
Точность результатов Очень точный и надежный метод. Менее точный и надежный метод.
Обучение в режиме реального времени Метод обучения происходит офлайн. Обучение методу происходит в режиме реального времени.
Количество классов Количество классов известно. Количество классов неизвестно.
Главный недостаток Классификация больших данных может стать настоящей проблемой в контролируемом обучении. Вы не можете получить точную информацию о сортировке данных, а выходные данные, используемые при обучении без учителя, помечены и неизвестны.