50 вопросов и ответов на собеседовании по машинному обучению (2024 г.)

Вот вопросы и ответы на собеседовании по машинному обучению как для новичков, так и для опытных кандидатов, желающих получить работу своей мечты.

 

Машинное обучение Viva: вопросы и ответы для первокурсников

1) Что такое машинное обучение?

Машинное обучение — это раздел информатики, который занимается системным программированием с целью автоматического обучения и совершенствования с опытом. Например: роботы запрограммированы так, что могут выполнять задачу на основе данных, которые они собирают с датчиков. Он автоматически изучает программы на основе данных.

👉 Скачать бесплатно PDF-файл: Вопросы и ответы для интервью по машинному обучению >>


2) Укажите разницу между интеллектуальным анализом данных и машинным обучением?

Машинное обучение связано с изучением, проектированием и разработкой algorithms которые дают компьютерам возможность учиться без явного программирования. В то время как интеллектуальный анализ данных можно определить как процесс, в котором неструктурированные данные пытаются извлечь знания или неизвестные интересные закономерности. В ходе этого процесса машина обучается algorithms используются.


3) Что такое «переобучение» в машинном обучении?

In обучение с помощью машины, когда статистическая модель описывает случайную ошибку или шум вместо лежащей в основе зависимости, происходит «переобучение». Когда модель чрезмерно комичнаplexОбычно наблюдается переоснащение из-за слишком большого количества параметров по сравнению с количеством типов обучающих данных. Модель демонстрирует плохую производительность, которая была переобучена.


4) Почему происходит переобучение?

Существует возможность переобучения, поскольку критерии, используемые для обучения модели, не совпадают с критериями, используемыми для оценки эффективности модели.


5) Как избежать переобучения?

Используя большое количество данных, можно избежать переоснащения, переоснащение происходит относительно небольшого набора данных, и вы пытаетесь извлечь из него уроки. Но если у вас небольшая база данных, и вы вынуждены использовать модель, основанную на ней. В такой ситуации вы можете использовать технику, известную как перекрестная проверка. В этом методе набор данных делится на два раздела: наборы данных для тестирования и наборы данных для обучения. Набор данных для тестирования будет проверять только модель, а в наборе данных для обучения точки данных будут соответствовать модели.

В этом методе модели обычно предоставляется набор известных данных, на которых выполняется обучение (набор обучающих данных), и набор данных неизвестных данных, на которых тестируется модель. Идея перекрестной проверки состоит в том, чтобы определить набор данных для «тестирования» модели на этапе обучения.


6) Что такое индуктивное машинное обучение?

Индуктивное машинное обучение включает в себя процесс обучения на примерах, когда система на основе набора наблюдаемых примеров пытается вывести общее правило.


7) Какие пять популярных algorithms машинного обучения?

  • Деревья решений
  • Нейронные сети (обратное распространение)
  • Вероятностные сети
  • NearesСосед
  • Поддерживающие векторные машины

8) Каковы различные алгоритмы машинного обучения?

Различные типы методов машинного обучения:


9) Каковы три этапа построения гипотез или модели машинного обучения?

  • Построение модели
  • Тестирование модели
  • Применение модели

10) Каков стандартный подход к контролируемому обучению?

Стандартный подход к обучению с учителем состоит в том, чтобы разделить набор примеров на обучающий набор и тест.


11) Что такое «Обучающий набор» и «Тестовый набор»?

В различных областях информатики, таких как машинное обучение, набор данных используется для обнаружения потенциально прогнозируемой взаимосвязи, известной как «Обучающий набор». Обучающий набор — это примеры, данные учащемуся, тогда как тестовый набор используется для проверки точности гипотез, выдвинутых учащимся, и это набор примеров, скрытый от учащегося. Обучающий набор отличается от тестового набора.


12) Перечислите различные подходы к машинному обучению?

Различные подходы в машинном обучении:

  • Концепция против классификационного обучения
  • Символическое и статистическое обучение
  • Индуктивное и аналитическое обучение

13) Что не является машинным обучением?


14) Объясните, какова функция «обучения без учителя»?

  • Найдите clusterданных
  • Найдите низкоразмерные представления данных
  • Найдите интересные направления в данных
  • Интересные координаты и корреляции
  • Найти новые наблюдения/очистить базу данных

15) Объясните, какова функция «контролируемого обучения»?

  • классификации
  • Распознавание речи
  • Регрессия
  • Прогнозировать временные ряды
  • Аннотировать строки

16) Что такое алгоритмонезависимое машинное обучение?

Машинное обучение там, где математические foundations не зависит от какого-либо конкретного классификатора или алгоритма обучения, называется машинным обучением, независимым от алгоритма?


17) В чем разница между искусственным обучением и машинным обучением?

Проектирование и разработка algorithms в соответствии с поведением, основанным на эмпирических данных, известны как машинное обучение. Хотя искусственный интеллект помимо машинного обучения, он также охватывает и другие аспекты, такие как представление знаний, обработка естественного языка, планирование, робототехника и т. д.


18) Что такое классификатор в машинном обучении?

Классификатор в машинном обучении — это система, которая вводит вектор дискретных или непрерывных значений признаков и выводит одно дискретное значение — класс.


19) Каковы преимущества наивного Байеса?

В Naïve байесовский классификатор сходится быстрее, чем дискриминационные модели, такие как логистическая регрессия, поэтому вам потребуется меньше обучающих данных. Основное преимущество заключается в том, что он не может изучать взаимодействие между функциями.


20) В каких областях используется распознавание образов?

Распознавание образов можно использовать в

  • Компьютерное зрение
  • Распознавание речи
  • Добыча данных
  • Показатели
  • Неформальный поиск
  • Биоинформатики

Вопросы для интервью по машинному обучению для опытных

21) Что такое генетическое программирование?

Генетическое программирование — один из двух методов, используемых в машинном обучении. Модель основана на тестировании и выборе лучшего варианта среди набора результатов.


22) Что такое индуктивный Logic Proграммирование в машинном обучении?

индуктивный Logic Proграммирование (ILP) — это подобласть машинного обучения, в которой используется логическое программирование, представляющее базовые знания и примеры.


23) Что такое выбор модели в машинном обучении?

Процесс выбора моделей среди различных математических моделей, которые используются для описания одного и того же набора данных, известен как выбор модели. Выбор модели применяется в областях статистики, машинного обучения и интеллектуального анализа данных.


24) Какие два метода используются для калибровки в контролируемом обучении?

Два метода, используемые для прогнозирования хороших вероятностей в контролируемом обучении:

  • Платт Калибровка
  • Изотоническая регрессия

Эти методы предназначены для бинарной классификации, и это нетривиально.


25) Какой метод часто используется для предотвращения переобучения?

При наличии достаточного количества данных используется «изотоническая регрессия», чтобы предотвратить проблему переобучения.


26) В чем разница между эвристикой для изучения правил и эвристикой для деревьев решений?

Разница в том, что эвристика для деревьев решений оценивает среднее качество ряда непересекающихся наборов, тогда как изучающие правила оценивают только качество набора экземпляров, который покрывается правилом-кандидатом.


27) Что такое Персепtron в области машинного обучения?

В области машинного обучения Perceptron — это контролируемый алгоритм обучения для двоичных классификаторов, где двоичный классификатор является решающей функцией того, представляет ли входной сигнал вектор или число.


28) Объясните два компонента байесовского подхода. logic proграмм?

байесовский logic proграмм состоит из двух компонентов. Первый компонент является логическим; он состоит из набора байесовских предложений, которые отражают качественную структуру предметной области. Второй компонент – количественный, он кодирует количественную информацию о предметной области.


29) Что такое байесовские сети (БС)?

Байесовская сеть используется для представления графической модели вероятностных отношений между набором переменных.


30) Почему алгоритм обучения на основе экземпляров иногда называют алгоритмом ленивого обучения?

Алгоритм обучения на основе экземпляров также называется алгоритмом ленивого обучения, поскольку они задерживают процесс индукции или обобщения до тех пор, пока не будет выполнена классификация.


31) Какие два метода классификации может обрабатывать SVM (машина опорных векторов)?

  • Объединение бинарных классификаторов
  • Изменение двоичного файла для включения многоклассового обучения

32) Что такое ансамблевое обучение?

Для решения конкретной вычислительной программы стратегически создаются и объединяются несколько моделей, таких как классификаторы или эксперты. Этот процесс известен как ансамблевое обучение.


33) Почему используется ансамблевое обучение?

Ансамблевое обучение используется для улучшения классификации, прогнозирования, аппроксимации функций и т. д. модели.


34) Когда использовать ансамблевое обучение?

Ансамблевое обучение используется при создании более точных и независимых друг от друга классификаторов компонентов.


35) Каковы две парадигмы ансамблевых методов?

Две парадигмы ансамблевых методов:

  • Последовательные ансамблевые методы
  • Методы параллельного ансамбля

36) Каков общий принцип ансамблевого метода и что такое пакетирование и повышение в ансамблевом методе?

Общий принцип ансамблевого метода заключается в объединении прогнозов нескольких моделей, построенных с использованием заданного алгоритма обучения, чтобы повысить надежность одной модели. Бэггинг — это комплексный метод улучшения нестабильных схем оценки или классификации. При этом метод бустинга используется последовательно, чтобы уменьшить погрешность комбинированной модели. И повышение, и объединение могут уменьшить количество ошибок за счет уменьшения дисперсии.


37) Что такое дисперсионное разложение ошибки классификации в ансамблевом методе?

Ожидаемую ошибку алгоритма обучения можно разложить на смещение и дисперсию. Термин смещения измеряет, насколько близко средний классификатор, созданный алгоритмом обучения, соответствует целевой функции. Термин дисперсия измеряет, насколько колеблется прогноз алгоритма обучения для разных обучающих наборов.


38) Что такое алгоритм дополнительного обучения в ансамбле?

Метод постепенного обучения — это способность алгоритма учиться на новых данных, которые могут быть доступны после того, как классификатор уже создан из уже доступного набора данных.


39) Для чего используются PCA, KPCA и ICA?

PCA (анализ главных компонентов), KPCA (анализ главных компонентов на основе ядра) и ICA (анализ независимых компонентов) — важные методы извлечения признаков, используемые для уменьшения размерности.


40) Что такое уменьшение размерности в машинном обучении?

В машинном обучении и статистике уменьшение размерности — это процесс уменьшения количества рассматриваемых случайных величин, который можно разделить на выбор признаков и извлечение признаков.


41) Что такое машины опорных векторов?

Машины опорных векторов обучаются с учителем algorithms используется для классификации и регрессионного анализа.


42) Каковы компоненты методов реляционной оценки?

Важными компонентами методов реляционной оценки являются

  • Сбор данных
  • Получение основной истины
  • Метод перекрестной проверки
  • Тип запроса
  • Оценочная метрика
  • Тест значимости

43) Каковы различные методы последовательного контролируемого обучения?

Различные методы решения задач последовательного контролируемого обучения:

  • Методы скользящего окна
  • Рекуррентное скольжение windows
  • Скрытые модели Маркова
  • Модели Маркова с максимальной энтропией
  • Условные случайные поля
  • Графовые трансформаторные сети

44) В каких областях робототехники и обработки информации возникает проблема последовательного прогнозирования?

Области робототехники и обработки информации, где возникают проблемы последовательного прогнозирования:

  • Имитация обучения
  • Структурированное предсказание
  • Обучение с подкреплением на основе моделей

45) Что такое пакетное статистическое обучение?

Методы статистического обучения позволяют изучить функцию или предиктор на основе набора наблюдаемых данных, которые могут делать прогнозы относительно невидимых или будущих данных. Эти методы обеспечивают гарантии эффективности обученного предсказателя для будущих невидимых данных на основе статистических предположений о процессе генерации данных.


46) Что такое PAC-обучение?

Обучение PAC (вероятно, приблизительно правильное) — это структура обучения, которая была введена для анализа обучения. algorithms и их статистическая эффективность.


47) К каким категориям вы можете отнести последовательность процесса обучения?

  • Прогнозирование последовательности
  • Генерация последовательности
  • Распознавание последовательности
  • Последовательное решение

48) Что такое последовательное обучение?

Последовательное обучение – это логический метод преподавания и обучения.


49) Каковы два метода машинного обучения?

Два метода машинного обучения:

  • Генетическое программирование
  • Индуктивное обучение

50) Назовите популярное приложение машинного обучения, которое вы видите изо дня в день?

Механизм рекомендаций, реализованный на крупных веб-сайтах электронной коммерции, использует машинное обучение.

Эти вопросы для собеседования также помогут вам в устной речи.