50 запитань і відповідей на інтерв’ю з машинного навчання (2024)
Ось питання та відповіді на співбесіді з машинного навчання для нових і досвідчених кандидатів, щоб отримати роботу своєї мрії.
Машинне навчання Viva. Запитання та відповіді для першокурсників
1) Що таке машинне навчання?
Машинне навчання — це галузь інформатики, яка займається системним програмуванням для автоматичного навчання та вдосконалення з досвідом. Наприклад: роботи запрограмовані так, що вони можуть виконувати завдання на основі даних, які вони збирають із датчиків. Він автоматично вивчає програми з даних.
👉 Безкоштовне завантаження PDF: Запитання та відповіді на інтерв’ю з машинного навчання >>
2) Згадайте різницю між інтелектуальним аналізом даних і машинним навчанням?
Машинне навчання пов’язане з вивченням, проектуванням і розробкою алгоритмів, які дають комп’ютерам можливість навчатися без явного програмування. Хоча інтелектуальний аналіз даних можна визначити як процес, у якому неструктуровані дані намагаються отримати знання або невідомі цікаві шаблони. Під час цього процесу машини використовуються алгоритми навчання.
3) Що таке «переобладнання» в машинному навчанні?
In навчання за допомогою машини, коли статистична модель описує випадкову помилку або шум замість основного зв’язку, відбувається «переобладнання». Коли модель надмірно складна, зазвичай спостерігається переобладнання через надто багато параметрів щодо кількості навчальних типів даних. Модель демонструє низьку продуктивність, яка була перепідготовлена.
4) Чому відбувається переобладнання?
Можливість переобладнання існує, оскільки критерії, які використовуються для навчання моделі, не збігаються з критеріями, які використовуються для оцінки ефективності моделі.
5) Як можна уникнути переобладнання?
Використовуючи велику кількість даних, можна уникнути переобладнання, переобладнання відбувається відносно, оскільки у вас є невеликий набір даних, і ви намагаєтеся вчитися з нього. Але якщо у вас невелика база даних, і ви змушені створювати модель на її основі. У такій ситуації можна скористатися технікою, відомою як перехресна перевірка. У цьому методі набір даних розбивається на два розділи: набори даних для тестування та навчання, набір даних для тестування лише перевірятиме модель, тоді як у наборі даних для навчання точки даних створюватимуть модель.
У цій техніці моделі зазвичай надається набір відомих даних, на яких виконується навчання (навчальний набір даних), і набір невідомих даних, на основі яких перевіряється модель. Ідея перехресної перевірки полягає у визначенні набору даних для «перевірки» моделі на етапі навчання.
6) Що таке індуктивне машинне навчання?
Індуктивне машинне навчання передбачає процес навчання на прикладах, коли система з набору спостережуваних випадків намагається індукувати загальне правило.
7) Які п’ять популярних алгоритмів машинного навчання?
- Дерева рішень
- Нейронні мережі (зворотне поширення)
- Імовірнісні мережі
- Найближчий сусід
- Підтримка векторних машин
8) Які існують різні техніки алгоритмів у машинному навчанні?
У машинному навчанні існують різні типи технік
- Навчання під наглядом
- Навчання без нагляду
- Напівконтрольоване навчання
- Навчання зміцненню
- Трансдукція
- Вчимось вчитися
9) Які три етапи побудови гіпотез або моделі в машинному навчанні?
- Будівництво моделі
- Тестування моделі
- Нанесення моделі
10) Який стандартний підхід до контрольованого навчання?
Стандартний підхід до контрольованого навчання полягає в тому, щоб розділити набір прикладів на навчальний набір і тест.
11) Що таке «навчальний набір» і «тестовий набір»?
У різних сферах інформатики, як-от машинне навчання, набір даних використовується для виявлення потенційно прогностичного зв’язку, відомого як «навчальний набір». Навчальний набір – це приклади, які надаються учневі, тоді як тестовий набір використовується для перевірки точності гіпотез, створених учнем, і це набір прикладів, який приховується від учня. Навчальний набір відрізняється від тестового.
12) Перелічіть різні підходи до машинного навчання?
Різні підходи в машинному навчанні є
- Концепція проти класифікаційного навчання
- Символічне проти статистичного навчання
- Індуктивне проти аналітичного навчання
13) Чим не є машинне навчання?
- Штучний Інтелект
- Висновок на основі правил
14) Поясніть, у чому полягає функція «навчання без контролю»?
- Знайдіть кластери даних
- Знайдіть низькорозмірні представлення даних
- Знайдіть цікаві напрямки в даних
- Цікаві координати та співвідношення
- Знайти нові спостереження/очищення бази даних
15) Поясніть, у чому полягає функція «Контрольованого навчання»?
- класифікації
- Розпізнавання мови
- Регресія
- Прогнозувати часові ряди
- Анотуйте рядки
16) Що таке незалежне від алгоритму машинне навчання?
Машинне навчання, де математичні основи не залежать від будь-якого конкретного класифікатора чи алгоритму навчання, називають машинним навчанням, незалежним від алгоритму?
17) Яка різниця між штучним навчанням і машинним?
Проектування та розробка алгоритмів відповідно до поведінки на основі емпіричних даних відомі як машинне навчання. Хоча штучний інтелект, окрім машинного навчання, також охоплює інші аспекти, такі як представлення знань, обробка природної мови, планування, робототехніка тощо.
18) Що таке класифікатор у машинному навчанні?
Класифікатор у машинному навчанні — це система, яка вводить вектор дискретних або безперервних значень ознак і виводить єдине дискретне значення, клас.
19) Які переваги наївного Байєса?
У наивному класифікаторі Байєса сходитимуться швидше, ніж дискримінаційні моделі, такі як логістична регресія, тому вам потрібно менше навчальних даних. Основна перевага полягає в тому, що він не може навчатися взаємодії між функціями.
20) У яких сферах використовується розпізнавання образів?
Розпізнавання образів можна використовувати в
- Комп'ютерне бачення
- Розпізнавання мови
- Видобуток даних
- Статистика
- Неформальний пошук
- Біоінформатика
Запитання для співбесіди з машинного навчання для досвідчених
21) Що таке генетичне програмування?
Генетичне програмування є одним із двох методів, які використовуються в машинному навчанні. Модель базується на тестуванні та виборі найкращого вибору серед набору результатів.
22) Що таке індуктивний Logic Proграматизації в машинному навчанні?
Індуктивний Logic Programming (ILP) — це підполе машинного навчання, яке використовує логічне програмування, що представляє базові знання та приклади.
23) Що таке вибір моделі в машинному навчанні?
Процес вибору моделей серед різних математичних моделей, які використовуються для опису того самого набору даних, відомий як вибір моделі. Вибір моделі застосовується до статистики, машинного навчання та аналізу даних.
24) Які два методи використовуються для калібрування під час контрольованого навчання?
Два методи, які використовуються для прогнозування хороших ймовірностей у навчанні під керівництвом
- Калібрування Платта
- Ізотонічна регресія
Ці методи розроблені для бінарної класифікації, і вона не є тривіальною.
25) Який метод часто використовується для запобігання переобладнанню?
Коли є достатня кількість даних, використовується «Ізотонічна регресія», щоб запобігти проблемі переобладнання.
26) Яка різниця між евристикою для вивчення правил і евристикою для дерев рішень?
Різниця полягає в тому, що евристика для дерев рішень оцінює середню якість ряду незв’язаних наборів, тоді як ті, хто навчається правилам, оцінюють лише якість набору екземплярів, який охоплює правило-кандидат.
27) Що таке перцептрон у машинному навчанні?
У машинному навчанні Perceptron — це контрольований алгоритм навчання для двійкових класифікаторів, де двійковий класифікатор є вирішальною функцією того, чи вхідні дані представляють вектор чи число.
28) Поясніть два компоненти програми байєсівської логіки?
Програма байєсівської логіки складається з двох компонентів. Перший компонент – логічний; він складається з набору байєсівських положень, які фіксують якісну структуру домену. Другий компонент – кількісний, він кодує кількісну інформацію про домен.
29) Що таке байєсовські мережі (BN)?
Мережа Байєса використовується для представлення графічної моделі ймовірнісного зв’язку між набором змінних.
30) Чому алгоритм навчання на основі екземплярів іноді називають алгоритмом ледачого навчання?
Алгоритм навчання на основі екземплярів також називають алгоритмом ледачого навчання, оскільки він затримує процес індукції чи узагальнення, доки не буде виконано класифікацію.
31) Які два методи класифікації може обробляти SVM (Support Vector Machine)?
- Комбінування бінарних класифікаторів
- Зміна двійкового коду для включення багатокласового навчання
32) Що таке ансамблеве навчання?
Щоб розв’язати конкретну обчислювальну програму, стратегічно генеруються та об’єднуються кілька моделей, таких як класифікатори чи експерти. Цей процес відомий як ансамблеве навчання.
33) Чому використовується ансамблеве навчання?
Ансамблеве навчання використовується для покращення класифікації, прогнозування, апроксимації функцій тощо моделі.
34) Коли використовувати ансамблеве навчання?
Ансамблеве навчання використовується, коли ви створюєте класифікатори компонентів, які є більш точними та незалежними один від одного.
35) Які є дві парадигми методів ансамблю?
Двома парадигмами ансамблевих методів є
- Методи послідовного ансамблю
- Методи паралельного ансамблю
36) Який загальний принцип ансамблевого методу та що таке мішок і бустінг у ансамблевому методі?
Загальний принцип методу ансамблю полягає в об’єднанні передбачень кількох моделей, створених за допомогою певного алгоритму навчання, щоб підвищити надійність порівняно з однією моделлю. Бейгінг — це комплексний метод для покращення нестабільних схем оцінювання або класифікації. У той час як метод підвищення використовується послідовно для зменшення зміщення комбінованої моделі. Розширення та пакетування можуть зменшити кількість помилок шляхом зменшення терміну дисперсії.
37) Що таке розклад помилки класифікації на дисперсію в ансамблевому методі?
Очікувана помилка алгоритму навчання може бути розкладена на зміщення та дисперсію. Термін зсуву вимірює, наскільки середній класифікатор, створений алгоритмом навчання, відповідає цільовій функції. Термін дисперсії вимірює, наскільки прогнозування алгоритму навчання коливається для різних навчальних наборів.
38) Що таке алгоритм поступового навчання в ансамблі?
Метод інкрементального навчання — це здатність алгоритму навчатися на нових даних, які можуть бути доступні після того, як класифікатор вже було згенеровано з уже доступного набору даних.
39) Для чого використовуються PCA, KPCA та ICA?
PCA (аналіз основних компонентів), KPCA (аналіз основних компонентів на основі ядра) та ICA (аналіз незалежних компонентів) є важливими методами виділення ознак, які використовуються для зменшення розмірності.
40) Що таке зменшення розмірності в машинному навчанні?
У машинному навчанні та статистиці зменшення розмірності — це процес зменшення кількості випадкових змінних, які розглядаються, і його можна розділити на вибір функцій і вилучення функцій.
41) Що таке опорні векторні машини?
Машини опорних векторів — це контрольовані алгоритми навчання, які використовуються для класифікації та регресійного аналізу.
42) Які компоненти методів реляційної оцінки?
Важливими компонентами методів реляційної оцінки є
- Збір даних
- Виявлення правди на землі
- Техніка перехресної перевірки
- Тип запиту
- Метрика оцінки
- Тест на значимість
43) Які існують методи послідовного навчання під контролем?
Різні методи вирішення проблем послідовного навчання під наглядом:
- Розсувно-віконні методи
- Повторювані розсувні вікна
- Приховані моделі Маркова
- Моделі Маркова з максимальною ентропією
- Умовні випадкові поля
- Побудуйте графік трансформаторних мереж
44) У яких областях робототехніки та обробки інформації виникає проблема послідовного прогнозування?
Області робототехніки та обробки інформації, де виникає проблема послідовного прогнозування
- Імітаційне навчання
- Структуроване передбачення
- Навчання з підкріпленням на основі моделі
45) Що таке пакетне статистичне навчання?
Методи статистичного навчання дозволяють вивчати функцію або предиктор із набору спостережених даних, які можуть робити прогнози щодо невидимих або майбутніх даних. Ці методи забезпечують гарантії ефективності навченого предиктора щодо майбутніх невидимих даних на основі статистичних припущень щодо процесу генерації даних.
46) Що таке PAC Learning?
Навчання PAC (імовірно приблизно правильне) — це структура навчання, яка була запроваджена для аналізу алгоритмів навчання та їх статистичної ефективності.
47) За якими категоріями можна класифікувати процес навчання послідовності?
- Прогнозування послідовності
- Генерація послідовності
- Розпізнавання послідовності
- Послідовне рішення
48) Що таке послідовне навчання?
Послідовне навчання – це метод викладання та навчання в логічній манері.
49) Які дві методики машинного навчання?
Дві техніки машинного навчання є
- Генетичне програмування
- Індуктивне навчання
50) Укажіть популярну програму машинного навчання, яку ви бачите щодня?
Система рекомендацій, запроваджена великими веб-сайтами електронної комерції, використовує машинне навчання.
Ці запитання для співбесіди також допоможуть вам у життєдіяльності (усному)