50 pytań i odpowiedzi do wywiadu dotyczącego uczenia maszynowego (2025)
Oto pytania i odpowiedzi dotyczące rozmów kwalifikacyjnych w zakresie uczenia maszynowego, przeznaczone zarówno dla nowszych, jak i doświadczonych kandydatów, którzy chcą zdobyć wymarzoną pracę.
Pytania i odpowiedzi dotyczące uczenia maszynowego Viva dla nowicjuszy
1) Co to jest uczenie maszynowe?
Uczenie maszynowe to dziedzina informatyki zajmująca się programowaniem systemów w celu automatycznego uczenia się i doskonalenia wraz z doświadczeniem. Na przykład: Roboty są programowane tak, aby mogły wykonywać zadania w oparciu o dane zebrane z czujników. Automatycznie uczy się programów na podstawie danych.
2) Wspomnij różnicę między eksploracją danych a uczeniem maszynowym?
Uczenie maszynowe wiąże się z badaniem, projektowaniem i rozwojem algorytmów, które dają komputerom możliwość uczenia się bez wyraźnego programowania. Natomiast eksplorację danych można zdefiniować jako proces, w którym niestrukturyzowane dane próbują wydobyć wiedzę lub nieznane interesujące wzorce. Podczas tego procesu używane są algorytmy uczenia maszynowego.
3) Czym jest „nadmierne dopasowanie” w uczeniu maszynowym?
In uczenie maszynowe, gdy model statystyczny opisuje losowy błąd lub szum zamiast leżącej u jego podstaw relacji, występuje „nadmierne dopasowanie”. Gdy model jest nadmiernie złożony, zwykle obserwuje się nadmierne dopasowanie, ponieważ ma zbyt wiele parametrów w stosunku do liczby typów danych treningowych. Model wykazuje słabą wydajność, która została przećwiczona.
4) Dlaczego dochodzi do nadmiernego dopasowania?
Istnieje możliwość nadmiernego dopasowania, ponieważ kryteria stosowane do uczenia modelu nie są takie same, jak kryteria stosowane do oceny skuteczności modelu.
5) Jak uniknąć nadmiernego dopasowania?
Używając dużej ilości danych, można uniknąć nadmiernego dopasowania, które ma miejsce stosunkowo wtedy, gdy masz mały zbiór danych i próbujesz się na nim uczyć. Ale jeśli masz małą bazę danych i jesteś zmuszony zastosować model oparty na niej. W takiej sytuacji można zastosować technikę tzw walidacja krzyżowa. W tej metodzie zbiór danych dzieli się na dwie sekcje, zbiory testowe i szkoleniowe, przy czym zbiór testowy będzie testował tylko model, podczas gdy w zbiorze danych szkoleniowych punkty danych utworzą model.
W tej technice model otrzymuje zwykle zbiór znanych danych, na którym przeprowadzane jest szkolenie (zestaw danych uczących), oraz zbiór nieznanych danych, względem którego testowany jest model. Ideą walidacji krzyżowej jest zdefiniowanie zbioru danych w celu „przetestowania” modelu w fazie uczenia.
6) Czym jest indukcyjne uczenie maszynowe?
Indukcyjne uczenie maszynowe polega na procesie uczenia się na przykładach, podczas którego system na podstawie zbioru zaobserwowanych przypadków próbuje wyprowadzić ogólną regułę.
7) Jakie są pięć popularnych algorytmów uczenia maszynowego?
- Drzewa decyzyjne
- Sieci neuronowe (propagacja wsteczna)
- Sieci probabilistyczne
- Najbliższy sąsiad
- Obsługa maszyn wektorowych
8) Jakie są różne techniki algorytmiczne w uczeniu maszynowym?
Różne typy technik uczenia maszynowego to:
- Nadzorowana nauka
- Uczenie się bez nadzoru
- Nauka częściowo nadzorowana
- Uczenie się ze wzmocnieniem
- Transdukcja
- Nauka uczenia się
9) Jakie są trzy etapy budowania hipotez lub modelu w uczeniu maszynowym?
- Budowa modelu
- Testowanie modelu
- Zastosowanie modelu
10) Jakie jest standardowe podejście do uczenia się pod nadzorem?
Standardowe podejście do uczenia się nadzorowanego polega na podziale zestawu przykładów na zbiór uczący i test.
11) Co to jest „zestaw uczący” i „zbiór testowy”?
W różnych obszarach informatyki, takich jak uczenie maszynowe, zestaw danych jest wykorzystywany do odkrywania potencjalnie predykcyjnej relacji znanej jako „zestaw szkoleniowy”. Zbiór uczący to przykłady podawane uczniowi, natomiast zbiór testowy służy do sprawdzania trafności hipotez generowanych przez ucznia i jest to zbiór przykładów powstrzymywanych przed uczniem. Zbiór treningowy różni się od zbioru testowego.
12) Wymień różne podejścia do uczenia maszynowego?
Różne podejścia do uczenia maszynowego to:
- Koncepcja a nauka klasyfikacji
- Uczenie się symboliczne a statystyczne
- Uczenie się indukcyjne a analityczne
13) Czym nie jest uczenie maszynowe?
- Artificial Intelligence
- Wnioskowanie oparte na regułach
14) Wyjaśnij, jaka jest funkcja „uczenia się bez nadzoru”?
- Znajdź klastry danych
- Znajdź niskowymiarowe reprezentacje danych
- Znajdź interesujące wskazówki w danych
- Ciekawe współrzędne i korelacje
- Znajdź nowe obserwacje/czyszczenie bazy danych
15) Wyjaśnij, jaka jest funkcja „uczenia się pod nadzorem”?
- Klasyfikacje
- Rozpoznawanie mowy
- Regresja
- Przewiduj szeregi czasowe
- Adnotuj ciągi znaków
16) Co to jest uczenie maszynowe niezależne od algorytmu?
Uczenie maszynowe, w którym podstawy matematyczne są niezależne od jakiegokolwiek konkretnego klasyfikatora lub algorytmu uczenia, nazywa się uczeniem maszynowym niezależnym od algorytmu?
17) Jaka jest różnica pomiędzy sztucznym uczeniem się a uczeniem maszynowym?
Projektowanie i rozwijanie algorytmów zgodnie z zachowaniami opartymi na danych empirycznych jest znane jako uczenie maszynowe. Podczas gdy AI oprócz uczenia maszynowego obejmuje również inne aspekty, takie jak reprezentacja wiedzy, przetwarzanie języka naturalnego, planowanie, robotyka itp.
18) Czym jest klasyfikator w uczeniu maszynowym?
Klasyfikator w uczeniu maszynowym to system, który wprowadza wektor dyskretnych lub ciągłych wartości cech i wyprowadza pojedynczą wartość dyskretną, czyli klasę.
19) Jakie są zalety Naive Bayes?
W naiwnym klasyfikatorze Bayesa zbiega się szybciej niż modele dyskryminacyjne, takie jak regresja logistyczna, więc potrzebujesz mniej danych szkoleniowych. Główną zaletą jest to, że nie może uczyć się interakcji między funkcjami.
20) W jakich obszarach stosuje się rozpoznawanie wzorców?
Rozpoznawanie wzorców można zastosować w
- Wizja komputerowa
- Rozpoznawanie mowy
- Data Mining
- Statystyki
- Nieformalne pobieranie
- Bioinformatyka
Pytania do wywiadu dotyczące uczenia maszynowego dla doświadczonych
21) Czym jest programowanie genetyczne?
Programowanie genetyczne to jedna z dwóch technik stosowanych w uczeniu maszynowym. Model opiera się na testowaniu i wyborze najlepszego wyboru spośród zbioru wyników.
22) Co to jest indukcyjność Logic Programatyka w uczeniu maszynowym?
Indukcyjny Logic Programowanie (ILP) to poddziedzina uczenia maszynowego, która wykorzystuje programowanie logiczne reprezentujące wiedzę podstawową i przykłady.
23) Czym jest wybór modelu w uczeniu maszynowym?
Proces wybierania modeli spośród różnych modeli matematycznych, które są używane do opisu tego samego zestawu danych, nazywany jest wyborem modelu. Wybór modelu ma zastosowanie w dziedzinach statystyki, uczenia maszynowego i eksploracji danych.
24) Jakie są dwie metody stosowane do kalibracji w uczeniu nadzorowanym?
Dwie metody stosowane do przewidywania dobrego prawdopodobieństwa w uczeniu nadzorowanym to:
- Kalibracja Platta
- Regresja izotoniczna
Metody te są przeznaczone do klasyfikacji binarnej i nie jest to trywialne.
25) Która metoda jest często stosowana w celu zapobiegania nadmiernemu dopasowaniu?
Gdy jest wystarczająca ilość danych, stosuje się „regresję izotoniczną”, aby zapobiec problemowi z nadmiernym dopasowaniem.
26) Jaka jest różnica pomiędzy heurystyką uczenia się reguł a heurystyką drzew decyzyjnych?
Różnica polega na tym, że heurystyki dla drzew decyzyjnych oceniają średnią jakość pewnej liczby rozłącznych zbiorów, podczas gdy osoby uczące się reguł oceniają jedynie jakość zbioru instancji objętych regułą kandydującą.
27) Czym jest perceptron w uczeniu maszynowym?
W uczeniu maszynowym perceptron jest algorytmem uczenia nadzorowanego dla klasyfikatorów binarnych, w którym klasyfikator binarny jest funkcją decydującą o tym, czy dane wejściowe reprezentują wektor czy liczbę.
28) Wyjaśnij dwa składniki programu logiki bayesowskiej?
Program logiki bayesowskiej składa się z dwóch komponentów. Pierwszy komponent jest logiczny; składa się z zestawu klauzul bayesowskich, które odzwierciedlają jakościową strukturę domeny. Drugi komponent jest ilościowy, koduje ilościowe informacje o domenie.
29) Co to są sieci Bayesa (BN)?
Sieć Bayesa służy do przedstawienia graficznego modelu zależności prawdopodobieństwa między zbiorem zmiennych.
30) Dlaczego algorytm uczenia się oparty na instancjach jest czasami nazywany algorytmem uczenia się leniwego?
Algorytm uczenia się oparty na instancjach jest również nazywany algorytmem leniwego uczenia się, ponieważ opóźnia proces indukcji lub uogólniania do czasu przeprowadzenia klasyfikacji.
31) Jakie są dwie metody klasyfikacji, które obsługuje SVM (maszyna wektorów nośnych)?
- Łączenie klasyfikatorów binarnych
- Modyfikowanie plików binarnych w celu uwzględnienia uczenia się wieloklasowego
32) Czym jest uczenie się zespołowe?
Aby rozwiązać konkretny program obliczeniowy, strategicznie generuje się i łączy wiele modeli, takich jak klasyfikatory lub eksperci. Proces ten nazywany jest uczeniem się zespołowym.
33) Dlaczego stosuje się uczenie zespołowe?
Uczenie zespołowe służy do poprawy klasyfikacji, przewidywania, przybliżania funkcji itp. modelu.
34) Kiedy stosować naukę zespołową?
Uczenie zespołowe jest wykorzystywane podczas tworzenia klasyfikatorów komponentów, które są dokładniejsze i niezależne od siebie.
35) Jakie są dwa paradygmaty metod zespołowych?
Istnieją dwa paradygmaty metod zespołowych
- Metody zespołowe sekwencyjne
- Metody zespołowe równoległe
36) Jaka jest ogólna zasada metody zespołowej i na czym polega pakowanie i wzmacnianie w metodzie zespołowej?
Ogólna zasada metody zespołowej polega na łączeniu przewidywań kilku modeli zbudowanych za pomocą danego algorytmu uczenia się w celu poprawy odporności na pojedynczy model. Bagażowanie to kompleksowa metoda ulepszania niestabilnych schematów estymacji lub klasyfikacji. Podczas gdy metody wzmacniania są stosowane sekwencyjnie, aby zmniejszyć obciążenie połączonego modelu. Zarówno wzmacnianie, jak i pakowanie mogą zmniejszyć błędy poprzez zmniejszenie składnika wariancji.
37) Na czym polega rozkład odchylenia wariancyjnego błędu klasyfikacji w metodzie zespołowej?
Oczekiwany błąd algorytmu uczenia się można rozłożyć na błąd i wariancję. Termin odchylenia mierzy, jak bardzo średni klasyfikator utworzony przez algorytm uczenia się pasuje do funkcji celu. Termin wariancji mierzy, jak bardzo przewidywania algorytmu uczenia się wahają się dla różnych zbiorów uczących.
38) Co to jest algorytm uczenia przyrostowego w zespole?
Metoda uczenia przyrostowego to zdolność algorytmu do uczenia się na podstawie nowych danych, które mogą być dostępne po wygenerowaniu klasyfikatora na podstawie już dostępnego zbioru danych.
39) Do czego służą PCA, KPCA i ICA?
PCA (analiza głównych składowych), KPCA (analiza głównych składowych oparta na jądrze) i ICA (analiza niezależnych składowych) to ważne techniki ekstrakcji cech stosowane w celu redukcji wymiarowości.
40) Na czym polega redukcja wymiarów w uczeniu maszynowym?
W uczeniu maszynowym i statystyce redukcja wymiarów to proces zmniejszania liczby branych pod uwagę zmiennych losowych i można go podzielić na selekcję cech i ekstrakcję cech.
41) Czym są maszyny wektorów nośnych?
Maszyny wektorów nośnych to algorytmy uczenia nadzorowanego stosowane w analizie klasyfikacji i regresji.
42) Jakie są elementy technik ewaluacji relacyjnej?
Ważnymi elementami technik oceny relacyjnej są:
- Gromadzenie danych
- Pozyskiwanie prawdy naziemnej
- Technika weryfikacji krzyżowej
- Rodzaj zapytania
- Metryka punktacji
- Test istotności
43) Jakie są różne metody sekwencyjnego uczenia się pod nadzorem?
Istnieją różne metody rozwiązywania problemów sekwencyjnego uczenia się nadzorowanego
- Metody okna przesuwnego
- Powtarzające się okna przesuwne
- Ukryte modele Markowa
- Modele Markowa z maksymalną entropią
- Warunkowe pola losowe
- Wykresy sieci transformatorowych
44) W jakich obszarach robotyki i przetwarzania informacji pojawia się problem przewidywania sekwencyjnego?
Obszary robotyki i przetwarzania informacji, w których pojawia się problem przewidywania sekwencyjnego, to:
- Nauka naśladowania
- Ustrukturyzowana prognoza
- Uczenie się przez wzmacnianie w oparciu o model
45) Co to jest wsadowe uczenie się statystyczne?
Statystyczne techniki uczenia się umożliwiają uczenie się funkcji lub predyktorów na podstawie zestawu obserwowanych danych, które mogą przewidywać dane niewidoczne lub przyszłe. Techniki te zapewniają gwarancje działania wyuczonego predyktora na przyszłych, niewidocznych danych w oparciu o założenia statystyczne dotyczące procesu generowania danych.
46) Czym jest nauka PAC?
Uczenie PAC (Probably approx correct) to metoda uczenia się, która została wprowadzona w celu analizy algorytmów uczenia się i ich statystycznej efektywności.
47) Jakie są różne kategorie, do których można zaklasyfikować proces uczenia się sekwencyjnego?
- Przewidywanie sekwencji
- Generacja sekwencji
- Rozpoznawanie sekwencji
- Decyzja sekwencyjna
48) Co to jest uczenie się sekwencyjne?
Uczenie się sekwencyjne to metoda nauczania i uczenia się w logiczny sposób.
49) Jakie są dwie techniki uczenia maszynowego?
Dwie techniki uczenia maszynowego to:
- Programowanie genetyczne
- Uczenie się indukcyjne
50) Podaj popularne zastosowanie uczenia maszynowego, z którym spotykasz się na co dzień?
Silnik rekomendacji wdrażany przez największe serwisy e-commerce wykorzystuje Machine Learning.
Te pytania podczas rozmowy kwalifikacyjnej pomogą również w Twoim życiu (ustach)