50 de întrebări și răspunsuri la interviu de învățare automată (2025)

Iată întrebările și răspunsurile la interviu de învățare automată pentru candidații mai proaspeți, precum și cu experiență, pentru a obține locul de muncă visat.

 

Machine Learning Viva Întrebări și răspunsuri pentru cei care sunt în stare de proaspăt

1) Ce este învățarea automată?

Învățarea automată este o ramură a informaticii care se ocupă de programarea sistemelor pentru a învăța și a îmbunătăți automat experiența. De exemplu: roboții sunt programați astfel încât să poată îndeplini sarcina pe baza datelor pe care le adună de la senzori. Învață automat programele din date.

👉 Descărcare PDF gratuită: Întrebări și răspunsuri la interviu de învățare automată >>


2) Menționați diferența dintre Data Mining și Machine Learning?

Învățarea automată se referă la studiul, proiectarea și dezvoltarea algoritmilor care oferă computerelor capacitatea de a învăța fără a fi programate în mod explicit. În timp ce, data mining poate fi definit ca procesul în care datele nestructurate încearcă să extragă cunoștințe sau modele interesante necunoscute. În timpul acestei mașini de proces, sunt utilizați algoritmi de învățare.


3) Ce este „Suprafitting” în învățarea automată?

In masina de învățare, atunci când un model statistic descrie o eroare aleatoare sau un zgomot în loc de relația de bază, apare „suprafitting”. Atunci când un model este excesiv de complex, se observă în mod normal supraadaptarea, deoarece are prea mulți parametri în ceea ce privește numărul de tipuri de date de antrenament. Modelul prezintă performanțe slabe, care a fost supraadaptat.


4) De ce se întâmplă supraajustarea?

Posibilitatea de supraadaptare există deoarece criteriile utilizate pentru antrenamentul modelului nu sunt aceleași cu criteriile utilizate pentru a judeca eficacitatea unui model.


5) Cum poți evita supraadaptarea?

Folosind o mulțime de date, supraadaptarea poate fi evitată, supraadaptarea are loc relativ deoarece aveți un set de date mic și încercați să învățați din el. Dar dacă ai o bază de date mică și ești obligat să vii cu un model bazat pe asta. Într-o astfel de situație, puteți utiliza o tehnică cunoscută ca validare încrucișată. În această metodă, setul de date se împarte în două secțiuni, seturi de date de testare și antrenament, setul de date de testare va testa doar modelul, în timp ce, în setul de date de antrenament, punctele de date vor veni cu modelul.

În această tehnică, unui model i se oferă de obicei un set de date cu date cunoscute pe care se desfășoară antrenamentul (setul de date de antrenament) și un set de date cu date necunoscute față de care este testat modelul. Ideea validării încrucișate este de a defini un set de date pentru a „testa” modelul în faza de instruire.


6) Ce este învățarea automată inductivă?

Învățarea automată inductivă implică procesul de învățare prin exemple, în care un sistem, dintr-un set de instanțe observate, încearcă să inducă o regulă generală.


7) Care sunt cei cinci algoritmi populari de învățare automată?

  • Arbori de decizie
  • Rețele neuronale (propagare înapoi)
  • Rețele probabilistice
  • Cel mai apropiat vecin
  • Suporta mașini vectoriale

8) Care sunt diferitele tehnici de algoritm în Machine Learning?

Diferitele tipuri de tehnici din Machine Learning sunt


9) Care sunt cele trei etape pentru a construi ipotezele sau modelul în învățarea automată?

  • Construirea modelului
  • Testarea modelului
  • Aplicarea modelului

10) Care este abordarea standard a învățării supravegheate?

Abordarea standard a învățării supravegheate este împărțirea setului de exemple în setul de instruire și test.


11) Ce este „Setul de antrenament” și „Setul de testare”?

În diferite domenii ale științei informației, cum ar fi învățarea automată, un set de date este utilizat pentru a descoperi relația potențial predictivă cunoscută sub numele de „Setul de antrenament”. Setul de antrenament este un exemplu dat cursantului, în timp ce Setul de testare este folosit pentru a testa acuratețea ipotezelor generate de cursant și este un set de exemple reținut de cursant. Setul de antrenament este diferit de Setul de testare.


12) Listați diferite abordări pentru învățarea automată?

Diferitele abordări în Machine Learning sunt

  • Învățare Concept vs Clasificare
  • Învățare simbolică vs statistică
  • Învățare inductivă vs analitică

13) Ce nu este Machine Learning?


14) Explicați care este funcția „Învățare nesupravegheată”?

  • Găsiți grupuri de date
  • Găsiți reprezentări cu dimensiuni reduse ale datelor
  • Găsiți direcții interesante în date
  • Coordonate și corelații interesante
  • Găsiți observații noi / curățarea bazei de date

15) Explicați care este funcția „Învățare supravegheată”?

  • Clasificări
  • Recunoaștere a vorbirii
  • Regres
  • Prezice serii de timp
  • Adnotă șiruri

16) Ce este învățarea automată independentă de algoritm?

Învățarea automată în cazul în care bazele matematice sunt independente de un anumit clasificator sau un algoritm de învățare este denumit învățare automată independentă de algoritm?


17) Care este diferența dintre învățarea artificială și învățarea automată?

Proiectarea și dezvoltarea algoritmilor conform comportamentelor bazate pe date empirice sunt cunoscute sub denumirea de Machine Learning. În timp ce inteligența artificială, pe lângă învățarea automată, acoperă și alte aspecte precum reprezentarea cunoștințelor, procesarea limbajului natural, planificarea, robotica etc.


18) Ce este clasificatorul în învățarea automată?

Un clasificator într-un Machine Learning este un sistem care introduce un vector de valori discrete sau continue și scoate o singură valoare discretă, clasa.


19) Care sunt avantajele Naive Bayes?

În Naïve Bayes, clasificatorul va converge mai repede decât modelele discriminatorii precum regresia logistică, așa că aveți nevoie de mai puține date de antrenament. Principalul avantaj este că nu poate învăța interacțiunile dintre caracteristici.


20) În ce domenii este utilizată Pattern Recognition?

Recunoașterea modelelor poate fi utilizată în

  • Computer Vision
  • Recunoaștere a vorbirii
  • Data Mining
  • Statistici
  • Recuperare informală
  • Bioinformatica

Întrebări de interviu de învățare automată pentru experimentați

21) Ce este programarea genetică?

Programarea genetică este una dintre cele două tehnici utilizate în învățarea automată. Modelul se bazează pe testarea și selectarea celei mai bune alegeri dintr-un set de rezultate.


22) Ce este inductiv Logic Programatica în Machine Learning?

Inductiv Logic Programatica (ILP) este un subdomeniu al învățării automate care folosește programarea logică reprezentând cunoștințe de bază și exemple.


23) Ce este Selecția modelului în Machine Learning?

Procesul de selectare a modelelor dintre diferitele modele matematice, care sunt utilizate pentru a descrie același set de date, este cunoscut sub numele de Selecția modelului. Selecția modelului se aplică în domeniile statisticii, învățării automate și extragerea datelor.


24) Care sunt cele două metode utilizate pentru calibrarea în Învățare Supervizată?

Cele două metode utilizate pentru prezicerea probabilităților bune în Învățarea Supervizată sunt

  • Calibrare Platt
  • Regresia izotonică

Aceste metode sunt concepute pentru clasificarea binară și nu este trivială.


25) Ce metodă este folosită frecvent pentru a preveni supraadaptarea?

Când există date suficiente, „Regresia izotonică” este utilizată pentru a preveni o problemă de supraadaptare.


26) Care este diferența dintre euristica pentru învățarea regulilor și euristica pentru arbori de decizie?

Diferența este că euristica pentru arborii de decizie evaluează calitatea medie a unui număr de seturi disjunse, în timp ce cei care învață reguli evaluează doar calitatea setului de instanțe care este acoperit de regula candidată.


27) Ce este Perceptron în Machine Learning?

În Machine Learning, Perceptron este un algoritm de învățare supravegheat pentru clasificatoare binari, în care un clasificator binar este o funcție decisivă dacă o intrare reprezintă un vector sau un număr.


28) Explicați cele două componente ale programului logic bayesian?

Programul logic bayesian este format din două componente. Prima componentă este una logică; constă dintr-un set de clauze bayesiene, care surprinde structura calitativă a domeniului. A doua componentă este una cantitativă, codifică informațiile cantitative despre domeniu.


29) Ce sunt rețelele bayesiene (BN)?

Rețeaua Bayesiană este utilizată pentru a reprezenta modelul grafic pentru relația de probabilitate între un set de variabile.


30) De ce un algoritm de învățare bazat pe instanțe denumit uneori algoritm de învățare leneș?

Algoritmul de învățare bazat pe instanțe este, de asemenea, denumit algoritm de învățare leneș, deoarece întârzie procesul de inducție sau generalizare până când se realizează clasificarea.


31) Care sunt cele două metode de clasificare pe care SVM (Support Vector Machine) le poate gestiona?

  • Combinarea clasificatoarelor binari
  • Modificarea binarului pentru a încorpora învățarea multiclasă

32) Ce este învăţarea în ansamblu?

Pentru a rezolva un anumit program de calcul, mai multe modele, cum ar fi clasificatorii sau experții, sunt generate și combinate strategic. Acest proces este cunoscut sub denumirea de învățare în ansamblu.


33) De ce se folosește învățarea în ansamblu?

Învățarea ansamblului este utilizată pentru a îmbunătăți clasificarea, predicția, aproximarea funcției etc. a unui model.


34) Când să folosiți învățarea prin ansamblu?

Învățarea ansamblului este utilizată atunci când construiți clasificatoare de componente care sunt mai precise și independente unele de altele.


35) Care sunt cele două paradigme ale metodelor de ansamblu?

Cele două paradigme ale metodelor de ansamblu sunt

  • Metode de ansamblu secvenţial
  • Metode de ansamblu paralel

36) Care este principiul general al unei metode de ansamblu și ce este bagajul și amplificarea în metoda ansamblului?

Principiul general al unei metode de ansamblu este de a combina predicțiile mai multor modele construite cu un anumit algoritm de învățare pentru a îmbunătăți robustețea unui singur model. Bagajul este o metodă în ansamblu pentru îmbunătățirea schemelor de estimare sau clasificare instabile. În timp ce metodele de stimulare sunt utilizate secvenţial pentru a reduce părtinirea modelului combinat. Boosting și Bagging pot reduce erorile prin reducerea termenului de varianță.


37) Ce este descompunerea bias-variance a erorii de clasificare în metoda ansamblului?

Eroarea așteptată a unui algoritm de învățare poate fi descompusă în părtinire și varianță. Un termen de părtinire măsoară cât de aproape se potrivește clasificatorul mediu produs de algoritmul de învățare cu funcția țintă. Termenul de varianță măsoară cât de mult fluctuează predicția algoritmului de învățare pentru diferite seturi de antrenament.


38) Ce este un algoritm de învățare incrementală în ansamblu?

Metoda de învățare incrementală este capacitatea unui algoritm de a învăța din date noi care pot fi disponibile după ce clasificatorul a fost deja generat din setul de date deja disponibil.


39) Pentru ce se utilizează PCA, KPCA și ICA?

PCA (Analiza componentelor principale), KPCA (Analiza componentelor principale bazate pe kernel) și ICA (Analiza componentelor independente) sunt tehnici importante de extracție a caracteristicilor utilizate pentru reducerea dimensionalității.


40) Ce este reducerea dimensiunii în Machine Learning?

În Machine Learning și statistică, reducerea dimensiunilor este procesul de reducere a numărului de variabile aleatoare luate în considerare și poate fi împărțită în selecția caracteristicilor și extragerea caracteristicilor.


41) Ce sunt mașinile vectoriale suport?

Mașinile de suport vector sunt algoritmi de învățare supravegheați utilizați pentru clasificare și analiza de regresie.


42) Care sunt componentele tehnicilor de evaluare relațională?

Componentele importante ale tehnicilor de evaluare relaţională sunt

  • Achizitii de date
  • Dobândirea adevărului de bază
  • Tehnica de validare încrucișată
  • Tip de interogare
  • Valoarea punctajului
  • Test de semnificație

43) Care sunt diferitele metode pentru Învățarea Supervizată Secvențială?

Diferitele metode de rezolvare a problemelor de Învățare Supervizată Secvențială sunt

  • Metode cu ferestre glisante
  • Geamuri glisante recurente
  • Modele Markow ascunse
  • Modele Markow de entropie maximă
  • Câmpuri aleatoare condiționate
  • Rețele de transformatoare grafice

44) Care sunt domeniile în robotică și procesarea informațiilor în care apare problema de predicție secvențială?

Domeniile în robotică și procesarea informațiilor în care apare problema de predicție secvențială sunt

  • Învățare prin imitație
  • Predicție structurată
  • Învățare prin întărire bazată pe modele

45) Ce este învățarea statistică pe lot?

Tehnicile de învățare statistică permit învățarea unei funcții sau a unui predictor dintr-un set de date observate care pot face predicții despre date nevăzute sau viitoare. Aceste tehnici oferă garanții asupra performanței predictorului învățat asupra datelor viitoare nevăzute, bazate pe o ipoteză statistică asupra procesului de generare a datelor.


46) Ce este PAC Learning?

Învățarea PAC (Probably Approximately Correct) este un cadru de învățare care a fost introdus pentru a analiza algoritmii de învățare și eficiența lor statistică.


47) Care sunt diferitele categorii pe care le puteți clasifica în procesul de învățare în secvență?

  • Predicția secvenței
  • Generarea secvenței
  • Recunoașterea secvenței
  • Decizie secvenţială

48) Ce este învățarea secvențelor?

Învățarea secvență este o metodă de predare și învățare într-o manieră logică.


49) Care sunt două tehnici de învățare automată?

Cele două tehnici de învățare automată sunt

  • Programare genetică
  • Învățare inductivă

50) Oferiți o aplicație populară a învățării automate pe care o vedeți de zi cu zi?

Motorul de recomandare implementat de principalele site-uri de comerț electronic folosește Machine Learning.

Aceste întrebări de interviu vă vor ajuta, de asemenea, în viva (orale)