50 Pertanyaan dan Jawaban Wawancara Machine Learning (2025)

Berikut adalah pertanyaan dan jawaban wawancara Machine Learning untuk kandidat baru dan berpengalaman untuk mendapatkan pekerjaan impian mereka.

Pertanyaan dan Jawaban Viva Machine Learning untuk Mahasiswa Baru

1) Apa itu pembelajaran Mesin?

Pembelajaran mesin adalah cabang ilmu komputer yang berhubungan dengan pemrograman sistem agar dapat dipelajari dan ditingkatkan secara otomatis seiring dengan pengalaman. Misalnya: Robot diprogram sehingga mereka dapat melakukan tugas berdasarkan data yang dikumpulkan dari sensor. Secara otomatis mempelajari program dari data.

Unduhan PDF Gratis: Pertanyaan & Jawaban Wawancara Machine Learning >>

2) Sebutkan perbedaan antara Data Mining dan Machine learning?

Pembelajaran mesin berkaitan dengan studi, desain, dan pengembangan algoritma yang memberi komputer kemampuan untuk belajar tanpa diprogram secara eksplisit. Sementara itu, penambangan data dapat didefinisikan sebagai proses di mana data tak terstruktur mencoba mengekstraksi pengetahuan atau pola menarik yang tidak diketahui. Selama proses ini, algoritma pembelajaran mesin digunakan.

3) Apa yang dimaksud dengan 'Overfitting' dalam Machine learning?

In Mesin belajar, ketika model statistik menggambarkan kesalahan acak atau gangguan alih-alih hubungan yang mendasarinya, 'overfitting' terjadi. Ketika suatu model terlalu rumit, overfitting biasanya diamati, karena memiliki terlalu banyak parameter sehubungan dengan jumlah tipe data pelatihan. Model tersebut menunjukkan kinerja yang buruk yang telah mengalami overfitting.

4) Mengapa terjadi overfitting?

Kemungkinan terjadinya overfitting terjadi karena kriteria yang digunakan untuk melatih model tidak sama dengan kriteria yang digunakan untuk menilai kemanjuran suatu model.

5) Bagaimana cara menghindari overfitting?

Dengan menggunakan banyak data, overfitting dapat dihindari, overfitting terjadi secara relatif karena Anda memiliki kumpulan data yang kecil, dan Anda mencoba mempelajarinya. Tetapi jika Anda memiliki database kecil dan Anda terpaksa membuat model berdasarkan itu. Dalam situasi seperti ini, Anda dapat menggunakan teknik yang disebut validasi silang. Dalam metode ini dataset dibagi menjadi dua bagian, dataset pengujian dan pelatihan, dataset pengujian hanya akan menguji model sedangkan pada dataset pelatihan, titik data akan muncul dengan model.

Dalam teknik ini, suatu model biasanya diberikan kumpulan data dari data yang diketahui yang digunakan untuk menjalankan pelatihan (kumpulan data pelatihan) dan kumpulan data yang tidak diketahui yang menjadi dasar pengujian model tersebut. Ide validasi silang adalah untuk menentukan kumpulan data untuk “menguji” model dalam fase pelatihan.

6) Apa itu pembelajaran mesin induktif?

Pembelajaran mesin induktif melibatkan proses pembelajaran dengan contoh, di mana suatu sistem, dari serangkaian contoh yang diamati mencoba menghasilkan aturan umum.

7) Apa saja lima algoritma Pembelajaran Mesin yang populer?

Pohon Keputusan
Jaringan Syaraf Tiruan (propagasi balik)
Jaringan probabilistik
Tetangga terdekat
Mendukung mesin vektor

8) Apa sajakah teknik Algoritma dalam Pembelajaran Mesin?

Berbagai jenis teknik dalam Machine Learning adalah

Pembelajaran yang Diawasi
Pembelajaran Tanpa Pengawasan
Pembelajaran semi-diawasi
Pembelajaran Penguatan
Transduksi
Belajar untuk Belajar

9) Apa saja tiga tahap untuk membangun hipotesis atau model dalam pembelajaran mesin?

Bangunan model
pengujian model
Menerapkan model

10) Apa pendekatan standar untuk pembelajaran yang diawasi?

Pendekatan standar untuk pembelajaran yang diawasi adalah dengan membagi rangkaian contoh menjadi rangkaian pelatihan dan ujian.

11) Apa itu 'Set pelatihan' dan 'Set tes'?

Di berbagai bidang ilmu informasi seperti pembelajaran mesin, sekumpulan data digunakan untuk menemukan hubungan yang berpotensi bersifat prediktif yang dikenal sebagai 'Kumpulan Pelatihan'. Set pelatihan adalah contoh yang diberikan kepada pelajar, sedangkan set Tes digunakan untuk menguji keakuratan hipotesis yang dihasilkan oleh pelajar, dan merupakan kumpulan contoh yang ditahan dari pelajar. Set pelatihan berbeda dari set Tes.

12) Sebutkan berbagai pendekatan untuk pembelajaran mesin?

Pendekatan berbeda dalam Pembelajaran Mesin adalah

Pembelajaran Konsep Vs Klasifikasi
Pembelajaran Simbolik Vs Statistik
Pembelajaran Induktif Vs Analitik

13) Apa yang bukan Pembelajaran Mesin?

Kecerdasan Buatan
Inferensi berdasarkan aturan

14) Jelaskan apa fungsi 'Pembelajaran Tanpa Pengawasan'?

Temukan cluster data
Temukan representasi data berdimensi rendah
Temukan arah menarik dalam data
Koordinat dan korelasi yang menarik
Temukan pengamatan baru/pembersihan basis data

15) Jelaskan apa fungsi 'Supervised Learning'?

klasifikasi
Pengenalan suara
Regresi
Memprediksi deret waktu
Beri anotasi pada string

16) Apa itu pembelajaran mesin independen algoritma?

Pembelajaran mesin yang fondasi matematikanya tidak bergantung pada pengklasifikasi atau algoritma pembelajaran tertentu disebut pembelajaran mesin yang tidak bergantung pada algoritma?

17) Apa perbedaan antara pembelajaran buatan dan pembelajaran mesin?

Merancang dan mengembangkan algoritma sesuai dengan perilaku berdasarkan data empiris dikenal sebagai Pembelajaran Mesin. Sementara kecerdasan buatan selain pembelajaran mesin, juga mencakup aspek lain seperti representasi pengetahuan, pemrosesan bahasa alami, perencanaan, robotika, dll.

18) Apa yang dimaksud dengan pengklasifikasi dalam pembelajaran mesin?

Pengklasifikasi dalam Pembelajaran Mesin adalah sistem yang memasukkan vektor nilai fitur diskrit atau kontinu dan menghasilkan nilai diskrit tunggal, yaitu kelas.

19) Apa kelebihan Naive Bayes?

Di Naïve Bayes, pengklasifikasi akan menyatu lebih cepat dibandingkan model diskriminatif seperti regresi logistik, sehingga Anda memerlukan lebih sedikit data pelatihan. Keuntungan utamanya adalah tidak dapat mempelajari interaksi antar fitur.

20) Di bidang apa saja Pengenalan Pola digunakan?

Pengenalan Pola dapat digunakan di

Visi Komputer
Speech Recognition
Data Mining
statistika
Pengambilan Informal
Bio-Informatika

Pertanyaan Wawancara Pembelajaran Mesin untuk Berpengalaman

21) Apa itu Pemrograman Genetik?

Pemrograman genetik adalah salah satu dari dua teknik yang digunakan dalam pembelajaran mesin. Model ini didasarkan pada pengujian dan pemilihan pilihan terbaik di antara serangkaian hasil.

22) Apa itu Induktif Logic Protata bahasa dalam Pembelajaran Mesin?

Induktif Logic Protata bahasa (ILP) adalah subbidang pembelajaran mesin yang menggunakan pemrograman logis yang mewakili latar belakang pengetahuan dan contoh.

23) Apa yang dimaksud dengan Pemilihan Model dalam Pembelajaran Mesin?

Proses pemilihan model di antara model matematika yang berbeda, yang digunakan untuk mendeskripsikan kumpulan data yang sama dikenal sebagai Pemilihan Model. Pemilihan model diterapkan pada bidang statistik, pembelajaran mesin, dan penambangan data.

24) Apa dua metode yang digunakan untuk kalibrasi dalam Supervised Learning?

Dua metode yang digunakan untuk memprediksi probabilitas yang baik dalam Supervised Learning adalah

Kalibrasi Platt
Regresi Isotonik

Metode-metode ini dirancang untuk klasifikasi biner, dan ini tidak sepele.

25) Metode manakah yang sering digunakan untuk mencegah overfitting?

Jika terdapat cukup data, 'Regresi Isotonik' digunakan untuk mencegah masalah overfitting.

26) Apa perbedaan antara heuristik untuk pembelajaran aturan dan heuristik untuk pohon keputusan?

Perbedaannya adalah heuristik untuk pohon keputusan mengevaluasi kualitas rata-rata dari sejumlah himpunan yang terputus-putus, sedangkan pembelajar aturan hanya mengevaluasi kualitas himpunan contoh yang tercakup dalam aturan kandidat.

27) Apa itu Perceptron dalam Pembelajaran Mesin?

Dalam Pembelajaran Mesin, Perceptron adalah algoritma pembelajaran terbimbing untuk pengklasifikasi biner di mana pengklasifikasi biner merupakan fungsi penentu apakah masukan merepresentasikan vektor atau angka.

28) Jelaskan dua komponen program logika Bayesian?

Program logika Bayesian terdiri dari dua komponen. Komponen pertama adalah komponen logis; terdiri dari serangkaian Klausa Bayesian, yang menangkap struktur kualitatif domain. Komponen kedua adalah komponen kuantitatif, yang mengodekan informasi kuantitatif tentang domain.

29) Apa itu Jaringan Bayesian (BN)?

Bayesian Network digunakan untuk mewakili model grafis untuk hubungan probabilitas antara sekumpulan variabel.

30) Mengapa algoritma pembelajaran berbasis instance terkadang disebut sebagai algoritma pembelajaran Malas?

Algoritme pembelajaran berbasis instance juga disebut sebagai algoritma pembelajaran Malas karena menunda proses induksi atau generalisasi hingga klasifikasi dilakukan.

31) Apa dua metode klasifikasi yang dapat ditangani oleh SVM (Support Vector Machine)?

Menggabungkan pengklasifikasi biner
Memodifikasi biner untuk menggabungkan pembelajaran multikelas

32) Apa itu pembelajaran ansambel?

Untuk menyelesaikan program komputasi tertentu, beberapa model seperti pengklasifikasi atau pakar dihasilkan dan digabungkan secara strategis. Proses ini dikenal sebagai pembelajaran ansambel.

33) Mengapa pembelajaran ansambel digunakan?

Pembelajaran ensemble digunakan untuk meningkatkan klasifikasi, prediksi, perkiraan fungsi, dll dari suatu model.

34) Kapan menggunakan pembelajaran ansambel?

Pembelajaran ansambel digunakan saat Anda membuat pengklasifikasi komponen yang lebih akurat dan independen satu sama lain.

35) Apa dua paradigma metode ansambel?

Dua paradigma metode ansambel adalah

Metode ansambel berurutan
Metode ansambel paralel

36) Apa prinsip umum metode ansambel dan apa yang dimaksud dengan bagging dan boosting dalam metode ansambel?

Prinsip umum metode ansambel adalah menggabungkan prediksi beberapa model yang dibangun dengan algoritma pembelajaran tertentu untuk meningkatkan ketahanan pada satu model. Bagging adalah metode terpadu untuk memperbaiki skema estimasi atau klasifikasi yang tidak stabil. Sedangkan metode boosting digunakan secara berurutan untuk mengurangi bias model gabungan. Boosting dan Bagging keduanya dapat mengurangi kesalahan dengan mengurangi istilah varians.

37) Apa yang dimaksud dengan dekomposisi bias-varians dari kesalahan klasifikasi dalam metode ansambel?

Kesalahan yang diharapkan dari suatu algoritma pembelajaran dapat diuraikan menjadi bias dan varians. Istilah bias mengukur seberapa dekat rata-rata pengklasifikasi yang dihasilkan oleh algoritme pembelajaran cocok dengan fungsi target. Istilah varians mengukur seberapa besar fluktuasi prediksi algoritma pembelajaran untuk set pelatihan yang berbeda.

38) Apa yang dimaksud dengan algoritma Pembelajaran Inkremental dalam ansambel?

Metode pembelajaran inkremental adalah kemampuan suatu algoritma untuk belajar dari data baru yang mungkin tersedia setelah pengklasifikasi dihasilkan dari kumpulan data yang sudah tersedia.

39) Untuk apa PCA, KPCA dan ICA digunakan?

PCA (Analisis Komponen Utama), KPCA (Analisis Komponen Utama berbasis Kernel) dan ICA (Analisis Komponen Independen) adalah teknik ekstraksi fitur penting yang digunakan untuk reduksi dimensi.

40) Apa yang dimaksud dengan pengurangan dimensi dalam Machine Learning?

Dalam Pembelajaran Mesin dan statistik, reduksi dimensi adalah proses pengurangan jumlah variabel acak yang dipertimbangkan dan dapat dibagi menjadi pemilihan fitur dan ekstraksi fitur.

41) Apa yang dimaksud dengan mesin vektor pendukung?

Mesin vektor dukungan adalah algoritma pembelajaran yang diawasi yang digunakan untuk klasifikasi dan analisis regresi.

42) Apa saja komponen teknik evaluasi relasional?

Komponen penting dari teknik evaluasi relasional adalah

Akuisisi Data
Akuisisi Kebenaran Dasar
Teknik Validasi Silang
Jenis Permintaan
Metrik Penilaian
Uji Signifikansi

43) Apa saja metode berbeda untuk Pembelajaran Sequential Supervised?

Berbagai metode untuk menyelesaikan masalah Sequential Supervised Learning adalah

Metode jendela geser
Jendela geser berulang
Model Markow Tersembunyi
Model Markow entropi maksimum
Bidang acak bersyarat
Jaringan transformator grafik

44) Bidang robotika dan pemrosesan informasi apa saja yang menimbulkan masalah prediksi sekuensial?

Area dalam robotika dan pemrosesan informasi di mana masalah prediksi sekuensial muncul adalah

Pembelajaran Imitasi
Prediksi terstruktur
Pembelajaran penguatan berbasis model

45) Apa yang dimaksud dengan pembelajaran statistik batch?

Teknik pembelajaran statistik memungkinkan mempelajari suatu fungsi atau prediktor dari sekumpulan data yang diamati yang dapat membuat prediksi tentang data yang tidak terlihat atau yang akan datang. Teknik-teknik ini memberikan jaminan atas kinerja prediktor yang dipelajari pada data masa depan yang tidak terlihat berdasarkan asumsi statistik pada proses menghasilkan data.

46) Apa itu Pembelajaran PAC?

Pembelajaran PAC (Probably Approximately Correct) adalah kerangka kerja pembelajaran yang diperkenalkan untuk menganalisis algoritma pembelajaran dan efisiensi statistiknya.

47) Apa saja kategori berbeda yang dapat Anda kategorikan dalam proses pembelajaran urutan?

Prediksi urutan
Pembuatan urutan
Pengenalan urutan
Keputusan berurutan

48) Apa itu pembelajaran urutan?

Pembelajaran berurutan adalah metode belajar mengajar dengan cara yang logis.

49) Apa saja dua teknik Pembelajaran Mesin?

Dua teknik Machine Learning tersebut adalah

Pemrograman Genetik
Pembelajaran Induktif

50) Berikan aplikasi pembelajaran mesin populer yang Anda lihat sehari-hari?

Mesin rekomendasi yang diterapkan oleh situs e-commerce besar menggunakan Machine Learning.

Pertanyaan wawancara ini juga akan membantu dalam viva Anda (lisan)