50 Pertanyaan dan Jawaban Wawancara Machine Learning (2024)

Berikut adalah pertanyaan dan jawaban wawancara Machine Learning untuk kandidat baru dan berpengalaman untuk mendapatkan pekerjaan impian mereka.

 

Pertanyaan dan Jawaban Viva Machine Learning untuk Mahasiswa Baru

1) Apa itu pembelajaran Mesin?

Pembelajaran mesin adalah cabang ilmu komputer yang berhubungan dengan pemrograman sistem agar dapat dipelajari dan ditingkatkan secara otomatis seiring dengan pengalaman. Misalnya: Robot diprogram sehingga mereka dapat melakukan tugas berdasarkan data yang dikumpulkan dari sensor. Secara otomatis mempelajari program dari data.

Unduhan PDF Gratis: Pertanyaan & Jawaban Wawancara Machine Learning >>


2) Sebutkan perbedaan antara Data Mining dan Machine learning?

Pembelajaran mesin berkaitan dengan studi, desain, dan pengembangan algoritma yang memberi komputer kemampuan untuk belajar tanpa diprogram secara eksplisit. Sementara itu, penambangan data dapat didefinisikan sebagai proses di mana data tak terstruktur mencoba mengekstraksi pengetahuan atau pola menarik yang tidak diketahui. Selama proses ini, algoritma pembelajaran mesin digunakan.


3) Apa yang dimaksud dengan 'Overfitting' dalam Machine learning?

In Mesin belajar, ketika model statistik menggambarkan kesalahan acak atau gangguan alih-alih hubungan yang mendasarinya, 'overfitting' terjadi. Ketika suatu model terlalu rumit, overfitting biasanya diamati, karena memiliki terlalu banyak parameter sehubungan dengan jumlah tipe data pelatihan. Model tersebut menunjukkan kinerja yang buruk yang telah mengalami overfitting.


4) Mengapa terjadi overfitting?

Kemungkinan terjadinya overfitting terjadi karena kriteria yang digunakan untuk melatih model tidak sama dengan kriteria yang digunakan untuk menilai kemanjuran suatu model.


5) Bagaimana cara menghindari overfitting?

Dengan menggunakan banyak data, overfitting dapat dihindari, overfitting terjadi secara relatif karena Anda memiliki kumpulan data yang kecil, dan Anda mencoba mempelajarinya. Tetapi jika Anda memiliki database kecil dan Anda terpaksa membuat model berdasarkan itu. Dalam situasi seperti ini, Anda dapat menggunakan teknik yang disebut validasi silang. Dalam metode ini dataset dibagi menjadi dua bagian, dataset pengujian dan pelatihan, dataset pengujian hanya akan menguji model sedangkan pada dataset pelatihan, titik data akan muncul dengan model.

Dalam teknik ini, suatu model biasanya diberikan kumpulan data dari data yang diketahui yang digunakan untuk menjalankan pelatihan (kumpulan data pelatihan) dan kumpulan data yang tidak diketahui yang menjadi dasar pengujian model tersebut. Ide validasi silang adalah untuk menentukan kumpulan data untuk โ€œmengujiโ€ model dalam fase pelatihan.


6) Apa itu pembelajaran mesin induktif?

Pembelajaran mesin induktif melibatkan proses pembelajaran dengan contoh, di mana suatu sistem, dari serangkaian contoh yang diamati mencoba menghasilkan aturan umum.


7) Apa saja lima algoritma Pembelajaran Mesin yang populer?

  • Pohon Keputusan
  • Jaringan Syaraf Tiruan (propagasi balik)
  • Jaringan probabilistik
  • Tetangga terdekat
  • Mendukung mesin vektor

8) Apa sajakah teknik Algoritma dalam Pembelajaran Mesin?

Berbagai jenis teknik dalam Machine Learning adalah


9) Apa saja tiga tahap untuk membangun hipotesis atau model dalam pembelajaran mesin?

  • Bangunan model
  • pengujian model
  • Menerapkan model

10) Apa pendekatan standar untuk pembelajaran yang diawasi?

Pendekatan standar untuk pembelajaran yang diawasi adalah dengan membagi rangkaian contoh menjadi rangkaian pelatihan dan ujian.


11) Apa itu 'Set pelatihan' dan 'Set tes'?

Di berbagai bidang ilmu informasi seperti pembelajaran mesin, sekumpulan data digunakan untuk menemukan hubungan yang berpotensi bersifat prediktif yang dikenal sebagai 'Kumpulan Pelatihan'. Set pelatihan adalah contoh yang diberikan kepada pelajar, sedangkan set Tes digunakan untuk menguji keakuratan hipotesis yang dihasilkan oleh pelajar, dan merupakan kumpulan contoh yang ditahan dari pelajar. Set pelatihan berbeda dari set Tes.


12) Sebutkan berbagai pendekatan untuk pembelajaran mesin?

Pendekatan berbeda dalam Pembelajaran Mesin adalah

  • Pembelajaran Konsep Vs Klasifikasi
  • Pembelajaran Simbolik Vs Statistik
  • Pembelajaran Induktif Vs Analitik

13) Apa yang bukan Pembelajaran Mesin?


14) Jelaskan apa fungsi 'Pembelajaran Tanpa Pengawasan'?

  • Temukan cluster data
  • Temukan representasi data berdimensi rendah
  • Temukan arah menarik dalam data
  • Koordinat dan korelasi yang menarik
  • Temukan pengamatan baru/pembersihan basis data

15) Jelaskan apa fungsi 'Supervised Learning'?

  • klasifikasi
  • Pengenalan suara
  • Regresi
  • Memprediksi deret waktu
  • Beri anotasi pada string

16) Apa itu pembelajaran mesin independen algoritma?

Pembelajaran mesin yang fondasi matematikanya tidak bergantung pada pengklasifikasi atau algoritma pembelajaran tertentu disebut pembelajaran mesin yang tidak bergantung pada algoritma?


17) Apa perbedaan antara pembelajaran buatan dan pembelajaran mesin?

Merancang dan mengembangkan algoritma sesuai dengan perilaku berdasarkan data empiris dikenal sebagai Pembelajaran Mesin. Sementara kecerdasan buatan selain pembelajaran mesin, juga mencakup aspek lain seperti representasi pengetahuan, pemrosesan bahasa alami, perencanaan, robotika, dll.


18) Apa yang dimaksud dengan pengklasifikasi dalam pembelajaran mesin?

Pengklasifikasi dalam Pembelajaran Mesin adalah sistem yang memasukkan vektor nilai fitur diskrit atau kontinu dan menghasilkan nilai diskrit tunggal, yaitu kelas.


19) Apa kelebihan Naive Bayes?

Di Naรฏve Bayes, pengklasifikasi akan menyatu lebih cepat dibandingkan model diskriminatif seperti regresi logistik, sehingga Anda memerlukan lebih sedikit data pelatihan. Keuntungan utamanya adalah tidak dapat mempelajari interaksi antar fitur.


20) Di bidang apa saja Pengenalan Pola digunakan?

Pengenalan Pola dapat digunakan di

  • Visi Komputer
  • Speech Recognition
  • Data Mining
  • statistika
  • Pengambilan Informal
  • Bio-Informatika

Pertanyaan Wawancara Pembelajaran Mesin untuk Berpengalaman

21) Apa itu Pemrograman Genetik?

Pemrograman genetik adalah salah satu dari dua teknik yang digunakan dalam pembelajaran mesin. Model ini didasarkan pada pengujian dan pemilihan pilihan terbaik di antara serangkaian hasil.


22) Apa itu Induktif Logic Protata bahasa dalam Pembelajaran Mesin?

Induktif Logic Protata bahasa (ILP) adalah subbidang pembelajaran mesin yang menggunakan pemrograman logis yang mewakili latar belakang pengetahuan dan contoh.


23) Apa yang dimaksud dengan Pemilihan Model dalam Pembelajaran Mesin?

Proses pemilihan model di antara model matematika yang berbeda, yang digunakan untuk mendeskripsikan kumpulan data yang sama dikenal sebagai Pemilihan Model. Pemilihan model diterapkan pada bidang statistik, pembelajaran mesin, dan penambangan data.


24) Apa dua metode yang digunakan untuk kalibrasi dalam Supervised Learning?

Dua metode yang digunakan untuk memprediksi probabilitas yang baik dalam Supervised Learning adalah

  • Kalibrasi Platt
  • Regresi Isotonik

Metode-metode ini dirancang untuk klasifikasi biner, dan ini tidak sepele.


25) Metode manakah yang sering digunakan untuk mencegah overfitting?

Jika terdapat cukup data, 'Regresi Isotonik' digunakan untuk mencegah masalah overfitting.


26) Apa perbedaan antara heuristik untuk pembelajaran aturan dan heuristik untuk pohon keputusan?

Perbedaannya adalah heuristik untuk pohon keputusan mengevaluasi kualitas rata-rata dari sejumlah himpunan yang terputus-putus, sedangkan pembelajar aturan hanya mengevaluasi kualitas himpunan contoh yang tercakup dalam aturan kandidat.


27) Apa itu Perceptron dalam Pembelajaran Mesin?

Dalam Pembelajaran Mesin, Perceptron adalah algoritma pembelajaran terbimbing untuk pengklasifikasi biner di mana pengklasifikasi biner merupakan fungsi penentu apakah masukan merepresentasikan vektor atau angka.


28) Jelaskan dua komponen program logika Bayesian?

Program logika Bayesian terdiri dari dua komponen. Komponen pertama adalah komponen logis; terdiri dari serangkaian Klausa Bayesian, yang menangkap struktur kualitatif domain. Komponen kedua adalah komponen kuantitatif, yang mengodekan informasi kuantitatif tentang domain.


29) Apa itu Jaringan Bayesian (BN)?

Bayesian Network digunakan untuk mewakili model grafis untuk hubungan probabilitas antara sekumpulan variabel.


30) Mengapa algoritma pembelajaran berbasis instance terkadang disebut sebagai algoritma pembelajaran Malas?

Algoritme pembelajaran berbasis instance juga disebut sebagai algoritma pembelajaran Malas karena menunda proses induksi atau generalisasi hingga klasifikasi dilakukan.


31) Apa dua metode klasifikasi yang dapat ditangani oleh SVM (Support Vector Machine)?

  • Menggabungkan pengklasifikasi biner
  • Memodifikasi biner untuk menggabungkan pembelajaran multikelas

32) Apa itu pembelajaran ansambel?

Untuk menyelesaikan program komputasi tertentu, beberapa model seperti pengklasifikasi atau pakar dihasilkan dan digabungkan secara strategis. Proses ini dikenal sebagai pembelajaran ansambel.


33) Mengapa pembelajaran ansambel digunakan?

Pembelajaran ensemble digunakan untuk meningkatkan klasifikasi, prediksi, perkiraan fungsi, dll dari suatu model.


34) Kapan menggunakan pembelajaran ansambel?

Pembelajaran ansambel digunakan saat Anda membuat pengklasifikasi komponen yang lebih akurat dan independen satu sama lain.


35) Apa dua paradigma metode ansambel?

Dua paradigma metode ansambel adalah

  • Metode ansambel berurutan
  • Metode ansambel paralel

36) Apa prinsip umum metode ansambel dan apa yang dimaksud dengan bagging dan boosting dalam metode ansambel?

Prinsip umum metode ansambel adalah menggabungkan prediksi beberapa model yang dibangun dengan algoritma pembelajaran tertentu untuk meningkatkan ketahanan pada satu model. Bagging adalah metode terpadu untuk memperbaiki skema estimasi atau klasifikasi yang tidak stabil. Sedangkan metode boosting digunakan secara berurutan untuk mengurangi bias model gabungan. Boosting dan Bagging keduanya dapat mengurangi kesalahan dengan mengurangi istilah varians.


37) Apa yang dimaksud dengan dekomposisi bias-varians dari kesalahan klasifikasi dalam metode ansambel?

Kesalahan yang diharapkan dari suatu algoritma pembelajaran dapat diuraikan menjadi bias dan varians. Istilah bias mengukur seberapa dekat rata-rata pengklasifikasi yang dihasilkan oleh algoritme pembelajaran cocok dengan fungsi target. Istilah varians mengukur seberapa besar fluktuasi prediksi algoritma pembelajaran untuk set pelatihan yang berbeda.


38) Apa yang dimaksud dengan algoritma Pembelajaran Inkremental dalam ansambel?

Metode pembelajaran inkremental adalah kemampuan suatu algoritma untuk belajar dari data baru yang mungkin tersedia setelah pengklasifikasi dihasilkan dari kumpulan data yang sudah tersedia.


39) Untuk apa PCA, KPCA dan ICA digunakan?

PCA (Analisis Komponen Utama), KPCA (Analisis Komponen Utama berbasis Kernel) dan ICA (Analisis Komponen Independen) adalah teknik ekstraksi fitur penting yang digunakan untuk reduksi dimensi.


40) Apa yang dimaksud dengan pengurangan dimensi dalam Machine Learning?

Dalam Pembelajaran Mesin dan statistik, reduksi dimensi adalah proses pengurangan jumlah variabel acak yang dipertimbangkan dan dapat dibagi menjadi pemilihan fitur dan ekstraksi fitur.


41) Apa yang dimaksud dengan mesin vektor pendukung?

Mesin vektor dukungan adalah algoritma pembelajaran yang diawasi yang digunakan untuk klasifikasi dan analisis regresi.


42) Apa saja komponen teknik evaluasi relasional?

Komponen penting dari teknik evaluasi relasional adalah

  • Akuisisi Data
  • Akuisisi Kebenaran Dasar
  • Teknik Validasi Silang
  • Jenis Permintaan
  • Metrik Penilaian
  • Uji Signifikansi

43) Apa saja metode berbeda untuk Pembelajaran Sequential Supervised?

Berbagai metode untuk menyelesaikan masalah Sequential Supervised Learning adalah

  • Metode jendela geser
  • Jendela geser berulang
  • Model Markow Tersembunyi
  • Model Markow entropi maksimum
  • Bidang acak bersyarat
  • Jaringan transformator grafik

44) Bidang robotika dan pemrosesan informasi apa saja yang menimbulkan masalah prediksi sekuensial?

Area dalam robotika dan pemrosesan informasi di mana masalah prediksi sekuensial muncul adalah

  • Pembelajaran Imitasi
  • Prediksi terstruktur
  • Pembelajaran penguatan berbasis model

45) Apa yang dimaksud dengan pembelajaran statistik batch?

Teknik pembelajaran statistik memungkinkan mempelajari suatu fungsi atau prediktor dari sekumpulan data yang diamati yang dapat membuat prediksi tentang data yang tidak terlihat atau yang akan datang. Teknik-teknik ini memberikan jaminan atas kinerja prediktor yang dipelajari pada data masa depan yang tidak terlihat berdasarkan asumsi statistik pada proses menghasilkan data.


46) Apa itu Pembelajaran PAC?

Pembelajaran PAC (Probably Approximately Correct) adalah kerangka kerja pembelajaran yang diperkenalkan untuk menganalisis algoritma pembelajaran dan efisiensi statistiknya.


47) Apa saja kategori berbeda yang dapat Anda kategorikan dalam proses pembelajaran urutan?

  • Prediksi urutan
  • Pembuatan urutan
  • Pengenalan urutan
  • Keputusan berurutan

48) Apa itu pembelajaran urutan?

Pembelajaran berurutan adalah metode belajar mengajar dengan cara yang logis.


49) Apa saja dua teknik Pembelajaran Mesin?

Dua teknik Machine Learning tersebut adalah

  • Pemrograman Genetik
  • Pembelajaran Induktif

50) Berikan aplikasi pembelajaran mesin populer yang Anda lihat sehari-hari?

Mesin rekomendasi yang diterapkan oleh situs e-commerce besar menggunakan Machine Learning.

Pertanyaan wawancara ini juga akan membantu dalam viva Anda (lisan)