50 câu hỏi và câu trả lời phỏng vấn về học máy (2024)
Dưới đây là các câu hỏi và câu trả lời phỏng vấn Machine Learning dành cho những ứng viên mới ra trường cũng như có kinh nghiệm để có được công việc mơ ước của họ.
Câu hỏi và câu trả lời về Machine Learning Viva dành cho người mới
1) Học máy là gì?
Học máy là một nhánh của khoa học máy tính liên quan đến lập trình hệ thống để tự động học hỏi và cải thiện theo kinh nghiệm. Ví dụ: Robot được lập trình để chúng có thể thực hiện nhiệm vụ dựa trên dữ liệu chúng thu thập được từ các cảm biến. Nó tự động học các chương trình từ dữ liệu.
👉 Tải xuống bản PDF miễn phí: Câu hỏi và câu trả lời phỏng vấn về Machine Learning >>
2) Hãy nêu sự khác biệt giữa Khai thác dữ liệu và Học máy?
Học máy liên quan đến việc nghiên cứu, thiết kế và phát triển các thuật toán giúp máy tính có khả năng học hỏi mà không cần lập trình rõ ràng. Trong khi đó, khai thác dữ liệu có thể được định nghĩa là quá trình trong đó dữ liệu phi cấu trúc cố gắng trích xuất kiến thức hoặc các mẫu thú vị chưa biết. Trong quá trình xử lý máy này, các thuật toán học tập được sử dụng.
3) 'Overfitting' trong Machine learning là gì?
In học máy, khi một mô hình thống kê mô tả lỗi ngẫu nhiên hoặc nhiễu thay vì mối quan hệ cơ bản, 'quá khớp' xảy ra. Khi một mô hình quá phức tạp, quá khớp thường được quan sát thấy, vì có quá nhiều tham số liên quan đến số lượng kiểu dữ liệu đào tạo. Mô hình thể hiện hiệu suất kém đã quá khớp.
4) Tại sao lại xảy ra tình trạng trang bị quá mức?
Khả năng trang bị quá mức tồn tại do tiêu chí được sử dụng để huấn luyện mô hình không giống với tiêu chí được sử dụng để đánh giá hiệu quả của mô hình.
5) Làm thế nào bạn có thể tránh trang bị quá mức?
Bằng cách tránh sử dụng quá nhiều dữ liệu, việc trang bị quá mức có thể xảy ra tương đối khi bạn có một tập dữ liệu nhỏ và bạn cố gắng học hỏi từ nó. Nhưng nếu bạn có một cơ sở dữ liệu nhỏ và bạn buộc phải tạo ra một mô hình dựa trên cơ sở dữ liệu đó. Trong tình huống như vậy, bạn có thể sử dụng một kỹ thuật được gọi là xác nhận chéo. Trong phương pháp này, tập dữ liệu chia thành hai phần, tập dữ liệu thử nghiệm và tập dữ liệu huấn luyện, tập dữ liệu thử nghiệm sẽ chỉ kiểm tra mô hình trong khi ở tập dữ liệu huấn luyện, các điểm dữ liệu sẽ đưa ra mô hình.
Trong kỹ thuật này, một mô hình thường được cung cấp một tập dữ liệu gồm dữ liệu đã biết để chạy đào tạo (tập dữ liệu huấn luyện) và một tập dữ liệu gồm những dữ liệu chưa biết mà mô hình được kiểm tra. Ý tưởng của xác thực chéo là xác định một tập dữ liệu để “kiểm tra” mô hình trong giai đoạn huấn luyện.
6) Học máy quy nạp là gì?
Học máy quy nạp bao gồm quá trình học bằng các ví dụ, trong đó một hệ thống, từ một tập hợp các trường hợp được quan sát, cố gắng tạo ra một quy tắc chung.
7) Năm thuật toán phổ biến của Machine Learning là gì?
- Cây quyết định
- Mạng thần kinh (lan truyền ngược)
- Mạng xác suất
- Láng giềng gần nhất
- Hỗ trợ máy vector
8) Các kỹ thuật thuật toán khác nhau trong Machine Learning là gì?
Các loại kỹ thuật khác nhau trong Machine Learning là
- Học tập có giám sát
- Học tập không giám sát
- Học bán giám sát
- Học tăng cường
- Truyền tải
- Học để học
9) Ba giai đoạn để xây dựng các giả thuyết hoặc mô hình trong học máy là gì?
- Xây dựng mô hình
- Kiểm tra mô hình
- Áp dụng mô hình
10) Cách tiếp cận tiêu chuẩn để học có giám sát là gì?
Cách tiếp cận tiêu chuẩn đối với việc học có giám sát là chia tập hợp ví dụ thành tập huấn luyện và bài kiểm tra.
11) 'Tập huấn luyện' và 'Tập kiểm tra' là gì?
Trong các lĩnh vực khoa học thông tin khác nhau như học máy, một tập hợp dữ liệu được sử dụng để khám phá mối quan hệ có khả năng dự đoán được gọi là 'Tập huấn luyện'. Tập huấn luyện là một ví dụ được cung cấp cho người học, trong khi Tập kiểm tra được sử dụng để kiểm tra tính chính xác của các giả thuyết do người học đưa ra và đó là tập hợp các ví dụ được người học giữ lại. Tập huấn luyện khác với tập Kiểm tra.
12) Liệt kê các phương pháp tiếp cận khác nhau cho học máy?
Các cách tiếp cận khác nhau trong Machine Learning là
- Học khái niệm và phân loại
- Học thống kê tượng trưng và thống kê
- Học tập quy nạp Vs phân tích
13) Cái gì không phải là Học máy?
- Trí tuệ nhân tạo
- Suy luận dựa trên quy tắc
14) Giải thích chức năng của 'Học không giám sát' là gì?
- Tìm cụm dữ liệu
- Tìm các biểu diễn chiều thấp của dữ liệu
- Tìm hướng thú vị trong dữ liệu
- Tọa độ và mối tương quan thú vị
- Tìm các quan sát mới/làm sạch cơ sở dữ liệu
15) Giải thích chức năng của 'Học có giám sát' là gì?
- phân loại
- Nhận dạng giọng nói
- Hồi quy
- Dự đoán chuỗi thời gian
- Chú thích chuỗi
16) Học máy độc lập với thuật toán là gì?
Học máy trong đó nền tảng toán học độc lập với bất kỳ thuật toán phân loại hoặc thuật toán học cụ thể nào được gọi là học máy độc lập với thuật toán?
17) Sự khác biệt giữa học nhân tạo và học máy là gì?
Thiết kế và phát triển các thuật toán theo hành vi dựa trên dữ liệu thực nghiệm được gọi là Machine Learning. Mặc dù trí tuệ nhân tạo ngoài học máy, nó còn bao gồm các khía cạnh khác như biểu diễn tri thức, xử lý ngôn ngữ tự nhiên, lập kế hoạch, robot, v.v.
18) Phân loại trong học máy là gì?
Bộ phân loại trong Machine Learning là một hệ thống nhập vào một vectơ các giá trị đặc trưng rời rạc hoặc liên tục và xuất ra một giá trị riêng biệt duy nhất, lớp.
19) Ưu điểm của Naive Bayes là gì?
Trong trình phân loại Naïve Bayes sẽ hội tụ nhanh hơn các mô hình phân biệt đối xử như hồi quy logistic, do đó bạn cần ít dữ liệu đào tạo hơn. Ưu điểm chính là nó không thể học được sự tương tác giữa các tính năng.
20) Nhận dạng mẫu được sử dụng trong những lĩnh vực nào?
Nhận dạng mẫu có thể được sử dụng trong
- Tầm nhìn máy tính
- Speech Recognition
- Khai thác dữ liệu
- Thống Kê
- Truy xuất không chính thức
- Tin học sinh học
Câu hỏi phỏng vấn Machine Learning dành cho người có kinh nghiệm
21) Lập trình di truyền là gì?
Lập trình di truyền là một trong hai kỹ thuật được sử dụng trong học máy. Mô hình này dựa trên việc thử nghiệm và lựa chọn lựa chọn tốt nhất trong số các kết quả.
22) Quy nạp là gì Logic Prongữ pháp trong Machine Learning?
Cảm ứng Logic Prongữ pháp (ILP) là một trường con của học máy sử dụng lập trình logic biểu diễn kiến thức và ví dụ nền tảng.
23) Lựa chọn mô hình trong Machine Learning là gì?
Quá trình lựa chọn các mô hình giữa các mô hình toán học khác nhau, được sử dụng để mô tả cùng một tập dữ liệu được gọi là Lựa chọn mô hình. Lựa chọn mô hình được áp dụng cho các lĩnh vực thống kê, học máy và khai thác dữ liệu.
24) Hai phương pháp được sử dụng để hiệu chỉnh trong Học tập có giám sát là gì?
Hai phương pháp được sử dụng để dự đoán xác suất tốt trong Học tập có giám sát là
- Hiệu chuẩn Platt
- Hồi quy đẳng áp
Những phương pháp này được thiết kế để phân loại nhị phân và nó không tầm thường.
25) Phương pháp nào thường được sử dụng để ngăn chặn việc trang bị quá mức?
Khi có đủ dữ liệu 'Hồi quy đẳng trương' được sử dụng để ngăn chặn sự cố trang bị quá mức.
26) Sự khác biệt giữa heuristic cho việc học quy tắc và heuristic cho cây quyết định là gì?
Sự khác biệt là phương pháp phỏng đoán cho cây quyết định đánh giá chất lượng trung bình của một số tập hợp rời rạc trong khi người học quy tắc chỉ đánh giá chất lượng của tập hợp các trường hợp nằm trong quy tắc ứng cử viên.
27) Perceptron trong Học máy là gì?
Trong Machine Learning, Perceptron là một thuật toán học có giám sát dành cho các bộ phân loại nhị phân trong đó bộ phân loại nhị phân là hàm quyết định xem đầu vào đại diện cho một vectơ hay một số.
28) Giải thích hai thành phần của chương trình logic Bayesian?
Chương trình logic Bayesian bao gồm hai thành phần. Thành phần đầu tiên là thành phần logic; nó bao gồm một tập hợp các Mệnh đề Bayesian, nắm bắt cấu trúc định tính của miền. Thành phần thứ hai là thành phần định lượng, nó mã hóa thông tin định lượng về miền.
29) Mạng Bayesian (BN) là gì?
Mạng Bayesian được sử dụng để biểu diễn mô hình đồ họa về mối quan hệ xác suất giữa một tập hợp các biến.
30) Tại sao thuật toán học dựa trên cá thể đôi khi được gọi là thuật toán học lười?
Thuật toán học dựa trên cá thể còn được gọi là thuật toán học lười biếng vì chúng trì hoãn quá trình quy nạp hoặc khái quát hóa cho đến khi việc phân loại được thực hiện.
31) Hai phương pháp phân loại mà SVM (Máy Vector Hỗ trợ) có thể xử lý là gì?
- Kết hợp phân loại nhị phân
- Sửa đổi nhị phân để kết hợp học tập nhiều lớp
32) Học tập theo nhóm là gì?
Để giải quyết một chương trình tính toán cụ thể, nhiều mô hình như bộ phân loại hoặc chuyên gia được tạo và kết hợp một cách chiến lược. Quá trình này được gọi là học tập tổng hợp.
33) Tại sao học tập theo nhóm được sử dụng?
Học tập hợp được sử dụng để cải thiện việc phân loại, dự đoán, xấp xỉ hàm, v.v. của một mô hình.
34) Khi nào nên sử dụng phương pháp học tập theo nhóm?
Học tập hợp được sử dụng khi bạn xây dựng các bộ phân loại thành phần chính xác hơn và độc lập với nhau hơn.
35) Hai mô hình của phương pháp tập hợp là gì?
Hai mô hình của các phương pháp tập hợp là
- Phương pháp tập hợp tuần tự
- Phương pháp tập hợp song song
36) Nguyên tắc chung của phương pháp tổng hợp là gì và đóng bao và thúc đẩy trong phương pháp tổng hợp là gì?
Nguyên tắc chung của phương pháp tập hợp là kết hợp các dự đoán của một số mô hình được xây dựng bằng thuật toán học nhất định để cải thiện độ tin cậy của một mô hình duy nhất. Đóng bao là một phương pháp tổng hợp để cải thiện các sơ đồ ước tính hoặc phân loại không ổn định. Trong khi phương pháp tăng cường được sử dụng tuần tự để giảm độ lệch của mô hình kết hợp. Tăng cường và Đóng bao đều có thể giảm lỗi bằng cách giảm số hạng phương sai.
37) Phân rã sai lệch phương sai của lỗi phân loại trong phương pháp tập hợp là gì?
Lỗi dự kiến của thuật toán học có thể được phân tách thành sai lệch và phương sai. Thuật ngữ sai lệch đo lường mức độ phù hợp của phân loại trung bình do thuật toán học tạo ra với hàm mục tiêu. Thuật ngữ phương sai đo lường mức độ dao động trong dự đoán của thuật toán học đối với các tập huấn luyện khác nhau.
38) Thuật toán Học tăng dần trong quần thể là gì?
Phương pháp học tăng dần là khả năng thuật toán học từ dữ liệu mới có thể có sau khi bộ phân loại đã được tạo từ tập dữ liệu đã có sẵn.
39) PCA, KPCA và ICA dùng để làm gì?
PCA (Phân tích thành phần chính), KPCA (Phân tích thành phần chính dựa trên hạt nhân) và ICA (Phân tích thành phần độc lập) là các kỹ thuật trích xuất tính năng quan trọng được sử dụng để giảm kích thước.
40) Giảm kích thước trong Machine Learning là gì?
Trong Machine Learning và thống kê, giảm kích thước là quá trình giảm số lượng biến ngẫu nhiên đang được xem xét và có thể được chia thành lựa chọn tính năng và trích xuất tính năng.
41) Máy vectơ hỗ trợ là gì?
Máy vectơ hỗ trợ là các thuật toán học có giám sát được sử dụng để phân loại và phân tích hồi quy.
42) Các thành phần của kỹ thuật đánh giá quan hệ là gì?
Các thành phần quan trọng của kỹ thuật đánh giá quan hệ là
- Thu thập dữ liệu
- Thu thập sự thật mặt đất
- Kỹ thuật xác thực chéo
- Loại truy vấn
- Chỉ số chấm điểm
- Kiểm tra ý nghĩa
43) Các phương pháp khác nhau cho Học tập có giám sát tuần tự là gì?
Các phương pháp khác nhau để giải các bài toán Học có giám sát tuần tự là
- Phương pháp cửa sổ trượt
- Cửa sổ trượt tuần hoàn
- Mô hình Markow ẩn
- Mô hình Markow entropy tối đa
- Trường ngẫu nhiên có điều kiện
- Mạng biến áp đồ thị
44) Các lĩnh vực nào trong robot và xử lý thông tin phát sinh vấn đề dự đoán tuần tự?
Các lĩnh vực trong robot và xử lý thông tin phát sinh vấn đề dự đoán tuần tự là
- học bắt chước
- Dự đoán có cấu trúc
- Học tăng cường dựa trên mô hình
45) Học thống kê hàng loạt là gì?
Kỹ thuật học thống kê cho phép học một hàm hoặc bộ dự đoán từ một tập hợp dữ liệu được quan sát có thể đưa ra dự đoán về dữ liệu chưa được nhìn thấy hoặc trong tương lai. Những kỹ thuật này cung cấp sự đảm bảo về hiệu suất của bộ dự đoán đã học đối với dữ liệu chưa được nhìn thấy trong tương lai dựa trên giả định thống kê về quá trình tạo dữ liệu.
46) Học PAC là gì?
Học tập PAC (Có lẽ là đúng) là một khung học tập đã được giới thiệu để phân tích các thuật toán học tập và hiệu quả thống kê của chúng.
47) Bạn có thể phân loại quá trình học theo trình tự thành những loại nào?
- Dự đoán trình tự
- Tạo trình tự
- Nhận dạng trình tự
- Quyết định tuần tự
48) Học theo trình tự là gì?
Học tuần tự là phương pháp dạy và học một cách logic.
49) Hai kỹ thuật của Machine Learning là gì?
Hai kỹ thuật của Machine Learning là
- Lập trình di truyền
- Học quy nạp
50) Hãy đưa ra một ứng dụng phổ biến của máy học mà bạn thấy hàng ngày?
Công cụ đề xuất được các trang web thương mại điện tử lớn triển khai sử dụng Machine Learning.
Những câu hỏi phỏng vấn này cũng sẽ giúp ích cho bài thi viva(orals) của bạn