30 câu hỏi phỏng vấn HBase hàng đầu (2025)

Dưới đây là các câu hỏi và câu trả lời phỏng vấn Apache HBase dành cho những ứng viên mới ra trường cũng như có kinh nghiệm để có được công việc mơ ước của họ.

 

Câu hỏi và câu trả lời phỏng vấn HBase dành cho người mới

1) Giải thích HBase là gì?

HBase là một hệ thống quản lý cơ sở dữ liệu hướng cột chạy trên HDFS (Hệ thống tệp phân phối Hadoop). HBase không phải là kho lưu trữ dữ liệu quan hệ và nó không hỗ trợ ngôn ngữ truy vấn có cấu trúc như SQL.

Trong HBase, nút chính điều chỉnh các máy chủ cụm và khu vực để lưu trữ các phần của bảng và vận hành công việc trên dữ liệu.

👉 Tải xuống bản PDF miễn phí: Câu hỏi và trả lời phỏng vấn HBase


2) Giải thích tại sao phải sử dụng HBase?

  • Hệ thống lưu trữ dung lượng cao
  • Thiết kế phân tán để phục vụ các bàn lớn
  • Cửa hàng theo cột
  • Có thể mở rộng theo chiều ngang
  • Hiệu suất cao và sẵn có
  • Mục tiêu cơ bản của HBase là hàng triệu cột, hàng ngàn phiên bản và hàng tỷ hàng
  • Không giống như HDFS (Hệ thống tệp phân phối Hadoop), nó hỗ trợ các hoạt động CRUD thời gian thực ngẫu nhiên

3) Hãy nêu các thành phần chính của HBase là gì?

Kiến trúc HBase chủ yếu bao gồm các thành phần sau

  • Người giữ vườn thú: Nó thực hiện công việc phối hợp giữa khách hàng và HBase Maser
  • Thạc sĩ HBase: HBase Master giám sát Máy chủ khu vực
  • Máy chủ khu vực: Máy chủ Vùng giám sát Vùng
  • Khu vực: Nó chứa trong kho dữ liệu bộ nhớ (MemStore) và Hfile.
  • Bảng danh mục: Bảng danh mục bao gồm ROOT và META
HBase Archisơ đồ kiến ​​trúc
HBase Archisơ đồ kiến ​​trúc

4) Giải thích HBase bao gồm những gì?

  • HBase bao gồm một tập hợp các bảng
  • Và mỗi bảng chứa các hàng và cột như cơ sở dữ liệu truyền thống
  • Mỗi bảng phải chứa một phần tử được xác định là Khóa chính
  • Cột HBase biểu thị thuộc tính của đối tượng

5) Hãy cho biết có bao nhiêu lệnh thao tác trong HBase?

Chủ yếu có năm loại Operacâu chuyện các lệnh trong HBase:

  • Nhận
  • Đặt
  • Xóa bỏ
  • Quét
  • Tăng
Câu hỏi phỏng vấn HBase
Câu hỏi phỏng vấn HBase

6) Giải thích WAL và Hlog trong HBase là gì?

WAL (Write Ahead Log) tương tự như MySQL Nhật ký BIN; nó ghi lại tất cả những thay đổi xảy ra trong dữ liệu. Nó là một tập tin trình tự tiêu chuẩn bởi Hadoop và nó lưu trữ HLogkey. Các khóa này bao gồm một số thứ tự cũng như dữ liệu thực tế và được sử dụng để phát lại dữ liệu chưa tồn tại sau sự cố máy chủ. Vì vậy, khi máy chủ bị lỗi, WAL hoạt động như một cứu cánh và lấy lại dữ liệu bị mất.


7) Khi nào bạn nên sử dụng HBase?

  • Kích thước dữ liệu rất lớn: Khi bạn có hàng triệu bản ghi để vận hành
  • Thiết kế lại hoàn chỉnh: Khi bạn chuyển RDBMS sang HBase, bạn coi đó là một thiết kế lại hoàn chỉnh, sau đó chỉ thay đổi các cổng
  • SQL-Less lệnh: Bạn có một số tính năng như giao dịch; các phép nối bên trong, các cột được gõ, v.v.
  • Đầu tư cơ sở hạ tầng: Bạn cần có đủ cluster để HBase thực sự hữu ích

8) Trong HBase họ cột là gì?

Các họ cột bao gồm đơn vị lưu trữ vật lý cơ bản trong HBase mà các tính năng như nén được áp dụng.


9) Giải thích phím hàng là gì?

Khóa hàng được xác định bởi ứng dụng. Vì khóa kết hợp được cố định trước bằng phím hàng nên nó cho phép ứng dụng xác định thứ tự sắp xếp mong muốn. Nó cũng cho phép nhóm các ô một cách hợp lý và đảm bảo rằng tất cả các ô có cùng một khóa hàng đều được đặt cùng vị trí trên cùng một máy chủ.


10) Giải thích việc xóa trong HBase? Hãy nêu ba loại bia mộ trong HBase là gì?

Khi bạn xóa ô trong HBase, dữ liệu không thực sự bị xóa nhưng điểm đánh dấu bia mộ được đặt, làm cho các ô đã xóa trở nên vô hình. HBase đã xóa thực sự bị xóa trong quá trình nén.

Có ba loại điểm đánh dấu bia mộ:

  • Điểm đánh dấu xóa phiên bản: Để xóa, nó đánh dấu một phiên bản duy nhất của một cột
  • Dấu xóa cột: Để xóa, nó đánh dấu tất cả các phiên bản của một cột
  • Điểm đánh dấu xóa họ: Để xóa, nó đánh dấu tất cả các cột cho một họ cột

11) Giải thích làm thế nào HBase thực sự xóa một hàng?

Trong HBase, bất cứ điều gì bạn viết sẽ được lưu trữ từ RAM vào đĩa, những lần ghi vào đĩa này là sự nén chặt bất biến. Trong quá trình xóa trong HBase, quá trình nén chính sẽ xóa điểm đánh dấu trong khi các lần nén nhỏ thì không. Trong các lần xóa thông thường, nó sẽ tạo ra một điểm đánh dấu bia mộ xóa - những dữ liệu xóa mà chúng đại diện sẽ bị xóa trong quá trình nén.

Ngoài ra, nếu bạn xóa dữ liệu và thêm nhiều dữ liệu hơn, nhưng có dấu thời gian sớm hơn dấu thời gian bia mộ, thì Được có thể bị che bởi điểm đánh dấu xóa/bia mộ và do đó bạn sẽ không nhận được giá trị được chèn cho đến sau quá trình nén chính.


12) Giải thích điều gì sẽ xảy ra nếu bạn thay đổi kích thước khối của họ cột trên cơ sở dữ liệu đã bị chiếm dụng?

Khi bạn thay đổi kích thước khối của họ cột, dữ liệu mới sẽ chiếm kích thước khối mới trong khi dữ liệu cũ vẫn nằm trong kích thước khối cũ. Trong quá trình nén dữ liệu, dữ liệu cũ sẽ có kích thước khối mới. Các tệp mới khi chúng được xóa sẽ có kích thước khối mới trong khi dữ liệu hiện có sẽ tiếp tục được đọc chính xác. Tất cả dữ liệu sẽ được chuyển đổi sang kích thước khối mới, sau lần nén lớn tiếp theo.


13) Hãy nêu sự khác biệt giữa HBase và Cơ sở dữ liệu quan hệ?

Dưới đây là một số khác biệt quan trọng giữa Apache HBase và Cơ sở dữ liệu quan hệ:

HBase Cơ sở dữ liệu quan hệ
  • Nó không có lược đồ
  • Nó là một kho lưu trữ dữ liệu theo cột
  • Nó được sử dụng để lưu trữ dữ liệu không chuẩn hóa
  • Nó chứa các bảng dân cư thưa thớt
  • Việc phân vùng tự động được thực hiện trong HBase
  • Nó là một cơ sở dữ liệu dựa trên lược đồ
  • Nó là một kho lưu trữ dữ liệu theo hàng
  • Nó được sử dụng để lưu trữ dữ liệu chuẩn hóa
  • Nó chứa các bảng mỏng
  • Không có điều khoản hoặc hỗ trợ tích hợp nào cho việc phân vùng

14) Lớp HBaseFsck là gì?

Có một tên công cụ được gọi là back có sẵn trong HBase, được triển khai bởi lớp HBaseFsck. Nó cung cấp một số công tắc dòng lệnh ảnh hưởng đến hành vi của nó.


Câu hỏi và câu trả lời phỏng vấn HBase dành cho người có kinh nghiệm

15) Cấu trúc chính của HBase là gì?

Khóa hàng và khóa Cột là hai cấu trúc khóa quan trọng nhất được sử dụng trong HBase


16) Thảo luận cách bạn có thể sử dụng các bộ lọc trong Apache HBase

Bộ lọc trong HBase Shell. Nó được giới thiệu trong Apache HBase 0.92, giúp bạn tiến hành lọc phía máy chủ để truy cập HBase qua Vỏ HBase hoặc tiết kiệm.


17) Cấu trúc cú pháp hỗ trợ HBase như SQL có hay không?

Không, thật không may, SQL Hiện tại không có hỗ trợ cho HBase. Tuy nhiên, bằng cách sử dụng Apache Phoenix, chúng ta có thể truy xuất dữ liệu từ HBase thông qua các truy vấn SQL.


18) Ý nghĩa của việc nén trong HBase là gì?

Tại thời điểm có nhiều lượt ghi đến, không thể đạt được hiệu suất tối ưu bằng cách chỉ có một tệp trên mỗi cửa hàng. HBase giúp bạn kết hợp tất cả các HFiles này để giảm số lượng hạt giống đĩa cho mỗi lần đọc. Quá trình này được gọi là Nén trong HBase.


19) Bạn sẽ triển khai các phép nối trong HBase như thế nào?

HBase, không hỗ trợ tham gia trực tiếp mà sử dụng Bản đồGiảm Các truy vấn tham gia công việc có thể được triển khai bằng cách truy xuất dữ liệu với sự trợ giúp của các bảng HBase khác nhau.


20) Giải thích JMX liên quan đến HBSE

Java Tiện ích mở rộng quản lý hoặc JMX là trạng thái xuất của Java ứng dụng là tiêu chuẩn cho họ.


21) Công dụng của MasterServer là gì?

Máy chủ chính cũng giúp bạn chỉ định một khu vực cho máy chủ khu vực. Nó cũng giúp bạn xử lý việc cân bằng tải mà chúng tôi sử dụng MasterServer.


22) Xác định thuật ngữ tiết kiệm

Apache Thrift được viết bằng C++. Nó cung cấp trình biên dịch lược đồ cho các ngôn ngữ lập trình khác nhau như C++, Perl, PHP, Python, Ruby, v.v.


23) Tại sao nên sử dụng HColumnDescripthay lớp học?

Thông tin chi tiết về họ cột như cài đặt nén, Số phiên bản, được lưu trữ .in HColumnDescripthoặc.


24) Ô trong HBase là gì?

Một ô trong HBase là đơn vị nhỏ nhất của một Bảng HBase. Nó giúp bạn giữ một phần dữ liệu ở dạng tuple{row, cột, version}


25) Bộ lọc Bloom là gì?

HBase hỗ trợ Bloom Filter giúp bạn cải thiện thông lượng tổng thể của cụm. Bộ lọc HBase Bloom là một cơ chế tiết kiệm không gian để kiểm tra xem HFile có bao gồm ô hàng hoặc ô hàng-col nhất định hay không.


26) Hãy cho tôi biết về các loại HBase Operaý kiến?

Trả lời. Hai loại HBase Operacác vấn đề là:

  • Đọc Operasản xuất
  • Viết Operasản xuất

27) Công dụng của HBase HMaster là gì?

Trách nhiệm chính của một bậc thầy là:

  1. Điều phối các máy chủ khu vực
  2. Chức năng quản trị

28) Bạn có thể sử dụng kỹ thuật nào trong HBase để truy cập trực tiếp vào HFile mà không cần sự trợ giúp của HBase?

Để truy cập trực tiếp vào HFile mà không cần sử dụng HBase, chúng ta sử dụng phương thức HFile.main().


29) Máy chủ khu vực có thể được đặt trên tất cả các DataNodes không?

Có, Máy chủ khu vực chạy trên cùng máy chủ với DataNodes


30) Đặt tên cho bộ lọc chấp nhận kích thước trang làm tham số trong HBase

Bộ lọc có tên PageFilter chấp nhận kích thước trang làm tham số.

Tài liệu này được soạn thảo bằng các công cụ chuyển đổi HTML tức thì.

Những câu hỏi phỏng vấn này cũng sẽ giúp ích cho bài thi viva(orals) của bạn