30 najpopularniejszych pytań do wywiadu HBase (2025)

Oto pytania i odpowiedzi dotyczące rozmów kwalifikacyjnych Apache HBase dla świeżych i doświadczonych kandydatów, którzy chcą zdobyć wymarzoną pracę.

 

Pytania i odpowiedzi dotyczące wywiadu HBase dla nowicjuszy

1) Wyjaśnij, czym jest HBase?

HBase to zorientowany na kolumny system zarządzania bazami danych, który działa na bazie HDFS (Hadoop Distribute File System). HBase nie jest relacyjnym magazynem danych i nie obsługuje strukturalnego języka zapytań, takiego jak SQL.

W HBase węzeł główny reguluje działanie serwerów klastra i regionu, przechowuje części tabel i wykonuje pracę na danych.

👉 Bezpłatne pobieranie pliku PDF: pytania i odpowiedzi dotyczące wywiadu HBase


2) Wyjaśnij, dlaczego warto używać HBase?

  • System przechowywania o dużej pojemności
  • Rozproszony projekt dostosowany do obsługi dużych stołów
  • Sklepy zorientowane kolumnowo
  • Skalowalny w poziomie
  • Wysoka wydajność i dostępność
  • Podstawowym celem HBase są miliony kolumn, tysiące wersji i miliardy wierszy
  • W przeciwieństwie do HDFS (Hadoop Distribute File System) obsługuje losowe operacje CRUD w czasie rzeczywistym

3) Wspomnij, jakie są kluczowe składniki HBase?

Architektura HBase składa się głównie z następujących komponentów

  • Opiekun zoo: Wykonuje prace koordynacyjne pomiędzy klientem a HBase Maser
  • Główny HBase: HBase Master monitoruje serwer regionu
  • Serwer regionalny: RegionServer monitoruje region
  • Region: Zawiera magazyn danych w pamięci (MemStore) i Hfile.
  • Tabele katalogowe: Tabele katalogowe składają się z ROOT i META
HBase ArchiSchemat tecture
HBase ArchiSchemat tecture

4) Wyjaśnij, z czego składa się HBase?

  • HBase składa się z zestawu tabel
  • Każda tabela zawiera wiersze i kolumny, tak jak tradycyjna baza danych
  • Każda tabela musi zawierać element zdefiniowany jako klucz podstawowy
  • Kolumna HBase oznacza atrybut obiektu

5) Podaj liczbę poleceń operacyjnych w HBase.

Istnieje głównie pięć rodzajów Operanarodowa polecenia w HBase:

  • Get
  • PUT
  • Usuń
  • Scan
  • Przyrost
Pytania do rozmowy kwalifikacyjnej HBase
Pytania do rozmowy kwalifikacyjnej HBase

6) Wyjaśnij, czym są WAL i Hlog w HBase?

WAL (dziennik zapisu z wyprzedzeniem) jest podobny do MySQL dziennik BIN; rejestruje wszystkie zmiany zachodzące w danych. Jest to standardowy plik sekwencji Hadoop i przechowuje HLogkey. Klucze te składają się z numeru porządkowego oraz rzeczywistych danych i służą do odtwarzania jeszcze nieutrwalonych danych po awarii serwera. Zatem w przypadku awarii serwera WAL działa jak ratunek i odzyskuje utracone dane.


7) Kiedy należy używać HBase?

  • Rozmiar danych jest ogromny: Kiedy masz do obsługi tony i miliony rekordów
  • Całkowite przeprojektowanie: Kiedy przenosisz RDBMS do HBase, traktujesz to jako całkowite przeprojektowanie, a nie zwykłą zmianę portów
  • SQL-Less polecenia: Masz kilka funkcji, takich jak transakcje; łączenia wewnętrzne, kolumny z typem itp.
  • Inwestycje infrastrukturalne: Aby HBase był naprawdę użyteczny, musisz mieć wystarczająco dużo klastra

8) Czym są rodziny kolumn w HBase?

Rodziny kolumn obejmują podstawową jednostkę magazynu fizycznego w HBase, do której stosowane są funkcje takie jak kompresje.


9) Wyjaśnij, co to jest klucz wiersza?

Klucz wiersza jest definiowany przez aplikację. Ponieważ połączony klucz jest wstępnie ustalony przez klucz wiersza, umożliwia on aplikacji zdefiniowanie żądanej kolejności sortowania. Umożliwia także logiczne grupowanie komórek i zapewnia, że ​​wszystkie komórki z tym samym kluczem wiersza znajdują się na tym samym serwerze.


10) Wyjaśnij usunięcie w HBase? Wspomnij, jakie są trzy typy znaczników nagrobków w HBase?

Po usunięciu komórki w HBase dane nie są w rzeczywistości usuwane, ale ustawiany jest znacznik nagrobka, dzięki czemu usunięte komórki stają się niewidoczne. Usunięte HBase są faktycznie usuwane podczas zagęszczania.

Istnieją trzy rodzaje znaczników nagrobków:

  • Znacznik usuwania wersji: w przypadku usunięcia oznacza pojedynczą wersję kolumny
  • Znacznik usuwania kolumny: w przypadku usunięcia zaznacza wszystkie wersje kolumny
  • Znacznik usunięcia rodziny: W przypadku usunięcia zaznacza wszystkie kolumny w rodzinie kolumn

11) Wyjaśnij, w jaki sposób HBase faktycznie usuwa wiersz?

W HBase wszystko, co napiszesz, będzie przechowywane z pamięci RAM na dysk, te zapisy na dysku są niezmienne, z wyjątkiem kompaktowania. Podczas procesu usuwania w HBase główny proces zagęszczania usuwa znacznik, podczas gdy mniejsze zagęszczanie nie. W przypadku normalnego usuwania skutkuje to znacznikiem nagrobka usunięcia — dane usuwania, które reprezentują, są usuwane podczas zagęszczania.

Ponadto, jeśli usuniesz dane i dodasz więcej danych, ale z wcześniejszym znacznikiem czasu niż znacznik czasu nagrobka, dalsze Pobiera może zostać zamaskowany przez znacznik usuwania/nagrobka, dlatego wstawiona wartość zostanie otrzymana dopiero po większym zagęszczeniu.


12) Wyjaśnij, co się stanie, jeśli zmienisz rozmiar bloku rodziny kolumn w już zajętej bazie danych?

Po zmianie rozmiaru bloku rodziny kolumn nowe dane zajmują nowy rozmiar bloku, podczas gdy stare dane pozostają w starym rozmiarze bloku. Podczas zagęszczania danych stare dane przyjmują nowy rozmiar bloku. Nowe pliki w miarę ich opróżniania mają nowy rozmiar bloku, podczas gdy istniejące dane będą nadal poprawnie odczytywane. Wszystkie dane należy przekształcić do nowego rozmiaru bloku po kolejnym większym zagęszczeniu.


13) Wspomnij różnicę między HBase a relacyjną bazą danych?

Oto kilka ważnych różnic między Apache HBase a relacyjną bazą danych:

HBase Relacyjna baza danych
  • Jest pozbawiony schematów
  • Jest to magazyn danych zorientowany na kolumny
  • Służy do przechowywania zdenormalizowanych danych
  • Zawiera słabo zapełnione tabele
  • Automatyczne partycjonowanie odbywa się w HBase
  • Jest to baza danych oparta na schemacie
  • Jest to magazyn danych zorientowany na wiersze
  • Służy do przechowywania znormalizowanych danych
  • Zawiera cienkie stoły
  • Nie ma takiego przepisu ani wbudowanej obsługi partycjonowania

14) Co to jest klasa HBaseFsck?

W HBase dostępna jest nazwa narzędzia o nazwie back, która jest implementowana przez klasę HBaseFsck. Oferuje kilka przełączników wiersza poleceń, które wpływają na jego zachowanie.


Pytania i odpowiedzi dotyczące wywiadu HBase dla doświadczonych

15) Jakie są główne kluczowe struktury HBase?

Klucz wiersza i klucz kolumny to dwie najważniejsze struktury kluczowe używane w HBase


16) Omów sposób wykorzystania filtrów w Apache HBase

Filtry w powłoce HBase. Został wprowadzony w Apache HBase 0.92, który pomaga w przeprowadzaniu filtrowania po stronie serwera w celu uzyskania dostępu do HBase przez Powłoka HBase lub oszczędność.


17) Struktura składni obsługi HBase, taka jak SQL tak czy nie?

Niestety nie, SQL obsługa HBase nie jest obecnie dostępna. Korzystając jednak z Apache Phoenix, możemy pobierać dane z HBase za pomocą zapytań SQL.


18) Jakie jest znaczenie zagęszczenia w HBase?

W czasie dużej liczby przychodzących zapisów niemożliwe jest osiągnięcie optymalnej wydajności, mając jeden plik na magazyn. HBase pomaga połączyć wszystkie te pliki HFiles, aby zmniejszyć liczbę zarodków dysku przy każdym odczycie. Proces ten jest znany jako zagęszczanie w HBase.


19) Jak zaimplementujesz złączenia w HBase?

HBase, nie obsługuje bezpośrednich połączeń, ale używa MapaReduce zapytania o łączenie zadań można wdrożyć poprzez pobieranie danych za pomocą różnych tabel HBase.


20) Wyjaśnij JMX odnośnie HBSE

Java Management Extensions lub JMX to status eksportu Java aplikacje to dla nich standard.


21) Jakie jest zastosowanie MasterServer?

Serwer główny pomaga również przypisać region do serwera regionalnego. Pomaga także w obsłudze równoważenia obciążenia, którego używamy na serwerze MasterServer.


22) Zdefiniuj pojęcie oszczędności

Apache Thrift jest napisany C++. Zapewnia kompilatory schematów dla różnych języków programowania, takich jak C++, Perla, PHP, Python, Rubin i inne.


23) Po co używać HColumnDescriptczy klasa?

Szczegóły dotyczące rodziny kolumn, takie jak ustawienia kompresji i liczba wersji, są przechowywane w pliku HColumnDescriptlub.


24) Co to jest komórka w HBase?

Komórka w HBase jest najmniejszą jednostką Tabela HBase. Pomaga przechowywać fragment danych w postaci krotki{wiersz, kolumna, wersja}


25) Czym jest filtr Blooma?

HBase obsługuje filtr Blooma, który pomaga Ci poprawić ogólną przepustowość klastra. Filtr Blooma HBase to wydajny pod względem miejsca mechanizm do testowania, czy plik HFile zawiera określony wiersz lub komórkę wiersz-kolumna.


26) Opowiedz mi o typach HBase Operacje?

Odp. Dwa typy HBase Operasą następujące:

  • Czytaj Operacja
  • Pisać Operacja

27) Jakie jest zastosowanie HBase HMaster?

Główne obowiązki mistrza to:

  1. Koordynacja serwerów regionalnych
  2. Funkcje administratora

28) Jakiej techniki możesz użyć w HBase, aby uzyskać bezpośredni dostęp do HFile bez pomocy HBase?

Aby uzyskać bezpośredni dostęp do HFile bez użycia HBase, używamy metody HFile.main().


29) Czy serwer regionalny będzie zlokalizowany na wszystkich DataNodesach?

Tak, serwery regionalne działają na tych samych serwerach, co węzły DataNodes


30) Nazwij filtr, który akceptuje rozmiar strony jako parametr w HBase

Filtr o nazwie PageFilter akceptuje rozmiar strony jako parametr.

Ten dokument został utworzony przy użyciu narzędzi do natychmiastowego konwertowania HTML.

Te pytania podczas rozmowy kwalifikacyjnej pomogą również w Twoim życiu (ustach)