30 nejčastějších otázek k rozhovoru s HBase (2025)

Zde jsou otázky a odpovědi na pohovor Apache HBase pro čerstvé i zkušené kandidáty, aby získali svou vysněnou práci.

 

Otázky a odpovědi k pohovoru HBase pro Freshers

1) Vysvětlete, co je HBase?

HBase je sloupcový systém správy databází, který běží nad HDFS (Hadoop Distribute File System). HBase není úložiště relačních dat a nepodporuje strukturovaný dotazovací jazyk, jako je SQL.

V HBase hlavní uzel reguluje servery clusteru a regionů tak, aby ukládaly části tabulek a provozuje práci s daty.

👉 Zdarma ke stažení PDF: HBase Interview Questions & Answers


2) Vysvětlete, proč používat HBase?

  • Vysokokapacitní úložný systém
  • Distribuovaný design pro velké stoly
  • Obchody zaměřené na sloupce
  • Horizontálně škálovatelné
  • Vysoký výkon a dostupnost
  • Základním cílem HBase jsou miliony sloupců, tisíce verzí a miliardy řádků
  • Na rozdíl od HDFS (Hadoop Distribute File System) podporuje náhodné operace CRUD v reálném čase

3) Uveďte, jaké jsou klíčové komponenty HBase?

Architektura HBase se skládá převážně z následujících komponent

  • Ošetřovatel v zoo: Provádí koordinační práci mezi klientem a HBase Maser
  • HBase Master: HBase Master monitoruje server regionu
  • RegionServer: RegionServer monitoruje region
  • Kraj: Obsahuje v paměti úložiště dat (MemStore) a Hfile.
  • Katalogové tabulky: Katalogové tabulky se skládají z ROOT a META
HBase Architecture Diagram
HBase Architecture Diagram

4) Vysvětlete, z čeho se skládá HBase?

  • HBase se skládá ze sady tabulek
  • A každá tabulka obsahuje řádky a sloupce jako tradiční databáze
  • Každá tabulka musí obsahovat prvek definovaný jako primární klíč
  • Sloupec HBase označuje atribut objektu

5) Uveďte, kolik operačních příkazů v HBase?

Existuje hlavně pět typů OperaTional příkazy v HBase:

  • Získejte
  • dát
  • Vymazat
  • Skenovat
  • Přírůstek
Otázky k pohovoru HBase
Otázky k pohovoru HBase

6) Vysvětlete, co je WAL a Hlog v HBase?

WAL (Write Ahead Log) je podobný MySQL deník BIN; zaznamenává všechny změny v datech. Je to standardní sekvenční soubor od Hadoop a ukládá HLogkey's. Tyto klíče se skládají z pořadového čísla i skutečných dat a používají se k přehrání dosud neuchovaných dat po havárii serveru. Takže v hotovosti v případě selhání serveru WAL funguje jako záchranné lano a obnovuje ztracená data.


7) Kdy byste měli používat HBase?

  • Velikost dat je obrovská: Když máte k provozu tuny a miliony záznamů
  • Kompletní redesign: Když přesouváte RDBMS na HBase, považujete to za kompletní přepracování, než jen za změnu portů
  • SQL-Less příkazy: Máte několik funkcí, jako jsou transakce; vnitřní spojení, typované sloupce atd.
  • Investice do infrastruktury: Aby byl HBase opravdu užitečný, musíte mít dostatek clusteru

8) Co jsou rodiny sloupců v HBase?

Rodiny sloupců tvoří základní jednotku fyzického úložiště v HBase, na kterou jsou aplikovány funkce jako komprese.


9) Vysvětlete, co je klíč řádku?

Klíč řádku je definován aplikací. Vzhledem k tomu, že kombinovaný klíč je přednastaven pomocí klíče řádku, umožňuje aplikaci definovat požadované pořadí řazení. Umožňuje také logické seskupování buněk a zajišťuje, že všechny buňky se stejným klíčem řádku jsou umístěny na stejném serveru.


10) Vysvětlete smazání v HBase? Uveďte, jaké jsou tři typy značek náhrobků v HBase?

Když odstraníte buňku v HBase, data se ve skutečnosti neodstraní, ale nastaví se značka náhrobek, takže odstraněné buňky budou neviditelné. Odstraněné HBase jsou ve skutečnosti odstraněny během komprimace.

Existují tři typy značek náhrobků:

  • Značka odstranění verze: Pro odstranění označí jednu verzi sloupce
  • Značka odstranění sloupce: Pro odstranění označí všechny verze sloupce
  • Značka odstranění rodiny: Pro odstranění označí všechny sloupce pro rodinu sloupců

11) Vysvětlete, jak HBase skutečně odstraní řádek?

V HBase bude vše, co zapíšete, uloženo z RAM na disk, tyto zápisy na disk jsou neměnné s výjimkou komprimace. Během procesu mazání v HBase proces hlavní komprimace odstraní značku, zatímco menší komprimace nikoli. Při normálním mazání to má za následek značku náhrobku pro odstranění – tato odstraněná data, která představují, jsou odstraněna během komprimace.

Pokud také odstraníte data a přidáte další data, ale s dřívějším časovým razítkem než časové razítko na náhrobku, Získá mohou být maskovány značkou odstranění/náhrobního kamene, a proto vloženou hodnotu obdržíte až po hlavním zhutnění.


12) Vysvětlete, co se stane, když změníte velikost bloku rodiny sloupců v již obsazené databázi?

Když změníte velikost bloku rodiny sloupců, nová data zaberou novou velikost bloku, zatímco stará data zůstanou v rámci staré velikosti bloku. Během komprimace dat budou mít stará data velikost nového bloku. Nové soubory, když jsou vyprázdněny, mají novou velikost bloku, zatímco existující data se budou i nadále správně číst. Všechna data by měla být po dalším velkém zhutnění převedena na novou velikost bloku.


13) Uveďte rozdíl mezi HBase a Relational Database?

Zde jsou některé důležité rozdíly mezi Apache HBase a Relational Database:

HBase Relační databáze
  • Je bez schématu
  • Jde o datové úložiště orientované na sloupce
  • Používá se k ukládání denormalizovaných dat
  • Obsahuje řídce osídlené tabulky
  • Automatické dělení se provádí v HBase
  • Je to databáze založená na schématu
  • Je to řádkově orientované úložiště dat
  • Slouží k ukládání normalizovaných dat
  • Obsahuje tenké tabulky
  • Neexistuje žádné takové ustanovení nebo vestavěná podpora pro dělení

14) Co je třída HBaseFsck?

V HBase je k dispozici název nástroje s názvem back, který je implementován třídou HBaseFsck. Nabízí několik přepínačů příkazového řádku, které ovlivňují jeho chování.


Otázky a odpovědi na pohovor HBase pro zkušené

15) Jaké jsou hlavní klíčové struktury HBase?

Klíč řádku a klíč sloupce jsou dvě nejdůležitější klíčové struktury používané v HBase


16) Diskutujte o tom, jak můžete používat filtry v Apache HBase

Filtry v HBase Shell. Byl představen v Apache HBase 0.92, který vám pomáhá provádět filtrování na straně serveru pro přístup k HBase přes HBase shell nebo šetrnost.


17) HBase podporuje strukturu syntaxe jako SQL ano nebo ne?

Bohužel ne, SQL podpora pro HBase aktuálně není k dispozici. Pomocí Apache Phoenix však můžeme načíst data z HBase prostřednictvím SQL dotazů.


18) Co znamená zhutnění v HBase?

V době velkých příchozích zápisů není možné dosáhnout optimálního výkonu tím, že budete mít jeden soubor na úložiště. HBase vám pomůže zkombinovat všechny tyto soubory HFiles, aby se snížil počet semenů disku pro každé čtení. Tento proces je v HBase známý jako zhutňování.


19) Jak budete implementovat spojení v HBase?

HBase se nepodporují přímo, ale používají MapReduce Dotazy na připojení úloh lze implementovat načítáním dat pomocí různých tabulek HBase.


20) Vysvětlete JMX ohledně HBSE

Java Management Extensions nebo JMX je stav exportu Java aplikace je pro ně standardem.


21) Jaké je použití MasterServeru?

Hlavní server vám také pomůže přiřadit region k serveru regionu. Pomůže vám také zvládnout vyrovnávání zátěže, které používáme na MasterServeru.


22) Definujte pojem šetrnost

Je napsáno Apache Thrift C++. Poskytuje kompilátory schémat pro různé programovací jazyky jako C++, Perl, PHP, Python, Ruby a další.


23) Proč používat HColumnDescriptnebo třída?

Podrobnosti týkající se rodiny sloupců, jako je nastavení komprese, Počet verzí, jsou uloženy v příponě HColumnDescriptnebo.


24) Co je buňka v HBase?

Buňka v HBase je nejmenší jednotkou an HZákladní tabulka. Pomůže vám uchovávat část dat ve formě n-tice {řádek, sloupec, verze}


25) Co je Bloomův filtr?

HBase podporuje Bloom Filter vám pomůže zlepšit celkovou propustnost clusteru. HBase Bloom Filter je prostorově efektivní mechanismus pro testování, zda soubor HF obsahuje určitý řádek nebo buňku řádku-sloupce.


26) Řekněte mi o typech HBase Operations?

Ans. Dva typy HBase Operato jsou:

  • číst Operavání
  • Napsat Operavání

27) Jaké je použití HBase HMaster?

Hlavní povinnosti mistra jsou:

  1. Koordinace regionálních serverů
  2. Funkce správce

28) Jakou techniku ​​můžete použít v HBase pro přímý přístup k HFile bez pomoci HBase?

Pro přímý přístup k HFile bez použití HBase používáme metodu HFile.main().


29) Může být regionální server umístěn na všech DataNodes?

Ano, servery regionů běží na stejných serverech jako DataNodes


30) Pojmenujte filtr, který akceptuje velikost stránky jako parametr v HBase

Filtr s názvem PageFilter přijímá jako parametr velikost stránky.

Tento dokument byl vytvořen pomocí nástrojů pro okamžitý převod HTML.

Tyto otázky na pohovoru také pomohou ve vašem životě (ústních)