30 nejčastějších otázek k rozhovoru s HBase (2025)
Zde jsou otázky a odpovědi na pohovor Apache HBase pro čerstvé i zkušené kandidáty, aby získali svou vysněnou práci.
Otázky a odpovědi k pohovoru HBase pro Freshers
1) Vysvětlete, co je HBase?
HBase je sloupcový systém správy databází, který běží nad HDFS (Hadoop Distribute File System). HBase není úložiště relačních dat a nepodporuje strukturovaný dotazovací jazyk, jako je SQL.
V HBase hlavní uzel reguluje servery clusteru a regionů tak, aby ukládaly části tabulek a provozuje práci s daty.
👉 Zdarma ke stažení PDF: HBase Interview Questions & Answers
2) Vysvětlete, proč používat HBase?
- Vysokokapacitní úložný systém
- Distribuovaný design pro velké stoly
- Obchody zaměřené na sloupce
- Horizontálně škálovatelné
- Vysoký výkon a dostupnost
- Základním cílem HBase jsou miliony sloupců, tisíce verzí a miliardy řádků
- Na rozdíl od HDFS (Hadoop Distribute File System) podporuje náhodné operace CRUD v reálném čase
3) Uveďte, jaké jsou klíčové komponenty HBase?
Architektura HBase se skládá převážně z následujících komponent
- Ošetřovatel v zoo: Provádí koordinační práci mezi klientem a HBase Maser
- HBase Master: HBase Master monitoruje server regionu
- RegionServer: RegionServer monitoruje region
- Kraj: Obsahuje v paměti úložiště dat (MemStore) a Hfile.
- Katalogové tabulky: Katalogové tabulky se skládají z ROOT a META

4) Vysvětlete, z čeho se skládá HBase?
- HBase se skládá ze sady tabulek
- A každá tabulka obsahuje řádky a sloupce jako tradiční databáze
- Každá tabulka musí obsahovat prvek definovaný jako primární klíč
- Sloupec HBase označuje atribut objektu
5) Uveďte, kolik operačních příkazů v HBase?
Existuje hlavně pět typů OperaTional příkazy v HBase:
- Získejte
- dát
- Vymazat
- Skenovat
- Přírůstek

6) Vysvětlete, co je WAL a Hlog v HBase?
WAL (Write Ahead Log) je podobný MySQL deník BIN; zaznamenává všechny změny v datech. Je to standardní sekvenční soubor od Hadoop a ukládá HLogkey's. Tyto klíče se skládají z pořadového čísla i skutečných dat a používají se k přehrání dosud neuchovaných dat po havárii serveru. Takže v hotovosti v případě selhání serveru WAL funguje jako záchranné lano a obnovuje ztracená data.
7) Kdy byste měli používat HBase?
- Velikost dat je obrovská: Když máte k provozu tuny a miliony záznamů
- Kompletní redesign: Když přesouváte RDBMS na HBase, považujete to za kompletní přepracování, než jen za změnu portů
- SQL-Less příkazy: Máte několik funkcí, jako jsou transakce; vnitřní spojení, typované sloupce atd.
- Investice do infrastruktury: Aby byl HBase opravdu užitečný, musíte mít dostatek clusteru
8) Co jsou rodiny sloupců v HBase?
Rodiny sloupců tvoří základní jednotku fyzického úložiště v HBase, na kterou jsou aplikovány funkce jako komprese.
9) Vysvětlete, co je klíč řádku?
Klíč řádku je definován aplikací. Vzhledem k tomu, že kombinovaný klíč je přednastaven pomocí klíče řádku, umožňuje aplikaci definovat požadované pořadí řazení. Umožňuje také logické seskupování buněk a zajišťuje, že všechny buňky se stejným klíčem řádku jsou umístěny na stejném serveru.
10) Vysvětlete smazání v HBase? Uveďte, jaké jsou tři typy značek náhrobků v HBase?
Když odstraníte buňku v HBase, data se ve skutečnosti neodstraní, ale nastaví se značka náhrobek, takže odstraněné buňky budou neviditelné. Odstraněné HBase jsou ve skutečnosti odstraněny během komprimace.
Existují tři typy značek náhrobků:
- Značka odstranění verze: Pro odstranění označí jednu verzi sloupce
- Značka odstranění sloupce: Pro odstranění označí všechny verze sloupce
- Značka odstranění rodiny: Pro odstranění označí všechny sloupce pro rodinu sloupců
11) Vysvětlete, jak HBase skutečně odstraní řádek?
V HBase bude vše, co zapíšete, uloženo z RAM na disk, tyto zápisy na disk jsou neměnné s výjimkou komprimace. Během procesu mazání v HBase proces hlavní komprimace odstraní značku, zatímco menší komprimace nikoli. Při normálním mazání to má za následek značku náhrobku pro odstranění – tato odstraněná data, která představují, jsou odstraněna během komprimace.
Pokud také odstraníte data a přidáte další data, ale s dřívějším časovým razítkem než časové razítko na náhrobku, Získá mohou být maskovány značkou odstranění/náhrobního kamene, a proto vloženou hodnotu obdržíte až po hlavním zhutnění.
12) Vysvětlete, co se stane, když změníte velikost bloku rodiny sloupců v již obsazené databázi?
Když změníte velikost bloku rodiny sloupců, nová data zaberou novou velikost bloku, zatímco stará data zůstanou v rámci staré velikosti bloku. Během komprimace dat budou mít stará data velikost nového bloku. Nové soubory, když jsou vyprázdněny, mají novou velikost bloku, zatímco existující data se budou i nadále správně číst. Všechna data by měla být po dalším velkém zhutnění převedena na novou velikost bloku.
13) Uveďte rozdíl mezi HBase a Relational Database?
Zde jsou některé důležité rozdíly mezi Apache HBase a Relational Database:
HBase | Relační databáze |
---|---|
|
|
14) Co je třída HBaseFsck?
V HBase je k dispozici název nástroje s názvem back, který je implementován třídou HBaseFsck. Nabízí několik přepínačů příkazového řádku, které ovlivňují jeho chování.
Otázky a odpovědi na pohovor HBase pro zkušené
15) Jaké jsou hlavní klíčové struktury HBase?
Klíč řádku a klíč sloupce jsou dvě nejdůležitější klíčové struktury používané v HBase
16) Diskutujte o tom, jak můžete používat filtry v Apache HBase
Filtry v HBase Shell. Byl představen v Apache HBase 0.92, který vám pomáhá provádět filtrování na straně serveru pro přístup k HBase přes HBase shell nebo šetrnost.
17) HBase podporuje strukturu syntaxe jako SQL ano nebo ne?
Bohužel ne, SQL podpora pro HBase aktuálně není k dispozici. Pomocí Apache Phoenix však můžeme načíst data z HBase prostřednictvím SQL dotazů.
18) Co znamená zhutnění v HBase?
V době velkých příchozích zápisů není možné dosáhnout optimálního výkonu tím, že budete mít jeden soubor na úložiště. HBase vám pomůže zkombinovat všechny tyto soubory HFiles, aby se snížil počet semenů disku pro každé čtení. Tento proces je v HBase známý jako zhutňování.
19) Jak budete implementovat spojení v HBase?
HBase se nepodporují přímo, ale používají MapReduce Dotazy na připojení úloh lze implementovat načítáním dat pomocí různých tabulek HBase.
20) Vysvětlete JMX ohledně HBSE
Java Management Extensions nebo JMX je stav exportu Java aplikace je pro ně standardem.
21) Jaké je použití MasterServeru?
Hlavní server vám také pomůže přiřadit region k serveru regionu. Pomůže vám také zvládnout vyrovnávání zátěže, které používáme na MasterServeru.
22) Definujte pojem šetrnost
Je napsáno Apache Thrift C++. Poskytuje kompilátory schémat pro různé programovací jazyky jako C++, Perl, PHP, Python, Ruby a další.
23) Proč používat HColumnDescriptnebo třída?
Podrobnosti týkající se rodiny sloupců, jako je nastavení komprese, Počet verzí, jsou uloženy v příponě HColumnDescriptnebo.
24) Co je buňka v HBase?
Buňka v HBase je nejmenší jednotkou an HZákladní tabulka. Pomůže vám uchovávat část dat ve formě n-tice {řádek, sloupec, verze}
25) Co je Bloomův filtr?
HBase podporuje Bloom Filter vám pomůže zlepšit celkovou propustnost clusteru. HBase Bloom Filter je prostorově efektivní mechanismus pro testování, zda soubor HF obsahuje určitý řádek nebo buňku řádku-sloupce.
26) Řekněte mi o typech HBase Operations?
Ans. Dva typy HBase Operato jsou:
- číst Operavání
- Napsat Operavání
27) Jaké je použití HBase HMaster?
Hlavní povinnosti mistra jsou:
- Koordinace regionálních serverů
- Funkce správce
28) Jakou techniku můžete použít v HBase pro přímý přístup k HFile bez pomoci HBase?
Pro přímý přístup k HFile bez použití HBase používáme metodu HFile.main().
29) Může být regionální server umístěn na všech DataNodes?
Ano, servery regionů běží na stejných serverech jako DataNodes
30) Pojmenujte filtr, který akceptuje velikost stránky jako parametr v HBase
Filtr s názvem PageFilter přijímá jako parametr velikost stránky.
Tento dokument byl vytvořen pomocí nástrojů pro okamžitý převod HTML.
Tyto otázky na pohovoru také pomohou ve vašem životě (ústních)