Топ 30 въпроса за интервю за HBase (2026)
Ето въпроси и отговори за интервю с Apache HBase за по-свежи и опитни кандидати, за да получат мечтаната работа.
Въпроси и отговори за HBase интервю за първокурсници
1) Обяснете какво е HBase?
HBase е система за управление на база данни, ориентирана към колони, която работи върху HDFS (Hadoop Distribute File System). HBase не е хранилище за релационни данни и не поддържа структуриран език за заявки като SQL.
В HBase главен възел регулира клъстера и регионалните сървъри за съхраняване на части от таблиците и управлява работата с данните.
👉 Безплатно изтегляне на PDF: HBase Интервю Въпроси и отговори
2) Обяснете защо да използвате HBase?
- Система за съхранение с голям капацитет
- Разпределен дизайн за обслужване на големи маси
- Магазини, ориентирани към колони
- Хоризонтално мащабируем
- Висока производителност и наличност
- Основната цел на HBase е милиони колони, хиляди версии и милиарди редове
- За разлика от HDFS (Hadoop Distribute File System), той поддържа произволни CRUD операции в реално време
3) Споменете кои са ключовите компоненти на HBase?
Архитектурата на HBase се състои главно от следните компоненти
- Пазач в зоопарка: Той извършва координационната работа между клиента и HBase Maser
- HBase Master: HBase Master наблюдава регионалния сървър
- RegionServer: RegionServer наблюдава региона
- област: Съдържа хранилище за данни в паметта (MemStore) и Hfile.
- Таблици в каталога: Каталожните таблици се състоят от ROOT и META

4) Обяснете от какво се състои HBase?
- HBase се състои от набор от таблици
- И всяка таблица съдържа редове и колони като традиционната база данни
- Всяка таблица трябва да съдържа елемент, дефиниран като първичен ключ
- Колоната HBase обозначава атрибут на обект
5) Споменете колко оперативни команди в HBase?
Има основно пет вида Operaналното команди в HBase:
- Обратна
- Слагам
- Изтрий
- Сканиране
- увеличение

6) Обяснете какво е WAL и Hlog в HBase?
WAL (Write Ahead Log) е подобен на MySQL BIN дневник; той записва всички промени, настъпили в данните. Това е стандартен файл с последователност от Hadoop и съхранява HLogkey. Тези ключове се състоят от пореден номер, както и от действителни данни и се използват за повторно възпроизвеждане на все още несъхранени данни след срив на сървъра. Така че, в случай на повреда на сървъра, WAL работи като спасителна линия и извлича изгубените данни.
7) Кога трябва да използвате HBase?
- Размерът на данните е огромен: Когато имате тонове и милиони записи, с които да работите
- Пълен редизайн: Когато премествате RDBMS към HBase, вие го смятате за пълен редизайн, а не просто за промяна на портовете
- SQL-Less команди: Имате няколко функции като транзакции; вътрешни съединения, въведени колони и др.
- Инвестиции в инфраструктура: Трябва да имате достатъчно клъстер, за да бъде HBase наистина полезен
8) В HBase какво са семейства колони?
Семействата колони съставляват основната единица за физическо съхранение в HBase, към която се прилагат функции като компресии.
9) Обяснете какво е ключът на реда?
Ключът на реда се дефинира от приложението. Тъй като комбинираният ключ е предварително фиксиран от ключа на реда, това позволява на приложението да дефинира желания ред на сортиране. Също така позволява логическо групиране.ping на клетки и се уверете, че всички клетки с един и същ ключ на реда са разположени на един и същ сървър.
10) Обяснете изтриването в HBase? Споменете кои са трите вида надгробни маркери в HBase?
Когато изтриете клетката в HBase, данните всъщност не се изтриват, но се задава надгробен маркер, което прави изтритите клетки невидими. Изтритите HBase всъщност се премахват по време на уплътняване.
Има три вида маркери за надгробни паметници:
- Маркер за изтриване на версия: За изтриване той маркира една версия на колона
- Маркер за изтриване на колона: За изтриване той маркира всички версии на колона
- Маркер за изтриване на семейство: За изтриване той маркира всички колони за семейство колони
11) Обяснете как всъщност HBase изтрива ред?
В HBase, каквото и да пишете, ще се съхранява от RAM на диска, тези записи на диск са неизменни, с изключение на уплътняването. По време на процеса на изтриване в HBase основният процес на уплътняване изтрива маркера, докато второстепенните уплътнения не го правят. При нормално изтриване това води до маркер за изтриване на надгробен камък - тези данни за изтриване, които представляват, се премахват по време на уплътняването.
Освен това, ако изтриете данни и добавите още данни, но с по-ранно времево клеймо от времевото клеймо на надгробната плоча, допълнително Получава може да бъде маскиран от маркера за изтриване/надгробна плоча и следователно няма да получите вмъкната стойност едва след основното уплътняване.
12) Обяснете какво се случва, ако промените размера на блока на семейство колони на вече заета база данни?
Когато промените размера на блока на семейството колони, новите данни заемат новия размер на блока, докато старите данни остават в рамките на стария размер на блока. По време на уплътняването на данни старите данни ще заемат новия размер на блока. Новите файлове, когато се изчистват, имат нов размер на блока, докато съществуващите данни ще продължат да се четат правилно. Всички данни трябва да бъдат преобразувани в новия размер на блока след следващото голямо уплътняване.
13) Споменете разликата между HBase и релационна база данни?
Ето някои важни разлики между Apache HBase и Relational Database:
| HBase | Релационна база данни |
|---|---|
|
|
14) Какво е клас HBaseFsck?
В HBase има име на инструмент, извикано обратно, което се изпълнява от класа HBaseFsck. Той предлага няколко превключвателя на командния ред, които влияят на поведението му.
HBase Интервю Въпроси и отговори за опитни
15) Какви са основните ключови структури на HBase?
Ключът за ред и ключът за колона са двете най-важни ключови структури, използвани в HBase
16) Обсъдете как можете да използвате филтри в Apache HBase
Филтри в HBase Shell. Беше въведен в Apache HBase 0.92, което ви помага да извършвате филтриране от страна на сървъра за достъп до HBase през HBase обвивка или спестовност.
17) HBase поддържа синтактична структура като SQL да или не?
не, за съжаление, SQL поддръжката за HBase не е налична в момента. Въпреки това, като използваме Apache Phoenix, можем да извлечем данни от HBase чрез SQL заявки.
18) Какво е значението на уплътняването в HBase?
По време на тежки входящи записи е невъзможно да се постигне оптимална производителност, като имате един файл на магазин. HBase ви помага да комбинирате всички тези HFiles, за да намалите броя на дисковите семена за всяко четене. Този процес е известен като уплътняване в HBase.
19) Как ще внедрите обединения в HBase?
HBase, не поддържа директно свързване, но използва MapReduce заявките за присъединяване към задания могат да бъдат реализирани чрез извличане на данни с помощта на различни HBase таблици.
20) Обяснете JMX относно HBSE
Java Разширенията за управление или JMX са състояние на експортиране на Java приложения е стандарт за тях.
21) Каква е ползата от MasterServer?
Главният сървър ви помага да зададете регион и на регионалния сървър. Също така ви помага да се справите с балансирането на натоварването, което използваме от MasterServer.
22) Дефинирайте термина спестовност
Apache Thrift е написан на C++. Той предоставя компилатори на схеми за различни езици за програмиране като C++, Perl, PHP, Python, Ruby и др.
23) Защо да използвате HColumnDescriptили клас?
Подробностите относно фамилията колони, като например настройки за компресиране, брой версии, се съхраняват в .in HColumnDescriptили.
24) Какво е клетка в HBase?
Клетка в HBase е най-малката единица на HBase таблица. Помага ви да съхранявате част от данните под формата на кортеж {ред, колона, версия}
25) Какво е Bloom филтър?
HBase поддържа Bloom Filter ви помага да подобрите общата производителност на клъстера. HBase Bloom Filter е ефективен от пространството механизъм за тестване дали HFile включва определен ред или клетка с ред-кола.
26) Разкажете ми за видовете HBase Operaции?
Отг. Два вида HBase Operaции са:
- Чети OperaАЦИ
- Пиша OperaАЦИ
27) Каква е употребата на HBase HMaster?
Основните отговорности на майстора са:
- Координиране на регионалните сървъри
- Административни функции
28) Коя техника можете да използвате в HBase за директен достъп до HFile без помощта на HBase?
За директен достъп до HFile, без да използваме HBase, използваме метода HFile.main().
29) Може ли регионалният сървър да бъде разположен на всички DataNodes?
Да, регионалните сървъри работят на същите сървъри като DataNodes
30) Дайте име на филтъра, който приема размера на страницата като параметър в HBase
Филтър с име PageFilter приема размера на страницата като параметър.
Този документ е съставен с инструментите за незабавен HTML конвертор.
Тези въпроси за интервюто също ще ви помогнат във вашата viva (устна)
