Top 30 de întrebări la interviu HBase (2025)
Iată întrebările și răspunsurile la interviu Apache HBase pentru candidații mai proaspeți, precum și cu experiență, pentru a obține jobul visat.
Întrebări și răspunsuri la interviu HBase pentru proaspete
1) Explicați Ce este HBase?
HBase este un sistem de gestionare a bazelor de date orientat pe coloane care rulează pe HDFS (Hadoop Distribute File System). HBase nu este un depozit de date relaționale și nu acceptă limbajul de interogare structurat precum SQL.
În HBase, un nod master reglează serverele de cluster și regiune pentru a stoca porțiuni din tabele și operează lucrul asupra datelor.
👉 Descărcare PDF gratuită: Întrebări și răspunsuri la interviu HBase
2) Explicați de ce să utilizați HBase?
- Sistem de stocare de mare capacitate
- Design distribuit pentru a satisface mese mari
- Magazine orientate pe coloane
- Scalabil pe orizontală
- Performanță ridicată și disponibilitate
- Scopul de bază al HBase este milioane de coloane, mii de versiuni și miliarde de rânduri
- Spre deosebire de HDFS (Hadoop Distribute File System), acesta acceptă operațiuni CRUD aleatorii în timp real
3) Menționați care sunt componentele cheie ale HBase?
Arhitectura HBase constă în principal din următoarele componente
- Ingrijitor zoo: Ea face munca de coordonare între client și HBase Maser
- HBase Master: HBase Master monitorizează serverul de regiune
- RegionServer: RegionServer monitorizează regiunea
- Regiune: Conține în stocul de date de memorie (MemStore) și Hfile.
- Tabele de catalog: Tabelele de catalog constau din ROOT și META
4) Explicați în ce constă HBase?
- HBase constă dintr-un set de mese
- Și fiecare tabel conține rânduri și coloane precum baza de date tradițională
- Fiecare tabel trebuie să conțină un element definit ca o cheie primară
- Coloana HBase denotă un atribut al unui obiect
5) Menționați câte comenzi operaționale în HBase?
Există în principal cinci tipuri de Operational comenzi în HBase:
- Obține
- Pune
- Șterge
- Scanda
- Creştere
6) Explicați ce este WAL și Hlog în HBase?
WAL (Write Ahead Log) este similar cu MySQL jurnal BIN; înregistrează toate modificările care apar în date. Este un fișier de secvență standard de Hadoop și stochează HLogkey. Aceste taste constau dintr-un număr secvențial, precum și date reale și sunt folosite pentru a reda datele care nu au fost încă persistente după o prăbușire a serverului. Deci, în caz de defecțiune a serverului, WAL funcționează ca o linie de viață și recuperează datele pierdute.
7) Când ar trebui să utilizați HBase?
- Dimensiunea datelor este mare: Când ai tone și milioane de înregistrări de operat
- Reproiectare completă: Când mutați RDBMS în HBase, îl considerați ca o reproiectare completă, apoi doar schimbarea porturilor
- SQL-Less comenzi: Aveți mai multe caracteristici, cum ar fi tranzacțiile; îmbinări interioare, coloane tastate etc.
- Investiții în infrastructură: Trebuie să aveți suficient cluster pentru ca HBase să fie cu adevărat util
8) În HBase ce este familiile de coloane?
Familiile de coloane cuprind unitatea de bază de stocare fizică în HBase căreia i se aplică caracteristici precum compresiile.
9) Explicați ce este cheia rândului?
Cheia de rând este definită de aplicație. Deoarece cheia combinată este prefixată de cheia rând, aceasta permite aplicației să definească ordinea de sortare dorită. De asemenea, permite gruparea logică a celulelor și asigurați-vă că toate celulele cu aceeași cheie de rând sunt amplasate pe același server.
10) Explicați ștergerea în HBase? Menționați care sunt cele trei tipuri de markeri pentru pietre funerare din HBase?
Când ștergeți celula din HBase, datele nu sunt de fapt șterse, dar este setat un marcator de piatră funerară, făcând celulele șterse invizibile. HBase șterse sunt de fapt eliminate în timpul compactării.
Există trei tipuri de marcatori pentru pietre funerare:
- Marcator de ștergere a versiunii: pentru ștergere, marchează o singură versiune a unei coloane
- Marcator de ștergere a coloanei: pentru ștergere, marchează toate versiunile unei coloane
- Marcator de ștergere a familiei: pentru ștergere, marchează toate coloanele pentru o familie de coloane
11) Explicați cum șterge de fapt HBase un rând?
În HBase, orice ai scrie va fi stocat de pe RAM pe disc, aceste scrieri pe disc sunt imuabile, cu excepția compactării. În timpul procesului de ștergere în HBase, procesul de compactare majoră șterge markerul, în timp ce compactările minore nu. În ștergerile normale, rezultă un marker de ștergere a pietrei funerare - aceste date de ștergere pe care le reprezintă sunt eliminate în timpul compactării.
De asemenea, dacă ștergeți date și adăugați mai multe date, dar cu o marca temporală anterioară decât marcajul de timp al pietrei funerare, mai departe Devine poate fi mascat de marcatorul de ștergere/piera funerară și, prin urmare, nu veți primi valoarea inserată decât după compactarea majoră.
12) Explicați ce se întâmplă dacă modificați dimensiunea blocului unei familii de coloane dintr-o bază de date deja ocupată?
Când modificați dimensiunea blocului familiei de coloane, noile date ocupă dimensiunea blocului nou, în timp ce datele vechi rămân în dimensiunea blocului vechi. În timpul compactării datelor, datele vechi vor lua noua dimensiune de bloc. Fișierele noi, pe măsură ce sunt eliminate, au o nouă dimensiune de bloc, în timp ce datele existente vor continua să fie citite corect. Toate datele ar trebui transformate la noua dimensiune a blocului, după următoarea compactare majoră.
13) Menționați diferența dintre HBase și baza de date relațională?
Iată câteva diferențe importante între Apache HBase și baza de date relațională:
HBase | Baza de date relațională |
---|---|
|
|
14) Ce este clasa HBaseFsck?
Există un nume de instrument numit înapoi este disponibil în HBase, care este implementat de clasa HBaseFsck. Oferă mai multe comutatoare din linia de comandă care îi influențează comportamentul.
Întrebări și răspunsuri la interviu HBase pentru cei cu experiență
15) Care sunt principalele structuri cheie ale HBase?
Cheia rând și cheia coloană sunt cele mai importante două structuri cheie utilizate în HBase
16) Discutați cum puteți utiliza filtrele în Apache HBase
Filtre în HBase Shell. A fost introdus în Apache HBase 0.92, care vă ajută să efectuați filtrarea pe partea serverului pentru accesarea HBase prin Carcasa HBase sau economii.
17) HBase suportă structura de sintaxă ca SQL da sau nu?
Nu din pacate, SQL suportul pentru HBase nu este disponibil momentan. Cu toate acestea, folosind Apache Phoenix, putem prelua date de la HBase prin interogări SQL.
18) Care este sensul compactării în HBază?
În momentul scrierilor grele primite, este imposibil să se obțină o performanță optimă având un fișier per magazin. HBase vă ajută să combinați toate aceste fișiere HF pentru a reduce numărul de semințe de disc pentru fiecare citire. Acest proces este cunoscut sub numele de Compactare în HBază.
19) Cum veți implementa asocierile în HBase?
HBase, nu acceptă alăturari direct, ci utilizări MapReduce interogările de unire a joburilor pot fi implementate prin preluarea datelor cu ajutorul diferitelor tabele HBase.
20) Explicați JMX cu privire la HBSE
Java Management Extensions sau JMX este un statut de export al Java aplicațiile este standardul pentru ei.
21) La ce folosește MasterServer?
Serverul principal vă ajută să atribuiți o regiune și serverului de regiune. De asemenea, vă ajută să gestionați echilibrarea sarcinii pe care o folosim MasterServer.
22) Definiți termenul Economie
Apache Thrift este scris în C++. Oferă compilatoare de schemă pentru diferite limbaje de programare, cum ar fi C++, Perl, PHP, Python, Ruby și multe altele.
23) De ce să folosiți HColumnDescriptsau clasa?
Detaliile referitoare la familia de coloane, cum ar fi setările de compresie, numărul de versiuni, sunt stocate .în HColumnDescriptsau.
24) Ce este o celulă în HBază?
O celulă din HBază este cea mai mică unitate a unui Masa HBase. Vă ajută să păstrați o bucată de date sub forma unui tuplu {rând, coloană, versiune}
25) Ce este un filtru Bloom?
HBase acceptă Bloom Filter vă ajută să îmbunătățiți debitul general al clusterului. Un filtru HBase Bloom este un mecanism eficient din punct de vedere al spațiului pentru a testa dacă un HFile include anumite celule rând sau rând-col.
26) Spuneți-mi despre tipurile de HBază Operațiuni?
Ans. Două tipuri de HBază Operacțiunile sunt:
- Citiți OperaTION
- Scrie OperaTION
27) La ce folosește HBase HMaster?
Principalele responsabilități ale unui master sunt:
- Coordonarea serverelor regiunii
- Funcții de administrare
28) Ce tehnică puteți folosi în HBase pentru a accesa HFile direct fără ajutorul HBase?
Pentru a accesa HFile direct fără a folosi HBase, folosim metoda HFile.main().
29) Serverul regiunii poate fi localizat pe toate nodurile de date?
Da, serverele de regiune rulează pe aceleași servere ca și DataNodes
30) Denumiți filtrul care acceptă dimensiunea paginii ca parametru în HBase
Un filtru numit PageFilter acceptă dimensiunea paginii ca parametru.
Acest document a fost compus cu instrumentele de conversie instant HTML.
Aceste întrebări de interviu vă vor ajuta, de asemenea, în viva (orale)