De 30 bästa HBase-intervjufrågorna (2025)

Här är Apache HBase-intervjufrågor och svar för både fräscha och erfarna kandidater att få sitt drömjobb.

 

HBase intervjufrågor och svar för nybörjare

1) Förklara vad är HBase?

HBase är ett kolumnorienterat databashanteringssystem som körs ovanpå HDFS (Hadoop Distribute File System). HBase är inte ett relationsdatalager, och det stöder inte strukturerat frågespråk som SQL.

I HBase reglerar en masternod kluster- och regionservrarna för att lagra delar av tabellerna och sköter arbetet med data.

👉 Gratis PDF-nedladdning: HBase-intervjufrågor och svar


2) Förklara varför man använder HBase?

  • Lagringssystem med hög kapacitet
  • Distribuerad design för att tillgodose stora bord
  • Kolumnorienterade butiker
  • Horisontellt skalbar
  • Hög prestanda och tillgänglighet
  • Grundmålet för HBase är miljontals kolumner, tusentals versioner och miljarder rader
  • Till skillnad från HDFS (Hadoop Distribute File System) stöder det slumpmässiga CRUD-operationer i realtid

3) Nämn vilka är nyckelkomponenterna i HBase?

HBase-arkitekturen består huvudsakligen av följande komponenter

  • Djurskötare: Den utför samordningsarbetet mellan klient och HBase Maser
  • HBase Master: HBase Master övervakar regionservern
  • RegionServer: RegionServer övervakar regionen
  • Region: Den innehåller i minnet datalager (MemStore) och Hfile.
  • Katalogtabeller: Katalogtabeller består av ROOT och META
HBase ArchiTecture Diagram
HBase ArchiTecture Diagram

4) Förklara vad består HBase av?

  • HBase består av en uppsättning tabeller
  • Och varje tabell innehåller rader och kolumner som en traditionell databas
  • Varje tabell måste innehålla ett element definierat som en primärnyckel
  • HBase-kolumnen anger ett attribut för ett objekt

5) Nämn hur många operativa kommandon i HBase?

Det finns främst fem typer av Operationell kommandon i HBase:

  • Skaffa sig
  • Sätta
  • Radera
  • scan
  • Ökning
HBase intervjufrågor
HBase intervjufrågor

6) Förklara vad är WAL och Hlog i HBase?

WAL (Write Ahead Log) liknar MySQL BIN-logg; den registrerar alla förändringar som sker i data. Det är en standardsekvensfil av Hadoop och den lagrar HLogkey's. Dessa nycklar består av ett sekventiellt nummer samt faktiska data och används för att spela upp data som ännu inte finns kvar efter en serverkrasch. Så, kontant efter serverfel fungerar WAL som en livlina och hämtar förlorad data.


7) När ska du använda HBase?

  • Datastorleken är enorm: När du har ton och miljontals poster att använda
  • Komplett omdesign: När du flyttar RDBMS till HBase, betraktar du det som en komplett omdesign och sedan bara att byta portar
  • SQL-Less kommandon: Du har flera funktioner som transaktioner; inre sammanfogningar, maskinskrivna kolumner, etc.
  • Infrastrukturinvesteringar: Du måste ha tillräckligt med kluster för att HBase ska vara riktigt användbart

8) Vad är kolumnfamiljer i HBase?

Kolumnfamiljer utgör den grundläggande enheten för fysisk lagring i HBase som funktioner som komprimering tillämpas på.


9) Förklara vad är radnyckeln?

Radnyckel definieras av applikationen. Eftersom den kombinerade nyckeln är prefixerad av radtangenten, gör den det möjligt för applikationen att definiera önskad sorteringsordning. Det tillåter också logisk gruppering av celler och se till att alla celler med samma radnyckel är samlokaliserade på samma server.


10) Förklara radering i HBase? Nämn vilka är de tre typerna av gravstensmarkörer i HBase?

När du raderar cellen i HBase raderas inte data faktiskt utan en gravstensmarkör ställs in, vilket gör de raderade cellerna osynliga. HBase raderade tas faktiskt bort under packningar.

Det finns tre typer av gravstensmarkörer:

  • Versionsborttagningsmarkör: För radering markerar den en enda version av en kolumn
  • Kolumnborttagningsmarkör: För radering markerar den alla versioner av en kolumn
  • Familjeborttagningsmarkör: För radering markerar den alla kolumner för en kolumnfamilj

11) Förklara hur HBase faktiskt tar bort en rad?

I HBase, vad du än skriver kommer att lagras från RAM till disk, dessa diskskrivningar är oföränderliga med undantag för komprimering. Under raderingsprocessen i HBase raderar större packningsprocess markör medan mindre packningar inte gör det. Vid normala borttagningar resulterar det i en raderingsmarkör för gravsten - dessa raderingsdata som de representerar tas bort under komprimering.

Dessutom, om du tar bort data och lägger till mer data, men med en tidigare tidsstämpel än gravstenens tidsstämpel, får kan maskeras av raderings-/gravstensmarkören och du kommer därför inte att få det infogade värdet förrän efter den stora packningen.


12) Förklara vad som händer om du ändrar blockstorleken för en kolumnfamilj på en redan upptagen databas?

När du ändrar blockstorleken för kolumnfamiljen, upptar den nya data den nya blockstorleken medan den gamla data förblir inom den gamla blockstorleken. Under datakomprimering kommer gamla data att få den nya blockstorleken. Nya filer när de rensas har en ny blockstorlek medan befintliga data fortsätter att läsas korrekt. All data bör omvandlas till den nya blockstorleken, efter nästa större komprimering.


13) Nämn skillnaden mellan HBase och Relational Database?

Här är några viktiga skillnader mellan Apache HBase och Relational Database:

HBase Relationsdatabas
  • Det är schemalöst
  • Det är ett kolumnorienterat datalager
  • Den används för att lagra avnormaliserade data
  • Den innehåller glest befolkade tabeller
  • Automatiserad partitionering görs i HBase
  • Det är en schemabaserad databas
  • Det är ett radorienterat datalager
  • Den används för att lagra normaliserade data
  • Den innehåller tunna tabeller
  • Det finns ingen sådan bestämmelse eller inbyggt stöd för partitionering

14) Vad är HBaseFsck-klass?

Det finns ett verktygsnamn som kallas tillbaka är tillgängligt i HBase, som implementeras av klassen HBaseFsck. Den erbjuder flera kommandoradsväxlar som påverkar dess beteende.


HBase intervjufrågor och svar för erfarna

15) Vilka är de viktigaste nyckelstrukturerna för HBase?

Radnyckel och kolumnnyckel är de två viktigaste nyckelstrukturerna som används i HBase


16) Diskutera hur du kan använda filter i Apache HBase

Filter i HBase Shell. Det introducerades i Apache HBase 0.92 som hjälper dig att utföra filtrering på serversidan för att komma åt HBase över HBase skal eller sparsamhet.


17) HBase stödjer syntaxstruktur som SQL ja eller nej?

Nej tyvärr, SQL stöd för HBase är inte tillgängligt för närvarande. Men genom att använda Apache Phoenix kan vi hämta data från HBase genom SQL-frågor.


18) Vad är innebörden av komprimering i HBase?

Vid tidpunkten för tunga inkommande skrivningar är det omöjligt att uppnå optimal prestanda genom att ha en fil per butik. HBase hjälper dig att kombinera alla dessa HFiles för att minska antalet diskfrön för varje läsning. Denna process är känd som komprimering i HBase.


19) Hur kommer du att implementera anslutningar i HBase?

HBase, inte stöd går direkt men använder MapReduce jobb join-frågor kan implementeras genom att hämta data med hjälp av olika HBase-tabeller.


20) Förklara JMX angående HBSE

Java Management Extensions eller JMX är en exportstatus för Java applikationer är standarden för dem.


21) Vad är användningen av MasterServer?

Master server hjälper dig att tilldela en region till regionservern också. Det hjälper dig också att hantera lastbalanseringen vi använder MasterServer.


22) Definiera termen sparsamhet

Apache Thrift är skrivet i C++. Det tillhandahåller schemakompilatorer för olika programmeringsspråk som C++, Perl, PHP, Python, Ruby och mer.


23) Varför använda HColumnDescripteller klass?

Detalj om kolumnfamilj som komprimeringsinställningar, Antal versioner, lagras .i HColumnDescripteller.


24) Vad är en cell i HBase?

En cell i HBase är den minsta enheten av en HBase tabell. Det hjälper dig att hålla en bit data i form av en tuppel{rad, kolumn, version}


25) Vad är ett Bloom-filter?

HBase stöder Bloom Filter hjälper dig att förbättra den totala genomströmningen av klustret. Ett HBase Bloom Filter är en utrymmeseffektiv mekanism för att testa om en HF-fil innehåller en viss rad- eller rad-kolcell.


26) Berätta för mig om typerna av HBase Operationer?

Ans. Två typer av HBase Operationerna är:

  • Läsa Operation
  • Skriva Operation

27) Vad är användningen av HBase HMaster?

Huvudansvaret för en mästare är:

  1. Koordinering av regionservrarna
  2. Admin funktioner

28) Vilken teknik kan du använda i HBase för att komma åt HFile direkt utan hjälp av HBase?

För att komma åt HFile direkt utan att använda HBase använder vi metoden HFile.main().


29) Kan regionservern finnas på alla DataNodes?

Ja, regionservrar körs på samma servrar som en DataNodes


30) Namnge filtret som accepterar sidstorleken som parameter i HBase

Ett filter med namnet PageFilter accepterar sidstorleken som parameter.

Det här dokumentet har skapats med verktygen för omedelbar HTML-konvertering.

Dessa intervjufrågor kommer också att hjälpa dig i din viva (orals)