Top 30 HBase-interviewvragen (2024)

Hier zijn Apache HBase-sollicitatievragen en -antwoorden voor nieuwere en ervaren kandidaten om hun droombaan te krijgen.

 

HBase-interviewvragen en -antwoorden voor eerstejaarsstudenten

1) Leg uit wat is HBase?

HBase is een kolomgeoriënteerd databasebeheersysteem dat bovenop HDFS (Hadoop Distribute File System) draait. HBase is geen relationele gegevensopslag en ondersteunt geen gestructureerde querytaal zoals SQL.

In HBase regelt een masternode de cluster- en regioservers om delen van de tabellen op te slaan en het werk aan de gegevens uit te voeren.

👉 Gratis pdf-download: vragen en antwoorden over HBase-interviews


2) Leg uit waarom u HBase moet gebruiken?

  • Opslagsysteem met hoge capaciteit
  • Gedistribueerd ontwerp voor grote tafels
  • Kolomgeoriënteerde winkels
  • Horizontaal schaalbaar
  • Hoge prestaties en beschikbaarheid
  • Het basisdoel van HBase is miljoenen kolommen, duizenden versies en miljarden rijen
  • In tegenstelling tot HDFS (Hadoop Distribute File System) ondersteunt het willekeurige realtime CRUD-bewerkingen

3) Noem wat de belangrijkste componenten van HBase zijn?

HBase-architectuur bestaat voornamelijk uit following componenten

  • Dierentuinmedewerker: Het doet het coördinatiewerk tussen de klant en HBase Maser
  • HBase-master: HBase Master bewaakt de regioserver
  • RegioServer: RegionServer bewaakt de regio
  • Regio: Het bevat in het geheugen gegevensopslag (MemStore) en Hfile.
  • Catalogustabellen: Catalogustabellen bestaan ​​uit ROOT en META
HBase-architectuurdiagram
HBase-architectuurdiagram

4) Leg uit waaruit HBase bestaat?

  • HBase bestaat uit een set tafels
  • En elke tabel bevat rijen en kolommen zoals een traditionele database
  • Elke tabel moet een element bevatten dat is gedefinieerd als een primaire sleutel
  • De HBase-kolom geeft een attribuut van een object aan

5) Vermeld hoeveel operationele commando's er in HBase zijn?

Er zijn hoofdzakelijk vijf soorten Operationeel opdrachten in HBase:

  • Krijgen
  • Zetten
  • Verwijder
  • aftasten
  • aanwas
HBase-interviewvragen
HBase-interviewvragen

6) Leg uit wat WAL en Hlog in HBase zijn?

WAL (Write Ahead Log) is vergelijkbaar met het MySQL BIN-logboek; het registreert alle veranderingen die zich in de gegevens voordoen. Het is een standaard sequentiebestand van Hadoop en het slaat HLogkey's op. Deze sleutels bestaan ​​uit een volgnummer en feitelijke gegevens en worden gebruikt om nog niet bewaarde gegevens opnieuw af te spelen na een servercrash. Dus bij een serverstoring werkt WAL als een reddingslijn en haalt de verloren gegevens op.


7) Wanneer moet u HBase gebruiken?

  • De gegevensomvang is enorm: Wanneer u tonnen en miljoenen records moet beheren
  • Compleet herontwerp: Wanneer u RDBMS naar HBase verplaatst, beschouwt u het als een compleet nieuw ontwerp en hoeft u alleen maar de poorten te wijzigen
  • SQL-minder opdrachten: Je hebt verschillende functies zoals transacties; inner joins, getypte kolommen, enz.
  • Investering in infrastructuur: U moet voldoende cluster hebben om HBase echt nuttig te laten zijn

8) Wat zijn kolomfamilies in HBase?

Kolomfamilies vormen de basiseenheid van fysieke opslag in HBase waarop functies zoals compressies worden toegepast.


9) Leg uit wat de rijsleutel is?

Rijsleutel wordt gedefinieerd door de toepassing. Omdat de gecombineerde sleutel vooraf wordt vastgelegd door de rijtoets, kan de toepassing de gewenste sorteervolgorde definiëren. Het maakt ook logische groepering van cellen mogelijk en zorgt ervoor dat alle cellen met dezelfde rijsleutel zich op dezelfde server bevinden.


10) Verklaar de verwijdering in HBase? Noem wat de drie soorten grafsteenmarkeringen zijn in HBase?

Wanneer u de cel in HBase verwijdert, worden de gegevens niet daadwerkelijk verwijderd, maar wordt er een tombstone-markering geplaatst, waardoor de verwijderde cellen onzichtbaar worden. Verwijderde HBase worden daadwerkelijk verwijderd tijdens het comprimeren.

Er zijn drie soorten grafsteenmarkeringen:

  • Versieverwijderingsmarkering: voor verwijdering markeert deze een enkele versie van een kolom
  • Markering voor kolomverwijdering: voor verwijdering markeert deze alle versies van een kolom
  • Markering voor verwijderen van familie: voor verwijdering worden alle kolommen voor een kolomfamilie gemarkeerd

11) Leg uit hoe HBase een rij daadwerkelijk verwijdert?

In HBase wordt alles wat u schrijft, van RAM naar schijf opgeslagen. Deze schijfschrijfbewerkingen zijn onveranderlijk, behoudens compactie. Tijdens het verwijderingsproces in HBase verwijdert het grote verdichtingsproces de markering, terwijl kleine verdichtingen dat niet doen. Bij normale verwijderingen resulteert dit in een verwijderingsgrafsteenmarkering. Deze verwijderingsgegevens die zij vertegenwoordigen, worden verwijderd tijdens het comprimeren.

Als u gegevens verwijdert en meer gegevens toevoegt, maar met een eerdere tijdstempel dan de tombstone-tijdstempel, Krijgt kan worden gemaskeerd door de verwijder-/tombstone-markering en daarom ontvangt u de ingevoegde waarde pas na de grote verdichting.


12) Leg uit wat er gebeurt als je de blokgrootte van een kolomfamilie in een reeds bezette database wijzigt?

Wanneer u de blokgrootte van de kolomfamilie wijzigt, nemen de nieuwe gegevens de nieuwe blokgrootte in beslag, terwijl de oude gegevens binnen de oude blokgrootte blijven. Tijdens het comprimeren van gegevens krijgen oude gegevens de nieuwe blokgrootte. Nieuwe bestanden krijgen, zodra ze worden leeggemaakt, een nieuwe blokgrootte, terwijl bestaande gegevens correct blijven worden gelezen. Alle gegevens moeten na de volgende grote verdichting worden getransformeerd naar de nieuwe blokgrootte.


13) Noem het verschil tussen HBase en Relationele Database?

Hier zijn enkele belangrijke verschillen tussen Apache HBase en Relationele Database:

HBase Relationele database
  • Het is schemaloos
  • Het is een kolomgeoriënteerde gegevensopslag
  • Het wordt gebruikt om gedenormaliseerde gegevens op te slaan
  • Het bevat dunbevolkte tabellen
  • Geautomatiseerde partitionering gebeurt in HBase
  • Het is een schemagebaseerde database
  • Het is een rijgeoriënteerde gegevensopslag
  • Het wordt gebruikt om genormaliseerde gegevens op te slaan
  • Het bevat dunne tabellen
  • Er bestaat geen dergelijke voorziening of ingebouwde ondersteuning voor partitionering

14) Wat is de HBaseFsck-klasse?

Er is een teruggeroepen toolnaam beschikbaar in HBase, die wordt geïmplementeerd door de klasse HBaseFsck. Het biedt verschillende opdrachtregelopties die het gedrag ervan beïnvloeden.


HBase-interviewvragen en antwoorden voor ervaren

15) Wat zijn de belangrijkste sleutelstructuren van HBase?

Rijsleutel en Kolomsleutel zijn de twee belangrijkste sleutelstructuren die in HBase worden gebruikt


16) Bespreek hoe u filters kunt gebruiken in Apache HBase

Filters in HBase-shell. Het werd geïntroduceerd in Apache HBase 0.92, waarmee u server-side filtering kunt uitvoeren voor toegang tot HBase via HBase-schaal of spaarzaamheid.


17) HBase ondersteunt syntaxisstructuur zoals SQL ja of nee?

Nee helaas, SQL ondersteuning voor HBase is momenteel niet beschikbaar. Door Apache Phoenix te gebruiken, kunnen we echter gegevens uit HBase ophalen via SQL-query's.


18) Wat is de betekenis van compactie in HBase?

Op het moment dat er veel binnenkomende schrijfbewerkingen plaatsvinden, is het onmogelijk om optimale prestaties te bereiken door één bestand per winkel te hebben. HBase helpt u al deze HFiles te combineren om het aantal schijfzaden voor elke leesbewerking te verminderen. Dit proces staat bekend als Compaction in HBase.


19) Hoe gaat u joins in HBase implementeren?

HBase ondersteunt niet rechtstreeks joins, maar gebruikt KaartVerminderen Jobs join-query's kunnen worden geïmplementeerd door gegevens op te halen met behulp van verschillende HBase-tabellen.


20) Leg JMX uit met betrekking tot HBSE

Java Management Extensions of JMX is een exportstatus van Java-applicaties die daarvoor de standaard is.


21) Wat is het nut van MasterServer?

Master-server helpt u ook bij het toewijzen van een regio aan de regioserver. Het helpt u ook bij het afhandelen van de taakverdeling. Wij gebruiken de MasterServer.


22) Definieer de term spaarzaamheid

Apache Thrift is geschreven C + +. Het biedt schemacompilers voor verschillende programmeertalen zoals C++, Perl, PHP, Python, Ruby en meer.


23) Waarom de klasse HColumnDescriptor gebruiken?

De details met betrekking tot de kolomfamilie, zoals compressie-instellingen en aantal versies, worden opgeslagen in HColumnDescriptor.


24) Wat is een cel in HBase?

Een cel in HBase is de kleinste eenheid van een HBase-tabel. Het helpt u een stukje gegevens vast te houden in de vorm van een tuple{row, column,version}


25) Wat is een bloeifilter?

HBase ondersteunt Bloom Filter helpt u de algehele doorvoer van het cluster te verbeteren. Een HBase Bloom Filter is een ruimtebesparend mechanisme om te testen of een HFile een bepaalde rij- of rij-col-cel bevat.


26) Vertel mij over de soorten HBase-bewerkingen?

Ant. Er zijn twee typen HBase-bewerkingen:

  • Lees bewerking
  • Schrijfbewerking

27) Wat is het nut van HBase HMaster?

De belangrijkste verantwoordelijkheden van een master zijn:

  1. Coördineren van de regioservers
  2. Administratieve functies

28) Welke techniek kunt u in HBase gebruiken om rechtstreeks toegang te krijgen tot HFile zonder de hulp van HBase?

Om rechtstreeks toegang te krijgen tot HFile zonder HBase te gebruiken, gebruiken we de methode HFile.main().


29) Kan de regioserver zich op alle DataNodes bevinden?

Ja, regioservers draaien op dezelfde servers als DataNodes


30) Geef het filter dat de paginagrootte accepteert een naam als parameter in HBase

Een filter met de naam PageFilter accepteert het paginaformaat als parameter.

Dit document is samengesteld met de instant HTML-conversietools.

Deze interviewvragen zullen ook helpen bij je viva (oralen)