Die 30 wichtigsten HBase-Interviewfragen (2024)

Hier finden Sie Fragen und Antworten zu Apache HBase-Interviews für neue und erfahrene Kandidaten, die ihren Traumjob bekommen möchten.

 

Fragen und Antworten zum HBase-Interview für Erstsemester

1) Erklären Sie, was HBase ist?

HBase ist ein spaltenorientiertes Datenbankverwaltungssystem, das auf HDFS (Hadoop Distribute File System) läuft. HBase ist kein relationaler Datenspeicher und unterstützt keine strukturierte Abfragesprache wie SQL.

In HBase reguliert ein Masterknoten die Cluster- und Regionsserver zum Speichern von Teilen der Tabellen und führt die Arbeit an den Daten durch.

👉Kostenloser PDF-Download: Fragen und Antworten zum HBase-Interview


2) Erklären Sie, warum HBase verwendet werden sollte.

  • Speichersystem mit hoher Kapazität
  • Verteiltes Design für große Tische
  • Spaltenorientierte Geschäfte
  • Horizontal skalierbar
  • Hohe Leistung und Verfügbarkeit
  • Das Grundziel von HBase sind Millionen von Spalten, Tausende von Versionen usw billIonen von Reihen
  • Im Gegensatz zu HDFS (Hadoop Distribute File System) unterstützt es zufällige Echtzeit-CRUD-Operationen

3) Erwähnen Sie, was die Schlüsselkomponenten von HBase sind?

HBase archiDie Tektur besteht hauptsächlich aus Following Komponenten

  • Tierpfleger: Es übernimmt die Koordinationsarbeit zwischen Client und HBase Maser
  • HBase-Master: HBase Master überwacht den Regionsserver
  • RegionServer: RegionServer überwacht die Region
  • Region: Es enthält einen Speicherdatenspeicher (MemStore) und eine H-Datei.
  • Katalogtische: Katalogtabellen bestehen aus ROOT und META
HBase ArchiStrukturdiagramm
HBase ArchiStrukturdiagramm

4) Erklären Sie, woraus HBase besteht?

  • HBase besteht aus einer Reihe von Tabellen
  • Und jede Tabelle enthält Zeilen und Spalten wie eine herkömmliche Datenbank
  • Jede Tabelle muss ein als Primärschlüssel definiertes Element enthalten
  • Die HBase-Spalte bezeichnet ein Attribut eines Objekts

5) Erwähnen Sie, wie viele Betriebsbefehle in HBase vorhanden sind?

Es gibt hauptsächlich fünf Arten von Operationen Befehle in HBase:

  • Erhalten Sie
  • setzen
  • Löschen
  • Scan
  • Inkrementieren
Fragen zum HBase-Interview
Fragen zum HBase-Interview

6) Erklären Sie, was WAL und Hlog in HBase sind.

WAL (Write Ahead Log) ähnelt dem MySQL BIN-Protokoll. Es zeichnet alle in den Daten auftretenden Änderungen auf. Es handelt sich um eine Standardsequenzdatei von Hadoop und es speichert HLogkeys. Diese Schlüssel bestehen aus einer fortlaufenden Nummer sowie tatsächlichen Daten und dienen der Wiedergabe noch nicht persistierter Daten nach einem Serverabsturz. Im Falle eines Serverausfalls fungiert WAL also als Lebensader und stellt die verlorenen Daten wieder her.


7) Wann sollten Sie HBase verwenden?

  • Die Datenmenge ist riesig: Wenn Sie Tonnen und Millionen von Datensätzen verwalten müssen
  • Komplette Neugestaltung: Wenn Sie ein RDBMS auf HBase umstellen, betrachten Sie dies als eine komplette Neugestaltung und nicht nur als eine bloße Änderung der Ports
  • SQL-lose Befehle: Sie haben mehrere Funktionen wie Transaktionen; innere Verknüpfungen, typisierte Spalten usw.
  • Infrastrukturinvestitionen: Damit HBase wirklich nützlich ist, müssen Sie über genügend Cluster verfügen

8) Was sind in HBase Spaltenfamilien?

Spaltenfamilien bilden die Grundeinheit des physischen Speichers in HBase, auf die Funktionen wie Komprimierungen angewendet werden.


9) Erklären Sie, was der Zeilenschlüssel ist.

Der Zeilenschlüssel wird von der Anwendung definiert. Da dem kombinierten Schlüssel der Zeilenschlüssel vorangestellt ist, kann die Anwendung die gewünschte Sortierreihenfolge definieren. Es ermöglicht außerdem die logische Gruppierung von Zellen und stellt sicher, dass sich alle Zellen mit demselben Zeilenschlüssel auf demselben Server befinden.


10) Erklären Sie das Löschen in HBase? Erwähnen Sie, welche drei Arten von Tombstone-Markierungen es in HBase gibt?

Wenn Sie die Zelle in HBase löschen, werden die Daten nicht tatsächlich gelöscht, sondern es wird eine Tombstone-Markierung gesetzt, die die gelöschten Zellen unsichtbar macht. Gelöschte HBase werden tatsächlich während der Komprimierung entfernt.

Es gibt drei Arten von Grabsteinmarkierungen:

  • Versionslöschmarkierung: Zum Löschen markiert sie eine einzelne Version einer Spalte
  • Spaltenlöschmarkierung: Zum Löschen werden alle Versionen einer Spalte markiert
  • Familienlöschmarkierung: Zum Löschen werden alle Spalten einer Spaltenfamilie markiert

11) Erklären Sie, wie HBase tatsächlich eine Zeile löscht?

In HBase wird alles, was Sie schreiben, vom RAM auf die Festplatte gespeichert. Diese Schreibvorgänge auf die Festplatte sind unveränderlich, abgesehen von der Komprimierung. Während des Löschvorgangs in HBase löscht der Hauptkomprimierungsprozess die Markierung, während dies bei kleineren Komprimierungen nicht der Fall ist. Bei normalen Löschvorgängen führt dies zu einer Lösch-Tombstone-Markierung – diese Löschdaten, die sie darstellen, werden während der Komprimierung entfernt.

Auch wenn Sie Daten löschen und weitere Daten hinzufügen, jedoch mit einem früheren Zeitstempel als dem Tombstone-Zeitstempel, weiter Ruft kann durch die Lösch-/Tombstone-Markierung maskiert sein und daher erhalten Sie den eingefügten Wert erst nach der größeren Komprimierung.


12) Erklären Sie, was passiert, wenn Sie die Blockgröße einer Spaltenfamilie in einer bereits belegten Datenbank ändern?

Wenn Sie die Blockgröße der Spaltenfamilie ändern, belegen die neuen Daten die neue Blockgröße, während die alten Daten innerhalb der alten Blockgröße bleiben. Während der Datenkomprimierung nehmen alte Daten die neue Blockgröße an. Neue Dateien haben beim Leeren eine neue Blockgröße, während vorhandene Daten weiterhin korrekt gelesen werden. Alle Daten sollten nach der nächsten großen Komprimierung in die neue Blockgröße umgewandelt werden.


13) Erwähnen Sie den Unterschied zwischen HBase und relationaler Datenbank?

Hier sind einige wichtige Unterschiede zwischen Apache HBase und relationaler Datenbank:

HBase Relationale Datenbank
  • Es ist schemalos
  • Es handelt sich um einen spaltenorientierten Datenspeicher
  • Es wird zum Speichern denormalisierter Daten verwendet
  • Es enthält dünn besiedelte Tabellen
  • Die automatisierte Partitionierung erfolgt in HBase
  • Es handelt sich um eine schemabasierte Datenbank
  • Es handelt sich um einen zeilenorientierten Datenspeicher
  • Es wird zum Speichern normalisierter Daten verwendet
  • Es enthält dünne Tabellen
  • Es gibt keine solche Bereitstellung oder integrierte Unterstützung für die Partitionierung

14) Was ist die HBaseFsck-Klasse?

In HBase ist ein Tool mit dem Namen „back“ verfügbar, das von der HBaseFsck-Klasse implementiert wird. Es bietet mehrere Befehlszeilenschalter, die sein Verhalten beeinflussen.


Fragen und Antworten zum HBase-Interview für Erfahrene

15) Was sind die wichtigsten Schlüsselstrukturen von HBase?

Zeilenschlüssel und Spaltenschlüssel sind die beiden wichtigsten Schlüsselstrukturen, die in HBase verwendet werden


16) Besprechen Sie, wie Sie Filter in Apache HBase verwenden können

Filter in der HBase-Shell. Es wurde in Apache HBase 0.92 eingeführt und hilft Ihnen, eine serverseitige Filterung für den Zugriff auf HBase durchzuführen HBase-Shell oder Sparsamkeit.


17) HBase unterstützt Syntaxstrukturen wie SQL ja oder nein?

Leider nein, SQL Unterstützung für HBase ist derzeit nicht verfügbar. Durch die Verwendung von Apache Phoenix können wir jedoch Daten von HBase über SQL-Abfragen abrufen.


18) Was bedeutet Komprimierung in HBase?

Bei vielen eingehenden Schreibvorgängen ist es unmöglich, mit einer Datei pro Speicher eine optimale Leistung zu erzielen. HBase hilft Ihnen, alle diese HFiles zu kombinieren, um die Anzahl der Festplatten-Seeds für jeden Lesevorgang zu reduzieren. Dieser Vorgang wird in HBase als Komprimierung bezeichnet.


19) Wie werden Sie Joins in HBase implementieren?

HBase unterstützt keine direkten Verknüpfungen, sondern verwendet MapReduce Jobs-Join-Abfragen können implementiert werden, indem Daten mithilfe verschiedener HBase-Tabellen abgerufen werden.


20) Erklären Sie JMX in Bezug auf HBSE

Java Management Extensions oder JMX ist ein Exportstatus von Java-Anwendungen, der für sie der Standard ist.


21) Wozu dient MasterServer?

Der Masterserver hilft Ihnen auch dabei, dem Regionsserver eine Region zuzuweisen. Es hilft Ihnen auch bei der Verwaltung des Lastausgleichs, den wir über den MasterServer verwenden.


22) Definieren Sie den Begriff Sparsamkeit

Apache Thrift ist eingeschrieben C + +. Es bietet Schema-Compiler für verschiedene Programmiersprachen wie C++, Perl, PHP, Python, Ruby und mehr.


23) Warum die HColumnDescriptor-Klasse verwenden?

Die Details zur Spaltenfamilie wie Komprimierungseinstellungen und Anzahl der Versionen werden in HColumnDescriptor gespeichert.


24) Was ist eine Zelle in HBase?

Eine Zelle in HBase ist die kleinste Einheit eines HBase-Tabelle. Es hilft Ihnen, ein Datenelement in Form eines Tupels (Zeile, Spalte, Version) zu speichern.


25) Was ist ein Bloom-Filter?

HBase unterstützt Bloom Filter, der Ihnen hilft, den Gesamtdurchsatz des Clusters zu verbessern. Ein HBase-Bloom-Filter ist ein platzsparender Mechanismus zum Testen, ob eine HFile bestimmte Zeilen- oder Zeilenspaltenzellen enthält.


26) Erzählen Sie mir etwas über die Arten von HBase-Operationen?

Antwort. Zwei Arten von HBase-Operationen sind:

  • Betrieb lesen
  • Schreibvorgang

27) Wozu dient HBase HMaster?

Hauptaufgaben eines Meisters sind:

  1. Koordinierung der Regionsserver
  2. Admin-Funktionen

28) Welche Technik können Sie in HBase verwenden, um ohne die Hilfe von HBase direkt auf HFile zuzugreifen?

Um direkt auf HFile zuzugreifen, ohne HBase zu verwenden, verwenden wir die Methode HFile.main().


29) Kann sich der Regionsserver auf allen DataNodes befinden?

Ja, Regionsserver laufen auf denselben Servern wie DataNodes


30) Benennen Sie den Filter, der die Seitengröße als Parameter in HBase akzeptiert

Ein Filter namens PageFilter akzeptiert die Seitengröße als Parameter.

Dieses Dokument wurde mit den Instant-HTML-Konverter-Tools erstellt.

Diese Interviewfragen helfen auch bei Ihrer mündlichen Prüfung