Top 30 des questions d'entretien HBase (2025)
Voici les questions et réponses d'entretien avec Apache HBase pour les candidats les plus récents et les plus expérimentés pour obtenir l'emploi de leurs rêves.
Questions et réponses d'entretien HBase pour les débutants
1) Expliquez qu'est-ce que HBase ?
HBase est un système de gestion de base de données orienté colonnes qui s'exécute sur HDFS (Hadoop Distribute File System). HBase n'est pas un magasin de données relationnelles et ne prend pas en charge le langage de requête structuré comme SQL.
Dans HBase, un nœud maître régule les serveurs de cluster et de région pour stocker des parties des tables et effectue le travail sur les données.
👉 Téléchargement PDF gratuit : questions et réponses d'entretien HBase
2) Expliquez pourquoi utiliser HBase ?
- Système de stockage haute capacité
- Conception distribuée pour accueillir de grandes tables
- Magasins orientés colonnes
- Évolutivité horizontale
- Hautes performances et disponibilité
- L'objectif de base de HBase est des millions de colonnes, des milliers de versions et des milliards de lignes
- Contrairement à HDFS (Hadoop Distribute File System), il prend en charge les opérations CRUD aléatoires en temps réel
3) Mentionnez quels sont les composants clés de HBase ?
L'architecture HBase se compose principalement des composants suivants
- Gardien de zoo : Il effectue le travail de coordination entre le client et HBase Maser
- Maître HBase : HBase Master surveille le serveur de région
- RégionServeur : RegionServer surveille la région
- Région: Il contient en mémoire un magasin de données (MemStore) et un Hfile.
- Tableaux du catalogue : Les tables du catalogue se composent de ROOT et META
4) Expliquez en quoi consiste HBase ?
- HBase se compose d'un ensemble de tables
- Et chaque table contient des lignes et des colonnes comme une base de données traditionnelle
- Chaque table doit contenir un élément défini comme clé primaire
- La colonne HBase désigne un attribut d'un objet
5) Mentionnez combien de commandes opérationnelles dans HBase ?
Il existe principalement cinq types de Operational commandes dans HBase:
- Obtenez
- mettre
- Supprimer
- Scanner
- Incrément
6) Expliquez ce que sont WAL et Hlog dans HBase ?
WAL (Write Ahead Log) est similaire à MySQL Journal BIN ; il enregistre tous les changements survenus dans les données. Il s'agit d'un fichier de séquence standard de Hadoop et il stocke les HLogkey. Ces clés se composent d'un numéro séquentiel ainsi que de données réelles et sont utilisées pour relire les données non encore conservées après une panne de serveur. Ainsi, en cas de panne de serveur, WAL fonctionne comme une bouée de sauvetage et récupère les données perdues.
7) Quand devriez-vous utiliser HBase ?
- La taille des données est énorme : Quand vous avez des tonnes et des millions de disques à exploiter
- Refonte complète : Lorsque vous déplacez un SGBDR vers HBase, vous considérez cela comme une refonte complète, puis simplement comme un simple changement de ports.
- SQL-Less commandes: Vous disposez de plusieurs fonctionnalités comme les transactions ; jointures internes, colonnes saisies, etc.
- Investissement dans les infrastructures : Vous devez disposer de suffisamment de cluster pour que HBase soit vraiment utile
8) Dans HBase, que sont les familles de colonnes ?
Les familles de colonnes constituent l'unité de base de stockage physique dans HBase à laquelle des fonctionnalités telles que les compressions sont appliquées.
9) Expliquez quelle est la clé de ligne ?
La clé de ligne est définie par l'application. La clé combinée étant préfixée par la rowkey, elle permet à l'application de définir l'ordre de tri souhaité. Il permet également le regroupement logique des cellules et garantit que toutes les cellules avec la même clé de ligne sont colocalisées sur le même serveur.
10) Expliquez la suppression dans HBase ? Mentionnez quels sont les trois types de marqueurs de pierre tombale dans HBase ?
Lorsque vous supprimez la cellule dans HBase, les données ne sont pas réellement supprimées mais un marqueur de pierre tombale est défini, rendant les cellules supprimées invisibles. Les HBase supprimées sont en fait supprimées lors des compactages.
Il existe trois types de marqueurs de pierre tombale :
- Marqueur de suppression de version : pour la suppression, il marque une seule version d'une colonne
- Marqueur de suppression de colonne : Pour la suppression, il marque toutes les versions d'une colonne
- Marqueur de suppression de famille : pour la suppression, il marque toutes les colonnes d'une famille de colonnes.
11) Expliquez comment HBase supprime réellement une ligne ?
Dans HBase, tout ce que vous écrivez sera stocké de la RAM sur le disque, ces écritures sur disque sont immuables, sauf compactage. Pendant le processus de suppression dans HBase, le processus de compactage majeur supprime le marqueur, contrairement aux compactages mineurs. Dans les suppressions normales, cela entraîne la création d'un marqueur de suppression - ces données de suppression qu'elles représentent sont supprimées lors du compactage.
De plus, si vous supprimez des données et en ajoutez d'autres, mais avec un horodatage antérieur à l'horodatage de désactivation, Obtient peut être masqué par le marqueur de suppression/tombstone et vous ne recevrez donc la valeur insérée qu'après le compactage majeur.
12) Expliquez ce qui se passe si vous modifiez la taille de bloc d'une famille de colonnes sur une base de données déjà occupée ?
Lorsque vous modifiez la taille de bloc de la famille de colonnes, les nouvelles données occupent la nouvelle taille de bloc tandis que les anciennes données restent dans l'ancienne taille de bloc. Lors du compactage des données, les anciennes données prendront la nouvelle taille de bloc. Les nouveaux fichiers, au fur et à mesure qu'ils sont vidés, ont une nouvelle taille de bloc tandis que les données existantes continueront à être lues correctement. Toutes les données doivent être transformées à la nouvelle taille de bloc, après le prochain compactage majeur.
13) Mentionner la différence entre HBase et base de données relationnelle ?
Voici quelques différences importantes entre Apache HBase et la base de données relationnelle :
HBase | Base de données relationnelle |
---|---|
|
|
14) Qu'est-ce que la classe HBaseFsck ?
Il existe un nom d'outil rappelé disponible dans HBase, qui est implémenté par la classe HBaseFsck. Il propose plusieurs commutateurs de ligne de commande qui influencent son comportement.
Questions et réponses d'entretien HBase pour les expérimentés
15) Quelles sont les principales structures clés de HBase ?
La clé de ligne et la clé de colonne sont les deux structures de clés les plus importantes utilisées dans HBase
16) Discutez de la façon dont vous pouvez utiliser les filtres dans Apache HBase
Filtres dans le shell HBase. Il a été introduit dans Apache HBase 0.92 et vous aide à effectuer un filtrage côté serveur pour accéder à HBase via Coque HBase ou l'épargne.
17) HBase prend en charge la structure syntaxique comme SQL oui ou non ?
Non malheureusement, SQL la prise en charge de HBase n'est pas disponible actuellement. Cependant, en utilisant Apache Phoenix, nous pouvons récupérer des données de HBase via des requêtes SQL.
18) Quelle est la signification du compactage dans HBase ?
En période d'écritures entrantes abondantes, il est impossible d'obtenir des performances optimales en ayant un fichier par magasin. HBase vous aide à combiner tous ces HFiles pour réduire le nombre de valeurs de départ de disque pour chaque lecture. Ce processus est connu sous le nom de compactage dans HBase.
19) Comment allez-vous implémenter les jointures dans HBase ?
HBase, ne prend pas en charge les jointures directement mais utilise MapReduce Les requêtes de jointure de travaux peuvent être implémentées en récupérant des données à l'aide de différentes tables HBase.
20) Expliquez JMX concernant HBSE
Java Management Extensions ou JMX est un statut d'exportation de Java les applications sont la norme pour eux.
21) A quoi sert MasterServer ?
Le serveur maître vous aide également à attribuer une région au serveur de région. Cela vous aide également à gérer l'équilibrage de charge que nous utilisons sur le MasterServer.
22) Définir le terme économie
Apache Thrift est écrit en C++. Il fournit des compilateurs de schémas pour divers langages de programmation tels que C++, Perl, PHP, Python, Ruby, et plus encore.
23) Pourquoi utiliser HColumnDescriptou la classe ?
Les détails concernant la famille de colonnes, tels que les paramètres de compression et le nombre de versions, sont stockés dans HColumn.Descriptou.
24) Qu'est-ce qu'une cellule dans HBase ?
Une cellule dans HBase est la plus petite unité d'un Tableau HBase. Il vous aide à conserver une donnée sous la forme d'un tuple {ligne, colonne, version}
25) Qu'est-ce qu'un filtre Bloom ?
HBase prend en charge Bloom Filter vous aide à améliorer le débit global du cluster. Un filtre HBase Bloom est un mécanisme peu encombrant pour tester si un HFile inclut certaines cellules de ligne ou de colonne de ligne.
26) Parlez-moi des types de HBase Operation ?
Rép. Deux types de HBase Operales situations sont :
- Lire Operaproduction
- Écrire Operaproduction
27) A quoi sert HBase HMaster ?
Les principales responsabilités d'un master sont :
- Coordination des serveurs de région
- Fonctions d'administration
28) Quelle technique pouvez-vous utiliser dans HBase pour accéder directement à HFile sans l'aide de HBase ?
Pour accéder directement à HFile sans utiliser HBase, nous utilisons la méthode HFile.main().
29) Le serveur régional peut-il être localisé sur tous les DataNodes ?
Oui, les serveurs de région s'exécutent sur les mêmes serveurs qu'un DataNodes
30) Nommez le filtre qui accepte la taille de la page comme paramètre dans HBase
Un filtre nommé PageFilter accepte la taille de la page comme paramètre.
Ce document a été composé avec les outils de conversion HTML instantanés.
Ces questions d'entretien vous aideront également dans votre soutenance