Κορυφαίες 30 ερωτήσεις συνέντευξης HBase (2025)
Ακολουθούν ερωτήσεις συνέντευξης και απαντήσεις στο Apache HBase για πιο φρέσκους όσο και έμπειρους υποψηφίους για να πάρουν τη δουλειά των ονείρων τους.
HBase Συνέντευξη Ερωτήσεις και Απαντήσεις για Freshers
1) Εξηγήστε τι είναι το HBase;
Το HBase είναι ένα σύστημα διαχείρισης βάσης δεδομένων προσανατολισμένο στη στήλη που τρέχει πάνω από το HDFS (Hadoop Distribute File System). Το HBase δεν είναι χώρος αποθήκευσης σχεσιακών δεδομένων και δεν υποστηρίζει δομημένη γλώσσα ερωτημάτων όπως η SQL.
Στο HBase, ένας κύριος κόμβος ρυθμίζει τους διακομιστές συμπλέγματος και περιοχής για αποθήκευση τμημάτων των πινάκων και λειτουργεί την εργασία στα δεδομένα.
👉 Δωρεάν λήψη PDF: Ερωτήσεις & Απαντήσεις συνέντευξης HBase
2) Εξηγήστε γιατί να χρησιμοποιήσετε το HBase;
- Σύστημα αποθήκευσης υψηλής χωρητικότητας
- Διανεμημένο σχέδιο για την εξυπηρέτηση μεγάλων τραπεζιών
- Καταστήματα με προσανατολισμό στη στήλη
- Οριζόντια κλιμάκωση
- Υψηλή απόδοση & Διαθεσιμότητα
- Ο βασικός στόχος του HBase είναι εκατομμύρια στήλες, χιλιάδες εκδόσεις και δισεκατομμύρια σειρές
- Σε αντίθεση με το HDFS (Hadoop Distribute File System), υποστηρίζει τυχαίες λειτουργίες CRUD σε πραγματικό χρόνο
3) Αναφέρετε ποια είναι τα βασικά συστατικά του HBase;
Η αρχιτεκτονική HBase αποτελείται κυρίως από τα ακόλουθα στοιχεία
- Ζωοφύλακας: Κάνει τη δουλειά συντονισμού μεταξύ πελάτη και HBase Maser
- HBase Master: Το HBase Master παρακολουθεί τον διακομιστή περιοχής
- RegionServer: Ο RegionServer παρακολουθεί την περιοχή
- Περιοχή: Περιέχει στη μνήμη αποθήκευση δεδομένων (MemStore) και Hfile.
- Πίνακες καταλόγου: Οι πίνακες καταλόγων αποτελούνται από ROOT και META
4) Εξηγήστε από τι αποτελείται το HBase;
- HBase αποτελείται από ένα σύνολο τραπεζιών
- Και κάθε πίνακας περιέχει γραμμές και στήλες όπως η παραδοσιακή βάση δεδομένων
- Κάθε πίνακας πρέπει να περιέχει ένα στοιχείο που ορίζεται ως πρωτεύον κλειδί
- Η στήλη HBase υποδηλώνει ένα χαρακτηριστικό ενός αντικειμένου
5) Αναφέρετε πόσες λειτουργικές εντολές στο HBase;
Υπάρχουν κυρίως πέντε τύποι Operaλογικό εντολές στο HBase:
- ΕΠΙΚΟΙΝΩΝΗΣΤΕ
- Βάζω
- Διαγραφή
- σάρωση
- Αύξηση
6) Εξηγήστε τι είναι το WAL και το Hlog στο HBase;
Το WAL (Write Ahead Log) είναι παρόμοιο με MySQL BIN αρχείο καταγραφής? καταγράφει όλες τις αλλαγές που συμβαίνουν στα δεδομένα. Είναι ένα τυπικό αρχείο ακολουθίας από Hadoop και αποθηκεύει τα HLogkey's. Αυτά τα κλειδιά αποτελούνται από έναν διαδοχικό αριθμό καθώς και από πραγματικά δεδομένα και χρησιμοποιούνται για την επανάληψη της αναπαραγωγής μη διατηρούμενων ακόμη δεδομένων μετά από σφάλμα διακομιστή. Έτσι, σε μετρητά αποτυχία διακομιστή, το WAL λειτουργεί ως σωτήρια γραμμή και ανακτά τα χαμένα δεδομένα.
7) Πότε πρέπει να χρησιμοποιήσετε το HBase;
- Το μέγεθος των δεδομένων είναι τεράστιο: Όταν έχεις τόνους και εκατομμύρια δίσκους να λειτουργήσεις
- Πλήρης επανασχεδιασμός: Όταν μετακινείτε το RDBMS στο HBase, το θεωρείτε ως πλήρη επανασχεδιασμό και στη συνέχεια απλώς αλλάζετε τις θύρες
- SQL-Less εντολές: Έχετε πολλές δυνατότητες όπως συναλλαγές. εσωτερικές ενώσεις, δακτυλογραφημένες στήλες κ.λπ.
- Επενδύσεις σε υποδομές: Πρέπει να έχετε αρκετό σύμπλεγμα για να είναι πραγματικά χρήσιμο το HBase
8) Στο HBase τι είναι οι οικογένειες στηλών;
Οι οικογένειες στηλών αποτελούν τη βασική μονάδα φυσικής αποθήκευσης στο HBase στην οποία εφαρμόζονται χαρακτηριστικά όπως οι συμπιέσεις.
9) Εξηγήστε τι είναι το κλειδί γραμμής;
Το κλειδί γραμμής ορίζεται από την εφαρμογή. Καθώς το συνδυασμένο κλειδί είναι προκαθορισμένο από το κλειδί σειράς, επιτρέπει στην εφαρμογή να ορίσει την επιθυμητή σειρά ταξινόμησης. Επιτρέπει επίσης τη λογική ομαδοποίηση κελιών και βεβαιωθείτε ότι όλα τα κελιά με το ίδιο κλειδί σειράς βρίσκονται στον ίδιο διακομιστή.
10) Εξηγήστε τη διαγραφή στο HBase; Αναφέρετε ποιοι είναι οι τρεις τύποι μαρκαδόρων ταφόπλακα στο HBase;
Όταν διαγράφετε το κελί στο HBase, τα δεδομένα δεν διαγράφονται, αλλά ορίζεται ένας δείκτης ταφόπλακα, καθιστώντας τα διαγραμμένα κελιά αόρατα. Το HBase που έχει διαγραφεί αφαιρείται στην πραγματικότητα κατά τη διάρκεια της συμπίεσης.
Υπάρχουν τρεις τύποι μαρκαδόρων ταφόπλακας:
- Δείκτης διαγραφής έκδοσης: Για διαγραφή, επισημαίνει μια μεμονωμένη έκδοση μιας στήλης
- Δείκτης διαγραφής στήλης: Για διαγραφή, επισημαίνει όλες τις εκδόσεις μιας στήλης
- Δείκτης διαγραφής οικογένειας: Για διαγραφή, επισημαίνει όλες τις στήλες για μια οικογένεια στηλών
11) Εξηγήστε πώς το HBase διαγράφει πραγματικά μια σειρά;
Στο HBase, ό,τι γράψετε θα αποθηκευτεί από τη μνήμη RAM σε δίσκο, αυτές οι εγγραφές δίσκου είναι αμετάβλητη συμπίεση φραγής. Κατά τη διάρκεια της διαδικασίας διαγραφής στο HBase, η κύρια διαδικασία συμπύκνωσης διαγράφει τον δείκτη ενώ οι δευτερεύουσες συμπαγείς όχι. Σε κανονικές διαγραφές, έχει ως αποτέλεσμα έναν δείκτη διαγραφής ταφόπλακα - αυτά τα δεδομένα διαγραφής που αντιπροσωπεύουν αφαιρούνται κατά τη συμπίεση.
Επίσης, εάν διαγράψετε δεδομένα και προσθέσετε περισσότερα δεδομένα, αλλά με προγενέστερη χρονική σήμανση από τη χρονική σήμανση ταφόπλακα, περαιτέρω Παίρνει μπορεί να καλυφθεί από τον δείκτη διαγραφής/ταφόπλακα και ως εκ τούτου δεν θα λάβετε την εισαγόμενη τιμή παρά μόνο μετά τη μεγάλη συμπύκνωση.
12) Εξηγήστε τι συμβαίνει εάν αλλάξετε το μέγεθος του μπλοκ μιας οικογένειας στηλών σε μια ήδη κατειλημμένη βάση δεδομένων;
Όταν αλλάζετε το μέγεθος μπλοκ της οικογένειας στηλών, τα νέα δεδομένα καταλαμβάνουν το νέο μέγεθος μπλοκ ενώ τα παλιά δεδομένα παραμένουν εντός του παλιού μεγέθους μπλοκ. Κατά τη συμπίεση δεδομένων, τα παλιά δεδομένα θα πάρουν το νέο μέγεθος μπλοκ. Τα νέα αρχεία καθώς ξεπλένονται, έχουν νέο μέγεθος μπλοκ, ενώ τα υπάρχοντα δεδομένα θα συνεχίσουν να διαβάζονται σωστά. Όλα τα δεδομένα θα πρέπει να μετατραπούν στο νέο μέγεθος μπλοκ, μετά την επόμενη μεγάλη συμπίεση.
13) Αναφέρετε τη διαφορά μεταξύ HBase και Relational Database;
Ακολουθούν ορισμένες σημαντικές διαφορές μεταξύ του Apache HBase και της Σχεσιακής βάσης δεδομένων:
HBase | Σχεσιακή βάση δεδομένων |
---|---|
|
|
14) Τι είναι η κλάση HBaseFsck;
Υπάρχει ένα όνομα εργαλείου που ονομάζεται πίσω είναι διαθέσιμο στο HBase, το οποίο υλοποιείται από την κλάση HBaseFsck. Προσφέρει πολλούς διακόπτες γραμμής εντολών που επηρεάζουν τη συμπεριφορά του.
Ερωτήσεις και απαντήσεις συνέντευξης HBase για έμπειρους
15) Ποιες είναι οι κύριες βασικές δομές του HBase;
Το κλειδί γραμμής και το κλειδί στήλης είναι οι δύο πιο σημαντικές δομές κλειδιών που χρησιμοποιούνται στο HBase
16) Συζητήστε πώς μπορείτε να χρησιμοποιήσετε φίλτρα στο Apache HBase
Φίλτρα στο κέλυφος HBase. Εισήχθη στο Apache HBase 0.92 που σας βοηθά να διεξάγετε φιλτράρισμα από την πλευρά του διακομιστή για πρόσβαση στο HBase μέσω Κέλυφος HBase ή λιτότητα.
17) HBase υποστηρίζει τη δομή σύνταξης όπως η SQL ναι ή όχι;
ΟΧΙ ΔΥΣΤΥΧΩΣ, SQL Η υποστήριξη για το HBase δεν είναι διαθέσιμη αυτήν τη στιγμή. Ωστόσο, χρησιμοποιώντας το Apache Phoenix, μπορούμε να ανακτήσουμε δεδομένα από το HBase μέσω ερωτημάτων SQL.
18) Ποια είναι η έννοια της συμπίεσης στο HBase;
Τη στιγμή των έντονων εισερχόμενων εγγραφών, είναι αδύνατο να επιτευχθεί η βέλτιστη απόδοση έχοντας ένα αρχείο ανά κατάστημα. Το HBase σάς βοηθά να συνδυάσετε όλα αυτά τα HFiles για να μειώσετε τον αριθμό των σπόρων δίσκου για κάθε ανάγνωση. Αυτή η διαδικασία είναι γνωστή ως Compaction στο HBase.
19) Πώς θα εφαρμόσετε συνδέσεις στο HBase;
Το HBase, δεν υποστηρίζει απευθείας συνδέσεις αλλά χρησιμοποιεί ΜΕΙΩΣΗ ΧΑΡΤΗ τα ερωτήματα σύνδεσης εργασιών μπορούν να υλοποιηθούν με την ανάκτηση δεδομένων με τη βοήθεια διαφορετικών πινάκων HBase.
20) Εξηγήστε το JMX σχετικά με την HBSE
Java Επεκτάσεις διαχείρισης ή JMX είναι μια κατάσταση εξαγωγής του Java Οι εφαρμογές είναι το πρότυπο για αυτούς.
21) Ποια είναι η χρήση του MasterServer;
Ο κύριος διακομιστής σάς βοηθά να αντιστοιχίσετε μια περιοχή και στον διακομιστή περιοχής. Σας βοηθά επίσης να χειριστείτε την εξισορρόπηση φορτίου που χρησιμοποιούμε τον MasterServer.
22) Ορίστε τον όρο Thrift
Το Apache Thrift είναι γραμμένο C++. Παρέχει μεταγλωττιστές σχημάτων για διάφορες γλώσσες προγραμματισμού όπως C++, Perl, PHP, Python, Ruby και πολλά άλλα.
23) Γιατί να χρησιμοποιήσετε το HCColumnDescriptή τάξη;
Οι λεπτομέρειες σχετικά με την οικογένεια στηλών, όπως ρυθμίσεις συμπίεσης, αριθμός εκδόσεων, αποθηκεύονται στο HCColumnDescriptή.
24) Τι είναι ένα κελί στην HBase;
Ένα κελί στην HBase είναι η μικρότερη μονάδα ενός Πίνακας HBase. Σας βοηθά να κρατάτε ένα κομμάτι δεδομένων με τη μορφή πλειάδας{σειρά, στήλη, έκδοση}
25) Τι είναι το φίλτρο Bloom;
Το HBase υποστηρίζει Bloom Filter σας βοηθά να βελτιώσετε τη συνολική απόδοση του συμπλέγματος. Ένα φίλτρο HBase Bloom είναι ένας μηχανισμός αποδοτικής χρήσης χώρου για να ελέγξετε εάν ένα HFile περιλαμβάνει συγκεκριμένη γραμμή ή κελί γραμμής-στήλης.
26) Πείτε μου για τους τύπους HBase Operaθέσεις;
Απ. Δύο τύποι HBase Operaοι θέσεις είναι:
- Διάβασε Operaσμού
- Γράφω Operaσμού
27) Ποια είναι η χρήση του HBase HMaster;
Οι κύριες αρμοδιότητες ενός πλοιάρχου είναι:
- Συντονισμός των διακομιστών της περιοχής
- Λειτουργίες διαχειριστή
28) Ποια τεχνική μπορείτε να χρησιμοποιήσετε στο HBase για να αποκτήσετε απευθείας πρόσβαση στο HFile χωρίς τη βοήθεια του HBase;
Για να αποκτήσουμε απευθείας πρόσβαση στο HFile χωρίς τη χρήση HBase, χρησιμοποιούμε τη μέθοδο HFile.main().
29) Μπορεί ο διακομιστής περιοχής να βρίσκεται σε όλους τους DataNodes;
Ναι, οι διακομιστές περιοχής εκτελούνται στους ίδιους διακομιστές με τους DataNodes
30) Ονομάστε το φίλτρο που δέχεται το μέγεθος σελίδας ως παράμετρο στο HBase
Ένα φίλτρο με το όνομα PageFilter δέχεται το μέγεθος σελίδας ως παράμετρο.
Αυτό το έγγραφο έχει δημιουργηθεί με τα εργαλεία μετατροπέα στιγμιαίων HTML.
Αυτές οι ερωτήσεις συνέντευξης θα βοηθήσουν επίσης στο viva (προφορικά) σας