Top 30 HBase-interviewspørgsmål (2025)
Her er Apache HBase-interviewspørgsmål og svar til både friskere og erfarne kandidater til at få deres drømmejob.
HBase-interviewspørgsmål og svar til nybegyndere
1) Forklar hvad er HBase?
HBase er et kolonneorienteret databasestyringssystem, som kører oven på HDFS (Hadoop Distribute File System). HBase er ikke et relationelt datalager, og det understøtter ikke struktureret forespørgselssprog som SQL.
I HBase regulerer en masterknude klynge- og regionserverne til at gemme dele af tabellerne og betjener arbejdet på dataene.
👉 Gratis PDF-download: HBase-interviewspørgsmål og -svar
2) Forklar hvorfor man skal bruge HBase?
- Lagersystem med høj kapacitet
- Distribueret design til at tage højde for store borde
- Kolonneorienterede butikker
- Vandret skalerbar
- Høj ydeevne og tilgængelighed
- Grundmålet for HBase er millioner af kolonner, tusindvis af versioner og milliarder af rækker
- I modsætning til HDFS (Hadoop Distribute File System) understøtter det tilfældige CRUD-operationer i realtid
3) Nævn, hvad er nøglekomponenterne i HBase?
HBase-arkitektur består hovedsageligt af følgende komponenter
- Dyrepasser: Det udfører koordineringsarbejdet mellem klient og HBase Maser
- HBase Master: HBase Master overvåger regionsserveren
- RegionServer: RegionServer overvåger regionen
- Region: Den indeholder i hukommelsen datalager (MemStore) og Hfile.
- Katalogtabeller: Katalogtabeller består af ROOT og META
4) Forklar hvad HBase består af?
- HBase består af et sæt borde
- Og hver tabel indeholder rækker og kolonner som en traditionel database
- Hver tabel skal indeholde et element, der er defineret som en primær nøgle
- HBase-kolonnen angiver en attribut for et objekt
5) Nævn hvor mange operationelle kommandoer i HBase?
Der er hovedsageligt fem typer Operanale kommandoer i HBase:
- Få
- Sætte
- Slette
- Scan
- Increment (Forøgelse)
6) Forklar, hvad er WAL og Hlog i HBase?
WAL (Write Ahead Log) ligner MySQL BIN log; den registrerer alle ændringer, der sker i data. Det er en standard sekvensfil af Hadoop og den gemmer HLogkey's. Disse nøgler består af et sekventielt nummer såvel som faktiske data og bruges til at afspille endnu ikke-vedvarende data efter et servernedbrud. Så kontant ved serverfejl fungerer WAL som en livline og henter de tabte data.
7) Hvornår skal du bruge HBase?
- Datastørrelsen er enorm: Når du har tonsvis og millioner af poster at betjene
- Komplet redesign: Når du flytter RDBMS til HBase, betragter du det som et komplet re-design, så bare at ændre portene
- SQL-Less kommandoer: Du har flere funktioner som transaktioner; indre sammenføjninger, indtastede kolonner osv.
- Infrastrukturinvesteringer: Du skal have nok klynge til, at HBase virkelig kan bruges
8) Hvad er kolonnefamilier i HBase?
Kolonnefamilier omfatter den grundlæggende enhed for fysisk lagring i HBase, som funktioner som kompressioner anvendes til.
9) Forklar hvad rækkenøglen er?
Rækkenøglen er defineret af applikationen. Da den kombinerede nøgle er præfikseret af rækketasten, gør den det muligt for applikationen at definere den ønskede sorteringsrækkefølge. Det tillader også logisk gruppering af celler og sørg for, at alle celler med den samme rækketast er placeret på samme server.
10) Forklar sletning i HBase? Nævn hvad er de tre typer gravstensmarkører i HBase?
Når du sletter cellen i HBase, slettes dataene faktisk ikke, men der er sat en gravstensmarkør, hvilket gør de slettede celler usynlige. Slettede HBase fjernes faktisk under komprimeringer.
Der er tre typer gravstensmarkører:
- Versionssletningsmarkør: For sletning markerer den en enkelt version af en kolonne
- Kolonnesletningsmarkør: For sletning markerer den alle versioner af en kolonne
- Familiesletningsmarkør: For sletning markerer den alle kolonner for en kolonnefamilie
11) Forklar hvordan HBase rent faktisk sletter en række?
I HBase, hvad end du skriver, vil blive lagret fra RAM til disk, disse diskskrivninger er uforanderlige og spærrer for komprimering. Under sletningsprocessen i HBase sletter større komprimeringsproces markør, mens mindre komprimeringer ikke gør det. Ved normale sletninger resulterer det i en sletning af gravstensmarkør - disse slettedata, de repræsenterer, fjernes under komprimering.
Desuden, hvis du sletter data og tilføjer flere data, men med et tidligere tidsstempel end gravstenens tidsstempling, Bliver kan være maskeret af slette-/gravstensmarkøren, og du vil derfor ikke modtage den indsatte værdi før efter den større komprimering.
12) Forklar, hvad der sker, hvis du ændrer blokstørrelsen af en kolonnefamilie på en allerede optaget database?
Når du ændrer blokstørrelsen for kolonnefamilien, optager de nye data den nye blokstørrelse, mens de gamle data forbliver inden for den gamle blokstørrelse. Under datakomprimering vil gamle data få den nye blokstørrelse. Nye filer, efterhånden som de tømmes, har en ny blokstørrelse, mens eksisterende data fortsat vil blive læst korrekt. Alle data skal transformeres til den nye blokstørrelse efter den næste større komprimering.
13) Nævn forskellen mellem HBase og Relationel Database?
Her er nogle vigtige forskelle mellem Apache HBase og Relational Database:
HBase | Relationsdatabase |
---|---|
|
|
14) Hvad er HBaseFsck klasse?
Der er et værktøjsnavn kaldet tilbage er tilgængeligt i HBase, som er implementeret af HBaseFsck-klassen. Det tilbyder flere kommandolinje-switche, der påvirker dets adfærd.
HBase Interview Spørgsmål og Svar til Erfarne
15) Hvad er de vigtigste nøglestrukturer i HBase?
Rækkenøgle og kolonnenøgle er de to vigtigste nøglestrukturer, der bruges i HBase
16) Diskuter, hvordan du kan bruge filtre i Apache HBase
Filtre i HBase Shell. Det blev introduceret i Apache HBase 0.92, som hjælper dig med at udføre serversidefiltrering for at få adgang til HBase over HBase skal eller sparsommelighed.
17) HBase understøtter syntaksstruktur som SQL ja eller nej?
Nej desværre, SQL support til HBase er ikke tilgængelig i øjeblikket. Ved at bruge Apache Phoenix kan vi dog hente data fra HBase gennem SQL-forespørgsler.
18) Hvad er meningen med komprimering i HBase?
På tidspunktet for tunge indgående skrivninger er det umuligt at opnå optimal ydeevne ved at have én fil pr. butik. HBase hjælper dig med at kombinere alle disse HFiles for at reducere antallet af diskseeds for hver læsning. Denne proces er kendt som komprimering i HBase.
19) Hvordan vil du implementere joins i HBase?
HBase, ikke support joins direkte, men bruger KortReducer job join-forespørgsler kan implementeres ved at hente data ved hjælp af forskellige HBase-tabeller.
20) Forklar JMX vedrørende HBSE
Java Management Extensions eller JMX er en eksportstatus for Java applikationer er standarden for dem.
21) Hvad er brugen af MasterServer?
Master server hjælper dig med at tildele en region til regionsserveren også. Det hjælper dig også med at håndtere den belastningsbalancering, vi bruger MasterServeren.
22) Definer begrebet sparsommelighed
Apache Thrift er skrevet i C++. Det giver skemakompilere til forskellige programmeringssprog som f.eks C++, Perl, PHP, Python, Ruby og mere.
23) Hvorfor bruge HColumnDescripteller klasse?
Detaljerne vedrørende kolonnefamilien, såsom komprimeringsindstillinger, Antal versioner, gemmes .i HColumnDescripteller.
24) Hvad er en celle i HBase?
En celle i HBase er den mindste enhed af en HBase tabel. Det hjælper dig med at opbevare et stykke data i form af en tupel{række, kolonne, version}
25) Hvad er et Bloom-filter?
HBase understøtter Bloom Filter hjælper dig med at forbedre den samlede gennemstrømning af klyngen. Et HBase Bloom Filter er en pladseffektiv mekanisme til at teste, om en HF-fil indeholder en bestemt række- eller række-kol-celle.
26) Fortæl mig om typerne af HBase Operationer?
Ans. To typer HBase Operationer er:
- Læs Operation
- Skrive Operation
27) Hvad er brugen af HBase HMaster?
Hovedansvaret for en mester er:
- Koordinering af regionsservere
- Admin funktioner
28) Hvilken teknik kan du bruge i HBase til at få direkte adgang til HFile uden hjælp fra HBase?
For at få direkte adgang til HFile uden at bruge HBase, bruger vi metoden HFile.main().
29) Kan regionsserveren være placeret på alle DataNodes?
Ja, regionsservere kører på de samme servere som en DataNodes
30) Navngiv filteret, der accepterer sidestørrelsen som parameter i HBase
Et filter ved navn PageFilter accepterer sidestørrelsen som parameter.
Dette dokument er blevet sammensat med de øjeblikkelige HTML-konverteringsværktøjer.
Disse interviewspørgsmål vil også hjælpe i din viva(orals)