As 30 principais perguntas da entrevista do HBase (2025)
Aqui estão as perguntas e respostas da entrevista do Apache HBase para candidatos mais novos e experientes para conseguir o emprego dos sonhos.
Perguntas e respostas da entrevista HBase para calouros
1) Explique o que é HBase?
HBase é um sistema de gerenciamento de banco de dados orientado a colunas que roda sobre HDFS (Hadoop Distribute File System). HBase não é um armazenamento de dados relacional e não oferece suporte a linguagem de consulta estruturada como SQL.
No HBase, um nó mestre regula o cluster e os servidores da região para armazenar partes das tabelas e opera o trabalho nos dados.
👉 Download gratuito de PDF: Perguntas e respostas da entrevista HBase
2) Explique por que usar o HBase?
- Sistema de armazenamento de alta capacidade
- Design distribuído para atender mesas grandes
- Lojas Orientadas a Colunas
- Escalável horizontalmente
- Alto desempenho e disponibilidade
- O objetivo básico do HBase é milhões de colunas, milhares de versões e bilhões de linhas
- Ao contrário do HDFS (Hadoop Distribute File System), ele suporta operações CRUD aleatórias em tempo real
3) Mencione quais são os principais componentes do HBase?
A arquitetura HBase consiste principalmente nos seguintes componentes
- Funcionário do zoológico: Faz o trabalho de coordenação entre o cliente e o HBase Maser
- Mestre HBase: HBase Master monitora o servidor regional
- Servidor de região: RegionServer monitora a região
- Região: Ele contém armazenamento de dados na memória (MemStore) e Hfile.
- Tabelas de catálogo: As tabelas de catálogo consistem em ROOT e META

4) Explique em que consiste o HBase?
- HBase consiste em um conjunto de tabelas
- E cada tabela contém linhas e colunas como um banco de dados tradicional
- Cada tabela deve conter um elemento definido como Chave Primária
- A coluna HBase denota um atributo de um objeto
5) Mencione quantos comandos operacionais no HBase?
Existem principalmente cinco tipos de Operaprofissional comandos no HBase:
- Get
- colocar
- Apagar
- Escanear
- Incremento

6) Explique o que é WAL e Hlog no HBase?
WAL (Write Ahead Log) é semelhante a MySQL Registro BIN; ele registra todas as mudanças que ocorrem nos dados. É um arquivo de sequência padrão por Hadoop e armazena HLogkey's. Essas chaves consistem em um número sequencial e também em dados reais e são usadas para reproduzir dados ainda não persistidos após uma falha do servidor. Assim, em caso de falha do servidor, o WAL funciona como uma tábua de salvação e recupera os dados perdidos.
7) Quando você deve usar o HBase?
- O tamanho dos dados é enorme: Quando você tem toneladas e milhões de registros para operar
- Redesenho completo: Quando você está migrando RDBMS para HBase, você considera isso como uma reformulação completa e apenas uma mudança nas portas
- SQL-Less comandos: Você tem vários recursos como transações; junções internas, colunas digitadas, etc.
- Investimento em infraestrutura: Você precisa ter cluster suficiente para que o HBase seja realmente útil
8) No HBase, o que são famílias de colunas?
As famílias de colunas constituem a unidade básica de armazenamento físico no HBase à qual recursos como compactações são aplicados.
9) Explique o que é a chave de linha?
A chave da linha é definida pelo aplicativo. Como a chave combinada é pré-fixada pela chave de linha, ela permite que o aplicativo defina a ordem de classificação desejada. Ele também permite o agrupamento lógico de células e garante que todas as células com a mesma chave de linha estejam localizadas no mesmo servidor.
10) Explique a exclusão no HBase? Mencione quais são os três tipos de marcadores de lápide no HBase?
Quando você exclui a célula no HBase, os dados não são realmente excluídos, mas um marcador de marca para exclusão é definido, tornando as células excluídas invisíveis. Os HBase excluídos são, na verdade, removidos durante as compactações.
Existem três tipos de marcadores de lápide:
- Marcador de exclusão de versão: para exclusão, marca uma única versão de uma coluna
- Marcador de exclusão de coluna: Para exclusão, marca todas as versões de uma coluna
- Marcador de exclusão de família: para exclusão, marca todas as colunas de uma família de colunas
11) Explique como o HBase realmente exclui uma linha?
No HBase, tudo o que você escrever será armazenado da RAM no disco; essas gravações em disco são imutáveis, exceto a compactação. Durante o processo de exclusão no HBase, o processo de compactação principal exclui o marcador, enquanto as compactações menores não. Em exclusões normais, isso resulta em um marcador de exclusão de exclusão - esses dados de exclusão que eles representam são removidos durante a compactação.
Além disso, se você excluir dados e adicionar mais dados, mas com um carimbo de data/hora anterior ao carimbo de data/hora da marca para exclusão, Obtém pode ser mascarado pelo marcador de exclusão/marca para exclusão e, portanto, você não receberá o valor inserido até depois da compactação principal.
12) Explique o que acontece se você alterar o tamanho do bloco de um grupo de colunas em um banco de dados já ocupado?
Quando você altera o tamanho do bloco do grupo de colunas, os novos dados ocupam o novo tamanho do bloco enquanto os dados antigos permanecem dentro do tamanho do bloco antigo. Durante a compactação de dados, os dados antigos assumirão o novo tamanho de bloco. Novos arquivos, à medida que são liberados, terão um novo tamanho de bloco, enquanto os dados existentes continuarão a ser lidos corretamente. Todos os dados deverão ser transformados para o novo tamanho de bloco, após a próxima grande compactação.
13) Mencionou a diferença entre HBase e Banco de Dados Relacional?
Aqui estão algumas diferenças importantes entre Apache HBase e banco de dados relacional:
HBase | Banco de Dados Relacional |
---|---|
|
|
14) O que é a classe HBaseFsck?
Existe um nome de ferramenta chamado back que está disponível no HBase, que é implementado pela classe HBaseFsck. Ele oferece várias opções de linha de comando que influenciam seu comportamento.
Perguntas e respostas da entrevista HBase para experientes
15) Quais são as principais estruturas-chave do HBase?
Chave de linha e chave de coluna são as duas estruturas de chave mais importantes usadas no HBase
16) Discuta como você pode usar filtros no Apache HBase
Filtros no shell HBase. Foi introduzido no Apache HBase 0.92 que ajuda você a realizar a filtragem do lado do servidor para acessar o HBase através Shell do HBase ou economia.
17) HBase suporta estrutura de sintaxe como SQL sim ou não?
Infelizmente não, SQL o suporte para HBase não está disponível atualmente. No entanto, usando o Apache Phoenix, podemos recuperar dados do HBase por meio de consultas SQL.
18) Qual o significado de compactação no HBase?
No momento de gravações de entrada pesadas, é impossível obter o desempenho ideal tendo um arquivo por armazenamento. O HBase ajuda você a combinar todos esses HFiles para reduzir o número de sementes de disco para cada leitura. Este processo é conhecido como Compactação no HBase.
19) Como você implementará joins no HBase?
HBase, não oferece suporte a joins diretamente, mas usa MapaReduzir consultas de junção de trabalhos podem ser implementadas recuperando dados com a ajuda de diferentes tabelas HBase.
20) Explique JMX sobre HBSE
Java Management Extensions ou JMX é um status de exportação de Java aplicativos é o padrão para eles.
21) Qual a utilidade do MasterServer?
O servidor mestre também ajuda você a atribuir uma região ao servidor da região. Também ajuda você a lidar com o balanceamento de carga que usamos no MasterServer.
22) Defina o termo Economia
Apache Thrift está escrito em C++. Ele fornece compiladores de esquema para várias linguagens de programação como C++, Perl, PHP, Python, Rubi e muito mais.
23) Por que usar HColumnDescriptou aula?
Os detalhes sobre a família de colunas, como configurações de compactação e número de versões, são armazenados .in HColumnDescriptou.
24) O que é uma célula no HBase?
Uma célula no HBase é a menor unidade de um Tabela HBase. Ele ajuda você a armazenar dados na forma de uma tupla {linha, coluna, versão}
25) O que é um filtro Bloom?
HBase suporta Bloom Filter e ajuda a melhorar o rendimento geral do cluster. Um filtro HBase Bloom é um mecanismo com uso eficiente de espaço para testar se um HFile inclui determinada linha ou célula de coluna de linha.
26) Conte-me sobre os tipos de HBase Operações?
Resp. Dois tipos de HBase Operasão:
- Leia Operação
- Escreva Operação
27) Qual a utilidade do HBase HMaster?
As principais responsabilidades de um mestre são:
- Coordenando os servidores da região
- funções administrativas
28) Qual técnica você pode usar no HBase para acessar o HFile diretamente sem a ajuda do HBase?
Para acessar HFile diretamente sem usar HBase, usamos o método HFile.main().
29) O servidor da região pode estar localizado em todos os DataNodes?
Sim, os Region Servers são executados nos mesmos servidores que um DataNodes
30) Nomeie o filtro que aceita o tamanho da página como parâmetro no HBase
Um filtro chamado PageFilter aceita o tamanho da página como parâmetro.
Este documento foi composto com ferramentas de conversão instantânea de HTML.
Essas perguntas da entrevista também ajudarão em sua viva (oral)