Las 30 preguntas principales de la entrevista de HBase (2025)

Aquí hay preguntas y respuestas de la entrevista de Apache HBase para que los candidatos más nuevos y experimentados consigan el trabajo de sus sueños.

 

Preguntas y respuestas de la entrevista de HBase para principiantes

1) Explique ¿Qué es HBase?

HBase es un sistema de gestión de bases de datos orientado a columnas que se ejecuta sobre HDFS (Hadoop Distribute File System). HBase no es un almacén de datos relacional y no admite lenguajes de consulta estructurados como SQL.

En HBase, un nodo maestro regula los servidores de clúster y de región para almacenar partes de las tablas y opera el trabajo sobre los datos.

👉 Descarga gratuita de PDF: Preguntas y respuestas de la entrevista de HBase


2) Explique por qué utilizar HBase.

  • Sistema de almacenamiento de alta capacidad
  • Diseño distribuido para atender mesas grandes.
  • Tiendas orientadas a columnas
  • Escalable horizontalmente
  • Alto rendimiento y disponibilidad
  • El objetivo base de HBase son millones de columnas, miles de versiones y miles de millones de filas.
  • A diferencia de HDFS (Hadoop Distribute File System), admite operaciones CRUD aleatorias en tiempo real.

3) Mencione cuáles son los componentes clave de HBase.

La arquitectura de HBase consta principalmente de los siguientes componentes

  • Guardián del zoológico: Realiza el trabajo de coordinación entre el cliente y HBase Maser.
  • Maestro HBase: HBase Master monitorea el servidor de región
  • RegiónServidor: RegionServer monitorea la región
  • Región: Contiene en la memoria el almacén de datos (MemStore) y el Hfile.
  • Tablas de catálogo: Las tablas del catálogo constan de ROOT y META.
HBase ArchiDiagrama de tecnología
HBase ArchiDiagrama de tecnología

4) Explique en qué consiste HBase.

  • HBase consta de un conjunto de mesas
  • Y cada tabla contiene filas y columnas como una base de datos tradicional.
  • Cada tabla debe contener un elemento definido como Clave Primaria
  • La columna HBase denota un atributo de un objeto

5) Mencione cuántos comandos operativos hay en HBase.

Existen principalmente cinco tipos de OperaFuncional​ comandos en HBase:

  • Obtén
  • poner
  • Borrar
  • Escanear
  • Incremento
Preguntas de entrevista de HBase
Preguntas de entrevista de HBase

6) Explique qué es WAL y Hlog en HBase.

WAL (Registro de escritura anticipada) es similar a MySQL registro BIN; registra todos los cambios que ocurren en los datos. Es un archivo de secuencia estándar de Hadoop y almacena HLogkey. Estas claves constan de un número secuencial, así como de datos reales, y se utilizan para reproducir datos que aún no persisten después de una falla del servidor. Entonces, en caso de falla del servidor, WAL funciona como un salvavidas y recupera los datos perdidos.


7) ¿Cuándo deberías usar HBase?

  • El tamaño de los datos es enorme: Cuando tienes toneladas y millones de registros para operar
  • Rediseño completo: Cuando traslada RDBMS a HBase, lo considera como un rediseño completo y luego simplemente cambia los puertos.
  • SQL-Less comandos: Tiene varias funciones como transacciones; uniones internas, columnas escritas, etc.
  • Inversión en Infraestructura: Necesita tener suficiente clúster para que HBase sea realmente útil

8) En HBase, ¿qué son las familias de columnas?

Las familias de columnas comprenden la unidad básica de almacenamiento físico en HBase a la que se aplican características como compresiones.


9) Explique ¿qué es la clave de fila?

La clave de fila la define la aplicación. Como la clave combinada está precedida por la clave de fila, permite a la aplicación definir el orden de clasificación deseado. También permite la agrupación lógica de celdas y garantiza que todas las celdas con la misma clave de fila estén ubicadas en el mismo servidor.


10) ¿Explicar la eliminación en HBase? Mencione cuáles son los tres tipos de marcadores de lápida en HBase.

Cuando elimina la celda en HBase, los datos en realidad no se eliminan, pero se establece un marcador de desecho, lo que hace que las celdas eliminadas sean invisibles. Los HBase eliminados en realidad se eliminan durante las compactaciones.

Existen tres tipos de marcadores de lápidas:

  • Marcador de eliminación de versión: para eliminar, marca una única versión de una columna.
  • Marcador de eliminación de columna: Para eliminar, marca todas las versiones de una columna.
  • Marcador de eliminación de familia: para la eliminación, marca todas las columnas de una familia de columnas.

11) Explique cómo HBase realmente elimina una fila.

En HBase, todo lo que escriba se almacenará de la RAM en el disco; estas escrituras en el disco son inmutables salvo compactación. Durante el proceso de eliminación en HBase, el proceso de compactación mayor elimina el marcador, mientras que las compactaciones menores no. En las eliminaciones normales, se produce un marcador de eliminación de lápida; estos datos de eliminación que representan se eliminan durante la compactación.

Además, si elimina datos y agrega más datos, pero con una marca de tiempo anterior a la marca de tiempo de desecho, más Obtiene puede estar enmascarado por el marcador de eliminación/lápida y, por lo tanto, no recibirá el valor insertado hasta después de la compactación mayor.


12) Explique qué sucede si modifica el tamaño de bloque de una familia de columnas en una base de datos ya ocupada.

Cuando modifica el tamaño de bloque de la familia de columnas, los nuevos datos ocupan el nuevo tamaño de bloque mientras que los datos antiguos permanecen dentro del tamaño de bloque anterior. Durante la compactación de datos, los datos antiguos adoptarán el nuevo tamaño de bloque. Los archivos nuevos, a medida que se vacían, tienen un nuevo tamaño de bloque, mientras que los datos existentes seguirán leyéndose correctamente. Todos los datos deben transformarse al nuevo tamaño de bloque, después de la siguiente compactación importante.


13) ¿Mencione la diferencia entre HBase y la base de datos relacional?

A continuación se muestran algunas diferencias importantes entre Apache HBase y la base de datos relacional:

HBase Base de datos relacional
  • No tiene esquema
  • Es un almacén de datos orientado a columnas.
  • Se utiliza para almacenar datos desnormalizados.
  • Contiene tablas escasamente pobladas.
  • La partición automatizada se realiza en HBase
  • Es una base de datos basada en esquemas.
  • Es un almacén de datos orientado a filas.
  • Se utiliza para almacenar datos normalizados.
  • Contiene mesas delgadas.
  • No existe tal disposición ni soporte integrado para la partición

14) ¿Qué es la clase HBaseFsck?

Hay un nombre de herramienta llamado back disponible en HBase, que se implementa mediante la clase HBaseFsck. Ofrece varios modificadores de línea de comandos que influyen en su comportamiento.


Preguntas y respuestas de la entrevista de HBase para experimentados

15) ¿Cuáles son las principales estructuras clave de HBase?

La clave de fila y la clave de columna son las dos estructuras de claves más importantes que se utilizan en HBase


16) Analice cómo puede utilizar filtros en Apache HBase

Filtros en HBase Shell. Se introdujo en Apache HBase 0.92 y le ayuda a realizar filtrado del lado del servidor para acceder a HBase a través de Caparazón HBase o ahorro.


17) ¿HBase admite estructura de sintaxis como SQL, sí o no?

No Desafortunadamente, SQL El soporte para HBase no está disponible actualmente. Sin embargo, al utilizar Apache Phoenix, podemos recuperar datos de HBase mediante consultas SQL.


18) ¿Cuál es el significado de compactación en HBase?

En momentos de gran cantidad de escrituras entrantes, es imposible lograr un rendimiento óptimo teniendo un archivo por almacén. HBase le ayuda a combinar todos estos HFiles para reducir la cantidad de semillas de disco para cada lectura. Este proceso se conoce como Compactación en HBase.


19) ¿Cómo implementará uniones en HBase?

HBase, no admite uniones directas pero usa MapReduce Las consultas de unión de trabajos se pueden implementar recuperando datos con la ayuda de diferentes tablas HBase.


20) Explique JMX sobre HBSE

Java Management Extensions o JMX es un estado de exportación de Java aplicaciones es el estándar para ellos.


21) ¿Para qué sirve MasterServer?

El servidor maestro también le ayuda a asignar una región al servidor de región. También le ayuda a manejar el equilibrio de carga que utilizamos MasterServer.


22) Defina el término ahorro

Apache Thrift está escrito en C++. Proporciona compiladores de esquemas para varios lenguajes de programación como C++, Perl, PHP, Python, Rubí y más.


23) ¿Por qué utilizar HColumn?Descripto clase?

Los detalles relacionados con la familia de columnas, como la configuración de compresión y el número de versiones, se almacenan en HColumn.Descripto.


24) ¿Qué es una celda en HBase?

Una celda en HBase es la unidad más pequeña de un Tabla HBase. Le ayuda a contener un dato en forma de tupla {fila, columna, versión}


25) ¿Qué es un filtro Bloom?

HBase admite el filtro Bloom, que ayuda a mejorar el rendimiento general del clúster. Un filtro Bloom de HBase es un mecanismo que permite ahorrar espacio y permite comprobar si un archivo HFile incluye una determinada fila o celda de columna de fila.


26) Cuéntame sobre los tipos de HBase Operaciones?

Respuesta. Dos tipos de HBase Operaciones son:

  • Leer Operadesarrollo
  • Escribe. Operadesarrollo

27) ¿Para qué sirve HBase HMaster?

Las principales responsabilidades de un maestro son:

  1. Coordinación de los servidores de la región.
  2. Funciones de administración

28) ¿Qué técnica puedes usar en HBase para acceder a HFile directamente sin la ayuda de HBase?

Para acceder a HFile directamente sin usar HBase, usamos el método HFile.main().


29) ¿El servidor de región puede estar ubicado en todos los DataNodes?

Sí, los servidores regionales se ejecutan en los mismos servidores que los DataNodes.


30) Nombra el filtro que acepta el tamaño de la página como parámetro en HBase.

Un filtro llamado PageFilter acepta el tamaño de la página como parámetro.

Este documento ha sido elaborado con herramientas de conversión instantánea de HTML.

Estas preguntas de la entrevista también te ayudarán en tu viva(orals)