Las 25 preguntas y respuestas principales de la entrevista sobre pruebas ETL para 2025

Aquí hay preguntas y respuestas de la entrevista de ETL Testing para que los candidatos más nuevos y experimentados consigan el trabajo de sus sueños.

 

Preguntas de la entrevista de prueba ETL para principiantes


1) ¿Qué es ETL?

En la arquitectura de almacenamiento de datos, ETL es un componente importante que administra los datos para cualquier proceso comercial. ETL significa Extraer, transformar y Carga. Extract realiza el proceso de leer datos de una base de datos. Transform convierte datos a un formato que podría ser apropiado para informes y análisis. Mientras que la carga realiza el proceso de escribir los datos en la base de datos de destino.

👉 Descarga gratuita de PDF: Preguntas y respuestas de la entrevista de prueba ETL


2) Explique qué incluyen las operaciones de prueba ETL.

Las pruebas ETL incluyen:

  • Verificar si los datos se están transformando correctamente según los requisitos del negocio.
  • Verifique que los datos proyectados se carguen en el almacén de datos sin truncamientos ni pérdidas de datos.
  • Asegúrese de que la aplicación ETL informe datos no válidos y los reemplace con valores predeterminados
  • Asegúrese de que los datos se carguen en el plazo previsto para mejorar la escalabilidad y el rendimiento.

Proceso ETL
ETL


3) Mencione cuáles son los tipos de aplicaciones de almacenamiento de datos y cuál es la diferencia entre minería de datos y almacenamiento de datos.

Los tipos de aplicaciones de almacenamiento de datos son

  • Procesamiento de información
  • Procesamiento Analítico
  • Extracción de Información

Data mining Se puede definir como el proceso de extraer información predictiva oculta de grandes bases de datos e interpretar los datos, mientras que el almacenamiento de datos puede hacer uso de una mina de datos para el procesamiento analítico de los datos de una manera más rápida. Almacenamiento de datos Es el proceso de agregar datos de múltiples fuentes en un repositorio común.


4) ¿Cuáles son las diversas herramientas utilizadas en ETL?

  • Flujo de decisiones de Cognos
  • Oracle Constructor de almacenes
  • Objetos de negocio XI
  • Almacén empresarial SAS
  • Servidor ETL empresarial SAS

5) ¿Qué es un hecho? ¿Cuales son los tipos de hechos?

Es un componente central de un modelo multidimensional que contiene las medidas a analizar. Los hechos están relacionados con las dimensiones.

Los tipos de hechos son

  • Hechos aditivos
  • Hechos de semi-aditivos
  • Hechos no aditivos

6) Explique qué son los cubos y los cubos OLAP.

Los cubos son unidades de procesamiento de datos compuestas por tablas de hechos y dimensiones del almacén de datos. Proporciona análisis multidimensional.

OLAP significa procesamiento de análisis en línea y el cubo OLAP almacena grandes datos en forma multidimensional con fines de generación de informes. Consta de hechos denominados medidas categorizados por dimensiones.


7) Explique qué es el nivel de rastreo y cuáles son los tipos.

El nivel de seguimiento es la cantidad de datos almacenados en los archivos de registro. El nivel de seguimiento se puede clasificar en dos Normal y Detallado. El nivel normal explica el nivel de seguimiento de manera detallada, mientras que el nivel detallado explica los niveles de seguimiento en todas y cada una de las filas.


8) Explique qué es el grano de hecho.

El hecho de grano se puede definir como el nivel en el que se almacena la información del hecho. También se conoce como granularidad de hechos.


9) Explique qué es el esquema de hecho in factual y qué son las medidas.

Una tabla de hechos sin medidas se conoce como tabla de hechos sin hechos. Puede ver el número de eventos que ocurren. Por ejemplo, se utiliza para registrar un evento como el recuento de empleados en una empresa.

Los datos numéricos basados ​​en columnas en una tabla de hechos se conocen como Medidas.


10) Explique ¿qué es la transformación?

Una transformación es un objeto de repositorio que genera, modifica o pasa datos. Las transformaciones son de dos tipos: Activa y Pasiva.


Preguntas y respuestas de la entrevista para desarrolladores de ETL para experimentados

11) ¿Explica el uso de la transformación de búsqueda?

La transformación de búsqueda es útil para

  • Obtener un valor relacionado de una tabla usando un valor de columna
  • Actualizar la tabla de dimensiones que cambia lentamente
  • Verificar si ya existen registros en la tabla

12) Explique qué es la partición, la partición hash y la partición round robin.

Para mejorar el rendimiento, las transacciones se subdividen, esto se denomina Partición. El particionamiento permite informática Servidor para crear múltiples conexiones a varias fuentes

Los tipos de particiones son

Partición por turnos:

  • Por informatica los datos se distribuyen uniformemente entre todas las particiones
  • En cada partición donde el número de filas a procesar es aproximadamente el mismo, se aplica esta partición

Partición hash:

  • Con el fin de particionar claves para agrupar datos entre particiones, el servidor de Informatica aplica una función hash.
  • Se utiliza cuando se debe garantizar que los procesos tengan grupos de filas con la misma clave de partición en la misma partición.

13) Mencione cuál es la ventaja de utilizar el Adaptador de destino DataReader.

La ventaja de utilizar el Adaptador de destino DataReader es que llena un conjunto de registros ADO (consta de registros y columnas) en la memoria y expone los datos de la tarea DataFlow implementando la interfaz DataReader, para que otra aplicación pueda consumir los datos.


14) Usando SSIS (Servicio de integración de SQL Server), ¿cuáles son las formas posibles de actualizar la tabla?

Para actualizar la tabla usando SSIS, las formas posibles son:

  • Utilizar SQL comando
  • Utilice una mesa de preparación
  • Usar caché
  • Utilice la tarea de secuencia de comandos
  • Utilice el nombre completo de la base de datos para actualizar si se utiliza MSSQL

15) En caso de que tenga una fuente que no sea OLEDB (Base de datos de incrustación y vinculación de objetos) para la búsqueda, ¿qué haría?

En caso de que tenga una fuente que no sea OLEBD para la búsqueda, deberá usar Cache para cargar datos y usarlos como fuente.


16) ¿En qué caso se utiliza caché dinámico y caché estático en transformaciones conectadas y no conectadas?

  • La caché dinámica se utiliza cuando tiene que actualizar la tabla maestra y cambiar lentamente las dimensiones (SCD) tipo 1
  • Para archivos planos se utiliza caché estática

17) Explique cuáles son las diferencias entre la búsqueda conectada y desconectada.

Búsqueda conectada Búsqueda desconectada
La búsqueda conectada participa en el mapeo Se utiliza cuando se utiliza la función de búsqueda en lugar de una transformación de expresión durante el mapeo.
Se pueden devolver múltiples valores. Sólo devuelve un puerto de salida
Se puede conectar a otras transformaciones y devuelve un valor. No se puede conectar otra transformación.
Se puede utilizar caché estático o dinámico para la búsqueda conectada Desconectado como solo caché estático
La búsqueda conectada admite valores predeterminados definidos por el usuario La búsqueda no conectada no admite valores predeterminados definidos por el usuario
En la búsqueda conectada se pueden devolver varias columnas desde la misma fila o insertarlas en la caché de búsqueda dinámica La búsqueda no conectada designa un puerto de retorno y devuelve una columna de cada fila

18) Explique qué es la vista de fuente de datos.

Una vista de fuente de datos permite definir el esquema relacional que se utilizará en las bases de datos de los servicios de análisis. En lugar de hacerlo directamente a partir de objetos de origen de datos, las dimensiones y los cubos se crean a partir de vistas de origen de datos.


19) Explique cuál es la diferencia entre las herramientas OLAP y las herramientas ETL.

La diferencia entre la herramienta ETL y OLAP es que

Herramienta ETL está destinado a la extracción de datos de los sistemas heredados y cargarlos en una base de datos específica con algún proceso de limpieza de datos.

Ejemplo: Etapa de datos, informática, etc.

Mientras que OLAP está destinado a fines de generación de informes en datos OLAP disponibles en modelo multidireccional.

Ejemplo: Objetos de negocio, Cognos, etc.


20) ¿Cómo puedes extraer? SAP datos utilizando Informatica?

  • Con la opción de conexión de energía extraes SAP datos usando informatica
  • Instalar y configurar la herramienta PowerConnect
  • Importe la fuente al Analizador de fuentes. Entre informática y SAP Powerconnect actúa como puerta de entrada. El siguiente paso es generar el código ABAP para el mapeo, luego solo Informatica puede extraer datos de SAP
  • Para conectar e importar fuentes de sistemas externos se utiliza Power Connect

21) Mencione ¿cuál es la diferencia entre Power Mart y Power Center?

Centro de poder Mercado de energía
Supongamos que procesa un gran volumen de datos. Supongamos que procesa un bajo volumen de datos.
Admite fuentes de ERP como SAP, gente suave, etc. No es compatible con fuentes ERP.
Soporta repositorio local y global. Soporta repositorio local
Convierte un repositorio local en global. No tiene ninguna especificación para convertir el repositorio local en global.

22) Explique qué es el área de preparación y cuál es el propósito de un área de preparación.

El almacenamiento provisional de datos es un área donde se almacenan los datos temporalmente en un servidor de almacenamiento de datos. El almacenamiento provisional de datos incluye los siguientes pasos:

  • Extracción de datos fuente y transformación de datos (reestructuración)
  • Transformación de datos (limpieza de datos, transformación de valor)
  • Asignaciones de claves sustitutas

23) ¿Qué es el esquema de bus?

Para que los distintos procesos de negocio identifiquen las dimensiones comunes, se utiliza el esquema BUS. Viene con dimensiones conformadas junto con una definición estandarizada de información.


24) Explique qué es la depuración de datos.

La depuración de datos es un proceso de eliminación de datos del almacén de datos. Elimina filas similares a datos basura con valores nulos o espacios adicionales.


25) Explique qué son los objetos de esquema.

Los objetos de esquema son la estructura lógica que se refiere directamente a los datos de la base de datos. Los objetos de esquema incluyen tablas, vistas, sinónimos de secuencia, índices, clústeres, paquetes de funciones y enlaces de bases de datos.


26) Explique estos términos Sesión, Worklet, Mapplet y Workflow.

  • Mapplete: Organiza o crea conjuntos de transformación.
  • Trabajo: Representa un conjunto específico de tareas dadas.
  • Flujo de trabajo: Es un conjunto de instrucciones que le indican al servidor cómo ejecutar tareas.
  • Sesión: Es un conjunto de parámetros que le indica al servidor cómo mover datos desde el origen al destino.

Estas preguntas de la entrevista también te ayudarán en tu viva(orals)