Las 25 preguntas y respuestas principales de la entrevista sobre pruebas ETL para 2026
Preguntas de la entrevista de prueba ETL para principiantes
1) ยฟQuรฉ es ETL?
En la arquitectura de almacenamiento de datos, ETL es un componente importante que administra los datos para cualquier proceso comercial. ETL significa Extraer, transformar y Carga. Extract realiza el proceso de leer datos de una base de datos. Transform convierte datos a un formato que podrรญa ser apropiado para informes y anรกlisis. Mientras que la carga realiza el proceso de escribir los datos en la base de datos de destino.
๐ Descarga gratuita de PDF: Preguntas y respuestas de la entrevista de prueba ETL
2) Explique quรฉ incluyen las operaciones de prueba ETL.
Las pruebas ETL incluyen:
- Verificar si los datos se estรกn transformando correctamente segรบn los requisitos del negocio.
- Verifique que los datos proyectados se carguen en el almacรฉn de datos sin truncamientos ni pรฉrdidas de datos.
- Asegรบrese de que la aplicaciรณn ETL informe datos no vรกlidos y los reemplace con valores predeterminados
- Asegรบrese de que los datos se carguen en el plazo previsto para mejorar la escalabilidad y el rendimiento.

3) Mencione cuรกles son los tipos de aplicaciones de almacenamiento de datos y cuรกl es la diferencia entre minerรญa de datos y almacenamiento de datos.
Los tipos de aplicaciones de almacenamiento de datos son
- Procesamiento de informaciรณn
- Procesamiento Analรญtico
- Extracciรณn de Informaciรณn
Data mining Se puede definir como el proceso de extraer informaciรณn predictiva oculta de grandes bases de datos e interpretar los datos, mientras que el almacenamiento de datos puede hacer uso de una mina de datos para el procesamiento analรญtico de los datos de una manera mรกs rรกpida. Almacenamiento de datos Es el proceso de agregar datos de mรบltiples fuentes en un repositorio comรบn.
4) ยฟCuรกles son las diversas herramientas utilizadas en ETL?
- Flujo de decisiones de Cognos
- Oracle Constructor de almacenes
- Objetos de negocio XI
- Almacรฉn empresarial SAS
- Servidor ETL empresarial SAS
5) ยฟQuรฉ es un hecho? ยฟCuales son los tipos de hechos?
Es un componente central de un modelo multidimensional que contiene las medidas a analizar. Los hechos estรกn relacionados con las dimensiones.
Los tipos de hechos son
- Hechos aditivos
- Hechos de semi-aditivos
- Hechos no aditivos
6) Explique quรฉ son los cubos y los cubos OLAP.
Los cubos son unidades de procesamiento de datos compuestas por tablas de hechos y dimensiones del almacรฉn de datos. Proporciona anรกlisis multidimensional.
OLAP significa procesamiento de anรกlisis en lรญnea y el cubo OLAP almacena grandes datos en forma multidimensional con fines de generaciรณn de informes. Consta de hechos denominados medidas categorizados por dimensiones.
7) Explique quรฉ es el nivel de rastreo y cuรกles son los tipos.
El nivel de seguimiento es la cantidad de datos almacenados en los archivos de registro. El nivel de seguimiento se puede clasificar en dos Normal y Detallado. El nivel normal explica el nivel de seguimiento de manera detallada, mientras que el nivel detallado explica los niveles de seguimiento en todas y cada una de las filas.
8) Explique quรฉ es el grano de hecho.
El hecho de grano se puede definir como el nivel en el que se almacena la informaciรณn del hecho. Tambiรฉn se conoce como granularidad de hechos.
9) Explique quรฉ es el esquema de hecho in factual y quรฉ son las medidas.
Una tabla de hechos sin medidas se conoce como tabla de hechos sin hechos. Puede ver el nรบmero de eventos que ocurren. Por ejemplo, se utiliza para registrar un evento como el recuento de empleados en una empresa.
Los datos numรฉricos basados โโen columnas en una tabla de hechos se conocen como Medidas.
10) Explique ยฟquรฉ es la transformaciรณn?
Una transformaciรณn es un objeto de repositorio que genera, modifica o pasa datos. Las transformaciones son de dos tipos: Activa y Pasiva.
Preguntas y respuestas de la entrevista para desarrolladores de ETL para experimentados
11) ยฟExplica el uso de la transformaciรณn de bรบsqueda?
La transformaciรณn de bรบsqueda es รบtil para
- Obtener un valor relacionado de una tabla usando un valor de columna
- Actualizar la tabla de dimensiones que cambia lentamente
- Verificar si ya existen registros en la tabla
12) Explique quรฉ es la particiรณn, la particiรณn hash y la particiรณn round robin.
Para mejorar el rendimiento, las transacciones se subdividen, esto se denomina Particiรณn. El particionamiento permite informรกtica Servidor para crear mรบltiples conexiones a varias fuentes
Los tipos de particiones son
Particiรณn por turnos:
- Por informatica los datos se distribuyen uniformemente entre todas las particiones
- En cada particiรณn donde el nรบmero de filas a procesar es aproximadamente el mismo, se aplica esta particiรณn
Particiรณn hash:
- Con el fin de particionar claves para agrupar datos entre particiones, el servidor de Informatica aplica una funciรณn hash.
- Se utiliza cuando se debe garantizar que los procesos tengan grupos de filas con la misma clave de particiรณn en la misma particiรณn.
13) Mencione cuรกl es la ventaja de utilizar el Adaptador de destino DataReader.
La ventaja de utilizar el Adaptador de destino DataReader es que llena un conjunto de registros ADO (consta de registros y columnas) en la memoria y expone los datos de la tarea DataFlow implementando la interfaz DataReader, para que otra aplicaciรณn pueda consumir los datos.
14) Usando SSIS (Servicio de integraciรณn de SQL Server), ยฟcuรกles son las formas posibles de actualizar la tabla?
Para actualizar la tabla usando SSIS, las formas posibles son:
- Usar un SQL comando
- Utilice una mesa de preparaciรณn
- Usar cachรฉ
- Utilice la tarea de secuencia de comandos
- Utilice el nombre completo de la base de datos para actualizar si se utiliza MSSQL
15) En caso de que tenga una fuente que no sea OLEDB (Base de datos de incrustaciรณn y vinculaciรณn de objetos) para la bรบsqueda, ยฟquรฉ harรญa?
En caso de que tenga una fuente que no sea OLEBD para la bรบsqueda, deberรก usar Cache para cargar datos y usarlos como fuente.
16) ยฟEn quรฉ caso se utiliza cachรฉ dinรกmico y cachรฉ estรกtico en transformaciones conectadas y no conectadas?
- La cachรฉ dinรกmica se utiliza cuando tiene que actualizar la tabla maestra y cambiar lentamente las dimensiones (SCD) tipo 1
- Para archivos planos se utiliza cachรฉ estรกtica
17) Explique cuรกles son las diferencias entre la bรบsqueda conectada y desconectada.
| Bรบsqueda conectada | Bรบsqueda desconectada |
|---|---|
| La bรบsqueda conectada participa en el mapeo | Se utiliza cuando se utiliza la funciรณn de bรบsqueda en lugar de una transformaciรณn de expresiรณn durante el mapeo. |
| Se pueden devolver mรบltiples valores. | Sรณlo devuelve un puerto de salida |
| Se puede conectar a otras transformaciones y devuelve un valor. | No se puede conectar otra transformaciรณn. |
| Se puede utilizar cachรฉ estรกtico o dinรกmico para la bรบsqueda conectada | Desconectado como solo cachรฉ estรกtico |
| La bรบsqueda conectada admite valores predeterminados definidos por el usuario | La bรบsqueda no conectada no admite valores predeterminados definidos por el usuario |
| En la bรบsqueda conectada se pueden devolver varias columnas desde la misma fila o insertarlas en la cachรฉ de bรบsqueda dinรกmica | La bรบsqueda no conectada designa un puerto de retorno y devuelve una columna de cada fila |
18) Explique quรฉ es la vista de fuente de datos.
Una vista de fuente de datos permite definir el esquema relacional que se utilizarรก en las bases de datos de los servicios de anรกlisis. En lugar de hacerlo directamente a partir de objetos de origen de datos, las dimensiones y los cubos se crean a partir de vistas de origen de datos.
19) Explique cuรกl es la diferencia entre las herramientas OLAP y las herramientas ETL.
La diferencia entre la herramienta ETL y OLAP es que
Herramienta ETL estรก destinado a la extracciรณn de datos de los sistemas heredados y cargarlos en una base de datos especรญfica con algรบn proceso de limpieza de datos.
Ejemplo: Etapa de datos, informรกtica, etc.
Mientras que OLAP estรก destinado a fines de generaciรณn de informes en datos OLAP disponibles en modelo multidireccional.
Ejemplo: Objetos de negocio, Cognos, etc.
20) ยฟCรณmo puedes extraer? SAP datos utilizando Informatica?
- Con la opciรณn de conexiรณn de energรญa extraes SAP datos usando informatica
- Instalar y configurar la herramienta PowerConnect
- Importe la fuente al Analizador de fuentes. Entre informรกtica y SAP Powerconnect actรบa como puerta de entrada. El siguiente paso es generar el cรณdigo ABAP para el mapeo, luego solo Informatica puede extraer datos de SAP
- Para conectar e importar fuentes de sistemas externos se utiliza Power Connect
21) Mencione ยฟcuรกl es la diferencia entre Power Mart y Power Center?
| Centro de poder | Mercado de energรญa |
|---|---|
| Supongamos que procesa un gran volumen de datos. | Supongamos que procesa un bajo volumen de datos. |
| Admite fuentes de ERP como SAP, gente suave, etc. | No es compatible con fuentes ERP. |
| Soporta repositorio local y global. | Soporta repositorio local |
| Convierte un repositorio local en global. | No tiene ninguna especificaciรณn para convertir el repositorio local en global. |
22) Explique quรฉ es el รกrea de preparaciรณn y cuรกl es el propรณsito de un รกrea de preparaciรณn.
El almacenamiento provisional de datos es un รกrea donde se almacenan los datos temporalmente en un servidor de almacenamiento de datos. El almacenamiento provisional de datos incluye los siguientes pasos:
- Extracciรณn de datos fuente y transformaciรณn de datos (reestructuraciรณn)
- Transformaciรณn de datos (limpieza de datos, transformaciรณn de valor)
- Asignaciones de claves sustitutas
23) ยฟQuรฉ es el esquema de bus?
Para que los distintos procesos de negocio identifiquen las dimensiones comunes, se utiliza el esquema BUS. Viene con dimensiones conformadas junto con una definiciรณn estandarizada de informaciรณn.
24) Explique quรฉ es la depuraciรณn de datos.
La depuraciรณn de datos es un proceso de eliminaciรณn de datos del almacรฉn de datos. Elimina filas similares a datos basura con valores nulos o espacios adicionales.
25) Explique quรฉ son los objetos de esquema.
Los objetos de esquema son la estructura lรณgica que se refiere directamente a los datos de la base de datos. Los objetos de esquema incluyen tablas, vistas, sinรณnimos de secuencia, รญndices, clรบsteres, paquetes de funciones y enlaces de bases de datos.
26) Explique estos tรฉrminos Sesiรณn, Worklet, Mapplet y Workflow.
- Mapplete: Organiza o crea conjuntos de transformaciรณn.
- Trabajo: Representa un conjunto especรญfico de tareas dadas.
- Flujo de trabajo: Es un conjunto de instrucciones que le indican al servidor cรณmo ejecutar tareas.
- Sesiรณn: Es un conjunto de parรกmetros que le indica al servidor cรณmo mover datos desde el origen al destino.
Estas preguntas de la entrevista tambiรฉn te ayudarรกn en tu viva(orals)
