Le 25 migliori domande e risposte per le interviste sui test ETL per il 2026

Ecco le domande e le risposte al colloquio di ETL Testing per i candidati piรน freschi ed esperti per ottenere il lavoro dei loro sogni.

 

Domande di intervista sul test ETL per le matricole


1) Cos'รจ l'ETL?

Nell'architettura del data warehousing, ETL รจ un componente importante, che gestisce i dati per qualsiasi processo aziendale. ETL sta per Extract, Trasforma and Caricare. ExtracLa trasformazione (transform) si occupa della lettura dei dati da un database. La trasformazione (transform) converte i dati in un formato adatto alla creazione di report e all'analisi. Il caricamento (load), invece, si occupa della scrittura dei dati nel database di destinazione.

๐Ÿ‘‰ Download gratuito del PDF: domande e risposte all'intervista sui test ETL


2) Spiegare cosa comprendono le operazioni di test ETL?

I test ETL includono:

  • Verificare se i dati si stanno trasformando correttamente in base ai requisiti aziendali
  • Verificare che i dati proiettati vengano caricati nel data warehouse senza troncamenti e perdite di dati
  • Assicurati che l'applicazione ETL segnali dati non validi e li sostituisca con valori predefiniti
  • Assicurati che i dati vengano caricati nell'intervallo di tempo previsto per migliorare la scalabilitร  e le prestazioni

Processo ETL
ETL


3) Menzionare quali sono i tipi di applicazioni di data warehouse e qual รจ la differenza tra data mining e data warehousing?

I tipi di applicazioni di data warehouse sono

  • Elaborazione delle informazioni
  • Elaborazione analitica
  • Data Mining

Estrazione dei dati puรฒ essere definito come il processo di extracestrarre informazioni predittive nascoste da grandi database e interpretare i dati, mentre il data warehousing puรฒ utilizzare un data mining per l'elaborazione analitica dei dati in modo piรน rapido. Conservazione dei dati รจ il processo di aggregazione dei dati provenienti da piรน fonti in un unico repository comune


4) Quali sono i vari strumenti utilizzati in ETL?

  • Flusso decisionale Cognos
  • Oracle Costruttore di magazzini
  • Oggetti aziendali XI
  • Magazzino aziendale SAS
  • Server ETL aziendale SAS

5) Qual รจ il fatto? Quali sono i tipi di fatti?

รˆ una componente centrale di un modello multidimensionale che contiene le misure da analizzare. I fatti sono legati alle dimensioni.

I tipi di fatti sono

  • Fatti additivi
  • Fatti semi-additivi
  • Fatti non additivi

6) Spiegare cosa sono i Cubi e i Cubi OLAP?

I cubi sono unitร  di elaborazione dati costituite da tabelle dei fatti e dimensioni del data warehouse. Fornisce analisi multidimensionali.

OLAP sta per Online Analytics Processing e il cubo OLAP archivia dati di grandi dimensioni in formato multidimensionale a fini di reporting. Consiste in fatti chiamati misure classificate per dimensioni.


7) Spiegare di cosa si tratta traclivello e quali sono le tipologie?

TracIl livello di registrazione indica la quantitร  di dati memorizzati nei file di registro. TracIl livello di ing puรฒ essere classificato in due: Normale e Verboso. Il livello normale spiega il traclivello di dettaglio in modo dettagliato mentre verboso spiega il traclivelli di ing in ogni singola riga.


8) Spiegare cos'รจ il Grain of Fact?

Il fatto fondamentale puรฒ essere definito come il livello al quale vengono archiviate le informazioni sui fatti. รˆ noto anche come granularitร  dei fatti


9) Spiegare cos'รจ lo schema dei fatti senza fatti e cosa sono le misure?

Una tabella dei fatti senza misure รจ nota come tabella dei fatti priva di fatti. Puรฒ visualizzare il numero di eventi che si verificano. Ad esempio, viene utilizzato per registrare un evento come il conteggio dei dipendenti in un'azienda.

I dati numerici basati sulle colonne in una tabella dei fatti sono noti come misure


10) Spiegare cos'รจ la trasformazione?

Una trasformazione รจ un oggetto repository che genera, modifica o trasmette dati. Le trasformazioni sono di due tipi Attivo e Passivo


Domande e risposte per l'intervista allo sviluppatore ETL per esperti

11) Spiegare l'uso della trasformazione di ricerca?

La trasformazione Ricerca รจ utile per

  • Ottenere un valore correlato da una tabella utilizzando un valore di colonna
  • Aggiorna la tabella delle dimensioni che cambia lentamente
  • Verificare se i record esistono giร  nella tabella

12) Spiegare cos'รจ il partizionamento, il partizionamento hash e il partizionamento round robin?

Per migliorare le prestazioni, le transazioni vengono suddivise, questo รจ chiamato partizionamento. Il partizionamento consente Informatica Server per la creazione di connessioni multiple a varie fonti

I tipi di partizioni sono

Partizionamento Round-Robin:

  • Dall'informatica i dati vengono distribuiti uniformemente tra tutte le partizioni
  • In ogni partizione in cui il numero di righe da elaborare รจ approssimativamente lo stesso, questo partizionamento รจ applicabile

Partizionamento hash:

  • Allo scopo di partizionare le chiavi per raggruppare i dati tra partizioni, il server Informatica applica una funzione hash
  • Viene utilizzato quando si garantisce che i gruppi di righe di processi con la stessa chiave di partizionamento nella stessa partizione debbano essere garantiti

13) Menziona qual รจ il vantaggio di utilizzare DataReader Destination Adapter?

Il vantaggio di utilizzare l'adattatore di destinazione DataReader รจ che popola un file Set di record ADO (costituito da record e colonne) in memoria ed espone i dati dall'attivitร  DataFlow implementando l'interfaccia DataReader, in modo che altre applicazioni possano utilizzare i dati.


14) Utilizzando SSIS (SQL Server Integration Service) quali sono i modi possibili per aggiornare la tabella?

Per aggiornare la tabella utilizzando SSIS i modi possibili sono:

  • Utilizzare SQL command
  • Utilizza una tabella di stadiazione
  • Usa cache
  • Utilizzare l'attivitร  Script
  • Utilizza il nome completo del database per l'aggiornamento se viene utilizzato MSSQL

15) Nel caso in cui disponi di un'origine non OLEDB (Object Linking and Embedding Database) per la ricerca, cosa faresti?

Nel caso in cui si disponga di un'origine non OLEBD per la ricerca, รจ necessario utilizzare Cache per caricare i dati e utilizzarli come origine


16) In quali casi si utilizza la cache dinamica e la cache statica nelle trasformazioni connesse e non connesse?

  • La cache dinamica viene utilizzata quando รจ necessario aggiornare la tabella principale e le dimensioni a modifica lenta (SCD) di tipo 1
  • Per i file flat viene utilizzata la cache statica

17) Spiegare quali sono le differenze tra la ricerca non connessa e quella connessa?

Ricerca connessa Ricerca non connessa
La ricerca connessa partecipa alla mappaping Viene utilizzato quando si utilizza la funzione di ricerca invece di una trasformazione di espressione mentre si mappaping
รˆ possibile restituire piรน valori Restituisce solo una porta di output
Puรฒ essere collegato ad un'altra trasformazione e restituisce un valore Non รจ possibile collegare un'altra trasformazione
La cache statica o dinamica puรฒ essere utilizzata per la ricerca connessa Non connesso perchรฉ solo cache statica
La ricerca connessa supporta i valori predefiniti definiti dall'utente La ricerca non connessa non supporta i valori predefiniti definiti dall'utente
In Connected Lookup รจ possibile restituire piรน colonne dalla stessa riga o inserirle nella cache di ricerca dinamica La ricerca non connessa designa una porta di ritorno e restituisce una colonna da ogni riga

18) Spiegare cos'รจ la visualizzazione origine dati?

Una vista dell'origine dati consente di definire lo schema relazionale che verrร  utilizzato nei database dei servizi di analisi. Anzichรฉ direttamente dagli oggetti origine dati, le dimensioni e i cubi vengono creati dalle visualizzazioni origine dati.


19) Spiegare qual รจ la differenza tra gli strumenti OLAP e gli strumenti ETL?

La differenza tra lo strumento ETL e OLAP รจ questa

Strumento ETL รจ destinato all'extracacquisizione dei dati dai sistemi legacy e caricamento in un database specificato, previa un'apposita procedura di pulizia dei dati.

Esempio: Stadio dati, Informatica ecc.

Mentre OLAP รจ pensato per scopi di reporting nei dati OLAP disponibili nel modello multidirezionale.

Esempio: Oggetti aziendali, Cognos ecc.


20) Come puoi esprimeretract SAP dati utilizzando Informatica?

  • Con l'opzione di connessione di alimentazione puoitract SAP dati utilizzando l'informatica
  • Installare e configurare lo strumento PowerConnect
  • Importa la fonte nell'analizzatore della fonte. Tra Informatica e SAP Powerconnect funge da gateway. Il passo successivo รจ generare il codice ABAP per la mappa.ping quindi solo informatica puรฒ estrarre dati da SAP
  • Per connettere e importare sorgenti da sistemi esterni viene utilizzato Power Connect

21) Menziona qual รจ la differenza tra Power Mart e Power Center?

Centro di potere Mercato del potere
Supponiamo di elaborare un enorme volume di dati Supponiamo di elaborare un basso volume di dati
Supporta fonti ERP come SAP, persone morbide ecc. Non supporta le origini ERP
Supporta repository locale e globale Supporta il repository locale
Converte il repository locale in globale Non ha specifiche per convertire il repository locale in globale

22) Spiegare cos'รจ l'area di sosta e qual รจ lo scopo di un'area di sosta?

Lo staging dei dati รจ un'area in cui si conservano temporaneamente i dati sul server del data warehouse. Lo staging dei dati include i seguenti passaggi

  • Dati di origine extractrasformazione (ristrutturazione) dei dati e delle informazioni
  • Trasformazione dei dati (pulizia dei dati, trasformazione del valore)
  • Assegnazioni chiave surrogate

23) Cos'รจ lo schema degli autobus?

Affinchรฉ i vari processi aziendali possano identificare le dimensioni comuni, viene utilizzato lo schema BUS. Viene fornito con dimensioni conformi insieme a una definizione standardizzata di informazioni


24) Spiegare cos'รจ l'eliminazione dei dati?

L'eliminazione dei dati รจ un processo di eliminazione dei dati dal data warehouse. Elimina i dati spazzatura come righe con valori nulli o spazi aggiuntivi.


25) Spiegare cosa sono gli oggetti dello schema?

Gli oggetti dello schema sono la struttura logica che fa riferimento direttamente ai dati del database. Gli oggetti dello schema includono tabelle, viste, sinonimi di sequenze, indici, cluster, pacchetti di funzioni e collegamenti a database


26) Spiegare questi termini Sessione, Worklet, Mapplet e Workflow?

  • Mappa: Organizza o crea insiemi di trasformazione
  • Lavoro: Rappresenta un insieme specifico di compiti assegnati
  • Flusso di lavoro: รˆ un insieme di istruzioni che indicano al server come eseguire le attivitร 
  • Sessione: รˆ un insieme di parametri che indica al server come spostare i dati dalle origini alla destinazione

Queste domande del colloquio ti aiuteranno anche nel tuo viva(orale)

Riassumi questo post con: