25 nejlepších otázek a odpovědí na testovací rozhovor ETL pro rok 2026

Zde jsou otázky a odpovědi na pohovor ETL Testing pro čerstvější i zkušené kandidáty, aby získali svou vysněnou práci.

 

Otázky k pohovoru o testování ETL pro osvěžovače


1) Co je ETL?

V architektuře datových skladů je ETL důležitou součástí, která spravuje data pro jakýkoli podnikový proces. ETL znamená Extrahovat, transformovat si Zatížení. Extrakt provádí proces čtení dat z databáze. Transform provádí konverzi dat do formátu, který by mohl být vhodný pro reportování a analýzu. Zatímco load provádí proces zápisu dat do cílové databáze.

👉 Zdarma ke stažení PDF: Otázky a odpovědi k testovacímu rozhovoru ETL


2) Vysvětlete, co zahrnují operace testování ETL?

ETL testování zahrnuje:

  • Ověřte, zda se data transformují správně podle obchodních požadavků
  • Ověřte, zda jsou projektovaná data načtena do datového skladu bez jakéhokoli zkrácení a ztráty dat
  • Ujistěte se, že aplikace ETL hlásí neplatná data a nahradí je výchozími hodnotami
  • Ujistěte se, že se data načítají v očekávaném časovém rámci, aby se zlepšila škálovatelnost a výkon

ETL proces
ETL


3) Uveďte, jaké jsou typy aplikací datových skladů a jaký je rozdíl mezi data miningem a datovým skladem?

Typy aplikací datových skladů jsou

  • Zpracování informací
  • Analytické zpracování
  • Data Mining

Dolování dat lze definovat jako proces extrahování skrytých prediktivních informací z velkých databází a interpretaci dat, zatímco datové sklady mohou využívat datový důl pro rychlejší analytické zpracování dat. Skladování dat je proces agregace dat z více zdrojů do jednoho společného úložiště


4) Jaké jsou různé nástroje používané v ETL?

  • Rozhodovací proud Cognos
  • Oracle Stavitel skladu
  • Obchodní objekty XI
  • Obchodní sklad SAS
  • Server SAS Enterprise ETL

5) Co je skutečnost? Jaké jsou typy faktů?

Je to ústřední součást vícerozměrného modelu, který obsahuje opatření, která mají být analyzována. Fakta souvisí s rozměry.

Typy faktů jsou

  • Aditivní fakta
  • Poloaditivní fakta
  • Neaditivní fakta

6) Vysvětlete, co jsou kostky a OLAP kostky?

Kostky jsou jednotky pro zpracování dat složené z tabulek faktů a dimenzí z datového skladu. Poskytuje vícerozměrnou analýzu.

OLAP je zkratka pro Online Analytics Processing a OLAP kostka ukládá velká data ve vícerozměrné podobě pro účely vytváření sestav. Skládá se z faktů nazývaných jako míry kategorizované podle dimenzí.


7) Vysvětlete, co je to úroveň sledování a jaké jsou typy?

Úroveň trasování je množství dat uložených v souborech protokolu. Úroveň trasování lze rozdělit do dvou kategorií: Normální a Podrobná. Normální úroveň podrobně vysvětluje úroveň trasování, zatímco podrobně vysvětluje úrovně trasování na každém řádku.


8) Vysvětlete, co je Grain of Fact?

Fakta zrna lze definovat jako úroveň, na které jsou informace o faktech uloženy. Je také známá jako zrnitost faktů


9) Vysvětlete, co je schéma bez faktů a co jsou opatření?

Tabulka faktů bez měření je známá jako tabulka faktů bez faktů. Může zobrazit počet vyskytujících se událostí. Například se používá k záznamu události, jako je počet zaměstnanců ve společnosti.

Číselná data založená na sloupcích v tabulce faktů se nazývají míry


10) Vysvětlete, co je to transformace?

Transformace je objekt úložiště, který generuje, upravuje nebo předává data. Transformace jsou dva typy aktivní a pasivní


ETL Developer Interview Otázky a odpovědi pro zkušené

11) Vysvětlete použití Lookup Transformation?

Transformace vyhledávání je užitečná pro

  • Získání související hodnoty z tabulky pomocí hodnoty sloupce
  • Aktualizujte tabulku pomalu se měnících rozměrů
  • Ověřte, zda v tabulce již existují záznamy

12) Vysvětlete, co je to dělení, rozdělování hash a rozdělování typu round robin?

Pro zlepšení výkonu jsou transakce rozděleny na další části, což se nazývá rozdělení. Rozdělení umožňuje Informatika Server pro vytvoření vícenásobného připojení k různým zdrojům

Typy oddílů jsou

Rozdělení mezi kruhy:

  • Podle informatica jsou data distribuována rovnoměrně mezi všechny oddíly
  • V každém oddílu, kde je počet řádků ke zpracování přibližně stejný, je toto rozdělení použitelné

Rozdělení hash:

  • Pro účely rozdělení klíčů na seskupení dat mezi oddíly používá server Informatica hashovací funkci
  • Používá se při zajištění, že je potřeba zajistit skupiny procesů se stejným rozdělovacím klíčem ve stejném oddílu

13) Uveďte, jaké jsou výhody použití DataReader Destination Adapter?

Výhodou použití DataReader Destination Adapter je to, že naplní Sada záznamů ADO (sestávající ze záznamů a sloupců) v paměti a zpřístupňuje data z úlohy DataFlow implementací rozhraní DataReader, takže data může spotřebovávat jiná aplikace.


14) Jaké jsou možné způsoby aktualizace tabulky pomocí SSIS (SQL Server Integration Service)?

Pro aktualizaci tabulky pomocí SSIS jsou možné způsoby:

  • Použití SQL příkaz
  • Použijte pracovní stůl
  • Použijte mezipaměť
  • Použijte úlohu skriptu
  • Pokud používáte MSSQL, použijte pro aktualizaci úplný název databáze

15) V případě, že máte jiný zdroj než OLEDB (Object Linking and Embedding Database) pro vyhledávání, co byste udělali?

V případě, že máte pro vyhledávání jiný než OLEBD zdroj, musíte k načtení dat použít mezipaměť a použít je jako zdroj


16) V jakém případě používáte dynamickou mezipaměť a statickou mezipaměť v připojených a nepřipojených transformacích?

  • Dynamická mezipaměť se používá, když musíte aktualizovat hlavní tabulku a pomalu se měnící rozměry (SCD) typu 1
  • Pro ploché soubory se používá statická mezipaměť

17) Vysvětlete, jaké jsou rozdíly mezi vyhledáváním Nepřipojeno a Připojeno?

Připojené vyhledávání Nepřipojené vyhledávání
Připojené vyhledávání se účastní mapování Používá se, když se při mapování používá funkce vyhledávání místo transformace výrazu
Lze vrátit více hodnot Vrací pouze jeden výstupní port
Může být připojen k dalším transformacím a vrací hodnotu Další transformaci nelze připojit
Pro připojené vyhledávání lze použít statickou nebo dynamickou mezipaměť Nepřipojeno jako pouze statická mezipaměť
Připojené vyhledávání podporuje uživatelem definované výchozí hodnoty Nepřipojené vyhledávání nepodporuje uživatelem definované výchozí hodnoty
V Connected Lookup lze vrátit více sloupců ze stejného řádku nebo vložit do mezipaměti dynamického vyhledávání Nepřipojené vyhledávání určuje jeden návratový port a vrací jeden sloupec z každého řádku

18) Vysvětlete, co je zobrazení zdroje dat?

Zobrazení zdroje dat umožňuje definovat relační schéma, které bude použito v databázích analytických služeb. Spíše než přímo z objektů zdroje dat se dimenze a krychle vytvářejí ze zobrazení zdroje dat.


19) Vysvětlete, jaký je rozdíl mezi nástroji OLAP a nástroji ETL?

Rozdíl mezi nástrojem ETL a OLAP je v tom

ETL nástroj je určen pro extrakci dat ze starších systémů a načtení do specifikované databáze s určitým procesem čištění dat.

Příklad: Data stage, Informatica atd.

Zatímco OLAP je určen pro účely podávání zpráv v datech OLAP dostupných ve vícesměrném modelu.

Příklad: Business Objects, Cognos atd.


20) Jak můžete extrahovat SAP data pomocí Informatica?

  • S možností připojení napájení vytáhnete SAP data pomocí informatiky
  • Nainstalujte a nakonfigurujte nástroj PowerConnect
  • Importujte zdroj do Source Analyzer. Mezi Informatica a SAP Powerconnect funguje jako brána. Dalším krokem je vygenerování ABAP kódu pro mapování, ze kterého může data čerpat pouze informatica SAP
  • Pro připojení a import zdrojů z externích systémů se používá Power Connect

21) Uveďte, jaký je rozdíl mezi Power Mart a Power Center?

mocenské centrum Power Mart
Předpokládejme, že zpracováváte obrovské množství dat Předpokládejme, že zpracováváte malý objem dat
Podporuje ERP zdroje jako např SAP, lidé měkcí atd. Nepodporuje zdroje ERP
Podporuje lokální a globální úložiště Podporuje místní úložiště
Převádí místní na globální úložiště Nemá žádnou specifikaci pro převod lokálního na globální úložiště

22) Vysvětlete, co je to inscenační prostor a k čemu slouží?

Data staging je oblast, kde dočasně uchováváte data na serveru datového skladu. Data staging zahrnuje následující kroky

  • Extrakce zdrojových dat a transformace dat (restrukturalizace)
  • Transformace dat (čištění dat, transformace hodnot)
  • Náhradní klíčové úkoly

23) Co je schéma autobusu?

Pro různé obchodní procesy k identifikaci společných dimenzí se používá schéma BUS. Dodává se s přizpůsobenými rozměry spolu se standardizovanou definicí informací


24) Vysvětlete, co je čištění dat?

Čištění dat je proces mazání dat z datového skladu. Odstraňuje nevyžádaná data, jako jsou řádky s hodnotami null nebo mezerami navíc.


25) Vysvětlete, co jsou objekty schématu?

Objekty schématu jsou logickou strukturou, která přímo odkazuje na data databáze. Objekty schématu zahrnují tabulky, pohledy, synonyma sekvencí, indexy, shluky, balíčky funkcí a databázové odkazy


26) Vysvětlete tyto pojmy Session, Worklet, Mapplet a Workflow?

  • Mapplet: Uspořádá nebo vytvoří sady transformací
  • Worklet: Představuje konkrétní soubor zadaných úkolů
  • Pracovní postup: Je to sada instrukcí, které říkají serveru, jak provádět úkoly
  • Zasedání: Je to sada parametrů, které serveru říkají, jak přesunout data ze zdrojů do cíle

Tyto otázky na pohovoru také pomohou ve vašem životě (ústních)

Shrňte tento příspěvek takto: