Top 25 de întrebări și răspunsuri la interviu de testare ETL pentru 2025

Iată întrebările și răspunsurile la interviu ETL Testing pentru candidații mai proaspeți, precum și cu experiență, pentru a obține locul de muncă visat.

 

ETL Testing Interviu Întrebări pentru Freshers


1) Ce este ETL?

În arhitectura de depozitare a datelor, ETL este o componentă importantă, care gestionează datele pentru orice proces de afaceri. ETL înseamnă Extrage, transformă si A incarca. Extract face procesul de citire a datelor dintr-o bază de date. Transform face conversia datelor într-un format care ar putea fi adecvat pentru raportare și analiză. În timp ce, încărcarea face procesul de scriere a datelor în baza de date țintă.

👉 Descărcare PDF gratuită: Întrebări și răspunsuri la interviu de testare ETL


2) Explicați ce includ operațiunile de testare ETL?

Testarea ETL include:

  • Verificați dacă datele se transformă corect în funcție de cerințele afacerii
  • Verificați dacă datele proiectate sunt încărcate în depozitul de date fără trunchiere și pierderi de date
  • Asigurați-vă că aplicația ETL raportează date nevalide și le înlocuiește cu valori implicite
  • Asigurați-vă că datele se încarcă la intervalul de timp estimat pentru a îmbunătăți scalabilitatea și performanța

Procesul ETL
ETL


3) Menționați care sunt tipurile de aplicații de depozit de date și care este diferența dintre minarea de date și depozitarea de date?

Tipurile de aplicații de depozit de date sunt

  • Procesarea informațiilor
  • Prelucrare analitică
  • Data Mining

exploatare a datelor poate fi definit ca procesul de extragere a informațiilor predictive ascunse din baze de date mari și de interpretare a datelor, în timp ce depozitarea datelor poate utiliza o mină de date pentru procesarea analitică a datelor într-un mod mai rapid. Depozitare de date este procesul de agregare a datelor din mai multe surse într-un singur depozit comun


4) Care sunt diferitele instrumente utilizate în ETL?

  • Fluxul de decizii Cognos
  • Oracle Constructor de depozite
  • Obiecte de afaceri XI
  • Depozitul afacerii SAS
  • Server SAS Enterprise ETL

5) Ce este realitatea? Care sunt tipurile de fapte?

Este o componentă centrală a unui model multidimensional care conține măsurile care trebuie analizate. Faptele sunt legate de dimensiuni.

Tipurile de fapte sunt

  • Fapte aditive
  • Fapte semi-aditive
  • Fapte non-aditive

6) Explicați ce sunt Cuburile și Cuburile OLAP?

Cuburile sunt unități de procesare a datelor compuse din tabele de fapte și dimensiuni din depozitul de date. Oferă analiză multidimensională.

OLAP înseamnă Procesare analitică online, iar cubul OLAP stochează date mari în formă multidimensională în scopuri de raportare. Constă din fapte numite măsuri clasificate pe dimensiuni.


7) Explicați ce este nivelul de urmărire și care sunt tipurile?

Nivelul de urmărire este cantitatea de date stocată în fișierele jurnal. Nivelul de urmărire poate fi clasificat în două Normal și Verbos. Nivelul normal explică nivelul de urmărire într-o manieră detaliată, în timp ce verbose explică nivelurile de urmărire la fiecare rând.


8) Explicați ce este Granul de fapt?

Grain fact poate fi definit ca nivelul la care sunt stocate informațiile despre fapte. Este, de asemenea, cunoscut sub numele de Fat Granularity


9) Explicați ce este schema de fapt fără fapt și ce este Măsurile?

Un tabel de fapte fără măsuri este cunoscut ca tabel de fapte fără fapte. Poate vizualiza numărul de evenimente care au loc. De exemplu, este folosit pentru a înregistra un eveniment, cum ar fi numărul de angajați într-o companie.

Datele numerice bazate pe coloanele dintr-un tabel de fapte sunt cunoscute sub numele de Măsuri


10) Explicați ce este transformarea?

O transformare este un obiect de depozit care generează, modifică sau transmite date. Transformările sunt de două tipuri active și pasive


Întrebări și răspunsuri la interviu pentru dezvoltatori ETL pentru cei cu experiență

11) Explicați utilizarea Transformării Căutării?

Transformarea Căutării este utilă pentru

  • Obținerea unei valori asociate dintr-un tabel folosind o valoare de coloană
  • Actualizați tabelul de dimensiuni care se schimbă încet
  • Verificați dacă înregistrările există deja în tabel

12) Explicați ce este partiționarea, partiționarea hash și partiționarea round robin?

Pentru a îmbunătăți performanța, tranzacțiile sunt subdivizate, aceasta se numește Partiționare. Împărțirea permite Informatică Server pentru crearea unei conexiuni multiple la diverse surse

Tipurile de partiții sunt

Partiționare Round-Robin:

  • Prin informatica datele sunt distribuite uniform intre toate partitiile
  • În fiecare partiție în care numărul de rânduri de procesat este aproximativ același, această împărțire este aplicabilă

Partiționare hash:

  • În scopul partiționării cheilor pentru gruparea datelor între partiții, serverul Informatica aplică o funcție hash
  • Este utilizat atunci când se asigură că grupurile de rânduri cu aceeași cheie de partiționare în aceeași partiție trebuie să fie asigurate.

13) Menționați care este avantajul utilizării DataReader Destination Adapter?

Avantajul utilizării adaptorului de destinație DataReader este că populează un set de înregistrări ADO (constă din înregistrări și coloane) în memorie și expune datele din taskul DataFlow prin implementarea interfeței DataReader, astfel încât altă aplicație să poată consuma datele.


14) Utilizând SSIS (Serviciul de integrare SQL Server) care sunt modalitățile posibile de a actualiza tabelul?

Pentru a actualiza tabelul folosind SSIS, modurile posibile sunt:

  • Folosi SQL comandă
  • Utilizați o masă de punere în scenă
  • Utilizați cache
  • Utilizați Script Task
  • Utilizați numele complet al bazei de date pentru actualizare dacă este utilizat MSSQL

15) În cazul în care aveți o sursă non-OLEDB (Object Linking and Embedding Database) pentru căutare, ce ați face?

În cazul în care aveți o sursă non-OLEBD pentru căutare, atunci trebuie să utilizați Cache pentru a încărca datele și a le folosi ca sursă


16) În ce caz utilizați cache dinamic și cache static în transformările conectate și neconectate?

  • Cache-ul dinamic este utilizat atunci când trebuie să actualizați tabelul principal și dimensiunile cu schimbare lent (SCD) tip 1
  • Pentru fișierele plate este utilizat cache-ul static

17) Explicați care sunt diferențele dintre căutarea Neconectat și Conectat?

Căutare conectată Căutare neconectată
Căutarea conectată participă la cartografiere Este folosit când funcția de căutare este utilizată în loc de transformarea expresiei în timpul maparii
Pot fi returnate mai multe valori Returnează doar un port de ieșire
Poate fi conectat la alte transformări și returnează o valoare O altă transformare nu poate fi conectată
Cache-ul static sau dinamic poate fi utilizat pentru căutarea conectată Neconectat ca doar cache static
Căutarea conectată acceptă valorile implicite definite de utilizator Căutarea neconectată nu acceptă valorile implicite definite de utilizator
În căutarea conectată, mai multe coloane pot fi returnate de pe același rând sau inserate în memoria cache de căutare dinamică Căutarea neconectată desemnează un port de retur și returnează o coloană din fiecare rând

18) Explicați ce este vizualizarea sursei de date?

O vizualizare a sursei de date permite definirea schemei relaționale care va fi utilizată în bazele de date ale serviciilor de analiză. Mai degrabă decât direct din obiectele sursei de date, dimensiunile și cuburile sunt create din vizualizările sursei de date.


19) Explicați care este diferența dintre instrumentele OLAP și instrumentele ETL?

Diferența dintre instrumentul ETL și OLAP este că

instrument ETL este conceput pentru extragerea datelor din sistemele moștenite și încărcarea în baza de date specificată cu un proces de curățare a datelor.

Exemplu: Faza de date, Informatica etc.

În timp ce OLAP este destinat pentru raportare în datele OLAP disponibile în modelul multidirecțional.

Exemplu: Business Objects, Cognos etc.


20) Cum puteți extrage SAP date folosind Informatica?

  • Cu opțiunea de conectare la putere extrageți SAP date folosind informatica
  • Instalați și configurați instrumentul PowerConnect
  • Importați sursa în Analizorul de surse. Intre Informatica si SAP Powerconnect acționează ca un gateaway. Următorul pas este generarea codului ABAP pentru cartografiere, din care numai Informatica poate extrage date SAP
  • Pentru a conecta și a importa surse de la sisteme externe se folosește Power Connect

21) Menționați care este diferența dintre Power Mart și Power Center?

Centrul de alimentare Power Mart
Să presupunem că procesăm un volum mare de date Să presupunem că procesăm un volum redus de date
Acceptă surse ERP, cum ar fi SAP, oameni moale etc. Nu acceptă surse ERP
Acceptă depozitele locale și globale Acceptă depozitul local
Acesta convertește depozitul local în depozit global Nu are nicio specificație pentru a converti depozitul local în depozit global

22) Explicați ce este zona de amenajare și care este scopul unei zone de amenajare?

Stagingul de date este o zonă în care păstrați datele temporar pe serverul de depozit de date. Stadionarea datelor include următorii pași

  • Extragerea datelor sursă și transformarea datelor (restructurare)
  • Transformarea datelor (curățarea datelor, transformarea valorii)
  • Atribuții de cheie surogat

23) Ce este Schema de autobuz?

Pentru ca diferitele procese de afaceri să identifice dimensiunile comune, se utilizează schema BUS. Vine cu o dimensiune conformă împreună cu o definiție standardizată a informațiilor


24) Explicați ce este curățarea datelor?

Curățarea datelor este un proces de ștergere a datelor din depozitul de date. Acesta șterge datele nedorite precum rândurile cu valori nule sau spații suplimentare.


25) Explicați ce sunt obiectele Schema?

Obiectele de schemă sunt structura logică care se referă direct la datele bazei de date. Obiectele de schemă includ tabele, vizualizări, sinonime de secvențe, indecși, clustere, pachete de funcții și legături de baze de date


26) Explicați acești termeni Sesiune, Worklet, Mapplet și Workflow?

  • Mapplet: Aranjează sau creează seturi de transformare
  • Worklet: Reprezintă un set specific de sarcini date
  • Flux de lucru: Este un set de instrucțiuni care îi spun serverului cum să execute sarcini
  • Sesiune: Este un set de parametri care îi spune serverului cum să mute datele de la surse la țintă

Aceste întrebări de interviu vă vor ajuta, de asemenea, în viva (orale)