Top 25 pitanja i odgovora za intervju za ETL testiranje za 2025
Pitanja za intervju za ETL testiranje za brucoše
1) Što je ETL?
U arhitekturi skladištenja podataka, ETL je važna komponenta koja upravlja podacima za bilo koji poslovni proces. ETL je kratica za Ekstrahiraj, transformiraj i Opterećenje. Extract obavlja proces čitanja podataka iz baze podataka. Transform pretvara podatke u format koji bi mogao biti prikladan za izvješćivanje i analizu. Dok učitavanje obavlja proces pisanja podataka u ciljnu bazu podataka.
👉 Besplatno preuzimanje PDF-a: Pitanja i odgovori za intervju za ETL testiranje
2) Objasnite što uključuju operacije testiranja ETL-a?
ETL testiranje uključuje:
- Provjerite transformiraju li se podaci ispravno u skladu s poslovnim zahtjevima
- Provjerite jesu li projicirani podaci učitani u skladište podataka bez skraćivanja i gubitka podataka
- Provjerite javlja li ETL aplikacija nevažeće podatke i zamjenjuje ih zadanim vrijednostima
- Provjerite učitavaju li se podaci u očekivanom vremenskom okviru kako biste poboljšali skalabilnost i izvedbu
3) Navedite koje su vrste aplikacija za skladištenje podataka i koja je razlika između rudarenja podataka i skladištenja podataka?
Vrste aplikacija skladišta podataka su
- Obrada informacija
- Analitička obrada
- Data Mining
Data mining može se definirati kao proces izdvajanja skrivenih prediktivnih informacija iz velikih baza podataka i tumačenja podataka, dok skladištenje podataka može iskoristiti rudnik podataka za analitičku obradu podataka na brži način. Skladištenje podataka je proces prikupljanja podataka iz više izvora u jedno zajedničko spremište
4) Koji se različiti alati koriste u ETL-u?
- Cognos Decision Stream
- Oracle Graditelj skladišta
- Poslovni objekti XI
- SAS poslovno skladište
- SAS Enterprise ETL poslužitelj
5) Što je činjenica? Koje su vrste činjenica?
To je središnja komponenta višedimenzionalnog modela koji sadrži mjere koje treba analizirati. Činjenice su povezane s dimenzijama.
Vrste činjenica su
- Dodatne činjenice
- Poluaditivne činjenice
- Neaditivne činjenice
6) Objasnite što su kocke i OLAP kocke?
Kocke su jedinice za obradu podataka koje se sastoje od tablica činjenica i dimenzija iz skladišta podataka. Omogućuje višedimenzionalnu analizu.
OLAP je kratica za Online Analytics Processing, a OLAP kocka pohranjuje velike podatke u višedimenzionalnom obliku za potrebe izvješćivanja. Sastoji se od činjenica koje se nazivaju mjerama kategoriziranih po dimenzijama.
7) Objasnite što je razina praćenja i koje su vrste?
Razina praćenja je količina podataka pohranjenih u datotekama dnevnika. Razina praćenja može se klasificirati u dvije normalne i verbose. Normalna razina detaljno objašnjava razinu praćenja, dok verbose objašnjava razine praćenja u svakom retku.
8) Objasnite što je zrno činjenica?
Grain fact se može definirati kao razina na kojoj su informacije o činjenicama pohranjene. Također je poznat kao Fact Granularity
9) Objasnite što je shema činjenica bez činjenica, a što su mjere?
Tablica činjenica bez mjera poznata je kao tablica činjenica bez činjenica. Može vidjeti broj događaja koji su se dogodili. Na primjer, koristi se za bilježenje događaja kao što je broj zaposlenika u tvrtki.
Numerički podaci temeljeni na stupcima u tablici činjenica poznati su kao mjere
10) Objasnite što je transformacija?
Transformacija je objekt repozitorija koji generira, modificira ili prosljeđuje podatke. Transformacije su dvije vrste aktivne i pasivne
Pitanja i odgovori za intervju za ETL programere za iskusne
11) Objasnite korištenje Lookup transformacije?
Transformacija pretraživanja korisna je za
- Dobivanje povezane vrijednosti iz tablice pomoću vrijednosti stupca
- Ažurirajte tablicu dimenzija koja se polako mijenja
- Provjerite postoje li zapisi već u tablici
12) Objasnite što je particioniranje, hash particioniranje i kružno particioniranje?
Radi poboljšanja performansi, transakcije su poddijeljene, to se naziva particioniranje. Partioniranje omogućuje Informatika Poslužitelj za stvaranje višestruke veze s različitim izvorima
Vrste pregrada su
Round Robin particioniranje:
- Informatikom se podaci ravnomjerno raspoređuju među svim particijama
- U svakoj particiji gdje je broj redaka za obradu približno isti, ovo je dijeljenje primjenjivo
Hash particioniranje:
- U svrhu particioniranja ključeva za grupiranje podataka među particijama Informatica poslužitelj primjenjuje hash funkciju
- Koristi se kada se osigurava da procesi moraju osigurati grupe redaka s istim particijskim ključem u istoj particiji
13) Navedite koja je prednost korištenja DataReader Destination Adaptera?
Prednost korištenja DataReader odredišnog adaptera je u tome što popunjava ADO skup zapisa (sastoji se od zapisa i stupaca) u memoriji i izlaže podatke iz zadatka DataFlow implementacijom sučelja DataReader, tako da druge aplikacije mogu konzumirati podatke.
14) Korištenje SSIS-a (SQL Server Integration Service) koji su mogući načini ažuriranja tablice?
Za ažuriranje tablice pomoću SSIS-a mogući su sljedeći načini:
- Koristiti SQL naredba
- Koristite stol za postavljanje
- Koristite predmemoriju
- Koristite zadatak skripte
- Koristite puni naziv baze podataka za ažuriranje ako se koristi MSSQL
15) U slučaju da imate izvor koji nije OLEDB (Object Linking and Embedding Database) za pretraživanje, što biste učinili?
U slučaju da imate izvor koji nije OLEBD za pretraživanje, tada morate koristiti predmemoriju za učitavanje podataka i korištenje kao izvor
16) U kojem slučaju koristite dinamičku predmemoriju i statičku predmemoriju u povezanim i nepovezanim transformacijama?
- Dinamička predmemorija koristi se kada morate ažurirati glavnu tablicu i sporo promjenjive dimenzije (SCD) tipa 1
- Za ravne datoteke koristi se statička predmemorija
17) Objasnite koje su razlike između Unconnected i Connected lookup?
Povezano traženje | Nepovezano traženje |
---|---|
Povezano traženje sudjeluje u mapiranju | Koristi se kada se koristi funkcija pretraživanja umjesto transformacije izraza tijekom preslikavanja |
Moguće je vratiti više vrijednosti | Vraća samo jedan izlazni priključak |
Može se povezati s drugim transformacijama i vraća vrijednost | Ne može se povezati druga transformacija |
Statička ili dinamička predmemorija može se koristiti za povezano traženje | Nepovezan kao samo statička predmemorija |
Povezano traženje podržava korisnički definirane zadane vrijednosti | Nepovezano traženje ne podržava korisnički definirane zadane vrijednosti |
U Connected Lookup više stupaca može se vratiti iz istog retka ili umetnuti u predmemoriju dinamičkog pretraživanja | Nepovezano traženje označava jedan povratni port i vraća jedan stupac iz svakog retka |
18) Objasnite što je prikaz izvora podataka?
Prikaz izvora podataka omogućuje definiranje relacijske sheme koja će se koristiti u bazama podataka usluga analize. Umjesto izravno iz objekata izvora podataka, dimenzije i kocke se stvaraju iz prikaza izvora podataka.
19) Objasnite koja je razlika između OLAP alata i ETL alata?
Razlika između ETL i OLAP alata je u tome
ETL alat namijenjen je ekstrakciji podataka iz naslijeđenih sustava i učitavanju u određenu bazu podataka uz neki proces čišćenja podataka.
Primjer: Data stage, Informatica itd.
Dok je OLAP namijenjen za potrebe izvješćivanja, OLAP podaci dostupni su u višesmjernom modelu.
Primjer: Business Objects, Cognos itd.
20) Kako možete izdvojiti SAP podatke pomoću Informatice?
- S opcijom spajanja na napajanje koju izvlačite SAP podaci pomoću informatike
- Instalirajte i konfigurirajte alat PowerConnect
- Uvezite izvor u Source Analyzer. Između Informatice i SAP Powerconnect djeluje kao pristupnik. Sljedeći korak je generiranje ABAP koda za mapiranje iz kojeg samo informatica može izvlačiti podatke SAP
- Za povezivanje i uvoz izvora iz vanjskih sustava koristi se Power Connect
21) Navedite koja je razlika između Power Marta i Power Centera?
Centar napajanja | Power Mart |
---|---|
Pretpostavimo da obradimo veliku količinu podataka | Pretpostavimo da obrađujemo malu količinu podataka |
Podržava ERP izvore kao što su SAP, ljudi meki itd. | Ne podržava ERP izvore |
Podržava lokalni i globalni repozitorij | Podržava lokalno spremište |
Pretvara lokalno u globalno spremište | Nema specifikacije za pretvaranje lokalnog u globalno spremište |
22) Objasnite što je stajalište i čemu služi stajalište?
Određivanje podataka je područje u kojem privremeno držite podatke na poslužitelju skladišta podataka. Postavljanje podataka uključuje sljedeće korake
- Ekstrakcija izvornih podataka i transformacija podataka (restrukturiranje)
- Transformacija podataka (čišćenje podataka, transformacija vrijednosti)
- Dodjela zamjenskog ključa
23) Što je shema sabirnice?
Za različite poslovne procese za identifikaciju zajedničkih dimenzija koristi se BUS shema. Dolazi s usklađenim dimenzijama zajedno sa standardiziranom definicijom informacija
24) Objasnite što je čišćenje podataka?
Brisanje podataka je proces brisanja podataka iz skladišta podataka. Briše neželjene podatke poput redaka s nultim vrijednostima ili dodatnim razmacima.
25) Objasnite što su objekti sheme?
Objekti sheme su logička struktura koja se izravno odnosi na podatke baze podataka. Objekti sheme uključuju tablice, prikaze, sinonime nizova, indekse, klastere, pakete funkcija i veze baze podataka
26) Objasnite ove pojmove Sesija, Worklet, Mapplet i Workflow?
- Mapplet: Uređuje ili stvara skupove transformacije
- Worklet: Predstavlja određeni skup zadanih zadataka
- Tijek rada: To je skup uputa koje govore poslužitelju kako izvršiti zadatke
- Sjednica: To je skup parametara koji govore poslužitelju kako premjestiti podatke od izvora do cilja
Ova pitanja za intervju također će vam pomoći u vašem životu