25 parimat ETL-i testimise intervjuu küsimust ja vastust 2025. aastal

Siin on ETL Testingu intervjuu küsimused ja vastused nii värskematele kui ka kogenumatele kandidaatidele unistuste töökoha saamiseks.

 

ETL testimise intervjuu küsimused esmakursuslastele


1) Mis on ETL?

Andmeladu arhitektuuris on ETL oluline komponent, mis haldab andmeid iga äriprotsessi jaoks. ETL tähistab Ekstrakt, teisenda ja Koormus. Väljavõte loeb andmeid andmebaasist. Transform teisendab andmed vormingusse, mis võiks sobida aruandluseks ja analüüsiks. Samal ajal kirjutab laadimine andmed sihtandmebaasi.

👉 Tasuta PDF-i allalaadimine: ETL-i testimise intervjuu küsimused ja vastused


2) Selgitage, mida ETL-i testimistoimingud hõlmavad?

ETL testimine sisaldab:

  • Kontrollige, kas andmeid muudetakse vastavalt ärinõuetele õigesti
  • Veenduge, et prognoositavad andmed laaditakse andmelattu ilma kärpimise ja andmete kadumiseta
  • Veenduge, et ETL-rakendus teataks kehtetutest andmetest ja asendaks need vaikeväärtustega
  • Skaleeritavuse ja jõudluse parandamiseks veenduge, et andmed laaditakse eeldatava aja jooksul

ETL protsess
ETL


3) Nimetage, millised on andmelao rakenduste tüübid ja mis vahe on andmekaevel ja andmehoidlal?

Andmelao rakenduste tüübid on

  • Info töötlemine
  • Analüütiline töötlemine
  • Data Mining

Andmete kaevandamine võib defineerida kui protsessi, mille käigus eraldatakse suurtest andmebaasidest varjatud ennustav teave ja tõlgendatakse andmeid, samal ajal kui andmehoidla võib kasutada andmekaevandust andmete analüütiliseks töötlemiseks kiiremini. Andmete ladustamine on mitmest allikast pärit andmete koondamise protsess ühte ühisesse hoidlasse


4) Milliseid erinevaid tööriistu ETL-is kasutatakse?

  • Cognosi otsuste voog
  • Oracle Lao ehitaja
  • Äriobjektid XI
  • SAS äriladu
  • SAS Enterprise ETL server

5) Mis on fakt? Millised on faktide liigid?

See on mitmemõõtmelise mudeli keskne komponent, mis sisaldab analüüsitavaid meetmeid. Faktid on seotud mõõtmetega.

Faktide tüübid on

  • Lisanduvad faktid
  • Poollisandiga faktid
  • Lisanditeta faktid

6) Selgitage, mis on kuubikud ja OLAP-kuubikud?

Kuubikud on andmetöötlusüksused, mis koosnevad andmelao faktitabelitest ja dimensioonidest. See pakub mitmemõõtmelist analüüsi.

OLAP tähistab võrguanalüüsi töötlemist ja OLAP-kuubik salvestab aruandluse eesmärgil suuri andmeid mitmemõõtmelisel kujul. See koosneb faktidest, mida nimetatakse mõõtmeteks jaotatud mõõtmeteks.


7) Selgitage, mis on jälgimistase ja millised on selle tüübid?

Jälgimistase on logifailidesse salvestatud andmete hulk. Jälgimistaseme võib jagada kaheks tavaliseks ja paljusõnaliseks. Tavaline tase selgitab jälgimise taset üksikasjalikult, samas kui paljusõnaline selgitab jälitustasemeid igal real.


8) Selgitage, mis on tõsiasi?

Teravilja fakti saab määratleda kui faktiteabe salvestamise taset. Seda tuntakse ka kui fakti granulaarsust


9) Selgitage, mis on faktideta faktide skeem ja mis on meetmed?

Mõõtmeteta faktitabelit nimetatakse faktitabeliks. See saab vaadata toimunud sündmuste arvu. Näiteks kasutatakse seda sündmuse salvestamiseks, näiteks töötajate arvu ettevõttes.

Faktitabeli veergudel põhinevaid arvandmeid nimetatakse meetmeteks


10) Selgitage, mis on transformatsioon?

Teisendus on hoidla objekt, mis genereerib, muudab või edastab andmeid. Transformatsioone on kahte tüüpi: aktiivne ja passiivne


ETL-i arendajaintervjuu küsimused ja vastused kogenud inimestele

11) Selgitage otsingu teisenduse kasutamist?

Otsingu teisendus on kasulik

  • Seotud väärtuse hankimine tabelist veeru väärtuse abil
  • Värskendage aeglaselt muutuvat mõõtmete tabelit
  • Kontrollige, kas kirjed on tabelis juba olemas

12) Selgitage, mis on partitsioonid, räsipartitsioonid ja ringjaotus?

Toimivuse parandamiseks jagatakse tehingud osadeks, seda nimetatakse partitsiooniks. Eraldamine võimaldab Informaatika Server mitme ühenduse loomiseks erinevate allikatega

Vaheseinte tüübid on

Round-Robini eraldamine:

  • Informatika abil jaotatakse andmed ühtlaselt kõigi vaheseinte vahel
  • See jaotus on rakendatav igas partitsioonis, kus töödeldavate ridade arv on ligikaudu sama

Räsi jaotamine:

  • Informatica server kasutab räsifunktsiooni võtmete jaotamiseks andmete rühmitamiseks partitsioonide vahel
  • Seda kasutatakse juhul, kui tagatakse, et samas partitsioonis peavad olema tagatud sama partitsioonivõtmega ridade protsesside rühmad

13) Nimetage, mis on DataReaderi sihtadapteri kasutamise eelis?

DataReaderi sihtkoha adapteri kasutamise eeliseks on see, et see täidab ADO rekord (koosneb kirjetest ja veergudest) mällu ja paljastab DataFlow ülesande andmed, rakendades DataReaderi liidese, et teised rakendused saaksid andmeid tarbida.


14) Millised on võimalikud viisid tabeli värskendamiseks SSIS-i (SQL Server Integration Service) abil?

Tabeli värskendamiseks SSIS-i abil on võimalikud viisid:

  • Kasutama SQL käsk
  • Kasutage lavastustabelit
  • Kasutage vahemälu
  • Kasutage skriptiülesannet
  • MSSQL-i kasutamisel kasutage värskendamiseks andmebaasi täisnime

15) Mida teeksite, kui teil on otsingu jaoks mitte-OLEDB (objekti linkimise ja manustamise andmebaasi) allikas?

Kui teil on otsimiseks mitte-OLEBD allikas, peate andmete laadimiseks ja allikana kasutama vahemälu


16) Millisel juhul kasutate ühendatud ja ühendamata teisendustes dünaamilist vahemälu ja staatilist vahemälu?

  • Dünaamilist vahemälu kasutatakse siis, kui peate värskendama põhitabelit ja aeglaselt muutuvaid dimensioone (SCD) tüüpi 1
  • Lamedate failide puhul kasutatakse staatilist vahemälu

17) Selgitage, millised on ühenduseta ja ühendatud otsingu erinevused?

Ühendatud otsing Ühenduseta otsing
Ühendatud otsing osaleb kaardistamises Seda kasutatakse siis, kui vastendamisel kasutatakse avaldise teisenduse asemel otsingufunktsiooni
Tagastada saab mitu väärtust Tagastab ainult ühe väljundpordi
Seda saab ühendada teiste teisendustega ja tagastab väärtuse Teist teisendust ei saa ühendada
Ühendatud otsingu jaoks saab kasutada staatilist või dünaamilist vahemälu Ühendus katkestatud kui ainult staatiline vahemälu
Ühendatud otsing toetab kasutaja määratud vaikeväärtusi Ühenduseta otsing ei toeta kasutaja määratud vaikeväärtusi
Ühendatud otsingus saab mitu veergu tagastada samast reast või sisestada dünaamilise otsingu vahemällu Ühendamata otsing määrab ühe tagastuspordi ja tagastab igast reast ühe veeru

18) Selgitage, mis on andmeallika vaade?

Andmeallika vaade võimaldab määratleda relatsiooniskeemi, mida analüüsiteenuste andmebaasides kasutatakse. Otse andmeallika objektide asemel luuakse mõõtmed ja kuubikud andmeallika vaadetest.


19) Selgitage, mis vahe on OLAP-tööriistadel ja ETL-i tööriistadel?

Erinevus ETL-i ja OLAP-i tööriista vahel on see

ETL tööriist on mõeldud andmete väljavõtmiseks pärandsüsteemidest ja laadimiseks määratud andmebaasi koos mõne andmete puhastamise protsessiga.

Näide: Andmetapp, informaatika jne.

Kuigi OLAP on mõeldud aruandluse eesmärgil OLAP-i andmetes, mis on saadaval mitmesuunalises mudelis.

Näide: Äriobjektid, Cognod jne.


20) Kuidas saate ekstraheerida SAP andmeid kasutades Informaticat?

  • Toiteühenduse valikuga saate välja tõmmata SAP andmed informatika abil
  • Installige ja konfigureerige PowerConnecti tööriist
  • Importige allikas allikaanalüsaatorisse. Informatika ja SAP Toiteühendus toimib lüüsina. Järgmine samm on genereerida kaardistamiseks ABAP-kood, millest saab andmeid tõmmata ainult informatica SAP
  • Väliste süsteemide allikate ühendamiseks ja importimiseks kasutatakse Power Connecti

21) Mainige, mis vahe on Power Martil ja Power Centeril?

Jõukeskus Power Mart
Oletame, et töödeldakse tohutul hulgal andmeid Oletame, et töödeldakse väikest andmemahtu
See toetab selliseid ERP-allikaid nagu SAP, inimesed pehmed jne. See ei toeta ERP-allikaid
See toetab kohalikku ja globaalset hoidlat See toetab kohalikku hoidlat
See muudab kohaliku globaalseks hoidlaks Sellel pole spetsifikatsiooni kohalikuks globaalseks hoidlaks teisendamiseks

22) Selgitage, mis on lavastusala ja mis on lavastusala eesmärk?

Andmete lavastus on ala, kus hoiate andmeid andmelaoserveris ajutiselt. Andmete lavastamine hõlmab järgmisi samme

  • Lähteandmete väljavõtmine ja andmete teisendamine (ümberstruktureerimine)
  • Andmete teisendamine (andmete puhastamine, väärtuste teisendamine)
  • Asendusvõtmete ülesanded

23) Mis on bussiskeem?

Erinevate äriprotsesside jaoks ühiste dimensioonide tuvastamiseks kasutatakse siini skeemi. Sellega on kaasas kooskõlastatud mõõtmed koos teabe standardiseeritud määratlusega


24) Selgitage, mis on andmete puhastamine?

Andmete puhastamine on andmete andmelaost kustutamise protsess. See kustutab rämpsandmed nagu nullväärtuste või lisatühikutega read.


25) Selgitage, mis on skeemiobjektid?

Skeemiobjektid on loogiline struktuur, mis viitab otseselt andmebaasi andmetele. Skeemiobjektid hõlmavad tabeleid, vaateid, jada sünonüüme, indekseid, klastreid, funktsioonipakette ja andmebaasilinke


26) Selgitage neid mõisteid Seanss, Worklet, Mapplet ja Workflow?

  • Mapplet: See korraldab või loob teisenduskomplekte
  • Tööleht: See esindab konkreetset antud ülesannete kogumit
  • Töövoog: See on juhiste kogum, mis ütleb serverile, kuidas ülesandeid täita
  • Seanss: See on parameetrite kogum, mis ütleb serverile, kuidas andmeid allikatest sihtpunkti teisaldada

Need intervjuu küsimused aitavad ka teie viva (suuline)