25 parimat ETL-i testimise intervjuu küsimust ja vastust 2025. aastal
ETL testimise intervjuu küsimused esmakursuslastele
1) Mis on ETL?
Andmeladu arhitektuuris on ETL oluline komponent, mis haldab andmeid iga äriprotsessi jaoks. ETL tähistab Ekstrakt, teisenda ja Koormus. Väljavõte loeb andmeid andmebaasist. Transform teisendab andmed vormingusse, mis võiks sobida aruandluseks ja analüüsiks. Samal ajal kirjutab laadimine andmed sihtandmebaasi.
👉 Tasuta PDF-i allalaadimine: ETL-i testimise intervjuu küsimused ja vastused
2) Selgitage, mida ETL-i testimistoimingud hõlmavad?
ETL testimine sisaldab:
- Kontrollige, kas andmeid muudetakse vastavalt ärinõuetele õigesti
- Veenduge, et prognoositavad andmed laaditakse andmelattu ilma kärpimise ja andmete kadumiseta
- Veenduge, et ETL-rakendus teataks kehtetutest andmetest ja asendaks need vaikeväärtustega
- Skaleeritavuse ja jõudluse parandamiseks veenduge, et andmed laaditakse eeldatava aja jooksul
3) Nimetage, millised on andmelao rakenduste tüübid ja mis vahe on andmekaevel ja andmehoidlal?
Andmelao rakenduste tüübid on
- Info töötlemine
- Analüütiline töötlemine
- Data Mining
Andmete kaevandamine võib defineerida kui protsessi, mille käigus eraldatakse suurtest andmebaasidest varjatud ennustav teave ja tõlgendatakse andmeid, samal ajal kui andmehoidla võib kasutada andmekaevandust andmete analüütiliseks töötlemiseks kiiremini. Andmete ladustamine on mitmest allikast pärit andmete koondamise protsess ühte ühisesse hoidlasse
4) Milliseid erinevaid tööriistu ETL-is kasutatakse?
- Cognosi otsuste voog
- Oracle Lao ehitaja
- Äriobjektid XI
- SAS äriladu
- SAS Enterprise ETL server
5) Mis on fakt? Millised on faktide liigid?
See on mitmemõõtmelise mudeli keskne komponent, mis sisaldab analüüsitavaid meetmeid. Faktid on seotud mõõtmetega.
Faktide tüübid on
- Lisanduvad faktid
- Poollisandiga faktid
- Lisanditeta faktid
6) Selgitage, mis on kuubikud ja OLAP-kuubikud?
Kuubikud on andmetöötlusüksused, mis koosnevad andmelao faktitabelitest ja dimensioonidest. See pakub mitmemõõtmelist analüüsi.
OLAP tähistab võrguanalüüsi töötlemist ja OLAP-kuubik salvestab aruandluse eesmärgil suuri andmeid mitmemõõtmelisel kujul. See koosneb faktidest, mida nimetatakse mõõtmeteks jaotatud mõõtmeteks.
7) Selgitage, mis on jälgimistase ja millised on selle tüübid?
Jälgimistase on logifailidesse salvestatud andmete hulk. Jälgimistaseme võib jagada kaheks tavaliseks ja paljusõnaliseks. Tavaline tase selgitab jälgimise taset üksikasjalikult, samas kui paljusõnaline selgitab jälitustasemeid igal real.
8) Selgitage, mis on tõsiasi?
Teravilja fakti saab määratleda kui faktiteabe salvestamise taset. Seda tuntakse ka kui fakti granulaarsust
9) Selgitage, mis on faktideta faktide skeem ja mis on meetmed?
Mõõtmeteta faktitabelit nimetatakse faktitabeliks. See saab vaadata toimunud sündmuste arvu. Näiteks kasutatakse seda sündmuse salvestamiseks, näiteks töötajate arvu ettevõttes.
Faktitabeli veergudel põhinevaid arvandmeid nimetatakse meetmeteks
10) Selgitage, mis on transformatsioon?
Teisendus on hoidla objekt, mis genereerib, muudab või edastab andmeid. Transformatsioone on kahte tüüpi: aktiivne ja passiivne
ETL-i arendajaintervjuu küsimused ja vastused kogenud inimestele
11) Selgitage otsingu teisenduse kasutamist?
Otsingu teisendus on kasulik
- Seotud väärtuse hankimine tabelist veeru väärtuse abil
- Värskendage aeglaselt muutuvat mõõtmete tabelit
- Kontrollige, kas kirjed on tabelis juba olemas
12) Selgitage, mis on partitsioonid, räsipartitsioonid ja ringjaotus?
Toimivuse parandamiseks jagatakse tehingud osadeks, seda nimetatakse partitsiooniks. Eraldamine võimaldab Informaatika Server mitme ühenduse loomiseks erinevate allikatega
Vaheseinte tüübid on
Round-Robini eraldamine:
- Informatika abil jaotatakse andmed ühtlaselt kõigi vaheseinte vahel
- See jaotus on rakendatav igas partitsioonis, kus töödeldavate ridade arv on ligikaudu sama
Räsi jaotamine:
- Informatica server kasutab räsifunktsiooni võtmete jaotamiseks andmete rühmitamiseks partitsioonide vahel
- Seda kasutatakse juhul, kui tagatakse, et samas partitsioonis peavad olema tagatud sama partitsioonivõtmega ridade protsesside rühmad
13) Nimetage, mis on DataReaderi sihtadapteri kasutamise eelis?
DataReaderi sihtkoha adapteri kasutamise eeliseks on see, et see täidab ADO rekord (koosneb kirjetest ja veergudest) mällu ja paljastab DataFlow ülesande andmed, rakendades DataReaderi liidese, et teised rakendused saaksid andmeid tarbida.
14) Millised on võimalikud viisid tabeli värskendamiseks SSIS-i (SQL Server Integration Service) abil?
Tabeli värskendamiseks SSIS-i abil on võimalikud viisid:
- Kasutama SQL käsk
- Kasutage lavastustabelit
- Kasutage vahemälu
- Kasutage skriptiülesannet
- MSSQL-i kasutamisel kasutage värskendamiseks andmebaasi täisnime
15) Mida teeksite, kui teil on otsingu jaoks mitte-OLEDB (objekti linkimise ja manustamise andmebaasi) allikas?
Kui teil on otsimiseks mitte-OLEBD allikas, peate andmete laadimiseks ja allikana kasutama vahemälu
16) Millisel juhul kasutate ühendatud ja ühendamata teisendustes dünaamilist vahemälu ja staatilist vahemälu?
- Dünaamilist vahemälu kasutatakse siis, kui peate värskendama põhitabelit ja aeglaselt muutuvaid dimensioone (SCD) tüüpi 1
- Lamedate failide puhul kasutatakse staatilist vahemälu
17) Selgitage, millised on ühenduseta ja ühendatud otsingu erinevused?
Ühendatud otsing | Ühenduseta otsing |
---|---|
Ühendatud otsing osaleb kaardistamises | Seda kasutatakse siis, kui vastendamisel kasutatakse avaldise teisenduse asemel otsingufunktsiooni |
Tagastada saab mitu väärtust | Tagastab ainult ühe väljundpordi |
Seda saab ühendada teiste teisendustega ja tagastab väärtuse | Teist teisendust ei saa ühendada |
Ühendatud otsingu jaoks saab kasutada staatilist või dünaamilist vahemälu | Ühendus katkestatud kui ainult staatiline vahemälu |
Ühendatud otsing toetab kasutaja määratud vaikeväärtusi | Ühenduseta otsing ei toeta kasutaja määratud vaikeväärtusi |
Ühendatud otsingus saab mitu veergu tagastada samast reast või sisestada dünaamilise otsingu vahemällu | Ühendamata otsing määrab ühe tagastuspordi ja tagastab igast reast ühe veeru |
18) Selgitage, mis on andmeallika vaade?
Andmeallika vaade võimaldab määratleda relatsiooniskeemi, mida analüüsiteenuste andmebaasides kasutatakse. Otse andmeallika objektide asemel luuakse mõõtmed ja kuubikud andmeallika vaadetest.
19) Selgitage, mis vahe on OLAP-tööriistadel ja ETL-i tööriistadel?
Erinevus ETL-i ja OLAP-i tööriista vahel on see
ETL tööriist on mõeldud andmete väljavõtmiseks pärandsüsteemidest ja laadimiseks määratud andmebaasi koos mõne andmete puhastamise protsessiga.
Näide: Andmetapp, informaatika jne.
Kuigi OLAP on mõeldud aruandluse eesmärgil OLAP-i andmetes, mis on saadaval mitmesuunalises mudelis.
Näide: Äriobjektid, Cognod jne.
20) Kuidas saate ekstraheerida SAP andmeid kasutades Informaticat?
- Toiteühenduse valikuga saate välja tõmmata SAP andmed informatika abil
- Installige ja konfigureerige PowerConnecti tööriist
- Importige allikas allikaanalüsaatorisse. Informatika ja SAP Toiteühendus toimib lüüsina. Järgmine samm on genereerida kaardistamiseks ABAP-kood, millest saab andmeid tõmmata ainult informatica SAP
- Väliste süsteemide allikate ühendamiseks ja importimiseks kasutatakse Power Connecti
21) Mainige, mis vahe on Power Martil ja Power Centeril?
Jõukeskus | Power Mart |
---|---|
Oletame, et töödeldakse tohutul hulgal andmeid | Oletame, et töödeldakse väikest andmemahtu |
See toetab selliseid ERP-allikaid nagu SAP, inimesed pehmed jne. | See ei toeta ERP-allikaid |
See toetab kohalikku ja globaalset hoidlat | See toetab kohalikku hoidlat |
See muudab kohaliku globaalseks hoidlaks | Sellel pole spetsifikatsiooni kohalikuks globaalseks hoidlaks teisendamiseks |
22) Selgitage, mis on lavastusala ja mis on lavastusala eesmärk?
Andmete lavastus on ala, kus hoiate andmeid andmelaoserveris ajutiselt. Andmete lavastamine hõlmab järgmisi samme
- Lähteandmete väljavõtmine ja andmete teisendamine (ümberstruktureerimine)
- Andmete teisendamine (andmete puhastamine, väärtuste teisendamine)
- Asendusvõtmete ülesanded
23) Mis on bussiskeem?
Erinevate äriprotsesside jaoks ühiste dimensioonide tuvastamiseks kasutatakse siini skeemi. Sellega on kaasas kooskõlastatud mõõtmed koos teabe standardiseeritud määratlusega
24) Selgitage, mis on andmete puhastamine?
Andmete puhastamine on andmete andmelaost kustutamise protsess. See kustutab rämpsandmed nagu nullväärtuste või lisatühikutega read.
25) Selgitage, mis on skeemiobjektid?
Skeemiobjektid on loogiline struktuur, mis viitab otseselt andmebaasi andmetele. Skeemiobjektid hõlmavad tabeleid, vaateid, jada sünonüüme, indekseid, klastreid, funktsioonipakette ja andmebaasilinke
26) Selgitage neid mõisteid Seanss, Worklet, Mapplet ja Workflow?
- Mapplet: See korraldab või loob teisenduskomplekte
- Tööleht: See esindab konkreetset antud ülesannete kogumit
- Töövoog: See on juhiste kogum, mis ütleb serverile, kuidas ülesandeid täita
- Seanss: See on parameetrite kogum, mis ütleb serverile, kuidas andmeid allikatest sihtpunkti teisaldada
Need intervjuu küsimused aitavad ka teie viva (suuline)