25 parasta ETL-testaushaastattelun kysymystä ja vastausta vuodelle 2025
ETL-testauksen haastattelukysymyksiä fuksilaisille
1) Mikä on ETL?
Tietovarastoarkkitehtuurissa ETL on tärkeä komponentti, joka hallitsee minkä tahansa liiketoimintaprosessin dataa. ETL tarkoittaa Pura, Muunna ja Ladata. Extract lukee tietoja tietokannasta. Transform muuntaa tiedot muotoon, joka voisi olla sopiva raportointiin ja analysointiin. Samalla lataus kirjoittaa tiedot kohdetietokantaan.
👉 Ilmainen PDF-lataus: ETL-testaushaastattelun kysymyksiä ja vastauksia
2) Selitä, mitä ETL-testaustoiminnot sisältävät?
ETL-testaus sisältää:
- Tarkista, muuttuvatko tiedot oikein liiketoiminnan vaatimusten mukaisesti
- Varmista, että projisoidut tiedot ladataan tietovarastoon ilman katkaisua ja tietojen menetystä
- Varmista, että ETL-sovellus raportoi virheelliset tiedot ja korvaa ne oletusarvoilla
- Varmista, että tiedot latautuvat odotetulla aikavälillä skaalautuvuuden ja suorituskyvyn parantamiseksi

3) Mainitse minkä tyyppisiä tietovarastosovelluksia on ja mitä eroa on tiedon louhinnalla ja tietovarastolla?
Tietovarastosovellusten tyypit ovat
- Tietojen käsittely
- Analyyttinen käsittely
- Data Mining
data mining voidaan määritellä prosessiksi, jossa poimitaan piilotettua ennakoivaa tietoa suurista tietokannoista ja tulkitaan dataa, kun taas tietovarastointi voi hyödyntää tietokaivoa tietojen analyyttiseen käsittelyyn nopeammin. Tietovarastointi on prosessi, jossa kootaan tietoja useista lähteistä yhdeksi yhteiseksi arkistoon
4) Mitä erilaisia työkaluja käytetään ETL:ssä?
- Cognos Decision Stream
- Oracle Varaston rakentaja
- Liiketoimintakohteet XI
- SAS:n yritysvarasto
- SAS Enterprise ETL -palvelin
5) Mikä on fakta? Millaisia tosiasioita ovat?
Se on keskeinen osa moniulotteista mallia, joka sisältää analysoitavat mittarit. Faktat liittyvät ulottuvuuksiin.
Faktojen tyyppejä ovat
- Lisäaineen tosiasiat
- Puolilisäaineen tosiasiat
- Ei-additiiviset tosiasiat
6) Selitä, mitä kuutiot ja OLAP-kuutiot ovat?
Kuutiot ovat tietojenkäsittelyyksiköitä, jotka koostuvat tietovaraston tietotaulukoista ja dimensioista. Se tarjoaa moniulotteisen analyysin.
OLAP on lyhenne sanoista Online Analytics Processing, ja OLAP-kuutio tallentaa suuria tietoja moniulotteisessa muodossa raportointitarkoituksiin. Se koostuu mittareiksi kutsutuista faktoista, jotka on luokiteltu ulottuvuuksien mukaan.
7) Selitä, mikä on jäljitystaso ja mitä tyyppejä on?
Jäljitystaso on lokitiedostoihin tallennettujen tietojen määrä. Jäljitystaso voidaan luokitella kahteen Normaaliin ja Verbose-tasoon. Normaali taso selittää jäljitystason yksityiskohtaisesti, kun taas verbose selittää jäljitystasot jokaisella rivillä.
8) Selitä, mikä on tosiasia?
Grain fact voidaan määritellä tasoksi, jolle faktatieto tallennetaan. Se tunnetaan myös nimellä Fact Granularity
9) Selitä mikä on tosiasiaton tosiasiaskeema ja mikä on Mitat?
Faktataulukko ilman mittoja tunnetaan nimellä Faktaton faktataulukko. Se voi tarkastella tapahtuvien tapahtumien määrää. Sitä käytetään esimerkiksi tapahtuman, kuten työntekijämäärän, tallentamiseen yrityksessä.
Faktataulukon sarakkeisiin perustuva numeerinen data tunnetaan nimellä Mitat
10) Selitä mitä transformaatio on?
Muunnos on arkistoobjekti, joka luo, muokkaa tai välittää tietoja. Transformaatioita on kahta tyyppiä aktiivinen ja passiivinen
ETL-kehittäjähaastattelun kysymyksiä ja vastauksia kokeneille
11) Selitä Lookup Transformationin käyttö?
Lookup Transformation on hyödyllinen
- Liittyvän arvon saaminen taulukosta sarakearvon avulla
- Päivitä hitaasti muuttuva mittataulukko
- Tarkista, onko taulukossa jo tietueita
12) Selitä mitä on osiointi, hash-osiointi ja round robin -osiointi?
Suorituskyvyn parantamiseksi tapahtumat jaetaan osioihin, tätä kutsutaan osiointiksi. Osiointi mahdollistaa tietokone Palvelin useiden yhteyksien luomiseen eri lähteisiin
Osioiden tyypit ovat
Round-Robin-ositus:
- Informatican avulla tiedot jakautuvat tasaisesti kaikkien osioiden kesken
- Tätä osiointia sovelletaan jokaisessa osiossa, jossa käsiteltävien rivien määrä on suunnilleen sama
Hash-osiointi:
- Tietojen osiointia varten osioiden kesken Informatica-palvelin käyttää hajautustoimintoa
- Sitä käytetään, kun varmistetaan, että prosessien riviryhmät, joilla on sama osioavain samassa osiossa, on varmistettava
13) Mainitse mitä etua DataReader Destination Adapterin käytöstä on?
DataReader Destination Adapterin käytön etuna on, että se täyttää ADO-tietuesarja (koostuvat tietueista ja sarakkeista) muistissa ja paljastaa DataFlow-tehtävän tiedot toteuttamalla DataReader-rajapinnan, jotta muut sovellukset voivat kuluttaa tiedot.
14) SSIS:n (SQL Server Integration Service) avulla mitkä ovat mahdollisia tapoja päivittää taulukko?
Voit päivittää taulukon SSIS:n avulla seuraavilla tavoilla:
- Käyttää SQL komento
- Käytä esityspöytää
- Käytä välimuistia
- Käytä komentosarjatehtävää
- Käytä koko tietokannan nimeä päivittämiseen, jos MSSQL on käytössä
15) Jos sinulla on ei-OLEDB-lähde (Object Linking and Embedding Database) hakua varten, mitä tekisit?
Jos sinulla on ei-OLEBD-lähde hakua varten, sinun on käytettävä välimuistia tietojen lataamiseen ja käyttämiseen lähteenä
16) Missä tapauksessa käytät dynaamista välimuistia ja staattista välimuistia yhdistetyissä ja yhdistämättömissä muunnoksissa?
- Dynaamista välimuistia käytetään, kun sinun on päivitettävä päätaulukko ja hitaasti muuttuvat dimensiot (SCD) tyyppi 1
- Litteille tiedostoille käytetään staattista välimuistia
17) Selitä, mitä eroja on yhdistämättömän ja yhdistetyn haun välillä?
Yhdistetty haku | Yhteyttämätön haku |
---|---|
Yhdistetty haku osallistuu kartoitukseen | Sitä käytetään, kun hakufunktiota käytetään lausekkeen muunnoksen sijasta kartoituksessa |
Useita arvoja voidaan palauttaa | Palauttaa vain yhden lähtöportin |
Se voidaan yhdistää muihin muunnoksiin ja palauttaa arvon | Toista muunnosa ei voi yhdistää |
Staattista tai dynaamista välimuistia voidaan käyttää yhdistetyssä haussa | Ei yhteyttä, koska vain staattinen välimuisti |
Yhdistetty haku tukee käyttäjän määrittämiä oletusarvoja | Yhteyttämätön haku ei tue käyttäjän määrittämiä oletusarvoja |
Yhdistetyssä haussa useita sarakkeita voidaan palauttaa samalta riviltä tai lisätä dynaamiseen haun välimuistiin | Yhteyttämätön haku määrittää yhden paluuportin ja palauttaa yhden sarakkeen jokaiselta riviltä |
18) Selitä mikä on tietolähdenäkymä?
Tietolähdenäkymässä voidaan määrittää relaatioskeema, jota käytetään analyysipalveluiden tietokannassa. Sen sijaan, että suoraan tietolähdeobjekteista, dimensiot ja kuutiot luodaan tietolähdenäkymistä.
19) Selitä, mitä eroa on OLAP-työkaluilla ja ETL-työkaluilla?
Ero ETL- ja OLAP-työkalun välillä on se
ETL työkalu on tarkoitettu tiedon poimimiseen vanhoista järjestelmistä ja lataamiseen tiettyyn tietokantaan jollakin tietojen puhdistusprosessilla.
Esimerkiksi: Datavaihe, informatiikka jne.
Vaikka OLAP on tarkoitettu raportointitarkoituksiin OLAP-tiedoissa, jotka ovat saatavilla monisuuntaisessa mallissa.
Esimerkiksi: Business Objects, Cognos jne.
20) Kuinka voit purkaa SAP tietoja Informatican avulla?
- Virtaliitäntävaihtoehdolla purat SAP tiedot tietotekniikan avulla
- Asenna ja määritä PowerConnect-työkalu
- Tuo lähde Source Analyzeriin. Informatican ja SAP Powerconnect toimii yhdyskäytävänä. Seuraava askel on luoda ABAP-koodi kartoitusta varten, josta vain informatica voi hakea tietoja SAP
- Lähteiden yhdistämiseen ja tuomiseen ulkoisista järjestelmistä käytetään Power Connectia
21) Mainitse mitä eroa on Power Martilla ja Power Centerillä?
Voimakeskus | Power Mart |
---|---|
Oletetaan, että käsittelet valtavan määrän dataa | Oletetaan käsittelevän vähän dataa |
Se tukee ERP-lähteitä, kuten SAP, ihmiset pehmeät jne. | Se ei tue ERP-lähteitä |
Se tukee paikallista ja globaalia tietovarastoa | Se tukee paikallista tietovarastoa |
Se muuntaa paikallisen globaaliksi arkistoksi | Sillä ei ole spesifikaatiota paikallisen muuntamiseksi globaaliksi arkistoksi |
22) Selitä mikä lavastusalue on ja mikä on lavastusalueen tarkoitus?
Datan staging on alue, jossa säilytät tietoja väliaikaisesti tietovarastopalvelimella. Tietojen vaiheistus sisältää seuraavat vaiheet
- Lähdetietojen poiminta ja tietojen muuntaminen (uudelleenjärjestely)
- Datan muunnos (tietojen puhdistus, arvon muunnos)
- Korvaavat avaintehtävät
23) Mikä on Bus Schema?
Eri liiketoimintaprosessien yhteisten ulottuvuuksien tunnistamiseksi käytetään BUS-skeemaa. Siinä on yhdenmukaiset mitat sekä standardoitu tiedon määritelmä
24) Selitä, mitä on tietojen tyhjennys?
Tietojen tyhjennys on prosessi tietojen poistamiseksi tietovarastosta. Se poistaa turhat tiedot, kuten rivit, joissa on nolla-arvoja tai ylimääräisiä välilyöntejä.
25) Selitä, mitä ovat Schema Objects?
Kaavioobjektit ovat looginen rakenne, joka viittaa suoraan tietokantatietoihin. Schema-objektit sisältävät taulukoita, näkymiä, sekvenssisynonyymejä, indeksejä, klustereita, funktiopaketteja ja tietokantalinkkejä
26) Selitä nämä termit Istunto, Worklet, Mapplet ja Workflow?
- Mapplet: Se järjestää tai luo muunnossarjoja
- Työpöytä: Se edustaa tiettyä annettujen tehtävien joukkoa
- Työnkulku: Se on joukko ohjeita, jotka kertovat palvelimelle, kuinka tehtäviä suoritetaan
- Session: Se on joukko parametreja, jotka kertovat palvelimelle, kuinka tietoja siirretään lähteistä kohteeseen
Nämä haastattelukysymykset auttavat myös vivassasi (suullinen)