25 parasta ETL-testaushaastattelun kysymystä ja vastausta vuodelle 2025

Tässä ETL Testingin haastattelukysymyksiä ja vastauksia tuoreemmille ja kokeneemmille hakijoille unelmatyönsä saamiseksi.

 

ETL-testauksen haastattelukysymyksiä fuksilaisille


1) Mikä on ETL?

Tietovarastoarkkitehtuurissa ETL on tärkeä komponentti, joka hallitsee minkä tahansa liiketoimintaprosessin dataa. ETL tarkoittaa Pura, Muunna ja Ladata. Extract lukee tietoja tietokannasta. Transform muuntaa tiedot muotoon, joka voisi olla sopiva raportointiin ja analysointiin. Samalla lataus kirjoittaa tiedot kohdetietokantaan.

👉 Ilmainen PDF-lataus: ETL-testaushaastattelun kysymyksiä ja vastauksia


2) Selitä, mitä ETL-testaustoiminnot sisältävät?

ETL-testaus sisältää:

  • Tarkista, muuttuvatko tiedot oikein liiketoiminnan vaatimusten mukaisesti
  • Varmista, että projisoidut tiedot ladataan tietovarastoon ilman katkaisua ja tietojen menetystä
  • Varmista, että ETL-sovellus raportoi virheelliset tiedot ja korvaa ne oletusarvoilla
  • Varmista, että tiedot latautuvat odotetulla aikavälillä skaalautuvuuden ja suorituskyvyn parantamiseksi

ETL-prosessi
ETL


3) Mainitse minkä tyyppisiä tietovarastosovelluksia on ja mitä eroa on tiedon louhinnalla ja tietovarastolla?

Tietovarastosovellusten tyypit ovat

  • Tietojen käsittely
  • Analyyttinen käsittely
  • Data Mining

data mining voidaan määritellä prosessiksi, jossa poimitaan piilotettua ennakoivaa tietoa suurista tietokannoista ja tulkitaan dataa, kun taas tietovarastointi voi hyödyntää tietokaivoa tietojen analyyttiseen käsittelyyn nopeammin. Tietovarastointi on prosessi, jossa kootaan tietoja useista lähteistä yhdeksi yhteiseksi arkistoon


4) Mitä erilaisia ​​työkaluja käytetään ETL:ssä?

  • Cognos Decision Stream
  • Oracle Varaston rakentaja
  • Liiketoimintakohteet XI
  • SAS:n yritysvarasto
  • SAS Enterprise ETL -palvelin

5) Mikä on fakta? Millaisia ​​tosiasioita ovat?

Se on keskeinen osa moniulotteista mallia, joka sisältää analysoitavat mittarit. Faktat liittyvät ulottuvuuksiin.

Faktojen tyyppejä ovat

  • Lisäaineen tosiasiat
  • Puolilisäaineen tosiasiat
  • Ei-additiiviset tosiasiat

6) Selitä, mitä kuutiot ja OLAP-kuutiot ovat?

Kuutiot ovat tietojenkäsittelyyksiköitä, jotka koostuvat tietovaraston tietotaulukoista ja dimensioista. Se tarjoaa moniulotteisen analyysin.

OLAP on lyhenne sanoista Online Analytics Processing, ja OLAP-kuutio tallentaa suuria tietoja moniulotteisessa muodossa raportointitarkoituksiin. Se koostuu mittareiksi kutsutuista faktoista, jotka on luokiteltu ulottuvuuksien mukaan.


7) Selitä, mikä on jäljitystaso ja mitä tyyppejä on?

Jäljitystaso on lokitiedostoihin tallennettujen tietojen määrä. Jäljitystaso voidaan luokitella kahteen Normaaliin ja Verbose-tasoon. Normaali taso selittää jäljitystason yksityiskohtaisesti, kun taas verbose selittää jäljitystasot jokaisella rivillä.


8) Selitä, mikä on tosiasia?

Grain fact voidaan määritellä tasoksi, jolle faktatieto tallennetaan. Se tunnetaan myös nimellä Fact Granularity


9) Selitä mikä on tosiasiaton tosiasiaskeema ja mikä on Mitat?

Faktataulukko ilman mittoja tunnetaan nimellä Faktaton faktataulukko. Se voi tarkastella tapahtuvien tapahtumien määrää. Sitä käytetään esimerkiksi tapahtuman, kuten työntekijämäärän, tallentamiseen yrityksessä.

Faktataulukon sarakkeisiin perustuva numeerinen data tunnetaan nimellä Mitat


10) Selitä mitä transformaatio on?

Muunnos on arkistoobjekti, joka luo, muokkaa tai välittää tietoja. Transformaatioita on kahta tyyppiä aktiivinen ja passiivinen


ETL-kehittäjähaastattelun kysymyksiä ja vastauksia kokeneille

11) Selitä Lookup Transformationin käyttö?

Lookup Transformation on hyödyllinen

  • Liittyvän arvon saaminen taulukosta sarakearvon avulla
  • Päivitä hitaasti muuttuva mittataulukko
  • Tarkista, onko taulukossa jo tietueita

12) Selitä mitä on osiointi, hash-osiointi ja round robin -osiointi?

Suorituskyvyn parantamiseksi tapahtumat jaetaan osioihin, tätä kutsutaan osiointiksi. Osiointi mahdollistaa tietokone Palvelin useiden yhteyksien luomiseen eri lähteisiin

Osioiden tyypit ovat

Round-Robin-ositus:

  • Informatican avulla tiedot jakautuvat tasaisesti kaikkien osioiden kesken
  • Tätä osiointia sovelletaan jokaisessa osiossa, jossa käsiteltävien rivien määrä on suunnilleen sama

Hash-osiointi:

  • Tietojen osiointia varten osioiden kesken Informatica-palvelin käyttää hajautustoimintoa
  • Sitä käytetään, kun varmistetaan, että prosessien riviryhmät, joilla on sama osioavain samassa osiossa, on varmistettava

13) Mainitse mitä etua DataReader Destination Adapterin käytöstä on?

DataReader Destination Adapterin käytön etuna on, että se täyttää ADO-tietuesarja (koostuvat tietueista ja sarakkeista) muistissa ja paljastaa DataFlow-tehtävän tiedot toteuttamalla DataReader-rajapinnan, jotta muut sovellukset voivat kuluttaa tiedot.


14) SSIS:n (SQL Server Integration Service) avulla mitkä ovat mahdollisia tapoja päivittää taulukko?

Voit päivittää taulukon SSIS:n avulla seuraavilla tavoilla:

  • Käyttää SQL komento
  • Käytä esityspöytää
  • Käytä välimuistia
  • Käytä komentosarjatehtävää
  • Käytä koko tietokannan nimeä päivittämiseen, jos MSSQL on käytössä

15) Jos sinulla on ei-OLEDB-lähde (Object Linking and Embedding Database) hakua varten, mitä tekisit?

Jos sinulla on ei-OLEBD-lähde hakua varten, sinun on käytettävä välimuistia tietojen lataamiseen ja käyttämiseen lähteenä


16) Missä tapauksessa käytät dynaamista välimuistia ja staattista välimuistia yhdistetyissä ja yhdistämättömissä muunnoksissa?

  • Dynaamista välimuistia käytetään, kun sinun on päivitettävä päätaulukko ja hitaasti muuttuvat dimensiot (SCD) tyyppi 1
  • Litteille tiedostoille käytetään staattista välimuistia

17) Selitä, mitä eroja on yhdistämättömän ja yhdistetyn haun välillä?

Yhdistetty haku Yhteyttämätön haku
Yhdistetty haku osallistuu kartoitukseen Sitä käytetään, kun hakufunktiota käytetään lausekkeen muunnoksen sijasta kartoituksessa
Useita arvoja voidaan palauttaa Palauttaa vain yhden lähtöportin
Se voidaan yhdistää muihin muunnoksiin ja palauttaa arvon Toista muunnosa ei voi yhdistää
Staattista tai dynaamista välimuistia voidaan käyttää yhdistetyssä haussa Ei yhteyttä, koska vain staattinen välimuisti
Yhdistetty haku tukee käyttäjän määrittämiä oletusarvoja Yhteyttämätön haku ei tue käyttäjän määrittämiä oletusarvoja
Yhdistetyssä haussa useita sarakkeita voidaan palauttaa samalta riviltä tai lisätä dynaamiseen haun välimuistiin Yhteyttämätön haku määrittää yhden paluuportin ja palauttaa yhden sarakkeen jokaiselta riviltä

18) Selitä mikä on tietolähdenäkymä?

Tietolähdenäkymässä voidaan määrittää relaatioskeema, jota käytetään analyysipalveluiden tietokannassa. Sen sijaan, että suoraan tietolähdeobjekteista, dimensiot ja kuutiot luodaan tietolähdenäkymistä.


19) Selitä, mitä eroa on OLAP-työkaluilla ja ETL-työkaluilla?

Ero ETL- ja OLAP-työkalun välillä on se

ETL työkalu on tarkoitettu tiedon poimimiseen vanhoista järjestelmistä ja lataamiseen tiettyyn tietokantaan jollakin tietojen puhdistusprosessilla.

Esimerkiksi: Datavaihe, informatiikka jne.

Vaikka OLAP on tarkoitettu raportointitarkoituksiin OLAP-tiedoissa, jotka ovat saatavilla monisuuntaisessa mallissa.

Esimerkiksi: Business Objects, Cognos jne.


20) Kuinka voit purkaa SAP tietoja Informatican avulla?

  • Virtaliitäntävaihtoehdolla purat SAP tiedot tietotekniikan avulla
  • Asenna ja määritä PowerConnect-työkalu
  • Tuo lähde Source Analyzeriin. Informatican ja SAP Powerconnect toimii yhdyskäytävänä. Seuraava askel on luoda ABAP-koodi kartoitusta varten, josta vain informatica voi hakea tietoja SAP
  • Lähteiden yhdistämiseen ja tuomiseen ulkoisista järjestelmistä käytetään Power Connectia

21) Mainitse mitä eroa on Power Martilla ja Power Centerillä?

Voimakeskus Power Mart
Oletetaan, että käsittelet valtavan määrän dataa Oletetaan käsittelevän vähän dataa
Se tukee ERP-lähteitä, kuten SAP, ihmiset pehmeät jne. Se ei tue ERP-lähteitä
Se tukee paikallista ja globaalia tietovarastoa Se tukee paikallista tietovarastoa
Se muuntaa paikallisen globaaliksi arkistoksi Sillä ei ole spesifikaatiota paikallisen muuntamiseksi globaaliksi arkistoksi

22) Selitä mikä lavastusalue on ja mikä on lavastusalueen tarkoitus?

Datan staging on alue, jossa säilytät tietoja väliaikaisesti tietovarastopalvelimella. Tietojen vaiheistus sisältää seuraavat vaiheet

  • Lähdetietojen poiminta ja tietojen muuntaminen (uudelleenjärjestely)
  • Datan muunnos (tietojen puhdistus, arvon muunnos)
  • Korvaavat avaintehtävät

23) Mikä on Bus Schema?

Eri liiketoimintaprosessien yhteisten ulottuvuuksien tunnistamiseksi käytetään BUS-skeemaa. Siinä on yhdenmukaiset mitat sekä standardoitu tiedon määritelmä


24) Selitä, mitä on tietojen tyhjennys?

Tietojen tyhjennys on prosessi tietojen poistamiseksi tietovarastosta. Se poistaa turhat tiedot, kuten rivit, joissa on nolla-arvoja tai ylimääräisiä välilyöntejä.


25) Selitä, mitä ovat Schema Objects?

Kaavioobjektit ovat looginen rakenne, joka viittaa suoraan tietokantatietoihin. Schema-objektit sisältävät taulukoita, näkymiä, sekvenssisynonyymejä, indeksejä, klustereita, funktiopaketteja ja tietokantalinkkejä


26) Selitä nämä termit Istunto, Worklet, Mapplet ja Workflow?

  • Mapplet: Se järjestää tai luo muunnossarjoja
  • Työpöytä: Se edustaa tiettyä annettujen tehtävien joukkoa
  • Työnkulku: Se on joukko ohjeita, jotka kertovat palvelimelle, kuinka tehtäviä suoritetaan
  • Session: Se on joukko parametreja, jotka kertovat palvelimelle, kuinka tietoja siirretään lähteistä kohteeseen

Nämä haastattelukysymykset auttavat myös vivassasi (suullinen)