Οι κορυφαίες 25 Ερωτήσεις & Απαντήσεις συνέντευξης ETL Testing για το 2025

Ακολουθούν ερωτήσεις και απαντήσεις συνέντευξης ETL Testing για πιο φρέσκους αλλά και έμπειρους υποψηφίους για να πάρουν τη δουλειά των ονείρων τους.

 

Ερωτήσεις συνέντευξης ETL Testing για Freshers


1) Τι είναι το ETL;

Στην αρχιτεκτονική της αποθήκευσης δεδομένων, το ETL είναι ένα σημαντικό στοιχείο, το οποίο διαχειρίζεται τα δεδομένα για οποιαδήποτε επιχειρηματική διαδικασία. Το ETL σημαίνει Εκχύλισμα, Μετασχηματισμός και Φορτίο. Το Extract κάνει τη διαδικασία ανάγνωσης δεδομένων από μια βάση δεδομένων. Το Transform κάνει τη μετατροπή των δεδομένων σε μια μορφή που θα μπορούσε να είναι κατάλληλη για αναφορά και ανάλυση. Ενώ, το load κάνει τη διαδικασία εγγραφής των δεδομένων στη βάση δεδομένων προορισμού.

👉 Δωρεάν λήψη PDF: Ερωτήσεις & Απαντήσεις για τη Συνέντευξη Δοκιμών ETL


2) Εξηγήστε τι περιλαμβάνουν οι λειτουργίες δοκιμών ETL;

Η δοκιμή ETL περιλαμβάνει:

  • Επαληθεύστε εάν τα δεδομένα μετασχηματίζονται σωστά σύμφωνα με τις επιχειρηματικές απαιτήσεις
  • Βεβαιωθείτε ότι τα προβαλλόμενα δεδομένα φορτώνονται στην αποθήκη δεδομένων χωρίς περικοπή και απώλεια δεδομένων
  • Βεβαιωθείτε ότι η εφαρμογή ETL αναφέρει μη έγκυρα δεδομένα και αντικαθιστά με προεπιλεγμένες τιμές
  • Βεβαιωθείτε ότι τα δεδομένα φορτώνονται στο αναμενόμενο χρονικό πλαίσιο για τη βελτίωση της επεκτασιμότητας και της απόδοσης

Διαδικασία ETL
ETL


3) Αναφέρετε ποιοι είναι οι τύποι εφαρμογών αποθήκης δεδομένων και ποια είναι η διαφορά μεταξύ εξόρυξης δεδομένων και αποθήκευσης δεδομένων;

Οι τύποι εφαρμογών αποθήκης δεδομένων είναι

  • Επεξεργασία πληροφοριών
  • Αναλυτική Επεξεργασία
  • Data Mining

Εξόρυξη δεδομένων μπορεί να οριστεί ως η διαδικασία εξαγωγής κρυφών προγνωστικών πληροφοριών από μεγάλες βάσεις δεδομένων και ερμηνείας των δεδομένων, ενώ η αποθήκευση δεδομένων μπορεί να κάνει χρήση ενός ορυχείου δεδομένων για την αναλυτική επεξεργασία των δεδομένων με ταχύτερο τρόπο. Αποθήκευση δεδομένων είναι η διαδικασία συγκέντρωσης δεδομένων από πολλαπλές πηγές σε ένα κοινό αποθετήριο


4) Ποια είναι τα διάφορα εργαλεία που χρησιμοποιούνται στο ETL;

  • Cognos Decision Stream
  • Oracle Κατασκευαστής Αποθήκης
  • Επιχειρηματικά Αντικείμενα XI
  • Αποθήκη επιχειρήσεων SAS
  • Διακομιστής ETL SAS Enterprise

5) Τι είναι γεγονός; Ποια είναι τα είδη των γεγονότων;

Αποτελεί κεντρικό στοιχείο ενός πολυδιάστατου μοντέλου που περιέχει τα προς ανάλυση μέτρα. Τα γεγονότα σχετίζονται με τις διαστάσεις.

Τα είδη των γεγονότων είναι

  • Πρόσθετα γεγονότα
  • Ημι-πρόσθετα γεγονότα
  • Μη πρόσθετα γεγονότα

6) Εξηγήστε τι είναι οι κύβοι και οι κύβοι OLAP;

Οι κύβοι είναι μονάδες επεξεργασίας δεδομένων που αποτελούνται από πίνακες γεγονότων και διαστάσεις από την αποθήκη δεδομένων. Παρέχει πολυδιάστατη ανάλυση.

Το OLAP σημαίνει Online Analytics Processing και το OLAP cube αποθηκεύει μεγάλα δεδομένα σε πολυδιάστατη μορφή για σκοπούς αναφοράς. Αποτελείται από γεγονότα που ονομάζονται ως μέτρα κατηγοριοποιημένα ανά διαστάσεις.


7) Εξηγήστε τι είναι το επίπεδο ανίχνευσης και ποιοι είναι οι τύποι;

Το επίπεδο ανίχνευσης είναι ο όγκος των δεδομένων που αποθηκεύονται στα αρχεία καταγραφής. Το επίπεδο ιχνηλάτησης μπορεί να ταξινομηθεί σε δύο Κανονικό και Λεπτό. Το κανονικό επίπεδο επεξηγεί το επίπεδο ανίχνευσης με λεπτομερή τρόπο, ενώ το αναλυτικό επεξηγεί τα επίπεδα ανίχνευσης σε κάθε σειρά.


8) Εξηγήστε τι είναι το Grain of Fact;

Το Grain fact μπορεί να οριστεί ως το επίπεδο στο οποίο αποθηκεύονται οι πληροφορίες γεγονότων. Είναι επίσης γνωστό ως Fact Granularity


9) Εξηγήστε τι είναι το σχήμα χωρίς γεγονότα και τι είναι τα Μέτρα;

Ένας πίνακας γεγονότων χωρίς μέτρα είναι γνωστός ως πίνακας δεδομένων χωρίς στοιχεία. Μπορεί να δει τον αριθμό των συμβάντων που συμβαίνουν. Για παράδειγμα, χρησιμοποιείται για την καταγραφή ενός γεγονότος όπως ο αριθμός των εργαζομένων σε μια εταιρεία.

Τα αριθμητικά δεδομένα που βασίζονται σε στήλες σε έναν πίνακα γεγονότων είναι γνωστά ως Μέτρα


10) Εξηγήστε τι είναι ο μετασχηματισμός;

Ένας μετασχηματισμός είναι ένα αντικείμενο αποθήκης που δημιουργεί, τροποποιεί ή διαβιβάζει δεδομένα. Οι μετασχηματισμοί είναι δύο τύπων Ενεργοί και Παθητικοί


Ερωτήσεις και απαντήσεις για τη συνέντευξη προγραμματιστή ETL για έμπειρους

11) Εξηγήστε τη χρήση του Lookup Transformation;

Το Lookup Transformation είναι χρήσιμο για

  • Λήψη μιας σχετικής τιμής από έναν πίνακα χρησιμοποιώντας μια τιμή στήλης
  • Ενημερώστε τον πίνακα διαστάσεων που αλλάζει αργά
  • Επαληθεύστε εάν υπάρχουν ήδη εγγραφές στον πίνακα

12) Εξηγήστε τι είναι η κατάτμηση, η κατακερματισμός κατακερματισμού και η κατάτμηση σε κύκλους;

Για να βελτιωθεί η απόδοση, οι συναλλαγές υποδιαιρούνται, αυτό ονομάζεται κατάτμηση. Ο διαχωρισμός ενεργοποιεί πληροφορική Διακομιστής για δημιουργία πολλαπλής σύνδεσης με διάφορες πηγές

Τα είδη των κατατμήσεων είναι

Διαχωρισμός Round-Robin:

  • Με την informatica τα δεδομένα κατανέμονται ομοιόμορφα μεταξύ όλων των κατατμήσεων
  • Σε κάθε διαμέρισμα όπου ο αριθμός των σειρών προς επεξεργασία είναι περίπου ίδιος, αυτός ο διαχωρισμός ισχύει

Κατακερματισμός κατακερματισμού:

  • Για το σκοπό της κατάτμησης κλειδιών για την ομαδοποίηση δεδομένων μεταξύ των κατατμήσεων, ο διακομιστής Informatica εφαρμόζει μια συνάρτηση κατακερματισμού
  • Χρησιμοποιείται όταν διασφαλίζεται ότι πρέπει να διασφαλιστούν οι ομάδες διεργασιών σειρών με το ίδιο κλειδί κατάτμησης στο ίδιο διαμέρισμα

13) Αναφέρετε ποιο είναι το πλεονέκτημα της χρήσης του DataReader Destination Adapter;

Το πλεονέκτημα της χρήσης του DataReader Destination Adapter είναι ότι συμπληρώνει ένα Σύνολο εγγραφών ADO (αποτελείται από εγγραφές και στήλες) στη μνήμη και εκθέτει τα δεδομένα από την εργασία DataFlow υλοποιώντας τη διεπαφή DataReader, έτσι ώστε άλλη εφαρμογή να μπορεί να καταναλώσει τα δεδομένα.


14) Χρησιμοποιώντας το SSIS (SQL Server Integration Service) ποιοι είναι οι πιθανοί τρόποι ενημέρωσης του πίνακα;

Για να ενημερώσετε τον πίνακα χρησιμοποιώντας το SSIS οι πιθανοί τρόποι είναι:

  • Χρήση SQL εντολή
  • Χρησιμοποιήστε έναν πίνακα τοποθέτησης
  • Χρησιμοποιήστε την προσωρινή μνήμη
  • Χρησιμοποιήστε το Script Task
  • Χρησιμοποιήστε το πλήρες όνομα της βάσης δεδομένων για ενημέρωση εάν χρησιμοποιείται MSSQL

15) Σε περίπτωση που διαθέτετε πηγή μη OLEDB (Object Linking and Embedding Database) για την αναζήτηση, τι θα κάνατε;

Σε περίπτωση που έχετε πηγή που δεν είναι OLEBD για την αναζήτηση, τότε πρέπει να χρησιμοποιήσετε την προσωρινή μνήμη για να φορτώσετε δεδομένα και να τα χρησιμοποιήσετε ως πηγή


16) Σε ποια περίπτωση χρησιμοποιείτε δυναμική κρυφή και στατική κρυφή μνήμη σε συνδεδεμένους και μη συνδεδεμένους μετασχηματισμούς;

  • Η δυναμική κρυφή μνήμη χρησιμοποιείται όταν πρέπει να ενημερώσετε τον κύριο πίνακα και τις διαστάσεις που αλλάζουν αργά (SCD) τύπου 1
  • Για επίπεδα αρχεία χρησιμοποιείται στατική κρυφή μνήμη

17) Εξηγήστε ποιες είναι οι διαφορές μεταξύ Μη συνδεδεμένης και Συνδεδεμένης αναζήτησης;

Συνδεδεμένη αναζήτηση Μη συνδεδεμένη αναζήτηση
Η συνδεδεμένη αναζήτηση συμμετέχει στη χαρτογράφηση Χρησιμοποιείται όταν χρησιμοποιείται η συνάρτηση αναζήτησης αντί για μετασχηματισμό έκφρασης κατά την αντιστοίχιση
Μπορούν να επιστραφούν πολλαπλές τιμές Επιστρέφει μόνο μία θύρα εξόδου
Μπορεί να συνδεθεί με άλλους μετασχηματισμούς και να επιστρέψει μια τιμή Δεν μπορεί να συνδεθεί άλλος μετασχηματισμός
Η στατική ή δυναμική κρυφή μνήμη μπορεί να χρησιμοποιηθεί για τη συνδεδεμένη αναζήτηση Μη συνδεδεμένη ως μόνο στατική κρυφή μνήμη
Η συνδεδεμένη αναζήτηση υποστηρίζει προεπιλεγμένες τιμές που ορίζονται από το χρήστη Η αναζήτηση χωρίς σύνδεση δεν υποστηρίζει προεπιλεγμένες τιμές που ορίζονται από το χρήστη
Στη Συνδεδεμένη αναζήτηση μπορούν να επιστραφούν πολλές στήλες από την ίδια σειρά ή να εισαχθούν στην κρυφή μνήμη δυναμικής αναζήτησης Η μη συνδεδεμένη αναζήτηση ορίζει μία θύρα επιστροφής και επιστρέφει μία στήλη από κάθε σειρά

18) Εξηγήστε τι είναι η προβολή πηγής δεδομένων;

Μια προβολή πηγής δεδομένων επιτρέπει τον ορισμό του σχεσιακού σχήματος που θα χρησιμοποιηθεί στις βάσεις δεδομένων των υπηρεσιών ανάλυσης. Αντί απευθείας από αντικείμενα προέλευσης δεδομένων, οι διαστάσεις και οι κύβοι δημιουργούνται από προβολές πηγών δεδομένων.


19) Εξηγήστε ποια είναι η διαφορά μεταξύ των εργαλείων OLAP και των εργαλείων ETL;

Η διαφορά μεταξύ του εργαλείου ETL και OLAP είναι αυτή

Εργαλείο ETL προορίζεται για την εξαγωγή δεδομένων από τα παλαιού τύπου συστήματα και τη φόρτωση σε καθορισμένη βάση δεδομένων με κάποια διαδικασία καθαρισμού δεδομένων.

Παράδειγμα: Στάδιο δεδομένων, Informatica κ.λπ.

Ενώ το OLAP προορίζεται για σκοπούς αναφοράς σε δεδομένα OLAP που είναι διαθέσιμα σε μοντέλο πολλαπλών κατευθύνσεων.

Παράδειγμα: Business Objects, Cognos κ.λπ.


20) Πώς μπορείτε να εξαγάγετε SAP δεδομένα χρησιμοποιώντας Informatica;

  • Με την επιλογή σύνδεσης ρεύματος εξάγετε SAP δεδομένα με χρήση πληροφορικής
  • Εγκαταστήστε και διαμορφώστε το εργαλείο PowerConnect
  • Εισαγάγετε την πηγή στο Source Analyzer. Μεταξύ Informatica και SAP Το Powerconnect λειτουργεί ως πύλη. Το επόμενο βήμα είναι να δημιουργηθεί ο κώδικας ABAP για την αντιστοίχιση και από τότε μόνο η informatica μπορεί να αντλήσει δεδομένα SAP
  • Για σύνδεση και εισαγωγή πηγών από εξωτερικά συστήματα χρησιμοποιείται το Power Connect

21) Αναφέρετε ποια είναι η διαφορά μεταξύ Power Mart και Power Center;

Κέντρο δύναμης Power Mart
Ας υποθέσουμε ότι επεξεργαζόμαστε τεράστιο όγκο δεδομένων Ας υποθέσουμε ότι επεξεργάζεστε χαμηλό όγκο δεδομένων
Υποστηρίζει πηγές ERP όπως π.χ SAP, άνθρωποι μαλακοί κ.λπ. Δεν υποστηρίζει πηγές ERP
Υποστηρίζει τοπικό και παγκόσμιο αποθετήριο Υποστηρίζει τοπικό αποθετήριο
Μετατρέπει το τοπικό σε παγκόσμιο αποθετήριο Δεν έχει προδιαγραφές για τη μετατροπή τοπικού σε καθολικό αποθετήριο

22) Εξηγήστε τι είναι ο χώρος σκηνής και ποιος είναι ο σκοπός ενός χώρου σκηνής;

Η σταδιοποίηση δεδομένων είναι μια περιοχή όπου κρατάτε τα δεδομένα προσωρινά στον διακομιστή αποθήκης δεδομένων. Η σταδιοποίηση δεδομένων περιλαμβάνει τα ακόλουθα βήματα

  • Εξαγωγή δεδομένων πηγής και μετασχηματισμός δεδομένων (αναδιάρθρωση)
  • Μετασχηματισμός δεδομένων (καθαρισμός δεδομένων, μετασχηματισμός αξίας)
  • Αντικαταστάσεις κλειδιών

23) Τι είναι το Bus Schema;

Για την αναγνώριση των κοινών διαστάσεων από τις διάφορες επιχειρηματικές διαδικασίες, χρησιμοποιείται το σχήμα BUS. Έρχεται με προσαρμοσμένες διαστάσεις μαζί με τυποποιημένο ορισμό πληροφοριών


24) Εξηγήστε τι είναι η εκκαθάριση δεδομένων;

Η εκκαθάριση δεδομένων είναι μια διαδικασία διαγραφής δεδομένων από την αποθήκη δεδομένων. Διαγράφει ανεπιθύμητα δεδομένα σαν σειρές με μηδενικές τιμές ή επιπλέον κενά.


25) Εξηγήστε τι είναι τα Αντικείμενα Σχήματος;

Τα αντικείμενα σχήματος είναι η λογική δομή που αναφέρεται απευθείας στα δεδομένα της βάσης δεδομένων. Τα αντικείμενα σχήματος περιλαμβάνουν πίνακες, προβολές, συνώνυμα ακολουθιών, ευρετήρια, συμπλέγματα, πακέτα συναρτήσεων και συνδέσμους βάσης δεδομένων


26) Εξηγήστε αυτούς τους όρους Session, Worklet, Mapplet και Workflow ;

  • Mapplet: Τακτοποιεί ή δημιουργεί σύνολα μετασχηματισμών
  • Φύλλο εργασίας: Αντιπροσωπεύει ένα συγκεκριμένο σύνολο εργασιών που δίνονται
  • Ροή εργασιών: Είναι ένα σύνολο οδηγιών που λένε στον διακομιστή πώς να εκτελεί εργασίες
  • Συνεδρία: Είναι ένα σύνολο παραμέτρων που λέει στον διακομιστή πώς να μετακινεί δεδομένα από πηγές σε στόχο

Αυτές οι ερωτήσεις συνέντευξης θα βοηθήσουν επίσης στο viva (προφορικά) σας