Normalizer Transformation στην Informatica με ΠΑΡΑΔΕΙΓΜΑ
Τι είναι ο μετασχηματισμός κανονικοποιητή;
Ο κανονικοποιητής είναι ένας ενεργός μετασχηματισμός, που χρησιμοποιείται για τη μετατροπή μιας μεμονωμένης σειράς σε πολλές σειρές και αντίστροφα. Είναι ένας έξυπνος τρόπος να αναπαραστήσετε τα δεδομένα σας με πιο οργανωμένο τρόπο.
Εάν σε μία γραμμή υπάρχουν επαναλαμβανόμενα δεδομένα σε πολλές στήλες, τότε μπορεί να χωριστεί σε πολλές σειρές. Μερικές φορές έχουμε δεδομένα σε πολλαπλές στήλες. Για παράδειγμα
Ονομα μαθητή | Βαθμολογία 9ης τάξης | Βαθμολογία 10ης τάξης | Βαθμολογία 11ης τάξης | Βαθμολογία 12ης τάξης |
---|---|---|---|---|
Φοιτητής 1 | 50 | 60 | 65 | 80 |
Φοιτητής 2 | 70 | 64 | 83 | 77 |
Σε αυτήν την περίπτωση, η στήλη βαθμολογίας τάξης επαναλαμβάνεται σε τέσσερις στήλες. Χρησιμοποιώντας τον κανονικοποιητή, μπορούμε να τα χωρίσουμε στο ακόλουθο σύνολο δεδομένων.
Ονομα μαθητή | Τάξη | Σκορ |
---|---|---|
Φοιτητής 1 | 9 | 50 |
Φοιτητής 1 | 10 | 60 |
Φοιτητής 1 | 11 | 65 |
Φοιτητής 1 | 12 | 80 |
Φοιτητής 2 | 9 | 70 |
Φοιτητής 2 | 10 | 64 |
Φοιτητής 2 | 11 | 83 |
Φοιτητής 2 | 12 | 77 |
Βήμα 1) Δημιουργήστε πίνακα πηγής "sales_source" και στοχεύστε τον πίνακα "sales_target" χρησιμοποιώντας το σενάριο και εισαγάγετέ τα στο πληροφορική
Κατεβάστε το παραπάνω Αρχείο Sales_Source.txt
Βήμα 2)Δημιουργήστε μια αντιστοίχιση με πηγή "sales_source" και στόχευση πίνακα "sales_target"
Βήμα 3) Από το μενού μετασχηματισμού δημιουργήστε έναν νέο μετασχηματισμό
- Επιλέξτε κανονικοποιητή ως μετασχηματισμό
- Εισαγάγετε όνομα, "nrm_sales"
- Επιλέξτε την επιλογή δημιουργίας
Βήμα 4) Ο μετασχηματισμός θα δημιουργηθεί, επιλέξτε την επιλογή έγινε
Βήμα 5) Double κάντε κλικ στον μετασχηματισμό του κανονικοποιητή, στη συνέχεια
- Επιλέξτε την καρτέλα κανονικοποιητής
- Κάντε κλικ στο εικονίδιο για να δημιουργήσετε δύο στήλες
- Εισαγάγετε ονόματα στηλών
- Ορίστε τον αριθμό εμφάνισης σε 4 για τις πωλήσεις και 0 για το όνομα καταστήματος
- Επιλέξτε το κουμπί ΟΚ
Στο μετασχηματισμό θα δημιουργηθούν στήλες. Θα δείτε τη στήλη 4 αριθμός πωλήσεων καθώς ορίζουμε τον αριθμό των εμφανίσεων σε 4.
Βήμα 6) Στη συνέχεια, στο χαρτης
- Συνδέστε το προσδιοριστικό των τεσσάρων στηλών πηγής του τεσσάρου τριμήνου με τις στήλες του κανονικοποιητή αντίστοιχα.
- Συνδέστε τη στήλη ονόματος καταστήματος στη στήλη κανονικοποιητή
- Συνδέστε τις στήλες store_name & sales από τον κανονικοποιητή στον πίνακα προορισμού
- Συνδέστε τη στήλη GK_sales από τον κανονικοποιητή στον πίνακα προορισμού
Αποθηκεύστε την αντιστοίχιση και εκτελέστε την μετά τη δημιουργία συνεδρίας και ροής εργασίας. Για κάθε τρίμηνο πωλήσεων ενός καταστήματος, θα δημιουργείται μια ξεχωριστή σειρά από τον μετασχηματισμό του κανονικοποιητή.
Το αποτέλεσμα της χαρτογράφησης μας θα είναι σαν –
Όνομα Καταστήματος | Τέταρτο | ΕΚΠΤΩΣΕΙΣ |
---|---|---|
Δελχί | 1 | 150 |
Δελχί | 2 | 240 |
Δελχί | 3 | 455 |
Δελχί | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Τα δεδομένα πηγής είχαν επαναλαμβανόμενες στήλες, δηλαδή QUARTER1, QUARTER2, QUARTER3 και QUARTER4. Με τη βοήθεια του κανονικοποιητή, έχουμε αναδιατάξει τα δεδομένα ώστε να χωρούν σε μία στήλη του QUARTER και για μία εγγραφή πηγής δημιουργούνται τέσσερις εγγραφές στον στόχο.
Με αυτόν τον τρόπο, μπορείτε να κανονικοποιήσετε τα δεδομένα και να δημιουργήσετε πολλαπλές εγγραφές για μία μόνο πηγή δεδομένων.