Normalisatietransformatie in Informatica met VOORBEELD
Wat is Normalizer-transformatie?
Normalizer is een actieve transformatie, die wordt gebruikt om een enkele rij in meerdere rijen te converteren en omgekeerd. Het is een slimme manier om uw gegevens op een meer georganiseerde manier weer te geven.
Als er zich in een enkele rij herhalende gegevens in meerdere kolommen bevinden, kan deze in meerdere rijen worden opgesplitst. Soms hebben we gegevens in meerdere voorkomende kolommen. Bijvoorbeeld
Studentennaam | Klasse 9-score | Klasse 10-score | Klasse 11-score | Klasse 12-score |
---|---|---|---|---|
Student 1 | 50 | 60 | 65 | 80 |
Student 2 | 70 | 64 | 83 | 77 |
In dit geval herhaalt de klasse score kolom zich in vier kolommen. Met behulp van normalizer kunnen we deze splitsen in de volgende dataset.
Studentennaam | Klasse | Score |
---|---|---|
Student 1 | 9 | 50 |
Student 1 | 10 | 60 |
Student 1 | 11 | 65 |
Student 1 | 12 | 80 |
Student 2 | 9 | 70 |
Student 2 | 10 | 64 |
Student 2 | 11 | 83 |
Student 2 | 12 | 77 |
Stap 1) Maak brontabel “sales_source” en doeltabel “sales_target” met behulp van het script en importeer ze Informatica
Download het bovenstaande Sales_Source.txt-bestand
Stap 2)Maak een mapping met bron “sales_source” en doeltabel “sales_target”
Stap 3) Maak vanuit het transformatiemenu een nieuwe transformatie
- Selecteer normalisator als transformatie
- Voer de naam in, "nrm_sales"
- Selecteer optie maken
Stap 4) De transformatie wordt gemaakt, selecteer de optie Gereed
Stap 5) Double klik vervolgens op de normalisatietransformatie
- Selecteer het normalisatietabblad
- Klik op het pictogram om twee kolommen te maken
- Voer kolomnamen in
- Stel het aantal exemplaren in op 4 voor verkoop en 0 voor winkelnaam
- Selecteer de OK-knop
Tijdens de transformatie worden kolommen gegenereerd. U ziet de kolom met het aantal verkopen van 4 terwijl we het aantal exemplaren instellen op 4.
Stap 6) Dan in de in kaart brengen
- Koppel de vier kolommen van de bronkwalificatie van het vier kwart respectievelijk aan de normalisatiekolommen.
- Koppel de kolom winkelnaam aan de normalisatiekolom
- Koppel winkelnaam en verkoopkolommen van normalisator naar doeltabel
- Koppel de GK_sales-kolom van normalisatie naar doeltabel
Sla de mapping op en voer deze uit nadat u een sessie hebt gemaakt en workflow. Voor elke kwartaalomzet van een winkel wordt door de normalisatietransformatie een aparte rij aangemaakt.
De output van onze mapping zal zijn als:
Winkel naam | Quarter | Sales |
---|---|---|
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
De brongegevens hadden herhalende kolommen, namelijk KWARTAAL1, KWARTAAL2, KWARTAAL3 en KWARTAAL4. Met behulp van de normalizer hebben we de gegevens opnieuw gerangschikt zodat ze in één kolom van QUARTER passen en voor één bronrecord worden vier records in het doel gemaakt.
Op deze manier kunt u gegevens normaliseren en meerdere records maken voor één gegevensbron.