Normalisierungstransformation in Informatica mit BEISPIEL
Was ist Normalizer-Transformation?
Normalizer ist eine aktive Transformation, die zum Konvertieren einer einzelnen Zeile in mehrere Zeilen und umgekehrt verwendet wird. Dies ist eine intelligente Möglichkeit, Ihre Daten besser organisiert darzustellen.
Wenn in einer einzelnen Zeile sich wiederholende Daten in mehreren Spalten vorhanden sind, kann diese in mehrere Zeilen aufgeteilt werden. Manchmal haben wir Daten in mehreren vorkommenden Spalten. Zum Beispiel
Name des Schülers | Ergebnis der Klasse 9 | Ergebnis der Klasse 10 | Ergebnis der Klasse 11 | Ergebnis der Klasse 12 |
---|---|---|---|---|
Studentische 1 | 50 | 60 | 65 | 80 |
Studentische 2 | 70 | 64 | 83 | 77 |
In diesem Fall wiederholt sich die Spalte mit den Klassenergebnissen in vier Spalten. Mithilfe eines Normalisierers können wir diese in den folgenden Datensatz aufteilen.
Name des Schülers | Klasse | Score |
---|---|---|
Studentische 1 | 9 | 50 |
Studentische 1 | 10 | 60 |
Studentische 1 | 11 | 65 |
Studentische 1 | 12 | 80 |
Studentische 2 | 9 | 70 |
Studentische 2 | 10 | 64 |
Studentische 2 | 11 | 83 |
Studentische 2 | 12 | 77 |
Schritt 1) Erstellen Sie mithilfe des Skripts die Quelltabelle „sales_source“ und die Zieltabelle „sales_target“ und importieren Sie diese Informatik
Laden Sie die obige Sales_Source.txt-Datei herunter
Schritt 2)Erstellen Sie eine Zuordnung mit der Quelle „sales_source“ und der Zieltabelle „sales_target“.
Schritt 3) Erstellen Sie im Transformationsmenü eine neue Transformation
- Wählen Sie Normalizer als Transformation aus
- Geben Sie den Namen „nrm_sales“ ein.
- Wählen Sie die Erstellungsoption
Schritt 4) Die Transformation wird erstellt. Wählen Sie die Option „Fertig“.
Schritt 5) Double Klicken Sie dann auf die Normalisierungstransformation
- Wählen Sie die Registerkarte „Normalisierung“.
- Klicken Sie auf das Symbol, um zwei Spalten zu erstellen
- Geben Sie Spaltennamen ein
- Legen Sie die Anzahl der Vorkommen für Verkäufe auf 4 und für den Geschäftsnamen auf 0 fest
- Wählen Sie die Schaltfläche „OK“.
Bei der Transformation werden Spalten generiert. Da wir die Anzahl der Vorkommen auf 4 setzen, sehen Sie die Spalte „Anzahl der Verkäufe“ mit 4.
Schritt 6) Dann in der Mapping
- Verknüpfen Sie die vier Spalten des Quellqualifikators des vier Viertels jeweils mit den Normalisierungsspalten.
- Verknüpfen Sie die Spalte „Geschäftsname“ mit der Normalisierungsspalte
- Verknüpfen Sie die Spalten „store_name“ und „sales“ vom Normalizer mit der Zieltabelle
- Verknüpfen Sie die GK_sales-Spalte vom Normalizer mit der Zieltabelle
Speichern Sie das Mapping und führen Sie es aus, nachdem Sie eine Sitzung erstellt haben Arbeitsablauf.. Für jeden Quartalsumsatz eines Geschäfts wird durch die Normalisierungstransformation eine separate Zeile erstellt.
Die Ausgabe unserer Zuordnung wird wie folgt aussehen:
Name deines Geschäfts | Quartal | Verkauf |
---|---|---|
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Die Quelldaten hatten sich wiederholende Spalten, nämlich QUARTER1, QUARTER2, QUARTER3 und QUARTER4. Mit Hilfe des Normalisierers haben wir die Daten so neu angeordnet, dass sie in eine einzelne Spalte von QUARTER passen, und für einen Quelldatensatz werden im Ziel vier Datensätze erstellt.
Auf diese Weise können Sie Daten normalisieren und mehrere Datensätze für eine einzelne Datenquelle erstellen.