Transformacja normalizująca w informatyce z PRZYKŁADEM
Co to jest transformacja normalizująca?
Normalizator to aktywna transformacja używana do konwersji pojedynczego wiersza na wiele wierszy i odwrotnie. Jest to inteligentny sposób reprezentowania danych w bardziej zorganizowany sposób.
Jeśli w jednym wierszu znajdują się powtarzające się dane w wielu kolumnach, można je podzielić na wiele wierszy. Czasami mamy dane w wielu występujących kolumnach. Na przykład
Nazwa Student | Ocena klasy 9 | Ocena klasy 10 | Ocena klasy 11 | Ocena klasy 12 |
---|---|---|---|---|
Student 1 | 50 | 60 | 65 | 80 |
Student 2 | 70 | 64 | 83 | 77 |
W tym przypadku kolumna wyników klasy powtarza się w czterech kolumnach. Używając normalizatora możemy rozdzielić je w następującym zestawie danych.
Nazwa Student | Klasa | Wynik |
---|---|---|
Student 1 | 9 | 50 |
Student 1 | 10 | 60 |
Student 1 | 11 | 65 |
Student 1 | 12 | 80 |
Student 2 | 9 | 70 |
Student 2 | 10 | 64 |
Student 2 | 11 | 83 |
Student 2 | 12 | 77 |
Krok 1) Utwórz tabelę źródłową „źródło_sprzedaży” i tabelę docelową „target_sprzedaży” za pomocą skryptu i zaimportuj je Informatyka
Pobierz powyższy plik Sales_Source.txt
Krok 2)Utwórz mapowanie ze źródłem „źródło_sprzedaży” i tabelą docelową „target_sprzedaży”
Krok 3) Z menu transformacji utwórz nową transformację
- Wybierz normalizator jako transformację
- Wpisz nazwę „nrm_sales”
- Wybierz opcję tworzenia
Krok 4) Transformacja zostanie utworzona, wybierz opcję Gotowe
Krok 5) Double następnie kliknij transformację normalizującą
- Wybierz zakładkę normalizatora
- Kliknij ikonę, aby utworzyć dwie kolumny
- Wprowadź nazwy kolumn
- Ustaw liczbę wystąpień na 4 dla sprzedaży i 0 dla nazwy sklepu
- Wybierz przycisk OK
W transformacji zostaną wygenerowane kolumny. W kolumnie sprzedaży zobaczysz 4 liczby, ponieważ ustawiliśmy liczbę wystąpień na 4.
Krok 6) Następnie w mapowanie
- Połącz odpowiednio cztery kolumny kwalifikatora źródła czterech kwartałów z kolumnami normalizatora.
- Połącz kolumnę nazwy sklepu z kolumną normalizatora
- Połącz kolumny nazwa_sklepu i sprzedaż z normalizatora z tabelą docelową
- Połącz kolumnę GK_sales z normalizatora z tabelą docelową
Zapisz mapowanie i wykonaj je po utworzeniu sesji i workflow. Dla każdego kwartału sprzedaży sklepu zostanie utworzony oddzielny wiersz w wyniku transformacji normalizującej.
Wynik naszego mapowania będzie podobny do –
Nazwa sklepu | Kwartał | Sprzedaż |
---|---|---|
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Dane źródłowe zawierały powtarzające się kolumny, a mianowicie KWARTALNIK 1, KWARTALNIK 2, KWARTAŁ 3 i KWARTALNIK 4. Za pomocą normalizatora uporządkowaliśmy dane tak, aby zmieściły się w jednej kolumnie KWARTAŁ i dla jednego rekordu źródłowego tworzone są cztery rekordy w celu.
W ten sposób można normalizować dane i tworzyć wiele rekordów dla jednego źródła danych.