Normalizační transformace v Informatica s PŘÍKLADEM
Co je normalizační transformace?
Normalizer je aktivní transformace, která se používá k převodu jednoho řádku na více řádků a naopak. Je to chytrý způsob, jak zorganizovat vaše data.
Pokud se v jednom řádku opakují data ve více sloupcích, lze je rozdělit do více řádků. Někdy máme data ve více vyskytujících se sloupcích. Například
| Jméno studenta | Skóre 9. třídy | Skóre 10. třídy | Skóre 11. třídy | Skóre 12. třídy |
|---|---|---|---|---|
| Student 1 | 50 | 60 | 65 | 80 |
| Student 2 | 70 | 64 | 83 | 77 |
V tomto případě se sloupec skóre třídy opakuje ve čtyřech sloupcích. Pomocí normalizátoru je můžeme rozdělit do následujícího souboru dat.
| Jméno studenta | Třída | Skóre |
|---|---|---|
| Student 1 | 9 | 50 |
| Student 1 | 10 | 60 |
| Student 1 | 11 | 65 |
| Student 1 | 12 | 80 |
| Student 2 | 9 | 70 |
| Student 2 | 10 | 64 |
| Student 2 | 11 | 83 |
| Student 2 | 12 | 77 |
Krok 1) Vytvořte zdrojovou tabulku „sales_source“ a cílovou tabulku „sales_target“ pomocí skriptu a importujte je do Informatika
Stáhněte si výše uvedený soubor Sales_Source.txt
Krok 2)Vytvořte mapování se zdrojovou „sales_source“ a cílovou tabulkou „sales_target“
Krok 3) Z nabídky transformace vytvořte novou transformaci
- Vyberte normalizátor jako transformaci
- Zadejte název „nrm_sales“
- Vyberte možnost vytvoření
Krok 4) Transformace bude vytvořena, vyberte možnost hotovo
Krok 5) Double pak klikněte na transformaci normalizátoru
- Vyberte kartu normalizátor
- Kliknutím na ikonu vytvoříte dva sloupce
- Zadejte názvy sloupců
- Nastavte počet výskytů na 4 pro prodej a 0 pro název obchodu
- Vyberte tlačítko OK
Při transformaci se vygenerují sloupce. Uvidíte sloupec 4 počet prodejů, protože nastavíme počet výskytů na 4.
Krok 6) Pak v mapování
- Propojte čtyři sloupce kvalifikátoru zdroje ze čtyř čtvrtletí se sloupci normalizátoru.
- Propojte sloupec názvu obchodu se sloupcem normalizátoru
- Propojte sloupce store_name a sales z normalizátoru s cílovou tabulkou
- Propojte sloupec GK_sales z normalizátoru s cílovou tabulkou
Uložte mapování a spusťte jej po vytvoření relace a workflow. Pro každý čtvrtletní prodej obchodu bude transformací normalizátoru vytvořen samostatný řádek.
Výstupem našeho mapování bude –
| Jméno obchodu | Čtvrťák | Prodej |
|---|---|---|
| DILLÍ | 1 | 150 |
| DILLÍ | 2 | 240 |
| DILLÍ | 3 | 455 |
| DILLÍ | 4 | 100 |
| MUMBAI | 1 | 100 |
| MUMBAI | 2 | 500 |
| MUMBAI | 3 | 350 |
| MUMBAI | 4 | 340 |
Zdrojová data měla opakující se sloupce, jmenovitě QUARTER1, QUARTER2, QUARTER3 a QUARTER4. Pomocí normalizátoru jsme přeuspořádali data tak, aby se vešla do jednoho sloupce ČTVRTLETÍ a pro jeden zdrojový záznam jsou v cíli vytvořeny čtyři záznamy.
Tímto způsobem můžete normalizovat data a vytvořit více záznamů pro jeden zdroj dat.






