Normalizer Transformation in Informatica cu EXEMPLU
Ce este transformarea normalizatorului?
Normalizatorul este o transformare activă, folosită pentru a converti un singur rând în mai multe rânduri și invers. Este o modalitate inteligentă de a vă reprezenta datele într-un mod mai organizat.
Dacă într-un singur rând există date repetate în mai multe coloane, atunci acestea pot fi împărțite în mai multe rânduri. Uneori avem date în mai multe coloane care apar. De exemplu
Numele studentului | Scor clasa 9 | Scor clasa 10 | Scor clasa 11 | Scor clasa 12 |
---|---|---|---|---|
Elevul 1 | 50 | 60 | 65 | 80 |
Elevul 2 | 70 | 64 | 83 | 77 |
În acest caz, coloana scorului clasei se repetă în patru coloane. Folosind normalizatorul, le putem împărți în următorul set de date.
Numele studentului | Clasă | Scor |
---|---|---|
Elevul 1 | 9 | 50 |
Elevul 1 | 10 | 60 |
Elevul 1 | 11 | 65 |
Elevul 1 | 12 | 80 |
Elevul 2 | 9 | 70 |
Elevul 2 | 10 | 64 |
Elevul 2 | 11 | 83 |
Elevul 2 | 12 | 77 |
Pas 1) Creați tabelul sursă „sales_source” și tabelul țintă „sales_target” folosind scriptul și importați-le în Informatică
Descărcați fișierul Sales_Source.txt de mai sus
Pas 2)Creați o mapare având sursa „sales_source” și tabel țintă „sales_target”
Pas 3) Din meniul de transformare creați o nouă transformare
- Selectați normalizatorul ca transformare
- Introduceți numele, „nrm_sales”
- Selectați opțiunea de creare
Pas 4) Transformarea va fi creată, selectați opțiunea gata
Pas 5) Double faceți clic pe transformarea normalizatorului, apoi
- Selectați fila de normalizator
- Faceți clic pe pictogramă pentru a crea două coloane
- Introduceți numele coloanelor
- Setați numărul de apariții la 4 pentru vânzări și 0 pentru numele magazinului
- Selectați butonul OK
În transformare vor fi generate coloane. Veți vedea 4 coloană de număr de vânzări, pe măsură ce setăm numărul de apariții la 4.
Pas 6) Apoi în cartografiere
- Conectați cele patru coloane ale calificatorului sursă din cele patru sferturi de coloanele de normalizare, respectiv.
- Conectați coloana cu numele magazinului la coloana normalizatorului
- Conectați coloanele store_name și vânzări de la normalizator la tabelul țintă
- Conectați coloana GK_sales de la normalizator la tabelul țintă
Salvați maparea și executați-o după crearea sesiunii și flux de lucru. Pentru fiecare vânzări trimestriale ale unui magazin, un rând separat va fi creat prin transformarea normalizatorului.
Rezultatul cartografierii noastre va fi ca:
Numele magazinului | Trimestru | Vânzări |
---|---|---|
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
Mumbai | 1 | 100 |
Mumbai | 2 | 500 |
Mumbai | 3 | 350 |
Mumbai | 4 | 340 |
Datele sursă au avut coloane care se repetă și anume QUARTER1, QUARTER2, QUARTER3 și QUARTER4. Cu ajutorul normalizatorului, am rearanjat datele pentru a se încadra într-o singură coloană de QUARTER și pentru o înregistrare sursă sunt create patru înregistrări în țintă.
În acest fel, puteți normaliza datele și puteți crea mai multe înregistrări pentru o singură sursă de date.