Trasformazione del normalizzatore in Informatica con ESEMPIO
Cos'è la trasformazione del normalizzatore?
Il normalizzatore è una trasformazione attiva, utilizzata per convertire una singola riga in più righe e viceversa. È un modo intelligente di rappresentare i tuoi dati in modo più organizzato.
Se in una singola riga sono presenti dati ripetuti in più colonne, è possibile suddividerli in più righe. A volte abbiamo dati in più colonne ricorrenti. Per esempio
Nome dello studente | Punteggio della classe 9 | Punteggio della classe 10 | Punteggio della classe 11 | Punteggio della classe 12 |
---|---|---|---|---|
Studente 1 | 50 | 60 | 65 | 80 |
Studente 2 | 70 | 64 | 83 | 77 |
In questo caso, la colonna del punteggio di classe si ripete in quattro colonne. Utilizzando il normalizzatore, possiamo dividerle nel seguente set di dati.
Nome dello studente | Classe | Punti |
---|---|---|
Studente 1 | 9 | 50 |
Studente 1 | 10 | 60 |
Studente 1 | 11 | 65 |
Studente 1 | 12 | 80 |
Studente 2 | 9 | 70 |
Studente 2 | 10 | 64 |
Studente 2 | 11 | 83 |
Studente 2 | 12 | 77 |
Passo 1) Crea la tabella di origine "sales_source" e la tabella di destinazione "sales_target" utilizzando lo script e importale Informatica
Scarica il file Sales_Source.txt sopra
Passo 2)Crea una mappatura con origine "sales_source" e tabella di destinazione "sales_target"
Passo 3) Dal menu trasformazione crea una nuova trasformazione
- Seleziona il normalizzatore come trasformazione
- Inserisci il nome, "nrm_sales"
- Seleziona l'opzione di creazione
Passo 4) La trasformazione verrà creata, seleziona l'opzione Fine
Passo 5) Double fare clic sulla trasformazione del normalizzatore, quindi
- Seleziona la scheda Normalizzatore
- Fare clic sull'icona per creare due colonne
- Inserisci i nomi delle colonne
- Imposta il numero di occorrenze su 4 per le vendite e 0 per il nome del negozio
- Selezionare il pulsante OK
Le colonne verranno generate nella trasformazione. Vedrai 4 numeri di colonne di vendita poiché impostiamo il numero di occorrenze su 4.
Passo 6) Quindi nel mappatura
- Collega le quattro colonne del qualificatore di origine dei quattro quarti rispettivamente alle colonne del normalizzatore.
- Collega la colonna del nome del negozio alla colonna del normalizzatore
- Collega le colonne store_name e sales dal normalizzatore alla tabella di destinazione
- Collega la colonna GK_sales dal normalizzatore alla tabella di destinazione
Salva la mappatura ed eseguila dopo aver creato la sessione e flusso di lavoro. Per ogni trimestre delle vendite di un negozio, verrà creata una riga separata dalla trasformazione del normalizzatore.
L'output della nostra mappatura sarà come:
Nome del negozio | Trimestre | Sconti |
---|---|---|
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
I dati di origine avevano colonne ripetute, ovvero QUARTER1, QUARTER2, QUARTER3 e QUARTER4. Con l'aiuto del normalizzatore, abbiamo riorganizzato i dati per adattarli a una singola colonna di QUARTER e per un record di origine vengono creati quattro record nella destinazione.
In questo modo è possibile normalizzare i dati e creare più record per un'unica origine dati.