Transformación del normalizador en Informatica con EJEMPLO
¿Qué es la transformación normalizadora?
El normalizador es una transformación activa que se utiliza para convertir una sola fila en varias filas y viceversa. Es una forma inteligente de representar sus datos de manera más organizada.
Si en una sola fila hay datos repetidos en varias columnas, entonces se puede dividir en varias filas. A veces tenemos datos en varias columnas. Por ejemplo
Nombre del estudiante | Puntuación de clase 9 | Puntuación de clase 10 | Puntuación de clase 11 | Puntuación de clase 12 |
---|---|---|---|---|
Estudiante 1 | 50 | 60 | 65 | 80 |
Estudiante 2 | 70 | 64 | 83 | 77 |
En este caso, la columna de puntuación de la clase se repite en cuatro columnas. Mediante el normalizador, podemos dividirlas en el siguiente conjunto de datos.
Nombre del estudiante | Clase | Puntuación |
---|---|---|
Estudiante 1 | 9 | 50 |
Estudiante 1 | 10 | 60 |
Estudiante 1 | 11 | 65 |
Estudiante 1 | 12 | 80 |
Estudiante 2 | 9 | 70 |
Estudiante 2 | 10 | 64 |
Estudiante 2 | 11 | 83 |
Estudiante 2 | 12 | 77 |
Paso 1) Cree la tabla de origen "sales_source" y la tabla de destino "sales_target" usando el script e impórtelas en informática
Descargue el archivo Sales_Source.txt anterior
Paso 2)Cree una asignación que tenga la fuente "sales_source" y la tabla de destino "sales_target"
Paso 3) Desde el menú de transformación crea una nueva transformación.
- Seleccione normalizador como transformación
- Ingrese el nombre, "nrm_sales"
- Seleccione la opción de crear
Paso 4) Se creará la transformación, seleccione la opción Listo.
Paso 5) Double haga clic en la transformación del normalizador, luego
- Seleccione la pestaña del normalizador
- Haga clic en el icono para crear dos columnas.
- Introduzca los nombres de las columnas
- Establezca el número de ocurrencia en 4 para ventas y 0 para el nombre de la tienda.
- Seleccione el botón Aceptar
Se generarán columnas en la transformación. Verá 4 columnas de números de ventas ya que configuramos el número de ocurrencias en 4.
Paso 6) Entonces en el cartografía
- Vincule las cuatro columnas del calificador de origen del cuatro trimestre a las columnas del normalizador respectivamente.
- Vincular la columna del nombre de la tienda a la columna del normalizador
- Vincular el nombre de la tienda y las columnas de ventas del normalizador a la tabla de destino
- Vincular la columna GK_sales del normalizador a la tabla de destino
Guarde el mapeo y ejecútelo después de crear la sesión y flujo de trabajo. Para cada trimestre de ventas de una tienda, la transformación del normalizador creará una fila separada.
El resultado de nuestro mapeo será como:
Nombre de la tienda | Trimestre | Sales |
---|---|---|
DELI | 1 | 150 |
DELI | 2 | 240 |
DELI | 3 | 455 |
DELI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Los datos de origen tenían columnas repetidas, a saber, TRIMESTRE1, TRIMESTRE2, TRIMESTRE3 y TRIMESTRE4. Con la ayuda del normalizador, hemos reorganizado los datos para que quepan en una sola columna de TRIMESTRE y para un registro de origen se crean cuatro registros en el destino.
De esta manera, puede normalizar los datos y crear múltiples registros para una única fuente de datos.