Tutorial de Informatica PowerCenter: Architectura, componentes

Informática PowerCenter Architectura

La arquitectura general de Informatica PowerCenter está orientada a servicios ArchiArquitectura SOA (SOA). La arquitectura de la herramienta ETL de Informatica consta de los siguientes servicios y componentes:

  1. Servicio de repositorio – Responsable de mantener los metadatos de Informatica y proporcionar acceso a los mismos a otros servicios.
  2. Servicio de integracion – Responsable del movimiento de datos desde las fuentes a los objetivos.
  3. Servicio de informes – Permite la generación de informes.
  4. Nodes – Plataforma informática donde se ejecutan los servicios anteriores
  5. Diseñador de informática – Se utiliza para la creación de asignaciones entre origen y destino.
  6. Gerente de flujo de trabajo – Se utiliza para crear flujos de trabajo y otras tareas y su ejecución.
  7. Monitor de flujo de trabajo – Se utiliza para monitorear la ejecución de los flujos de trabajo.
  8. Gerente de repositorio – Se utiliza para gestionar objetos en el repositorio.
informática ArchiDiagrama de tecnología
informática ArchiDiagrama de tecnología

Dominio de informática

Informatica Domain es la unidad administrativa fundamental de la herramienta Informatica. Es una colección de nodos y servicios. Además, estos nodos y servicios se pueden clasificar en carpetas y subcarpetas según los requisitos de administración.

Por ejemplo, en la siguiente captura de pantalla, puede ver en la ventana del dominio que se crea la carpeta "Domain_Rajesh" bajo la cual hemos creado un nombre de nodo "node01_rajesh" y servicios como "servicios de integración guru99".

Dominio en informatica
Dominio en informatica

Nodo es una representación lógica de una máquina dentro del dominio. Se requiere nodo para ejecutar servicios y procesos para Informatica.

Puede tener varios nodos en un dominio. En un dominio, también encontrará un nodo de puerta de enlace.

El nodo de puerta de enlace es responsable de recibir solicitudes de diferentes herramientas del cliente y enrutarlas a diferentes nodos y servicios.

Hay dos tipos de servicios en Dominio.

  • Gerente de Servicio:El administrador de servicios administra operaciones de dominio como autenticación, autorización y registro. También ejecuta servicios de aplicaciones en los nodos y administra usuarios y grupos.
  • Servicios de aplicaciones: El servicio de aplicación representa los servicios específicos del servidor, como el servicio de integración, el servicio de repositorio y el servicio de informes. Estos servicios se ejecutan en diferentes nodos según la configuración.

Repositorio de Informatica PowerCenter

El repositorio de PowerCenter es una base de datos relacional como Oracle, Sybase, SQL servidor y es administrado por el servicio de repositorio. Consiste en tablas de bases de datos que almacenan metadatos.

Hay tres herramientas de Informatica Client disponibles en Informatica PowerCenter. ellos son informatica

  • Diseño
  • Monitor de flujo de trabajo
  • Gerente de flujo de trabajo

Estos clientes pueden acceder al repositorio utilizando únicamente el servicio de repositorio.

Para gestionar un repositorio existe un servicio de Informatica llamado Servicio de Repositorio. Un único servicio de repositorio maneja exclusivamente un solo repositorio. Además, un servicio de repositorio se puede ejecutar en varios nodos para aumentar el rendimiento.

Los servicios de repositorio utilizan bloqueos en los objetos, por lo que varios usuarios no pueden modificar el mismo objeto al mismo tiempo.

Puede habilitar el control de versiones en el repositorio. Con la función de control de versiones, puede mantener diferentes versiones del mismo objeto.

Los objetos creados en el repositorio pueden tener los siguientes tres estados

  • Válido: Los objetos válidos son aquellos objetos cuya sintaxis es correcta según Informatica. Estos objetos se pueden utilizar en la ejecución de flujos de trabajo.
  • Inválido: Los objetos no válidos son aquellos que no se ajustan a la norma o reglas especificadas. Cuando se guarda cualquier objeto en Informatica, se comprueba si su sintaxis y propiedades son válidas o no, y el objeto se marca con el estado correspondiente.
  • Impactado: Los objetos afectados son aquellos cuyos objetos secundarios no son válidos. Por ejemplo, en una asignación, si está utilizando una transformación reutilizable y este objeto de transformación deja de ser válido, la asignación se marcará como afectada.

Configuración de dominio en Informatica

Como se mencionó anteriormente, el dominio es el control administrativo básico en Informatica. Es la entidad matriz que consta de otros servicios como el servicio de integración, el servicio de repositorio y varios nodos.

La configuración del dominio se puede realizar mediante la consola de administración de Informatica. La consola se puede iniciar mediante navegadores web.

Configuración de dominio en Informatica

Una vez abierto en un navegador web, solicita el inicio de sesión de administrador. La contraseña se establece durante la instalación de Informatica.

Configuración de dominio en Informatica

Después de iniciar sesión en el dominio de Informatica, la página de inicio se parece a esta.

Configuración de dominio en Informatica

En el panel izquierdo muestra los nodos existentes, los servicios de repositorio y los servicios de integración bajo el dominio.

En la ventana principal, muestra el estado de esos servicios, ya sea que estén activos o inactivos.

Propiedades del dominio en informatica

Haga clic en el menú de propiedades en la página de administración para ver las propiedades del dominio.

Propiedades del dominio en informatica

Propiedades del dominio en informatica

A continuación se muestran las propiedades clave del dominio en Informatica:

Tiempo de espera de resiliencia – Si alguno de los servicios de integración o de repositorio deja de funcionar, el tiempo de espera de resiliencia es el número de segundos que el servicio de la aplicación intenta conectarse a esos servicios.

Período de reinicio – Es la cantidad máxima de segundos que tarda el dominio en reiniciar un servicio.

Modo de envío – Es la política utilizada por el balanceador de carga para enviar tareas a varios nodos.

Tipo de base de datos – El tipo de base de datos en la que está configurado el dominio.

Host de base de datos – Nombre de host de la máquina en la que está configurado el dominio.

puerto de base de datos & nombre – Es el puerto de la base de datos y el nombre de la instancia de la base de datos para el dominio.

Estas propiedades se pueden modificar según los requisitos.

Conectividad de cliente y servidor de PowerCenter

Las herramientas cliente de PowerCenter son herramientas de desarrollo que se instalan en las máquinas cliente. El diseñador de PowerCenter, el administrador de flujo de trabajo, el administrador de repositorio y el monitor de flujo de trabajo son las principales herramientas del cliente.

Las asignaciones y objetos que creamos en estas herramientas cliente se guardan en el repositorio de Informatica que reside en el servidor de Informatica. Por tanto, las herramientas del cliente deben tener conectividad de red con el servidor.

Por otro lado, el cliente PowerCenter se conecta a los orígenes y destinos para importar los metadatos y las definiciones de la estructura de origen/destino. Por lo tanto, también debe tener conectividad con los sistemas de origen/destino.

  • Para conectarse al servicio de integración y al servicio de repositorio, el cliente de PowerCenter utiliza protocolos TCP/IP y
  • Para conectarse a los orígenes/destinos, el cliente PowerCenter utiliza controladores ODBC.

Servicio de repositorio en Informatica

La Servicio de repositorio en Informatica mantiene las conexiones de los clientes de PowerCenter al repositorio de PowerCenter. Es un proceso multiproceso independiente que recupera, inserta y actualiza los metadatos dentro del repositorio. También es responsable de mantener la coherencia dentro de los metadatos del repositorio.

Servicio de repositorio en Informatica
Servicio de repositorio en Informatica

Servicio de Integración en Informatica

El servicio de integración es el motor de ejecución de Informatica, es decir, esta es la entidad que ejecuta las tareas que creamos en Informatica. Así es como funciona:

  • Un usuario ejecuta un flujo de trabajo.
  • Informatica indica al servicio de integración que ejecute el flujo de trabajo
  • El servicio de integración lee los detalles del flujo de trabajo del repositorio
  • El servicio de integración inicia la ejecución de las tareas dentro del flujo de trabajo.
  • Una vez que se completa la ejecución, el estado de la tarea se actualiza, es decir, fallida, exitosa o abortada.
  • Una vez completada la ejecución, se genera el registro de sesión y el registro de flujo de trabajo.
  • Este servicio es responsable de cargar datos en los sistemas de destino.
  • El servicio de integración también combina datos de diferentes fuentes.

Por ejemplo, puede combinar datos de una tabla de Oracle y una fuente de archivo plano.

En resumen, el servicio de integración de Informatica es un proceso que reside en el servidor de Informatica y espera que se asignen tareas para su ejecución. Cuando ejecutamos un flujo de trabajo, el servicio de integración recibe una notificación para ejecutarlo. Luego, el servicio de integración lee el flujo de trabajo para conocer los detalles, como qué tareas debe ejecutar, como asignaciones, y en qué momentos. Luego, el servicio lee los detalles de la tarea del repositorio y procede con la ejecución.

Fuentes y Targets

La informática es una ETL y la herramienta de integración de datos, siempre estaría manejando y transformando algún tipo de datos. La entrada a nuestras asignaciones en Informatica se llama sistema de origen. Importamos definiciones de origen desde la fuente y luego nos conectamos a ella para obtener los datos de origen en nuestras asignaciones. Puede haber diferentes tipos de fuentes y pueden estar ubicadas en múltiples ubicaciones. Según sus requisitos, el sistema de destino puede ser un sistema de archivos relacional o plano. Los destinos de archivos planos se generan en la máquina del servidor de Informatica, que se pueden transferir más tarde mediante FTP.

Relacional– este tipo de fuentes son tablas del sistema de bases de datos. Estos sistemas de bases de datos generalmente pertenecen a otras aplicaciones que crean y mantienen estos datos. Puede ser una base de datos de gestión de relaciones con el cliente, una base de datos de recursos humanos, etc. Al utilizar dichas fuentes en Informatica, obtenemos una réplica de estos conjuntos de datos u obtenemos privilegios seleccionados en estos sistemas.

Archivos planos - Los archivos planos son las fuentes de datos más comunes después de las bases de datos relacionales en Informatica. Un archivo plano puede ser un archivo separado por comas, un archivo delimitado por tabulaciones o un archivo de ancho fijo. Informatica admite cualquiera de las páginas de códigos como ascii o Unicode. Para utilizar el archivo plano en Informatica, sus definiciones deben importarse de forma similar a como lo hacemos con las tablas relacionales.

Resumen

  • La arquitectura general de Informatica PowerCenter es Servicio Orientado Architectura (SOA).
  • Informatica Domain es la unidad administrativa fundamental de la herramienta Informatica.
  • El repositorio de PowerCenter es una base de datos relacional como Oracle, Sybase, servidor SQL y es administrado por el servicio de repositorio.
  • La configuración del dominio se puede realizar mediante la consola de administración de Informatica.
  • Propiedades del dominio en Informatica: tiempo de espera de resiliencia, período de reinicio, modo de envío, tipo de base de datos, host de la base de datos y puerto y nombre de la base de datos
  • Las herramientas cliente de PowerCenter son herramientas de desarrollo que se instalan en las máquinas cliente.
  • El servicio de repositorio de Informatica mantiene las conexiones de los clientes de PowerCenter al repositorio de PowerCenter.
  • El servicio de integración es el motor de ejecución de Informatica, es decir, esta es la entidad que ejecuta las tareas que creamos en Informatica.