Tutorial do Informatica PowerCenter: Archiarquitetura, componentes
Informática do PowerCenter Archiarquitetura
A arquitetura geral do Informatica PowerCenter é orientada a serviços Architecture (SOA). A arquitetura da ferramenta ETL da Informatica consiste nos seguintes serviços e componentes:
- Serviço de Repositório – Responsável por manter os metadados da Informatica e fornecer acesso dos mesmos a outros serviços.
- Serviço de Integração – Responsável pela movimentação de dados das fontes para os destinos
- Serviço de Relatório – Permite a geração de relatórios
- Nodes – Plataforma informática onde são executados os serviços acima referidos
- Designer de Informática – Usado para criação de mapeamentos entre origem e destino
- Gerente de fluxo de trabalho – Usado para criar fluxos de trabalho e outras tarefas e sua execução
- Monitor de fluxo de trabalho – Usado para monitorar a execução de fluxos de trabalho
- Gerenciador de repositório – Usado para gerenciar objetos no repositório

Domínio Informatica
O Domínio Informatica é a unidade administrativa fundamental da ferramenta Informatica. É uma coleção de nós e serviços. Além disso, esses nós e serviços podem ser categorizados em pastas e subpastas com base nos requisitos de administração.
Por exemplo, na imagem abaixo, você pode ver na janela do domínio a pasta “Domain_Rajesh” foi criada sob a qual criamos um nome de nó “node01_rajesh” e serviços como “serviços de integração guru99”.
Nó é uma representação lógica de uma máquina dentro do domínio. O Node é necessário para executar serviços e processos da Informatica.
Você pode ter vários nós em um domínio. Em um domínio, você também encontrará um nó de gateway.
O nó gateway é responsável por receber solicitações de diferentes ferramentas cliente e rotear essas solicitações para diferentes nós e serviços.
Existem dois tipos de serviços no domínio
- service Manager: o gerenciador de serviços gerencia operações de domínio como autenticação, autorização e registro em log. Ele também executa serviços de aplicativos nos nós e gerencia usuários e grupos.
- Serviços de Aplicação: o serviço de aplicativo representa os serviços específicos do servidor, como serviço de integração, serviço de repositório e serviço de relatório. Esses serviços são executados em nós diferentes com base na configuração.
Repositório Informatica PowerCenter
O repositório do PowerCenter é um banco de dados relacional como Oracle, Sybase, SQL servidor e é gerenciado pelo serviço de repositório. Consiste em tabelas de banco de dados que armazenam metadados.
Há três ferramentas do Informatica Client disponíveis no Informatica PowerCenter. Eles são Informática
- Designer
- Monitor de fluxo de trabalho
- Gerente de fluxo de trabalho
Esses clientes podem acessar o repositório usando apenas o serviço de repositório.
Para gerenciar um repositório existe um serviço da Informatica chamado Repository Service. Um único serviço de repositório lida exclusivamente com apenas um repositório. Além disso, um serviço de repositório pode ser executado em vários nós para aumentar o desempenho.
Os serviços de repositório usam bloqueios nos objetos, portanto, vários usuários não podem modificar o mesmo objeto ao mesmo tempo.
Você pode ativar o controle de versão no repositório. Com o recurso de controle de versão, você pode manter diferentes versões do mesmo objeto.
Os objetos criados no repositório podem ter os seguintes três estados
- Válido: objetos válidos são aqueles cuja sintaxe está correta de acordo com a Informatica. Esses objetos podem ser utilizados na execução de fluxos de trabalho.
- Inválido: Objetos inválidos são aqueles que não seguem o padrão ou regras especificadas. Quando qualquer objeto é salvo na Informatica, é verificado se sua sintaxe e propriedades são válidas ou não, e o objeto é marcado com o status correspondente.
- Impactado: os objetos impactados são aqueles cujos objetos filhos são inválidos. Por exemplo, em um mapeamento, se você estiver usando uma transformação reutilizável e esse objeto de transformação se tornar inválido, o mapeamento será marcado como impactado.
Configuração de domínio na Informatica
Conforme mencionado anteriormente, domínio é o controle administrativo básico na Informatica. É a entidade pai que consiste em outros serviços, como serviço de integração, serviço de repositório e vários nós.
A configuração do domínio pode ser feita usando o console administrativo da Informatica. O console pode ser iniciado usando navegadores da web.
Uma vez aberto em um navegador da web, ele solicita login do administrador. A senha é definida durante a instalação da Informatica.
Após fazer login no domínio Informatica, a página inicial será semelhante a esta.
No painel esquerdo mostra os nós existentes, serviços de repositório e serviços de integração no domínio.
Na janela principal, mostra o status desses serviços, estejam eles ativos ou inativos.
Propriedades de domínio na Informatica
Clique no menu de propriedades na página de administração para visualizar as propriedades do domínio.
Abaixo estão as principais propriedades do Domínio na Informatica:
Tempo limite de resiliência – Se algum serviço de integração ou serviço de repositório ficar inativo, o tempo limite de resiliência será o número de segundos que o serviço de aplicativo tenta se conectar a esses serviços.
Período de reinicialização – É o número máximo de segundos que o domínio gasta para reiniciar um serviço.
Modo de envio – É a política usada pelo balanceador de carga para despachar tarefas para vários nós.
Tipo de banco de dados – O tipo de banco de dados no qual o domínio está configurado.
Host do banco de dados – Nome do host da máquina na qual o domínio está configurado.
Porta do banco de dados & nome – É a porta do banco de dados e o nome da instância do banco de dados do domínio.
Essas propriedades podem ser modificadas com base nos requisitos.
Conectividade de cliente e servidor do PowerCenter
As ferramentas cliente do PowerCenter são ferramentas de desenvolvimento instaladas nas máquinas clientes. O designer do PowerCenter, o gerenciador de fluxo de trabalho, o gerenciador de repositório e o monitor de fluxo de trabalho são as principais ferramentas do cliente.
Os mapeamentos e objetos que criamos nessas ferramentas cliente são salvos no repositório Informatica que reside no servidor Informatica. Portanto, as ferramentas cliente devem ter conectividade de rede com o servidor.
Por outro lado, o cliente do PowerCenter se conecta às origens e aos destinos para importar os metadados e as definições da estrutura de origem/destino. Portanto, também deve ter conectividade com os sistemas de origem/destino.
- Para se conectar ao serviço de integração e ao serviço de repositório, o cliente do PowerCenter usa protocolos TCP/IP e
- Para se conectar às origens/destinos, o cliente do PowerCenter usa drivers ODBC.
Serviço de repositório na Informatica
A Serviço de Repositório na Informatica mantém as conexões dos clientes do PowerCenter com o repositório do PowerCenter. É um processo multithread separado e busca, insere e atualiza os metadados dentro do repositório. Também é responsável por manter a consistência dentro dos metadados do repositório.
Serviço de Integração na Informatica
O serviço de integração é o mecanismo de execução da Informatica, ou seja, é a entidade que executa as tarefas que criamos na Informatica. É assim que funciona:
- Um usuário executa um fluxo de trabalho
- A Informatica instrui o serviço de integração a executar o fluxo de trabalho
- O serviço de integração lê detalhes do fluxo de trabalho do repositório
- O serviço de integração inicia a execução das tarefas dentro do fluxo de trabalho
- Assim que a execução for concluída, o status da tarefa será atualizado, ou seja, falhou, foi bem-sucedida ou foi abortada.
- Após a conclusão da execução, o log da sessão e o log do fluxo de trabalho são gerados.
- Este serviço é responsável por carregar dados nos sistemas de destino
- O serviço de integração também combina dados de diferentes fontes
Por exemplo, ele pode combinar dados de uma tabela oracle e uma fonte de arquivo simples.
Portanto, em resumo, o serviço de integração Informatica é um processo que reside no servidor Informatica aguardando a atribuição de tarefas para execução. Quando executamos um fluxo de trabalho, o serviço de integração recebe uma notificação para executar o fluxo de trabalho. Em seguida, o serviço de integração lê o fluxo de trabalho para saber os detalhes, como quais tarefas ele deve executar, como mapeamentos, e em quais horários. Em seguida, o serviço lê os detalhes da tarefa no repositório e prossegue com a execução.
Fontes & Targets
A Informática sendo uma ETL e ferramenta de integração de dados, você estaria sempre manipulando e transformando alguma forma de dados. A entrada para nossos mapeamentos na Informatica é chamada de sistema de origem. Importamos definições de origem da origem e depois nos conectamos a ela para buscar os dados de origem em nossos mapeamentos. Pode haver diferentes tipos de fontes e podem estar localizadas em vários locais. Com base nos seus requisitos, o sistema de destino pode ser um sistema de arquivos relacional ou simples. Os destinos de arquivo simples são gerados na máquina do servidor Informatica, que podem ser transferidos posteriormente usando FTP.
Relacional– esses tipos de fontes são tabelas de sistema de banco de dados. Esses sistemas de banco de dados geralmente pertencem a outros aplicativos que criam e mantêm esses dados. Pode ser um banco de dados de gerenciamento de relacionamento com o cliente, um banco de dados de recursos humanos, etc. para usar essas fontes na Informatica, obtemos uma réplica desses conjuntos de dados ou obtemos privilégios selecionados nesses sistemas.
Arquivos simples – Arquivos simples são fontes de dados mais comuns depois dos bancos de dados relacionais na Informatica. Um arquivo simples pode ser um arquivo separado por vírgula, um arquivo delimitado por tabulação ou um arquivo de largura fixa. A Informatica oferece suporte a qualquer uma das páginas de código, como ASCII ou Unicode. Para usar o arquivo simples na Informatica, suas definições devem ser importadas da mesma forma que fazemos para tabelas relacionais.
Resumo
- A arquitetura geral do Informatica PowerCenter é Serviço-Orientado Archiarquitetura (SOA).
- O Domínio Informatica é a unidade administrativa fundamental da ferramenta Informatica.
- O repositório do PowerCenter é um banco de dados relacional como Oracle, Sybase, SQL server e é gerenciado pelo serviço de repositório.
- A configuração do domínio pode ser feita usando o console administrativo da Informatica.
- Propriedades do domínio na Informatica: tempo limite de resiliência, período de reinicialização, modo de envio, tipo de banco de dados, host do banco de dados e porta e nome do banco de dados
- As ferramentas cliente do PowerCenter são ferramentas de desenvolvimento instaladas nas máquinas clientes.
- O Serviço de Repositório na Informatica mantém as conexões dos clientes do PowerCenter com o repositório do PowerCenter.
- O serviço de integração é o mecanismo de execução da Informatica, ou seja, é a entidade que executa as tarefas que criamos na Informatica.