Mapeamentos na Informatica: Criar, Componentes, Parâmetro, Variável
O que é um mapeamento?
Mapeamento é uma coleção de objetos de origem e de destino vinculados por um conjunto de transformações. Essas transformações consistem em um conjunto de regras que definem o fluxo de dados e como os dados são carregados nos destinos.
Um mapeamento consiste no seguinte conjunto de objetos
- Definição de origem – A definição da fonte define a estrutura e as características da fonte, seus tipos de dados subjacentes, tipo de fonte de dados, etc.
- Transformação – Os objetos de transformação definem como os dados de origem são transformados e diversas funções podem ser aplicadas durante o processo.
- Target Definição - Target definição define o alvo final onde os dados serão carregados.
- Ligações – Links conectam a definição de origem a diferentes transformações e tabelas de destino. Ele define como os dados fluem da origem para o destino e as transformações.
Por que você precisa de mapeamento?
Mapeamento é um objeto na Informatica com a ajuda do qual você pode definir como os dados de origem são modificados antes de chegarem ao destino ou objeto de destino. Por exemplo, se você tiver o nome do funcionário como “Bill Clinton” em seu sistema de origem e no sistema de destino, o requisito é ter o nome do funcionário no formato “Clinton Bill”, tais operações podem ser projetadas no nível do mapeamento. Em termos básicos, o que você faz com os dados de origem é definido no nível do mapeamento.
Mapeamento é o objeto básico da Informatica com o qual podemos definir os detalhes da transformação de dados e as características do objeto de origem/destino. Os mapeamentos nos ajudam a definir a transformação de dados nos níveis de coluna individuais de cada linha. Mesmo em um único mapeamento você pode lidar com múltiplas origens e destinos.
Componentes do Mapeamento
Os componentes básicos de um mapeamento são
- Tabelas de origem
- Mapeando parâmetros e variáveis
- Target objetos
- Mapeando transformações
Existem vários objetos que constituem um mapeamento. Um mapeamento pode consistir de origens, destinos, parâmetros e variáveis de mapeamento, mapplets, diversas transformações e funções definidas pelo usuário.
- Fonte de mapeamento: as fontes de mapeamento são os objetos de onde você busca os dados de origem. Pode ser uma tabela de banco de dados, arquivo simples, fonte XML ou COBOL fonte do arquivo
- Destino de mapeamento: O destino de mapeamento são nossos objetos de destino onde os dados finais processados são carregados. O destino de mapeamento pode ser uma tabela relacional de um banco de dados, um arquivo simples ou um arquivo XML. Fontes e destinos são obrigatórios em qualquer mapeamento, seu tipo pode ser diferente
- Mapeando Parâmetros e Variáveis: O mapeamento de parâmetros e variáveis ajuda a criar objetos de variáveis temporárias que o ajudarão a definir e armazenar valores temporários durante o mapeamento do processamento de dados. Parâmetros e variáveis de mapeamento são tipos de dados opcionais definidos pelo usuário, que podem ser criados para um mapeamento e podem ser referenciados e atualizados para um requisito específico. Aprenderemos mais sobre mapeamento de parâmetros e variáveis nesta seção
- Mapplets: São objetos que consistem em um conjunto de transformação, origem ou destino. Geralmente, os mapplets são criados para reutilizar a funcionalidade existente de um conjunto de transformações. Ele pode ser usado em qualquer número de mapeamentos.
O que é mapeamento de estágio?
Um mapeamento de estágio é um mapeamento onde criamos a réplica da tabela de origem. Por exemplo, em um sistema de produção, se você tiver uma tabela “funcionário”, poderá criar uma tabela idêntica “employee_stage” no esquema ETL.
Ter uma tabela de estágio local oferece várias vantagens, como tempo de inatividade de produção, não afetará seu sistema ETL porque você tem sua própria tabela “employee_stage”, em vez de se referir à tabela de produção “employee”. Num sistema de Produção, pode haver outras operações e processos que afetam o desempenho. No entanto, quando você tiver uma tabela de teste de réplica, apenas os processos ETL poderão acessá-la. Isso oferece benefícios de desempenho.
Em mapeamentos de estágio,
- Fonte e Target tabelas têm estruturas idênticas
- Os dados na tabela de destino são uma réplica dos dados da tabela de origem ou
- Os dados na tabela de estágio (destino) são um subconjunto dos dados de origem.
Por exemplo, se sua tabela de origem contiver detalhes de funcionários dos números de departamento 10, 20, 30 e 40. A tabela intermediária pode ser uma tabela com registros de funcionários apenas dos números de departamento 10 e 30.
O objetivo de criar tabelas de estágio em Data Warehouse é tornar o processo de transformação de dados eficiente, buscando apenas os dados que são relevantes para nós e também minimizar a dependência do ETL/Data Warehouse do sistema operacional em tempo real.
Como criar um mapeamento
Neste exercício, criaremos um mapeamento de estágio, em que a origem será “emp table” e o destino será “emptgt”.
Convenção de nomes – os nomes dos mapeamentos são prefixados com 'm_' seguidos pelos nomes das tabelas de origem e destino separados por um sinal de sublinhado.
Exemplo – se você estiver carregando a tabela emp_target da tabela emp, o nome do mapeamento poderá ser 'm_emp_emp_target'.
Passo 1) Iniciando o Mapping Designer
- Abra a ferramenta Informatica Designer
- Clique no ícone do Mapping Designer para iniciar o Mapping Designer
Passo 2)No Designer de Mapeamento
- Clique no menu Mapeamentos
- Selecione a opção Criar
Passo 3) Insira o nome do mapeamento como 'm_emp_emp_target' e selecione o botão OK.
O mapeamento será criado e listado na pasta de mapeamentos.
Um Mapeamento deve ter pelo menos um origem e um destino, você adicionará origens e destinos ao mapeamento.
Passo 4) Nesta etapa iremos,
- Selecione a tabela de origem “emp” na pasta de fontes.
- Arraste e solte a tabela “emp” no designer de mapeamento.
No designer de mapeamento, a tabela de origem importada será mostrada.
Observação – Ao importar qualquer tabela relacional (banco de dados) em um mapeamento, um objeto adicional do tipo qualificador de origem também será criado. Essa transformação do qualificador de origem é necessária e ajuda o serviço de integração da Informatica a identificar a tabela do banco de dados de origem e suas propriedades. Sempre que você importar uma tabela de origem, a transformação do qualificador de origem também será criada. Você nunca deve excluir um objeto qualificador de origem em um mapeamento.
Passo 5) Nesta etapa iremos,
- Selecione a tabela de origem “emp_target” em Targetpasta s.
- Arraste e solte a tabela “emp_target” no designer de mapeamento
No designer de mapeamento, a “tabela de destino” será importada e mostrada.
Para gerenciar o espaço de visualização, você pode iconizar esses objetos no mapeamento.
Passo 6)Clique com o botão direito em qualquer lugar na área de trabalho vazia do designer de mapeamento e selecione a opção – Organizar todos os icônicos.
Após selecionar a opção “Organizar todos os icônicos”, a área de trabalho ficará assim.
Passo 7) In informática, Projetamos com o fluxo da esquerda para a direita. Portanto, as tabelas de origem devem estar à esquerda e as tabelas de destino à direita. Para organizar tabelas em nosso espaço de trabalho, selecione a tabela “emp_target” e arraste e solte-a no lado direito da tabela emp.
Após esta reorganização, o espaço de trabalho ficará assim.
Observação – Use periodicamente o atalho “ctrl+s” para salvar as alterações no repositório.
Passo 8) Agora você tem tabelas de origem e de destino no seu mapeamento, mas o mapeamento ainda não está completo. As tabelas de origem e de destino devem estar vinculadas para concluir um mapeamento.
Para vincular origem e destinos
Double clique na tabela SQ_EMP e na tabela EMP_TARGET para alterar a visualização delas de icônica para gráfica.
Passo 9) Clique com o botão direito na área de trabalho do designer de mapeamento e selecione a opção “Autolink” por nome.
Passo 10) Para vincular a origem à tabela de destino
- Selecione Colunas da tabela de origem.
- Arraste e solte colunas na tabela de destino.
A Fonte e o Target as tabelas serão vinculadas e setas de conexão aparecerão da tabela de origem para a tabela de destino.
Observação – Aqui você vinculou todas as colunas de origem à respectiva coluna da tabela de destino. Isso significa que para cada registro de origem obtido, todas as colunas do destino serão carregadas. Se você deseja excluir o carregamento de qualquer coluna específica, clique no link da coluna e pressione a tecla delete no teclado. O link será removido e a coluna de destino não será carregada.
Passo 11) Use o atalho “ctrl+s” para salvar as alterações em seu mapeamento. Na janela de saída, você pode ver a mensagem de validação/análise de mapeamento. Isso confirma que seu mapeamento é válido. Além disso, haverá uma marca verde temporária ao lado do nome do mapeamento na árvore de pastas de mapeamento, indicando que o mapeamento foi feito com êxito.
Nos mapeamentos pode haver um requisito, onde precisamos passar uma variável para o mapeamento ou pode haver um cenário onde precisamos calcular variáveis temporárias e ainda ser necessário armazená-las para a próxima sessão do mapeamento. Para isso, criamos parâmetros e variáveis de mapeamento.
Mapeando Parâmetros e Variáveis
Como toda linguagem de programação, a Informatica possui sua própria maneira de definir parâmetros e variáveis. Mas, diferentemente de outras linguagens de programação, a Informatica não é uma linguagem baseada em código. Para criar parâmetros e variáveis na Informatica, você deve seguir a sintaxe e a navegação predefinidas.
Diferença entre parâmetros e variáveis –
Parâmetros de mapeamento | Mapeando Variáveis |
---|---|
Parâmetros de mapeamento são aqueles tipos de dados cujo valor, uma vez atribuído, permanece constante durante a execução do mapeamento. Como se você tivesse criado um parâmetro de mapeamento deptno=20, o valor 20 será constante durante toda a execução do mapeamento. O parâmetro onde quer que seja referenciado sempre retornará o valor 20 para aquela instância de execução do mapeamento. Para uma nova instância de mapeamento, o valor do parâmetro pode ser redefinido. | Variáveis de mapeamento são objetos que podem ser referenciados durante a execução do mapeamento (para acessar seus valores) e seus valores podem ser reatribuídos. Por exemplo, uma variável de mapeamento total_salary pode ser usada em um mapeamento e seu valor pode ser atualizado com base nos salários. |
Os parâmetros e variáveis de mapeamento são específicos apenas para um mapeamento. Eles não podem ser referenciados em outro mapeamento.
Como criar parâmetro de mapeamento
Ao criar um parâmetro de mapeamento, durante a execução do mapeamento, o serviço de integração procura seu valor atribuído. Esses valores podem ser atribuídos aos seguintes locais.
- Arquivo de parâmetro interno
- Na atribuição de variáveis pré-sessão
- Valor inicial no repositório
- Valor padrão atribuído durante a criação da variável
Passo 1) Para criar parâmetro de mapeamento - No designer de mapeamento,
- Selecionar menu de mapeamentos
- Selecione o menu de parâmetros e variáveis
Passo 2) Na próxima tela,
- Clique no menu adicionar nova variável
- No menu suspenso, selecione o tipo como parâmetro
- Insira o nome do parâmetro como $$Deptno
- Insira um valor inicial de 10
- Selecione o botão OK
Agora, você criou um parâmetro de mapeamento deptno, com valor inicialmente atribuído de 10, e este parâmetro pode ser referenciado dentro do mapeamento.
Como criar variável de mapeamento
Passo 1) No designer de mapeamento
- Selecionar menu de mapeamentos
- Selecione o menu de parâmetros e variáveis
Passo 2) Na próxima tela
- Clique no menu adicionar nova variável
- No menu suspenso, selecione o tipo como variável
- Insira o nome da variável como $$TotalSalary
- Selecione DataType como decimal
- Insira um valor inicial de 0
- Selecione o botão OK
Isso criará uma variável de mapeamento.
Observação – os nomes dos parâmetros e variáveis de mapeamento sempre começam com $$.
Resumo
Os mapeamentos são importantes na Informatica para combinar os dados de origem com os de destino de acordo com os requisitos do projeto. Discutimos os mapeamentos de estágios e o conceito de variáveis e parâmetros de mapeamento.