Informatica PowerCenter Tutorial: Architecture, Komponenter

Informatica PowerCenter Architecture

Den overordnede arkitektur af Informatica PowerCenter er serviceorienteret Architecture (SOA). Informatica ETL-værktøjsarkitekturen består af følgende tjenester og komponenter:

  1. Depotservice – Ansvarlig for at vedligeholde Informatica-metadata og give adgang hertil til andre tjenester.
  2. Integrationstjeneste – Ansvarlig for flytning af data fra kilder til mål
  3. Rapporteringstjeneste – Muliggør generering af rapporter
  4. nodes – Computerplatform, hvor ovenstående tjenester udføres
  5. Informatik designer – Anvendes til oprettelse af kortlægninger mellem kilde og mål
  6. Workflow Manager – Bruges til at skabe arbejdsgange og andre opgaver og deres udførelse
  7. Workflow Monitor – Bruges til at overvåge udførelsen af ​​arbejdsgange
  8. Repository Manager – Bruges til at administrere objekter i depot
computer Architecture diagram
computer Architecture diagram

Informatica domæne

Informatica Domain er den grundlæggende administrative enhed i Informatica-værktøjet. Det er en samling af noder og tjenester. Yderligere kan disse noder og tjenester kategoriseres i mapper og undermapper baseret på administrationskravet.

For eksempel, i nedenstående skærmbillede, kan du under domænevinduet se mappen "Domain_Rajesh", hvorunder vi har oprettet et nodenavn "node01_rajesh" og tjenester som "guru99 integrationstjenester".

Domæne i Informatica
Domæne i Informatica

Node er en logisk repræsentation af en maskine inde i domænet. Node er påkrævet for at køre tjenester og processer for Informatica.

Du kan have flere noder i et domæne. I et domæne finder du også en gateway node.

Gateway noden er ansvarlig for at modtage anmodninger fra forskellige klientværktøjer og dirigere disse anmodninger til forskellige noder og tjenester.

Der er to typer tjenester i Domain

  • service manager: Servicemanager administrerer domæneoperationer som godkendelse, godkendelse og logning. Det kører også applikationstjenester på noderne samt administrerer brugere og grupper.
  • Applikationstjenester: Applikationstjeneste repræsenterer de serverspecifikke tjenester som integrationstjeneste, lagertjeneste og rapporteringstjeneste. Disse tjenester kører på forskellige noder baseret på konfigurationen.

Informatica PowerCenter Repository

PowerCenter repository er en relationel database som Oracle, Sybase, SQL server, og den administreres af repository service. Den består af databasetabeller, der gemmer metadata.

Der er tre Informatica Client-værktøjer tilgængelige i Informatica PowerCenter. De er Informatica

  • Designer
  • Workflow Monitor
  • Workflow Manager

Disse klienter kan kun få adgang til lageret ved hjælp af lagertjenesten.

For at administrere et arkiv findes der en Informatica-tjeneste kaldet Repository Service. En enkelt lagertjeneste håndterer udelukkende ét lager. En lagertjeneste kan også køre på flere noder for at øge ydeevnen.

Depottjenesterne bruger låse på objekterne, så flere brugere kan ikke ændre det samme objekt på samme tid.

Du kan aktivere versionskontrol i lageret. Med versionskontrolfunktionen kan du vedligeholde forskellige versioner af det samme objekt.

Objekter oprettet i depotet kan have følgende tre tilstande

  • Valid: Gyldige objekter er de objekter, hvis syntaks er korrekt ifølge Informatica. Disse objekter kan bruges i udførelsen af ​​arbejdsgange.
  • Ugyldig: Ugyldige objekter er dem, der ikke overholder den specificerede standard eller regler. Når et objekt gemmes i Informatica, kontrolleres det, om dets syntaks og egenskaber er gyldige eller ej, og objektet markeres med status i overensstemmelse hermed.
  • påvirket: Påvirkede objekter er dem, hvis underordnede objekter er ugyldige. For eksempel i en kortlægning, hvis du bruger en genanvendelig transformation, og dette transformationsobjekt bliver ugyldigt, vil kortlægningen blive markeret som påvirket.

Domænekonfiguration i Informatica

Som tidligere nævnt er domæne den grundlæggende administrative kontrol i Informatica. Det er moderselskabet, der består af andre tjenester som integrationstjeneste, lagertjeneste og forskellige noder.

Domænekonfigurationen kan udføres ved hjælp af Informatica-administrationskonsollen. Konsollen kan startes ved hjælp af webbrowsere.

Domænekonfiguration i Informatica

Når den er åbnet i en webbrowser, bliver den bedt om administratorlogin. Adgangskoden indstilles under Informatica-installationen.

Domænekonfiguration i Informatica

Efter login på Informatica-domænet ser hjemmesiden nogenlunde sådan ud.

Domænekonfiguration i Informatica

I venstre rude viser den de eksisterende noder, lagertjenester, integrationstjenester under domænet.

I hovedvinduet viser det status for disse tjenester, uanset om de er op eller ned.

Egenskaber for domæne i Informatica

Klik på egenskabsmenuen på admin-siden for at se egenskaberne for domænet.

Egenskaber for domæne i Informatica

Egenskaber for domæne i Informatica

Nedenfor er de vigtigste egenskaber for Domain in Informatica:

Resiliens timeout – Hvis nogen af ​​integrationstjenesten eller lagertjenesterne går ned, er resilience timeout det antal sekunder, applikationstjenesten forsøger at oprette forbindelse til disse tjenester.

Genstartsperiode – Det er det maksimale antal sekunder, domænet bruger på at genstarte en tjeneste.

Forsendelsestilstand – Det er den politik, som load balanceren bruger til at sende opgaver til forskellige noder.

Database type – Den type database, som domænet er konfigureret på.

Database vært – Værtsnavnet på den maskine, som domænet er konfigureret på.

Database port & navn – Det er databaseporten og databaseinstansens navn for domænet.

Disse egenskaber kan ændres efter behov.

PowerCenter klient- og serverforbindelse

PowerCenter-klientværktøjer er udviklingsværktøjer, som er installeret på klientmaskinerne. PowerCenter-designer, workflow manager, en repository manager og workflow monitor er de vigtigste klientværktøjer.

De kortlægninger og objekter, som vi opretter i disse klientværktøjer, gemmes i Informatica-lageret, som ligger på Informatica-serveren. Så klientværktøjerne skal have netværksforbindelse til serveren.

På den anden side forbinder PowerCenter-klienten til kilderne og målene for at importere metadata og kilde-/målstrukturdefinitioner. Så det skal også have forbindelse til kilde-/målsystemerne.

  • For at oprette forbindelse til integrationstjenesten og lagertjenesten bruger PowerCenter-klienten TCP/IP-protokoller og
  • For at oprette forbindelse til kilderne/målene bruger PowerCenter-klienten ODBC-drivere.

Repository Service i Informatica

Depotservice i Informatica vedligeholder forbindelserne fra PowerCenter-klienter til PowerCenter-lageret. Det er en separat flertrådsproces, og den henter, indsætter og opdaterer metadataene inde i depotet. Den er også ansvarlig for at opretholde konsistens inde i depotmetadataene.

Repository Service i Informatica
Repository Service i Informatica

Integrationstjeneste i Informatica

Integrationstjenesten er den eksekverende motor for Informatica, med andre ord er dette den enhed, der udfører de opgaver, vi opretter i Informatica. Sådan fungerer det:

  • En bruger udfører en arbejdsgang
  • Informatica instruerer integrationstjenesten til at udføre arbejdsgangen
  • Integrationstjenesten læser workflowdetaljer fra lageret
  • Integrationsservice starter udførelsen af ​​opgaverne inde i arbejdsgangen
  • Når udførelsen er fuldført, opdateres status for opgaven, dvs. mislykkedes, lykkedes eller afbrudt.
  • Efter afslutning af eksekvering genereres sessionslog og workflowlog.
  • Denne service er ansvarlig for at indlæse data i målsystemerne
  • Integrationstjenesten kombinerer også data fra forskellige kilder

For eksempel kan den kombinere data fra en oracle-tabel og en flad filkilde.

Så sammenfattende er Informatica-integrationstjenesten en proces, der ligger på Informatica-serveren og venter på, at opgaver skal tildeles til udførelsen. Når vi udfører en arbejdsgang, modtager integrationstjenesten en meddelelse om at udføre arbejdsgangen. Derefter læser integrationstjenesten workflowet for at kende detaljerne som hvilke opgaver den skal udføre som kortlægninger og på hvilke tidspunkter. Derefter læser tjenesten opgavedetaljerne fra lageret og fortsætter med udførelsen.

Kilder & Targets

Informatica er en ETL og dataintegrationsværktøj, ville du altid håndtere og transformere en form for data. Inputtet til vores kortlægninger i Informatica kaldes kildesystem. Vi importerer kildedefinitioner fra kilden og opretter derefter forbindelse til den for at hente kildedataene i vores kortlægninger. Der kan være forskellige typer kilder og kan være placeret flere steder. Baseret på dine krav kan målsystemet være et relationelt eller fladt filsystem. Flade filmål genereres på Informatica-servermaskinen, som kan overføres senere ved hjælp af ftp.

Relationel– disse typer kilder er databasesystemtabeller. Disse databasesystemer ejes generelt af andre applikationer, som opretter og vedligeholder disse data. Det kan være en Customer Relationship Management Database, Human Resource Database osv. For at bruge sådanne kilder i Informatica får vi enten en replika af disse datasæt, eller vi får udvalgte privilegier på disse systemer.

Flade filer – Flade filer er de mest almindelige datakilder efter relationelle databaser i Informatica. En flad fil kan være en kommasepareret fil, en tabulatorsepareret fil eller fil med fast bredde. Informatica understøtter alle kodesider som ascii eller Unicode. For at bruge den flade fil i Informatica skal dens definitioner importeres på samme måde, som vi gør for relationelle tabeller.

Resumé

  • Den overordnede arkitektur af Informatica PowerCenter er Serviceorienteret Architecture (SOA).
  • Informatica Domain er den grundlæggende administrative enhed i Informatica-værktøjet.
  • PowerCenter repository er en relationel database som Oracle, Sybase, SQL-server, og den administreres af repository service.
  • Domænekonfigurationen kan udføres ved hjælp af Informatica-administrationskonsollen.
  • Egenskaber for domæne i Informatica: Resilience timeout, genstartsperiode, afsendelsestilstand, databasetype, databasevært og databaseport og navn
  • PowerCenter-klientværktøjer er udviklingsværktøjer, som er installeret på klientmaskinerne.
  • Repository Service i Informatica vedligeholder forbindelserne fra PowerCenter-klienter til PowerCenter-depotet.
  • Integrationstjenesten er den eksekverende motor for Informatica, med andre ord er dette den enhed, der udfører de opgaver, vi opretter i Informatica.