Informatica PowerCenter Tutorial: Architecture, Komponenter

Informatica PowerCenter Architecture

Den overordnede arkitektur af Informatica PowerCenter er serviceorienteret Architecture (SOA). Informatica ETL-vรฆrktรธjsarkitekturen bestรฅr af fรธlgende tjenester og komponenter:

  1. Depotservice โ€“ Ansvarlig for at vedligeholde Informatica-metadata og give adgang hertil til andre tjenester.
  2. Integrationstjeneste โ€“ Ansvarlig for flytning af data fra kilder til mรฅl
  3. Rapporteringstjeneste โ€“ Muliggรธr generering af rapporter
  4. nodes โ€“ Computerplatform, hvor ovenstรฅende tjenester udfรธres
  5. Informatik designer โ€“ Bruges til oprettelse af kortpingmellem kilde og mรฅl
  6. Workflow Manager โ€“ Bruges til at skabe arbejdsgange og andre opgaver og deres udfรธrelse
  7. Workflow Monitor โ€“ Bruges til at overvรฅge udfรธrelsen af โ€‹โ€‹arbejdsgange
  8. Repository Manager โ€“ Bruges til at administrere objekter i depot
computer Architecture diagram
computer Architecture diagram

Informatica domรฆne

Informatica Domain er den grundlรฆggende administrative enhed i Informatica-vรฆrktรธjet. Det er en samling af noder og tjenester. Yderligere kan disse noder og tjenester kategoriseres i mapper og undermapper baseret pรฅ administrationskravet.

For eksempel, i nedenstรฅende skรฆrmbillede, kan du under domรฆnevinduet se mappen "Domain_Rajesh", hvorunder vi har oprettet et nodenavn "node01_rajesh" og tjenester som "guru99 integrationstjenester".

Domรฆne i Informatica
Domรฆne i Informatica

Node er en logisk reprรฆsentation af en maskine inde i domรฆnet. Node er pรฅkrรฆvet for at kรธre tjenester og processer for Informatica.

Du kan have flere noder i et domรฆne. I et domรฆne finder du ogsรฅ en gateway node.

Gateway noden er ansvarlig for at modtage anmodninger fra forskellige klientvรฆrktรธjer og dirigere disse anmodninger til forskellige noder og tjenester.

Der er to typer tjenester i Domain

  • service manager: Servicemanager administrerer domรฆneoperationer som godkendelse, godkendelse og logning. Det kรธrer ogsรฅ applikationstjenester pรฅ noderne samt administrerer brugere og grupper.
  • Applikationstjenester: Applikationstjeneste reprรฆsenterer de serverspecifikke tjenester som integrationstjeneste, lagertjeneste og rapporteringstjeneste. Disse tjenester kรธrer pรฅ forskellige noder baseret pรฅ konfigurationen.

Informatica PowerCenter Repository

PowerCenter repository er en relationel database som Oracle, Sybase, SQL server, og den administreres af repository service. Den bestรฅr af databasetabeller, der gemmer metadata.

Der er tre Informatica Client-vรฆrktรธjer tilgรฆngelige i Informatica PowerCenter. De er Informatica

  • Designer
  • Workflow Monitor
  • Workflow Manager

Disse klienter kan kun fรฅ adgang til lageret ved hjรฆlp af lagertjenesten.

For at administrere et arkiv findes der en Informatica-tjeneste kaldet Repository Service. En enkelt lagertjeneste hรฅndterer udelukkende รฉt lager. En lagertjeneste kan ogsรฅ kรธre pรฅ flere noder for at รธge ydeevnen.

Depottjenesterne bruger lรฅse pรฅ objekterne, sรฅ flere brugere kan ikke รฆndre det samme objekt pรฅ samme tid.

Du kan aktivere versionskontrol i lageret. Med versionskontrolfunktionen kan du vedligeholde forskellige versioner af det samme objekt.

Objekter oprettet i depotet kan have fรธlgende tre tilstande

  • Valid: Gyldige objekter er de objekter, hvis syntaks er korrekt ifรธlge Informatica. Disse objekter kan bruges i udfรธrelsen af โ€‹โ€‹arbejdsgange.
  • Ugyldig: Ugyldige objekter er dem, der ikke overholder den specificerede standard eller regler. Nรฅr et objekt gemmes i Informatica, kontrolleres det, om dets syntaks og egenskaber er gyldige eller ej, og objektet markeres med status i overensstemmelse hermed.
  • pรฅvirketBerรธrte objekter er dem, hvis underobjekter er ugyldige. For eksempel pรฅ et kortping Hvis du bruger en genbrugelig transformation, og dette transformationsobjekt bliver ugyldigt, sรฅ er kortetping vil blive markeret som pรฅvirket.

Domรฆnekonfiguration i Informatica

Som tidligere nรฆvnt er domรฆne den grundlรฆggende administrative kontrol i Informatica. Det er moderselskabet, der bestรฅr af andre tjenester som integrationstjeneste, lagertjeneste og forskellige noder.

Domรฆnekonfigurationen kan udfรธres ved hjรฆlp af Informatica-administrationskonsollen. Konsollen kan startes ved hjรฆlp af webbrowsere.

Domรฆnekonfiguration i Informatica

Nรฅr den er รฅbnet i en webbrowser, bliver den bedt om administratorlogin. Adgangskoden indstilles under Informatica-installationen.

Domรฆnekonfiguration i Informatica

Efter login pรฅ Informatica-domรฆnet ser hjemmesiden nogenlunde sรฅdan ud.

Domรฆnekonfiguration i Informatica

I venstre rude viser den de eksisterende noder, lagertjenester, integrationstjenester under domรฆnet.

I hovedvinduet viser det status for disse tjenester, uanset om de er op eller ned.

Egenskaber for domรฆne i Informatica

Klik pรฅ egenskabsmenuen pรฅ admin-siden for at se egenskaberne for domรฆnet.

Egenskaber for domรฆne i Informatica

Egenskaber for domรฆne i Informatica

Nedenfor er de vigtigste egenskaber for Domain in Informatica:

Resiliens timeout โ€“ Hvis nogen af โ€‹โ€‹integrationstjenesten eller lagertjenesterne gรฅr ned, er resilience timeout det antal sekunder, applikationstjenesten forsรธger at oprette forbindelse til disse tjenester.

Genstartsperiode โ€“ Det er det maksimale antal sekunder, domรฆnet bruger pรฅ at genstarte en tjeneste.

Forsendelsestilstand โ€“ Det er den politik, som load balanceren bruger til at sende opgaver til forskellige noder.

Database type โ€“ Den type database, som domรฆnet er konfigureret pรฅ.

Database vรฆrt โ€“ Vรฆrtsnavnet pรฅ den maskine, som domรฆnet er konfigureret pรฅ.

Database port & navn โ€“ Det er databaseporten og databaseinstansens navn for domรฆnet.

Disse egenskaber kan รฆndres efter behov.

PowerCenter klient- og serverforbindelse

PowerCenter-klientvรฆrktรธjer er udviklingsvรฆrktรธjer, som er installeret pรฅ klientmaskinerne. PowerCenter-designer, workflow manager, en repository manager og workflow monitor er de vigtigste klientvรฆrktรธjer.

KortetpingDe filer og objekter, som vi opretter i disse klientvรฆrktรธjer, gemmes i Informatica-arkivet, som findes pรฅ Informatica-serveren. Klientvรฆrktรธjerne skal derfor have netvรฆrksforbindelse til serveren.

Pรฅ den anden side forbinder PowerCenter-klienten til kilderne og mรฅlene for at importere metadata og kilde-/mรฅlstrukturdefinitioner. Sรฅ det skal ogsรฅ have forbindelse til kilde-/mรฅlsystemerne.

  • For at oprette forbindelse til integrationstjenesten og lagertjenesten bruger PowerCenter-klienten TCP/IP-protokoller og
  • For at oprette forbindelse til kilderne/mรฅlene bruger PowerCenter-klienten ODBC-drivere.

Repository Service i Informatica

Depotservice i Informatica vedligeholder forbindelserne fra PowerCenter-klienter til PowerCenter-lageret. Det er en separat flertrรฅdsproces, og den henter, indsรฆtter og opdaterer metadataene inde i depotet. Den er ogsรฅ ansvarlig for at opretholde konsistens inde i depotmetadataene.

Repository Service i Informatica
Repository Service i Informatica

Integrationstjeneste i Informatica

Integrationstjenesten er den eksekverende motor for Informatica, med andre ord er dette den enhed, der udfรธrer de opgaver, vi opretter i Informatica. Sรฅdan fungerer det:

  • En bruger udfรธrer en arbejdsgang
  • Informatica instruerer integrationstjenesten til at udfรธre arbejdsgangen
  • Integrationstjenesten lรฆser workflowdetaljer fra lageret
  • Integrationsservice starter udfรธrelsen af โ€‹โ€‹opgaverne inde i arbejdsgangen
  • Nรฅr udfรธrelsen er fuldfรธrt, opdateres status for opgaven, dvs. mislykkedes, lykkedes eller afbrudt.
  • Efter afslutning af eksekvering genereres sessionslog og workflowlog.
  • Denne service er ansvarlig for at indlรฆse data i mรฅlsystemerne
  • Integrationstjenesten kombinerer ogsรฅ data fra forskellige kilder

For eksempel kan den kombinere data fra en oracle-tabel og en flad filkilde.

Kort sagt er Informatica-integrationstjenesten en proces, der befinder sig pรฅ Informatica-serveren, og som venter pรฅ, at opgaver tildeles til udfรธrelse. Nรฅr vi udfรธrer en arbejdsgang, modtager integrationstjenesten en besked om at udfรธre arbejdsgangen. Derefter lรฆser integrationstjenesten arbejdsgangen for at kende detaljerne, f.eks. hvilke opgaver den skal udfรธre, f.eks. et kort.pings & pรฅ hvilke tidspunkter. Derefter lรฆser tjenesten opgavedetaljerne fra arkivet og fortsรฆtter med udfรธrelsen.

Kilder & Targets

Informatica er en ETL og dataintegrationsvรฆrktรธj, ville du altid hรฅndtere og transformere en eller anden form for data. Inputtet til vores kortpingI Informatica kaldes kildesystemet. Vi importerer kildedefinitioner fra kilden og opretter derefter forbindelse til den for at hente kildedataene i vores kort.pings. Der kan vรฆre forskellige typer kilder, og de kan vรฆre placeret pรฅ flere steder. Afhรฆngigt af dine krav kan mรฅlsystemet vรฆre et relationelt eller fladt filsystem. Flade filmรฅl genereres pรฅ Informatica-servermaskinen, som senere kan overfรธres ved hjรฆlp af ftp.

Relationelโ€“ disse typer kilder er databasesystemtabeller. Disse databasesystemer ejes generelt af andre applikationer, som opretter og vedligeholder disse data. Det kan vรฆre en Customer Relationship Management Database, Human Resource Database osv. For at bruge sรฅdanne kilder i Informatica fรฅr vi enten en replika af disse datasรฆt, eller vi fรฅr udvalgte privilegier pรฅ disse systemer.

Flade filer โ€“ Flade filer er de mest almindelige datakilder efter relationelle databaser i Informatica. En flad fil kan vรฆre en kommasepareret fil, en tabulatorsepareret fil eller fil med fast bredde. Informatica understรธtter alle kodesider som ascii eller Unicode. For at bruge den flade fil i Informatica skal dens definitioner importeres pรฅ samme mรฅde, som vi gรธr for relationelle tabeller.

Resumรฉ

  • Den overordnede arkitektur af Informatica PowerCenter er Serviceorienteret Architecture (SOA).
  • Informatica Domain er den grundlรฆggende administrative enhed i Informatica-vรฆrktรธjet.
  • PowerCenter repository er en relationel database som Oracle, Sybase, SQL-server, og den administreres af repository service.
  • Domรฆnekonfigurationen kan udfรธres ved hjรฆlp af Informatica-administrationskonsollen.
  • Egenskaber for domรฆne i Informatica: Resilience timeout, genstartsperiode, afsendelsestilstand, databasetype, databasevรฆrt og databaseport og navn
  • PowerCenter-klientvรฆrktรธjer er udviklingsvรฆrktรธjer, som er installeret pรฅ klientmaskinerne.
  • Repository Service i Informatica vedligeholder forbindelserne fra PowerCenter-klienter til PowerCenter-depotet.
  • Integrationstjenesten er den eksekverende motor for Informatica, med andre ord er dette den enhed, der udfรธrer de opgaver, vi opretter i Informatica.

Opsummer dette indlรฆg med: