Informatica PowerCenter-zelfstudie: Archistructuur, componenten
PowerCenter-informatica Architectuur
De algehele architectuur van Informatica PowerCenter is servicegericht Architechnologie (SOA). De Informatica ETL-toolarchitectuur bestaat uit de volgende services en componenten:
- Repository Service – Verantwoordelijk voor het onderhouden van Informatica-metagegevens en het verlenen van toegang daartoe tot andere diensten.
- Integratieservice – Verantwoordelijk voor de verplaatsing van gegevens van bronnen naar doelen
- Rapportageservice – Maakt het genereren van rapporten mogelijk
- Nodes – Computerplatform waarop bovenstaande diensten worden uitgevoerd
- Informatica-ontwerper – Gebruikt voor het maken van toewijzingen tussen bron en doel
- Werkstroombeheerder – Gebruikt om workflows en andere taken en de uitvoering ervan te creëren
- Workflowmonitor – Wordt gebruikt om de uitvoering van workflows te controleren
- Opslagplaatsbeheerder – Wordt gebruikt om objecten in de repository te beheren

Informatica-domein
Informatica Domain is de fundamentele administratieve eenheid in de Informatica-tool. Het is een verzameling knooppunten en services. Verder kunnen deze knooppunten en services worden onderverdeeld in mappen en submappen op basis van de beheervereisten.
In de onderstaande schermafbeelding ziet u bijvoorbeeld dat onder het domeinvenster de map “Domain_Rajesh” is aangemaakt waaronder we een knooppuntnaam “node01_rajesh” en services als “guru99-integratieservices” hebben gemaakt.
Knooppunt is een logische weergave van een machine binnen het domein. Node is vereist om services en processen voor Informatica uit te voeren.
U kunt meerdere knooppunten in een domein hebben. In een domein vind je ook een gateway-knooppunt.
Het gatewayknooppunt is verantwoordelijk voor het ontvangen van verzoeken van verschillende clienttools en het routeren van deze verzoeken naar verschillende knooppunten en services.
Er zijn twee soorten services in Domein
- Servicemanager: Service manager beheert domeinbewerkingen zoals authenticatie, autorisatie en logging. Het voert ook applicatieservices uit op de nodes en beheert gebruikers en groepen.
- Toepassingsservices: Applicatieservice vertegenwoordigt de serverspecifieke services, zoals integratieservice, repositoryservice en rapportageservice. Deze services draaien op verschillende knooppunten op basis van de configuratie.
Informatica PowerCenter-opslagplaats
PowerCenter-repository is een relationele database zoals Oracle, Sybase, SQL server en wordt beheerd door de repositoryservice. Het bestaat uit databasetabellen waarin metagegevens worden opgeslagen.
Er zijn drie Informatica Client-tools beschikbaar in Informatica PowerCenter. Zij zijn Informatica
- Designer
- Workflowmonitor
- Werkstroombeheerder
Deze clients hebben uitsluitend toegang tot de repository via de repositoryservice.
Om een repository te beheren bestaat er een Informatica-service genaamd Repository Service. Een enkele repositoryservice verwerkt uitsluitend slechts één repository. Ook kan een repositoryservice op meerdere knooppunten worden uitgevoerd om de prestaties te verbeteren.
De repositoryservices gebruiken vergrendelingen op de objecten, zodat meerdere gebruikers hetzelfde object niet tegelijkertijd kunnen wijzigen.
U kunt versiebeheer inschakelen in de repository. Met de versiebeheerfunctie kunt u verschillende versies van hetzelfde object onderhouden.
Objecten die in de repository zijn gemaakt, kunnen de volgende drie statussen hebben
- Geldig: Geldige objecten zijn objecten waarvan de syntaxis correct is volgens Informatica. Deze objecten kunnen worden gebruikt bij het uitvoeren van workflows.
- Ongeldig: Ongeldige objecten zijn objecten die zich niet aan de gespecificeerde norm of regels houden. Wanneer een object in Informatica wordt opgeslagen, wordt gecontroleerd of de syntaxis en eigenschappen ervan geldig zijn of niet, en wordt het object gemarkeerd met de overeenkomstige status.
- beïnvloed: Getroffen objecten zijn objecten waarvan de onderliggende objecten ongeldig zijn. Als u bijvoorbeeld bij een mapping een herbruikbare transformatie gebruikt en dit transformatieobject ongeldig wordt, wordt de mapping gemarkeerd als beïnvloed.
Domeinconfiguratie in Informatica
Zoals eerder vermeld, is domein de fundamentele administratieve controle in Informatica. Het is de bovenliggende entiteit die bestaat uit andere services, zoals de integratieservice, de repositoryservice en verschillende knooppunten.
De domeinconfiguratie kan worden uitgevoerd met behulp van de Informatica-beheerconsole. De console kan worden gestart met behulp van webbrowsers.
Eenmaal geopend in een webbrowser, wordt gevraagd om beheerdersaanmelding. Het wachtwoord wordt ingesteld tijdens de installatie van Informatica.
Nadat u zich heeft aangemeld bij het Informatica-domein, ziet de startpagina er ongeveer zo uit.
In het linkerdeelvenster worden de bestaande knooppunten, repositoryservices en integratieservices onder het domein weergegeven.
In het hoofdvenster wordt de status van die services weergegeven, ongeacht of deze omhoog of omlaag zijn.
Eigenschappen van domein in Informatica
Klik op het eigenschappenmenu op de beheerderspagina om de eigenschappen van het domein te bekijken.
Hieronder staan de belangrijkste eigenschappen van Domein in Informatica:
Time-out voor veerkracht – Als een van de integratieservices of repositoryservices uitvalt, is de time-out voor de veerkracht het aantal seconden dat de applicatieservice probeert verbinding te maken met die services.
Herstartperiode – Het is het maximale aantal seconden dat het domein besteedt aan het opnieuw opstarten van een service.
Verzendmodus – Het is het beleid dat door de load balancer wordt gebruikt om taken naar verschillende knooppunten te verzenden.
Databasetype – Het type database waarop het domein is geconfigureerd.
Databasehost – Hostnaam van de machine waarop het domein is geconfigureerd.
Databasepoort & naam – Het is de databasepoort en de naam van de database-instantie voor het domein.
Deze eigenschappen kunnen worden aangepast op basis van de vereisten.
PowerCenter Client- en serverconnectiviteit
PowerCenter-clienttools zijn ontwikkelingstools die op de clientmachines worden geïnstalleerd. PowerCenter-ontwerper, workflowmanager, een repositorymanager en workflowmonitor zijn de belangrijkste clienttools.
De toewijzingen en objecten die we in deze clienttools maken, worden opgeslagen in de Informatica-repository die zich op de Informatica-server bevindt. De clienttools moeten dus een netwerkverbinding met de server hebben.
Aan de andere kant maakt de PowerCenter-client verbinding met de bronnen en doelen om de metagegevens en bron-/doelstructuurdefinities te importeren. Het moet dus ook connectiviteit hebben met de bron-/doelsystemen.
- Om verbinding te maken met de integratieservice en repositoryservice gebruikt de PowerCenter-client TCP/IP-protocollen en
- Om verbinding te maken met de bronnen/doelen gebruikt de PowerCenter-client ODBC-stuurprogramma's.
Repositoryservice in Informatica
Het terrein van Repository Service in Informatica onderhoudt de verbindingen van PowerCenter-clients naar de PowerCenter-repository. Het is een afzonderlijk proces met meerdere threads en het haalt de metagegevens in de repository op, voegt deze in en werkt deze bij. Het is ook verantwoordelijk voor het handhaven van de consistentie binnen de metagegevens van de repository.
Integratieservice in Informatica
Integratieservice is de uitvoerende motor voor Informatica, met andere woorden, dit is de entiteit die de taken uitvoert die we in Informatica creëren. Dit is hoe het werkt:
- Een gebruiker voert een workflow uit
- Informatica instrueert de integratieservice om de workflow uit te voeren
- De integratieservice leest workflowdetails uit de repository
- De integratieservice start de uitvoering van de taken binnen de workflow
- Zodra de uitvoering is voltooid, wordt de status van de taak bijgewerkt, dwz mislukt, geslaagd of afgebroken.
- Na voltooiing van de uitvoering worden het sessielogboek en het workflowlogboek gegenereerd.
- Deze service is verantwoordelijk voor het laden van gegevens in de doelsystemen
- De integratieservice combineert ook gegevens uit verschillende bronnen
Het kan bijvoorbeeld gegevens uit een Oracle-tabel en een plat bestandsbron combineren.
Samengevat is de Informatica-integratieservice een proces dat zich op de Informatica-server bevindt en wacht tot taken worden toegewezen voor uitvoering. Wanneer we een workflow uitvoeren, ontvangt de integratieservice een melding om de workflow uit te voeren. Vervolgens leest de integratieservice de workflow om de details te weten, zoals welke taken deze moet uitvoeren, zoals toewijzingen en op welke tijdstippen. Vervolgens leest de service de taakdetails uit de repository en gaat verder met de uitvoering.
Bronnen & Targets
Informatica is een ETL en Data-integratietool, zou u altijd een vorm van data verwerken en transformeren. De invoer voor onze toewijzingen in Informatica wordt bronsysteem genoemd. We importeren brondefinities van de bron en maken er vervolgens verbinding mee om de brongegevens in onze toewijzingen op te halen. Er kunnen verschillende soorten bronnen zijn en deze kunnen zich op meerdere locaties bevinden. Afhankelijk van uw vereiste kan het doelsysteem een relationeel of plat bestandssysteem zijn. Platte bestandsdoelen worden gegenereerd op de Informatica-servermachine, die later kunnen worden overgedragen met behulp van ftp.
relationele– dit soort bronnen zijn databasesysteemtabellen. Deze databasesystemen zijn doorgaans eigendom van andere applicaties die deze gegevens creëren en onderhouden. Het kan een Customer Relationship Management Database, Human Resource Database, enz. zijn. Voor het gebruik van dergelijke bronnen in Informatica krijgen we ofwel een replica van deze datasets, ofwel krijgen we bepaalde privileges op deze systemen.
Platte bestanden – Platte bestanden zijn de meest voorkomende gegevensbronnen na relationele databases in Informatica. Een plat bestand kan een door komma's gescheiden bestand, een door tabs gescheiden bestand of een bestand met een vaste breedte zijn. Informatica ondersteunt alle codepagina's zoals ascii of Unicode. Om het platte bestand in Informatica te gebruiken, moeten de definities ervan worden geïmporteerd, net zoals we dat doen voor relationele tabellen.
Samenvatting
- De algehele architectuur van Informatica PowerCenter is Service gericht Architectuur (SOA).
- Informatica Domain is de fundamentele administratieve eenheid in de Informatica-tool.
- PowerCenter-repository is een relationele database zoals Oracle, Sybase, SQL-server en wordt beheerd door de repository-service.
- De domeinconfiguratie kan worden uitgevoerd met behulp van de Informatica-beheerconsole.
- Eigenschappen van domein in Informatica: Time-out veerkracht, herstartperiode, verzendmodus, databasetype, databasehost en databasepoort en -naam
- PowerCenter-clienttools zijn ontwikkelingstools die op de clientmachines worden geïnstalleerd.
- De Repository Service in Informatica onderhoudt de verbindingen van PowerCenter-clients met de PowerCenter-repository.
- Integratieservice is de uitvoerende motor voor Informatica, met andere woorden, dit is de entiteit die de taken uitvoert die we in Informatica creëren.