Informatica PowerCenter-Tutorial: ArchiStruktur, Komponenten
Informatik PowerCenter Architektur
Die Gesamtarchitektur von Informatica PowerCenter ist Service Oriented Archistruktur (SOA). Die Informatica ETL-Tool-Architektur besteht aus folgenden Diensten und Komponenten:
- Repository-Service – Verantwortlich für die Pflege der Informatica-Metadaten und die Bereitstellung des Zugriffs auf diese für andere Dienste.
- Integrationsservice – Verantwortlich für die Übertragung von Daten von Quellen zu Zielen
- Berichtsservice – Ermöglicht die Erstellung von Berichten
- Nodes – Computerplattform, auf der die oben genannten Dienste ausgeführt werden
- Informatik-Designer – Wird zur Erstellung von Zuordnungen zwischen Quelle und Ziel verwendet
- Workflow Manager – Wird zum Erstellen von Workflows und anderen Aufgaben sowie deren Ausführung verwendet
- Workflow-Monitor – Wird zur Überwachung der Ausführung von Workflows verwendet
- Repository-Manager – Wird zum Verwalten von Objekten im Repository verwendet
Informatica-Domäne
Die Informatica-Domäne ist die grundlegende Verwaltungseinheit im Informatica-Tool. Es handelt sich um eine Sammlung von Knoten und Diensten. Darüber hinaus können diese Knoten und Dienste je nach Verwaltungsanforderung in Ordner und Unterordner kategorisiert werden.
Im folgenden Screenshot können Sie beispielsweise sehen, dass unter dem Domänenfenster der Ordner „Domain_Rajesh“ erstellt wird, unter dem wir einen Knotennamen „node01_rajesh“ und Dienste als „guru99 Integration Services“ erstellt haben.
Ein Knoten ist eine logische Darstellung einer Maschine innerhalb der Domäne. Der Knoten ist erforderlich, um Dienste und Prozesse für Informatica auszuführen.
Sie können mehrere Knoten in einer Domäne haben. In einer Domäne finden Sie auch einen Gateway-Knoten.
Der Gateway-Knoten ist dafür verantwortlich, Anfragen von verschiedenen Client-Tools zu empfangen und diese Anfragen an verschiedene Knoten und Dienste weiterzuleiten.
Es gibt zwei Arten von Diensten in Domain
- Service Manager: Der Service Manager verwaltet Domänenvorgänge wie Authentifizierung, Autorisierung und Protokollierung. Er führt außerdem Anwendungsdienste auf den Knoten aus und verwaltet Benutzer und Gruppen.
- Anwendungsdienste: Der Anwendungsdienst stellt die serverspezifischen Dienste wie Integrationsdienst, Repository-Dienst und Berichtsdienst dar. Diese Dienste werden je nach Konfiguration auf unterschiedlichen Knoten ausgeführt.
Informatica PowerCenter-Repository
Das PowerCenter-Repository ähnelt einer relationalen Datenbank Oracle, Sybase, SQL Server und wird vom Repository-Dienst verwaltet. Es besteht aus Datenbanktabellen, die Metadaten speichern.
In Informatica PowerCenter stehen drei Informatica-Client-Tools zur Verfügung. Sie sind Informatica
- Designer
- Workflow-Monitor
- Workflow Manager
Diese Clients können nur über den Repository-Dienst auf das Repository zugreifen.
Zur Verwaltung eines Repositorys gibt es einen Informatica-Dienst namens Repository Service. Ein einzelner Repository-Dienst verwaltet ausschließlich nur ein Repository. Außerdem kann ein Repository-Dienst auf mehreren Knoten ausgeführt werden, um die Leistung zu steigern.
Die Repository-Dienste verwenden Sperren für die Objekte, sodass nicht mehrere Benutzer gleichzeitig dasselbe Objekt ändern können.
Sie können die Versionskontrolle im Repository aktivieren. Mit der Versionskontrollfunktion können Sie verschiedene Versionen desselben Objekts verwalten.
Im Repository erstellte Objekte können folgende drei Zustände haben:
- Gültig: Gültige Objekte sind solche Objekte, deren Syntax laut Informatica korrekt ist. Diese Objekte können bei der Ausführung von Workflows verwendet werden.
- Ungültig: Ungültige Objekte sind solche, die sich nicht an den angegebenen Standard oder die angegebenen Regeln halten. Wenn ein Objekt in Informatica gespeichert wird, wird geprüft, ob seine Syntax und Eigenschaften gültig sind oder nicht, und das Objekt wird mit dem entsprechenden Status markiert.
- Betroffene: Betroffen sind Objekte, deren untergeordnete Objekte ungültig sind. Wenn Sie beispielsweise in einem Mapping eine wiederverwendbare Transformation verwenden und dieses Transformationsobjekt ungültig wird, wird das Mapping als betroffen markiert.
Domänenkonfiguration in Informatica
Wie bereits erwähnt, ist die Domäne die grundlegende Verwaltungskontrolle in Informatica. Es ist die übergeordnete Entität, die aus anderen Diensten wie dem Integrationsdienst, dem Repository-Dienst und verschiedenen Knoten besteht.
Die Domänenkonfiguration kann über die Informatica-Administratorkonsole erfolgen. Die Konsole kann über Webbrowser gestartet werden.
Sobald es in einem Webbrowser geöffnet wird, werden Sie zur Anmeldung als Administrator aufgefordert. Das Passwort wird während der Informatica-Installation festgelegt.
Nach der Anmeldung bei der Informatica-Domäne sieht die Startseite in etwa so aus.
Im linken Bereich werden die vorhandenen Knoten, Repository-Dienste und Integrationsdienste unter der Domäne angezeigt.
Im Hauptfenster wird der Status dieser Dienste angezeigt, unabhängig davon, ob diese aktiv oder inaktiv sind.
Eigenschaften der Domäne in Informatica
Klicken Sie auf der Admin-Seite auf das Eigenschaftenmenü, um die Eigenschaften der Domain anzuzeigen.
Nachfolgend sind die wichtigsten Eigenschaften der Domäne in Informatica aufgeführt:
Resilienz-Timeout – Wenn einer der Integrationsdienste oder Repository-Dienste ausfällt, ist das Resilienz-Timeout die Anzahl der Sekunden, die der Anwendungsdienst versucht, eine Verbindung zu diesen Diensten herzustellen.
Neustartzeitraum – Dies ist die maximale Anzahl an Sekunden, die die Domäne für den Neustart eines Dienstes benötigt.
Versandmodus – Dies ist die Richtlinie, die vom Load Balancer verwendet wird, um Aufgaben an verschiedene Knoten zu verteilen.
Datenbanktyp – Der Datenbanktyp, für den die Domäne konfiguriert ist.
Datenbankhost – Hostname der Maschine, auf der die Domäne konfiguriert ist.
Datenbankport & Name – Es handelt sich um den Datenbankport und den Datenbankinstanznamen für die Domäne.
Diese Eigenschaften können je nach Anforderung geändert werden.
PowerCenter Client- und Server-Konnektivität
PowerCenter-Client-Tools sind Entwicklungstools, die auf den Client-Computern installiert werden. PowerCenter-Designer, Workflow-Manager, ein Repository-Manager und Workflow-Monitor sind die wichtigsten Client-Tools.
Die Zuordnungen und Objekte, die wir in diesen Client-Tools erstellen, werden im Informatica-Repository gespeichert, das sich auf dem Informatica-Server befindet. Daher müssen die Client-Tools über eine Netzwerkverbindung zum Server verfügen.
Andererseits stellt der PowerCenter-Client eine Verbindung zu den Quellen und Zielen her, um die Metadaten und Quell-/Zielstrukturdefinitionen zu importieren. Es muss also auch eine Verbindung zu den Quell-/Zielsystemen bestehen.
- Um eine Verbindung zum Integrationsdienst und Repository-Dienst herzustellen, verwendet der PowerCenter-Client TCP/IP-Protokolle und
- Um eine Verbindung zu den Quellen/Zielen herzustellen, verwendet der PowerCenter-Client ODBC-Treiber.
Repository-Dienst in Informatica
Die Repository-Service in Informatica verwaltet die Verbindungen von PowerCenter-Clients zum PowerCenter-Repository. Es handelt sich um einen separaten Multithread-Prozess, der die Metadaten im Repository abruft, einfügt und aktualisiert. Es ist auch für die Aufrechterhaltung der Konsistenz innerhalb der Repository-Metadaten verantwortlich.
Integrationsdienst in Informatica
Der Integrationsdienst ist die ausführende Engine für Informatica. Mit anderen Worten: Dies ist die Entität, die die Aufgaben ausführt, die wir in Informatica erstellen. So funktioniert es:
- Ein Benutzer führt einen Workflow aus
- Informatica weist den Integrationsdienst an, den Workflow auszuführen
- Der Integrationsdienst liest Workflow-Details aus dem Repository
- Der Integrationsdienst startet die Ausführung der Aufgaben innerhalb des Workflows
- Sobald die Ausführung abgeschlossen ist, wird der Status der Aufgabe aktualisiert, d. h. fehlgeschlagen, erfolgreich oder abgebrochen.
- Nach Abschluss der Ausführung werden ein Sitzungsprotokoll und ein Workflowprotokoll erstellt.
- Dieser Dienst ist für das Laden von Daten in die Zielsysteme verantwortlich
- Der Integrationsdienst führt auch Daten aus unterschiedlichen Quellen zusammen
Beispielsweise können Daten aus einer Oracle-Tabelle und einer Flatfile-Quelle kombiniert werden.
Zusammenfassend lässt sich also sagen, dass der Informatica-Integrationsdienst ein Prozess ist, der auf dem Informatica-Server läuft und darauf wartet, dass ihm Aufgaben zur Ausführung zugewiesen werden. Wenn wir einen Workflow ausführen, erhält der Integrationsdienst eine Benachrichtigung, den Workflow auszuführen. Anschließend liest der Integrationsdienst den Workflow, um die Details zu erfahren, z. B. welche Aufgaben er ausführen muss, z. B. Zuordnungen und zu welchen Zeitpunkten. Anschließend liest der Dienst die Aufgabendetails aus dem Repository und fährt mit der Ausführung fort.
Quellen & Targets
Informatica ist ein ETL und Datenintegrationstool, Sie würden immer irgendeine Form von Daten verarbeiten und transformieren. Die Eingabe für unsere Zuordnungen in Informatica wird als Quellsystem bezeichnet. Wir importieren Quelldefinitionen aus der Quelle und stellen dann eine Verbindung damit her, um die Quelldaten in unseren Zuordnungen abzurufen. Es kann verschiedene Arten von Quellen geben und sie können sich an mehreren Standorten befinden. Je nach Ihren Anforderungen kann das Zielsystem ein relationales oder flaches Dateisystem sein. Auf dem Informatica-Servercomputer werden flache Dateiziele generiert, die später per FTP übertragen werden können.
Relational– Bei diesen Arten von Quellen handelt es sich um Datenbanksystemtabellen. Diese Datenbanksysteme gehören im Allgemeinen anderen Anwendungen, die diese Daten erstellen und verwalten. Dabei kann es sich um eine Customer-Relationship-Management-Datenbank, eine Personaldatenbank usw. handeln. Für die Nutzung solcher Quellen in Informatica erhalten wir entweder eine Replik dieser Datensätze oder wir erhalten ausgewählte Berechtigungen für diese Systeme.
Flache Dateien – Flatfiles sind nach relationalen Datenbanken in Informatica die am häufigsten verwendeten Datenquellen. Eine Flatfile kann eine durch Kommas getrennte Datei, eine durch Tabulatoren getrennte Datei oder eine Datei mit fester Breite sein. Informatica unterstützt alle Codepages wie ASCII oder Unicode. Um die Flatfile in Informatica verwenden zu können, müssen ihre Definitionen ähnlich wie bei relationalen Tabellen importiert werden.
Zusammenfassung
- Die Gesamtarchitektur von Informatica PowerCenter ist Serviceorientiert Architektur (SOA).
- Die Informatica-Domäne ist die grundlegende Verwaltungseinheit im Informatica-Tool.
- Das PowerCenter-Repository ähnelt einer relationalen Datenbank Oracle, Sybase, SQL Server und wird vom Repository-Dienst verwaltet.
- Die Domänenkonfiguration kann über die Informatica-Administratorkonsole erfolgen.
- Eigenschaften der Domäne in Informatica: Resilienz-Timeout, Neustartzeitraum, Versandmodus, Datenbanktyp, Datenbankhost sowie Datenbankport und -name
- PowerCenter-Client-Tools sind Entwicklungstools, die auf den Client-Computern installiert werden.
- Der Repository-Dienst in Informatica verwaltet die Verbindungen von PowerCenter-Clients zum PowerCenter-Repository.
- Der Integrationsdienst ist die ausführende Engine für Informatica. Mit anderen Worten: Dies ist die Entität, die die Aufgaben ausführt, die wir in Informatica erstellen.