Samouczek Informatica PowerCenter: Architecture, komponenty

Informatyka PowerCenter Architektura

Ogólna architektura Informatica PowerCenter jest zorientowana na usługi Architecture (SOA). Architektura narzędzia Informatica ETL składa się z następujących usług i komponentów:

  1. Usługa repozytorium – Odpowiedzialny za utrzymanie metadanych Informatica i zapewnianie dostępu do nich innym usługom.
  2. Usługa integracji – Odpowiedzialny za przepływ danych ze źródeł do celów
  3. Usługa raportowania – Umożliwia generowanie raportów
  4. Węzły – Platforma obliczeniowa, na której realizowane są powyższe usługi
  5. Projektant informatyki – Służy do tworzenia mapowań pomiędzy źródłem a celem
  6. Menedżer przepływu pracy – Służy do tworzenia przepływów pracy i innych zadań oraz ich wykonywania
  7. Monitor przepływu pracy – Służy do monitorowania wykonywania przepływów pracy
  8. Menedżer repozytorium – Służy do zarządzania obiektami w repozytorium
Informatyka ArchiSchemat tecture
Informatyka ArchiSchemat tecture

Domena informatyczna

Domena Informatica jest podstawową jednostką administracyjną narzędzia Informatica. Jest to zbiór węzłów i usług. Co więcej, te węzły i usługi można podzielić na foldery i podfoldery w oparciu o wymagania administracyjne.

Przykładowo na poniższym zrzucie ekranu widać, że w oknie domeny tworzony jest folder „Domain_Rajesh”, pod którym utworzyliśmy nazwę węzła „node01_rajesh” i usługi jako „usługi integracji guru99”.

Domena w informatyce
Domena w informatyce

Węzeł jest logiczną reprezentacją maszyny wewnątrz domeny. Węzeł jest wymagany do uruchamiania usług i procesów dla Informatica.

W domenie można mieć wiele węzłów. W domenie znajdziesz także węzeł bramy.

Węzeł bramy jest odpowiedzialny za odbieranie żądań z różnych narzędzi klienckich i kierowanie tych żądań do różnych węzłów i usług.

W domenie dostępne są dwa rodzaje usług

  • service Manager: Menedżer usług zarządza operacjami domenowymi, takimi jak uwierzytelnianie, autoryzacja i rejestrowanie. Uruchamia również usługi aplikacji na węzłach, a także zarządza użytkownikami i grupami.
  • Usługi aplikacji: Usługa aplikacji reprezentuje usługi specyficzne dla serwera, takie jak usługa integracji, usługa repozytorium i usługa raportowania. Usługi te działają w różnych węzłach w zależności od konfiguracji.

Repozytorium Informatica PowerCenter

Repozytorium PowerCenter jest relacyjną bazą danych, taką jak Oracle, Sybaza, SQL serwerze i jest zarządzany przez usługę repozytorium. Składa się z tabel bazy danych przechowujących metadane.

W Informatica PowerCenter dostępne są trzy narzędzia klienckie Informatica. Są to Informatyka

  • projektant
  • Monitor przepływu pracy
  • Menedżer przepływu pracy

Klienci ci mogą uzyskać dostęp do repozytorium wyłącznie za pomocą usługi repozytorium.

Do zarządzania repozytorium istnieje usługa Informatica zwana Usługą Repozytorium. Usługa pojedynczego repozytorium obsługuje wyłącznie tylko jedno repozytorium. Ponadto usługa repozytorium może być uruchamiana na wielu węzłach, aby zwiększyć wydajność.

Usługi repozytorium używają blokad na obiektach, więc wielu użytkowników nie może modyfikować tego samego obiektu w tym samym czasie.

Możesz włączyć kontrolę wersji w repozytorium. Dzięki funkcji kontroli wersji możesz utrzymywać różne wersje tego samego obiektu.

Obiekty utworzone w repozytorium mogą mieć następujące trzy stany

  • Ważny: Poprawne obiekty to te obiekty, których składnia jest poprawna zgodnie z Informatica. Obiekty te można wykorzystać w realizacji przepływów pracy.
  • Nieważny: Nieprawidłowe obiekty to te, które nie spełniają określonych standardów lub zasad. Po zapisaniu dowolnego obiektu w Informatice sprawdzane jest, czy jego składnia i właściwości są prawidłowe, po czym obiekt zostaje odpowiednio oznaczony statusem.
  • Wpływ na to: Obiekty, których to dotyczy, to te, których obiekty podrzędne są nieprawidłowe. Na przykład w mapowaniu, jeśli używasz transformacji wielokrotnego użytku, a ten obiekt transformacji stanie się nieprawidłowy, wówczas mapowanie zostanie oznaczone jako dotknięte.

Konfiguracja domeny w informatyce

Jak wspomniano wcześniej, domena jest podstawową kontrolą administracyjną w Informatice. Jest to jednostka nadrzędna, która składa się z innych usług, takich jak usługa integracji, usługa repozytorium i różne węzły.

Konfiguracji domeny można dokonać za pomocą konsoli administracyjnej Informatica. Konsolę można uruchomić za pomocą przeglądarek internetowych.

Konfiguracja domeny w informatyce

Po otwarciu w przeglądarce internetowej pojawia się monit o zalogowanie się administratora. Hasło jest ustawiane podczas instalacji Informatica.

Konfiguracja domeny w informatyce

Po zalogowaniu się do domeny Informatica strona główna wygląda mniej więcej tak.

Konfiguracja domeny w informatyce

W lewym okienku pokazuje istniejące węzły, usługi repozytorium, usługi integracyjne w ramach domeny.

W oknie głównym pokazuje status tych usług, niezależnie od tego, czy są one aktywne, czy wyłączone.

Właściwości domeny w informatyce

Kliknij menu właściwości na stronie administratora, aby wyświetlić właściwości domeny.

Właściwości domeny w informatyce

Właściwości domeny w informatyce

Poniżej znajdują się kluczowe właściwości Domain in Informatica:

Limit czasu odporności – Jeśli którakolwiek usługa integracji lub usługa repozytorium ulegnie awarii, limit czasu odporności to liczba sekund, w których usługa aplikacji próbuje połączyć się z tymi usługami.

Okres ponownego uruchomienia – Jest to maksymalna liczba sekund, jaką domena poświęca na ponowne uruchomienie usługi.

Tryb wysyłki – Jest to polityka używana przez moduł równoważenia obciążenia do wysyłania zadań do różnych węzłów.

Typ bazy danych – Typ bazy danych, na której skonfigurowana jest domena.

Host bazy danych – Nazwa hosta komputera, na którym skonfigurowana jest domena.

Port bazy danych & Nazwa – Jest to port bazy danych i nazwa instancji bazy danych dla domeny.

Właściwości te można modyfikować w zależności od wymagań.

Łączność klienta i serwera PowerCenter

Narzędzia klienckie PowerCenter to narzędzia programistyczne instalowane na komputerach klienckich. Projektant PowerCenter, menedżer przepływu pracy, menedżer repozytorium i monitor przepływu pracy to główne narzędzia klienckie.

Mapowania i obiekty, które tworzymy w tych narzędziach klienckich, są zapisywane w repozytorium Informatica, które znajduje się na serwerze Informatica. Dlatego narzędzia klienckie muszą mieć połączenie sieciowe z serwerem.

Z drugiej strony klient PowerCenter łączy się ze źródłami i celami, aby zaimportować metadane oraz definicje struktury źródłowej/docelowej. Musi więc mieć także łączność z systemami źródłowymi/docelowymi.

  • Aby połączyć się z usługą integracji i usługą repozytorium, klient PowerCenter korzysta z protokołów TCP/IP i
  • Aby połączyć się ze źródłami/celami, klient PowerCenter korzysta ze sterowników ODBC.

Usługa repozytorium w informatyce

Kurs Usługa repozytorium in Informatica utrzymuje połączenia klientów PowerCenter z repozytorium PowerCenter. Jest to odrębny proces wielowątkowy, który pobiera, wstawia i aktualizuje metadane wewnątrz repozytorium. Odpowiada także za utrzymanie spójności wewnątrz metadanych repozytorium.

Usługa repozytorium w informatyce
Usługa repozytorium w informatyce

Usługa integracji w informatyce

Usługa integracyjna jest silnikiem wykonawczym dla Informatyki, innymi słowy jest to podmiot realizujący zadania, które tworzymy w Informatyce. Tak to działa:

  • Użytkownik wykonuje przepływ pracy
  • Informatica zleca usłudze integracji wykonanie przepływu pracy
  • Usługa integracji odczytuje szczegóły przepływu pracy z repozytorium
  • Usługa integracji rozpoczyna realizację zadań wewnątrz przepływu pracy
  • Po zakończeniu wykonywania status zadania jest aktualizowany, tzn. nie powiodło się, powiodło się lub zostało przerwane.
  • Po zakończeniu wykonywania generowany jest dziennik sesji i dziennik przepływu pracy.
  • Usługa ta odpowiada za załadowanie danych do systemów docelowych
  • Usługa integracji łączy także dane z różnych źródeł

Może na przykład łączyć dane z tabeli Oracle i pliku źródłowego.

Podsumowując, usługa integracyjna Informatica to proces rezydujący na serwerze Informatica, który czeka na przypisanie zadań do wykonania. Gdy wykonujemy przepływ pracy, usługa integracyjna otrzymuje powiadomienie o konieczności wykonania przepływu pracy. Następnie usługa integracyjna odczytuje przepływ pracy, aby poznać szczegóły, takie jak to, które zadania musi wykonać, takie jak mapowania i w jakich terminach. Następnie usługa odczytuje szczegóły zadania z repozytorium i kontynuuje wykonywanie.

Źródła i Targets

Informatyka jest ETL i narzędzia integracji danych, zawsze będziesz obsługiwać i przekształcać jakąś formę danych. Wejście do naszych mapowań w Informatica nazywa się systemem źródłowym. Importujemy definicje źródłowe ze źródła, a następnie łączymy się z nim, aby pobrać dane źródłowe w naszych mapowaniach. Mogą istnieć różne typy źródeł i mogą być zlokalizowane w wielu lokalizacjach. W zależności od wymagań system docelowy może być relacyjnym lub płaskim systemem plików. Płaskie cele plików są generowane na maszynie serwera Informatica, która może być później przesłana za pomocą ftp.

Relacyjny– tego typu źródłami są tabele systemu bazodanowego. Te systemy baz danych są zazwyczaj własnością innych aplikacji, które tworzą i przechowują te dane. Może to być baza danych zarządzania relacjami z klientami, baza danych zasobów ludzkich itp. Za korzystanie z takich źródeł w Informatica albo otrzymujemy replikę tych zbiorów danych, albo uzyskujemy wybrane uprawnienia w tych systemach.

Pliki płaskie – Pliki płaskie są po relacyjnych bazach danych najczęstszym źródłem danych w Informatica. Plik płaski może być plikiem rozdzielanym przecinkami, plikiem rozdzielanym tabulatorami lub plikiem o stałej szerokości. Informatica obsługuje dowolne strony kodowe, takie jak ascii lub Unicode. Aby móc korzystać z pliku płaskiego w Informatice, należy zaimportować jego definicje podobnie jak robimy to w przypadku tabel relacyjnych.

Podsumowanie

  • Ogólna architektura Informatica PowerCenter jest następująca: Zorientowany na usługi Architektura (SOA).
  • Domena Informatica jest podstawową jednostką administracyjną narzędzia Informatica.
  • Repozytorium PowerCenter jest relacyjną bazą danych, taką jak Oracle, Sybase, serwer SQL i jest zarządzany przez usługę repozytorium.
  • Konfiguracji domeny można dokonać za pomocą konsoli administracyjnej Informatica.
  • Właściwości domeny w Informatica: limit czasu odporności, okres ponownego uruchomienia, tryb wysyłki, typ bazy danych, host bazy danych oraz port i nazwa bazy danych
  • Narzędzia klienckie PowerCenter to narzędzia programistyczne instalowane na komputerach klienckich.
  • Usługa repozytorium w Informatica utrzymuje połączenia między klientami PowerCenter a repozytorium PowerCenter.
  • Usługa integracyjna jest silnikiem wykonawczym dla Informatyki, innymi słowy jest to podmiot realizujący zadania, które tworzymy w Informatyce.