Tutorial Informatica PowerCenter: Architectură, Componente

PowerCenter Informatică Architectură

Arhitectura generală a Informatica PowerCenter este orientată spre servicii Architectură (SOA). Arhitectura instrumentului Informatica ETL constă din următoarele servicii și componente:

  1. Serviciul de depozitare – Responsabil pentru menținerea metadatelor Informatica și furnizarea accesului acestora la alte servicii.
  2. Serviciul de integrare – Responsabil cu mutarea datelor de la surse la ținte
  3. Serviciul de raportare – Permite generarea de rapoarte
  4. Nodurile – Platformă de calcul pe care se execută serviciile de mai sus
  5. Informatica Designer – Folosit pentru crearea de mapări între sursă și țintă
  6. Manager de flux de lucru – Folosit pentru a crea fluxuri de lucru și alte sarcini și execuția acestora
  7. Monitor flux de lucru – Folosit pentru a monitoriza execuția fluxurilor de lucru
  8. Manager depozit – Folosit pentru a gestiona obiecte din depozit
Informatică ArchiDiagrama de tectură
Informatică ArchiDiagrama de tectură

Domeniul Informatica

Domeniul Informatica este unitatea administrativă fundamentală în instrumentul Informatica. Este o colecție de noduri și servicii. În plus, aceste noduri și servicii pot fi clasificate în foldere și subdirectoare în funcție de cerințele de administrare.

De exemplu, în captura de ecran de mai jos, puteți vedea în fereastra domeniului folderul „Domain_Rajesh” sub care am creat un nume de nod „node01_rajesh” și servicii ca „guru99 integration services”.

Domeniu în Informatica
Domeniu în Informatica

Nodul este o reprezentare logică a unei mașini în interiorul domeniului. Node este necesar pentru a rula servicii și procese pentru Informatica.

Puteți avea mai multe noduri într-un domeniu. Într-un domeniu, veți găsi și un nod gateway.

Nodul gateway este responsabil pentru primirea cererilor de la diferite instrumente client și direcționarea acestor cereri către diferite noduri și servicii.

Există două tipuri de servicii în Domeniu

  • Service Manager: Managerul de servicii gestionează operațiunile de domeniu, cum ar fi autentificarea, autorizarea și înregistrarea în jurnal. De asemenea, rulează servicii de aplicații pe noduri, precum și gestionează utilizatori și grupuri.
  • Servicii de aplicații: Serviciul de aplicație reprezintă serviciile specifice serverului, cum ar fi serviciul de integrare, serviciul de depozit și serviciul de raportare. Aceste servicii rulează pe diferite noduri în funcție de configurație.

Depozitul Informatica PowerCenter

Depozitul PowerCenter este o bază de date relațională asemănătoare Oracle, Sybase, SQL server și este gestionat de serviciul de depozit. Este format din tabele de baze de date care stochează metadate.

Există trei instrumente Informatica Client disponibile în Informatica PowerCenter. Ei sunt Informatica

  • proiectant
  • Monitor flux de lucru
  • Manager de flux de lucru

Acești clienți pot accesa depozitul numai folosind serviciul de depozit.

Pentru a gestiona un depozit există un serviciu Informatica numit Repository Service. Un singur serviciu de depozit se ocupă exclusiv de un singur depozit. De asemenea, un serviciu de depozit se poate executa pe mai multe noduri pentru a crește performanța.

Serviciile de depozit folosesc blocări asupra obiectelor, astfel încât mai mulți utilizatori nu pot modifica același obiect în același timp.

Puteți activa controlul versiunilor în depozit. Cu funcția de control al versiunilor, puteți menține versiuni diferite ale aceluiași obiect.

Obiectele create în depozit pot avea următoarele trei stări

  • Valabil: Obiectele valide sunt acele obiecte a căror sintaxă este corectă conform Informatica. Aceste obiecte pot fi utilizate în execuția fluxurilor de lucru.
  • Invalid: Obiectele nevalide sunt acelea care nu aderă la standardul sau regulile specificate. Când orice obiect este salvat în Informatica, se verifică dacă sintaxa și proprietățile acestuia sunt valide sau nu, iar obiectul este marcat cu starea corespunzător.
  • impactate: Obiectele afectate sunt acelea ale căror obiecte copil sunt nevalide. De exemplu, într-o mapare, dacă utilizați o transformare reutilizabilă și acest obiect de transformare devine invalid, maparea va fi marcată ca afectată.

Configurarea domeniului în Informatica

După cum am menționat mai devreme, domeniul este controlul administrativ de bază în Informatica. Este entitatea părinte care constă din alte servicii precum serviciul de integrare, serviciul de depozit și diverse noduri.

Configurarea domeniului se poate face folosind consola de administrare Informatica. Consola poate fi lansată folosind browsere web.

Configurarea domeniului în Informatica

Odată deschis într-un browser web, acesta solicită autentificarea administratorului. Parola este setată în timpul instalării Informatica.

Configurarea domeniului în Informatica

După conectarea la domeniul Informatica, pagina de pornire arată cam așa.

Configurarea domeniului în Informatica

În panoul din stânga arată nodurile existente, serviciile de depozit, serviciile de integrare din domeniu.

În fereastra principală, arată starea acelor servicii, indiferent dacă acestea sunt în sus sau în jos.

Proprietăți ale Domeniului în Informatica

Faceți clic pe meniul de proprietăți din pagina de administrare pentru a vizualiza proprietățile domeniului.

Proprietăți ale Domeniului în Informatica

Proprietăți ale Domeniului în Informatica

Mai jos sunt proprietățile cheie ale domeniului în Informatica:

Timeout pentru rezistență – Dacă oricare dintre serviciile de integrare sau serviciile de depozit se defectează, atunci timpul de expirare a rezilienței este numărul de secunde în care serviciul de aplicație încearcă să se conecteze la acele servicii.

Perioada de repornire – Este numărul maxim de secunde pe care domeniul le petrece pentru a reporni un serviciu.

Modul de expediere – Este politica utilizată de echilibrator de încărcare pentru a trimite sarcini către diferite noduri.

Tipul bazei de date – Tipul bazei de date pe care este configurat domeniul.

Gazda bazei de date – Numele de gazdă al mașinii pe care este configurat domeniul.

Portul bazei de date & nume – Este portul bazei de date și numele instanței bazei de date pentru domeniu.

Aceste proprietăți pot fi modificate în funcție de cerințe.

Conectivitate client și server PowerCenter

Instrumentele client PowerCenter sunt instrumente de dezvoltare care sunt instalate pe mașinile client. Designerul PowerCenter, managerul de flux de lucru, un manager de depozit și monitorul fluxului de lucru sunt instrumentele principale ale clientului.

Mapările și obiectele pe care le creăm în aceste instrumente client sunt salvate în depozitul Informatica care se află pe serverul Informatica. Deci, instrumentele client trebuie să aibă conectivitate la rețea la server.

Pe de altă parte, clientul PowerCenter se conectează la surse și ținte pentru a importa metadatele și definițiile structurii sursă/țintă. Deci, trebuie să aibă și conectivitate la sistemele sursă/țintă.

  • Pentru a se conecta la serviciul de integrare și serviciul de depozit, clientul PowerCenter utilizează protocoale TCP/IP și
  • Pentru a se conecta la sursele/ținte, clientul PowerCenter folosește drivere ODBC.

Serviciul de depozitare în Informatica

Serviciul de depozitare în Informatica menține conexiunile de la clienții PowerCenter la depozitul PowerCenter. Este un proces separat cu mai multe fire și preia, inserează și actualizează metadatele în interiorul depozitului. De asemenea, este responsabil pentru menținerea coerenței în interiorul metadatelor din depozit.

Serviciul de depozitare în Informatica
Serviciul de depozitare în Informatica

Serviciul de Integrare in Informatica

Serviciul de integrare este motorul de execuție pentru Informatica, cu alte cuvinte, aceasta este entitatea care execută sarcinile pe care le creăm în Informatica. Asa functioneaza:

  • Un utilizator execută un flux de lucru
  • Informatica instruiește serviciul de integrare să execute fluxul de lucru
  • Serviciul de integrare citește detaliile fluxului de lucru din depozit
  • Serviciul de integrare începe executarea sarcinilor din fluxul de lucru
  • Odată ce execuția este completă, starea sarcinii este actualizată, adică a eșuat, a reușit sau a renunțat.
  • După finalizarea execuției, se generează jurnalul de sesiune și jurnalul fluxului de lucru.
  • Acest serviciu este responsabil pentru încărcarea datelor în sistemele țintă
  • Serviciul de integrare combină și date din diferite surse

De exemplu, poate combina date dintr-un tabel oracle și o sursă de fișiere plat.

Deci, în rezumat, serviciul de integrare Informatica este un proces rezident pe serverul Informatica care așteaptă să fie atribuite sarcini pentru execuție. Când executăm un flux de lucru, serviciul de integrare primește o notificare pentru a executa fluxul de lucru. Apoi, serviciul de integrare citește fluxul de lucru pentru a cunoaște detalii, cum ar fi sarcinile pe care trebuie să le execute, cum ar fi mapările și la ce momente. Apoi, serviciul citește detaliile sarcinii din depozit și continuă cu execuția.

Surse & Targets

Informatica fiind an ETL și instrument de integrare a datelor, veți manipula și transforma întotdeauna o anumită formă de date. Intrarea în mapările noastre în Informatica se numește sistem sursă. Importăm definițiile sursei din sursă și apoi ne conectăm la aceasta pentru a prelua datele sursă din mapările noastre. Pot exista diferite tipuri de surse și pot fi localizate în mai multe locații. În funcție de cerințele dvs., sistemul țintă poate fi un sistem de fișiere relațional sau plat. Țintele fișierelor plate sunt generate pe computerul server Informatica, care pot fi transferate ulterior folosind ftp.

Relațional– aceste tipuri de surse sunt tabele de sistem de baze de date. Aceste sisteme de baze de date sunt în general deținute de alte aplicații care creează și mențin aceste date. Poate fi o bază de date de management al relațiilor cu clienții, o bază de date de resurse umane, etc. pentru utilizarea unor astfel de surse în Informatica fie obținem o replică a acestor seturi de date, fie obținem privilegii selectate pe aceste sisteme.

Fișiere plate - Fișierele plate sunt cele mai comune surse de date după bazele de date relaționale din Informatica. Un fișier plat poate fi un fișier separat prin virgulă, un fișier delimitat de file sau un fișier cu lățime fixă. Informatica acceptă oricare dintre paginile de cod, cum ar fi ascii sau Unicode. Pentru a utiliza fișierul plat în Informatica, definițiile acestuia trebuie importate similar cu tabelele relaționale.

Rezumat

  • Arhitectura generală a Informatica PowerCenter este Orientat spre servicii Architectură (SOA).
  • Domeniul Informatica este unitatea administrativă fundamentală în instrumentul Informatica.
  • Depozitul PowerCenter este o bază de date relațională asemănătoare Oracle, Sybase, SQL server și este gestionat de serviciul de depozit.
  • Configurarea domeniului se poate face folosind consola de administrare Informatica.
  • Proprietăți ale domeniului în Informatica: Reziliență timeout, Perioada de repornire, Modul de expediere, Tipul bazei de date, Gazda bazei de date și Portul și numele bazei de date
  • Instrumentele client PowerCenter sunt instrumente de dezvoltare care sunt instalate pe mașinile client.
  • Serviciul de depozitare din Informatica menține conexiunile de la clienții PowerCenter la depozitul PowerCenter.
  • Serviciul de integrare este motorul de execuție pentru Informatica, cu alte cuvinte, aceasta este entitatea care execută sarcinile pe care le creăm în Informatica.