Підручник Informatica PowerCenter: Archiтектура, Компоненти
Informatica PowerCenter Archiтектура
Загальна архітектура Informatica PowerCenter є сервісно-орієнтованою Archiтектура (SOA). Архітектура інструменту Informatica ETL складається з таких служб і компонентів:
- Служба репозиторію – Відповідає за підтримку метаданих Informatica та надання доступу до них іншим службам.
- Служба інтеграції – Відповідає за переміщення даних від джерел до цілей
- Служба звітності – Дозволяє генерувати звіти
- Nodes – Обчислювальна платформа, де виконуються вищезазначені послуги
- Дизайнер інформатики – Використовується для створення відповідностей між джерелом і метою
- Менеджер робочого процесу – Використовується для створення робочих процесів та інших завдань і їх виконання
- Монітор робочого процесу – Використовується для моніторингу виконання робочих процесів
- Менеджер сховища – Використовується для керування об’єктами в репозиторії
Домен Informatica
Домен Informatica є основною адміністративною одиницею в інструменті Informatica. Це набір вузлів і служб. Крім того, ці вузли та служби можна розділити на папки та підпапки на основі вимог адміністрування.
Наприклад, на наведеному нижче знімку екрана ви можете побачити під вікном домену створену папку «Domain_Rajesh», у якій ми створили назву вузла «node01_rajesh» і служби як «guru99 integration services».
Вузол — це логічне представлення машини всередині домену. Вузол потрібен для запуску служб і процесів для Informatica.
Ви можете мати кілька вузлів в домені. У домені ви також знайдете вузол шлюзу.
Вузол шлюзу відповідає за отримання запитів від різних клієнтських інструментів і маршрутизацію цих запитів до різних вузлів і служб.
У домені є два види послуг
- Service Manager: Диспетчер служб керує такими операціями домену, як автентифікація, авторизація та журналювання. Він також запускає служби додатків на вузлах, а також керує користувачами та групами.
- Служби додатків: служба додатків представляє специфічні служби сервера, такі як служба інтеграції, служба сховища та служба звітності. Ці служби працюють на різних вузлах залежно від конфігурації.
Репозиторій Informatica PowerCenter
Репозиторій PowerCenter схожий на реляційну базу даних Oracle, Sybase, SQL сервер і ним керує служба репозиторію. Він складається з таблиць бази даних, які зберігають метадані.
У Informatica PowerCenter доступні три інструменти клієнта Informatica. Вони Informatica
- Дизайнерка
- Монітор робочого процесу
- Менеджер робочого процесу
Ці клієнти можуть отримати доступ до репозиторію лише за допомогою служби репозиторію.
Для керування репозиторієм існує служба Informatica під назвою Repository Service. Одна служба репозиторію обробляє лише одне репозиторій. Крім того, служба репозиторію може виконуватися на кількох вузлах для підвищення продуктивності.
Служби сховища використовують блокування об’єктів, тому кілька користувачів не можуть змінювати один і той самий об’єкт одночасно.
Ви можете ввімкнути контроль версій у репозиторії. За допомогою функції керування версіями ви можете підтримувати різні версії одного об’єкта.
Об'єкти, створені в репозиторії, можуть мати наступні три стани
- Дійсний: Дійсні об’єкти – це об’єкти, синтаксис яких правильний відповідно до Informatica. Ці об'єкти можна використовувати під час виконання робочих процесів.
- Недійсний: Недійсні об’єкти – це ті, хто не відповідає встановленим стандартам або правилам. Коли будь-який об’єкт зберігається в Informatica, перевіряється, чи є його синтаксис і властивості дійсними, і об’єкт позначається відповідним статусом.
- Ретінірованние: зазнали впливу об’єкти, дочірні об’єкти яких недійсні. Наприклад, у відображенні, якщо ви використовуєте багаторазове перетворення, і цей об’єкт перетворення стає недійсним, відображення буде позначено як зазнає впливу.
Конфігурація домену в Informatica
Як згадувалося раніше, домен є основним адміністративним елементом керування в Informatica. Це батьківська сутність, яка складається з інших служб, таких як служба інтеграції, служба репозиторію та різні вузли.
Налаштувати домен можна за допомогою консолі адміністратора Informatica. Консоль можна запускати за допомогою веб-браузерів.
Після відкриття у веб-браузері з’являється запит на вхід адміністратора. Пароль встановлюється під час встановлення Informatica.
Після входу в домен Informatica домашня сторінка виглядає приблизно так.
На лівій панелі показано існуючі вузли, служби сховища, служби інтеграції в домені.
У головному вікні він показує статус цих служб, чи працюють вони чи не працюють.
Властивості домену в Informatica
Натисніть меню властивостей на сторінці адміністратора, щоб переглянути властивості домену.
Нижче наведено основні властивості домену в Informatica:
Тайм-аут стійкості – Якщо будь-яка служба інтеграції або служба репозиторію вимикається, то час очікування стійкості – це кількість секунд, протягом яких служба програми намагається підключитися до цих служб.
Період перезапуску – Це максимальна кількість секунд, яку домен витрачає на перезапуск служби.
Режим відправки – Це політика, яку використовує балансувальник навантаження для відправлення завдань на різні вузли.
Тип бази даних – Тип бази даних, на якій налаштовано домен.
Хост бази даних – Ім’я хоста машини, на якій налаштовано домен.
Порт бази даних & ім'я – Це порт бази даних і ім’я екземпляра бази даних для домену.
Ці властивості можна змінювати відповідно до вимог.
Підключення клієнта та сервера PowerCenter
Клієнтські засоби PowerCenter — це засоби розробки, які інстальовано на клієнтських машинах. Дизайнер PowerCenter, менеджер робочих процесів, менеджер сховища та монітор робочих процесів є основними інструментами клієнта.
Зіставлення та об’єкти, які ми створюємо в цих клієнтських інструментах, зберігаються в репозиторії Informatica, який знаходиться на сервері Informatica. Отже, інструменти клієнта повинні мати мережеве підключення до сервера.
З іншого боку, клієнт PowerCenter підключається до джерел і цілей для імпорту метаданих і визначень структури джерела/цільової інформації. Тому він також повинен мати зв’язок із вихідною/цільовою системами.
- Для підключення до служби інтеграції та служби репозиторію клієнт PowerCenter використовує протоколи TCP/IP і
- Для підключення до джерел/цілей клієнт PowerCenter використовує драйвери ODBC.
Служба репозиторію в Informatica
Команда Служба репозиторію в Informatica підтримує підключення клієнтів PowerCenter до репозиторію PowerCenter. Це окремий багатопоточний процес, який отримує, вставляє та оновлює метадані всередині сховища. Він також відповідає за підтримку узгодженості метаданих сховища.
Служба інтеграції в інформатиці
Служба інтеграції є виконавчим механізмом для Informatica, іншими словами, це організація, яка виконує завдання, які ми створюємо в Informatica. Ось як це працює:
- Користувач виконує робочий процес
- Informatica наказує службі інтеграції виконати робочий процес
- Служба інтеграції зчитує деталі робочого процесу зі сховища
- Служба інтеграції починає виконання завдань у робочому процесі
- Після завершення виконання статус завдання оновлюється, тобто не вдалося, успішно або перервано.
- Після завершення виконання генерується журнал сеансу та журнал робочого процесу.
- Ця служба відповідає за завантаження даних у цільові системи
- Служба інтеграції також поєднує дані з різних джерел
Наприклад, він може поєднувати дані з таблиці оракула та джерела плоского файлу.
Отже, підводячи підсумок, служба інтеграції Informatica — це процес, який знаходиться на сервері Informatica і очікує на призначення завдань для виконання. Коли ми виконуємо робочий процес, служба інтеграції отримує сповіщення про виконання робочого процесу. Потім служба інтеграції зчитує робочий процес, щоб дізнатися деталі, наприклад, які завдання вона має виконати, як-от зіставлення, і в який час. Потім сервіс зчитує деталі завдання зі сховища та продовжує виконання.
Джерела та Targets
Інформатика будучи ETL і інструмент інтеграції даних, ви завжди будете обробляти та перетворювати певну форму даних. Вхідні дані для наших відображень в Informatica називають вихідною системою. Ми імпортуємо визначення джерела з джерела, а потім підключаємося до нього, щоб отримати вихідні дані в наших відображеннях. Можуть бути різні типи джерел і вони можуть розташовуватися в різних місцях. Залежно від ваших вимог цільовою системою може бути реляційна або плоска файлова система. Цілі плоского файлу генеруються на сервері Informatica, який можна передати пізніше за допомогою ftp.
Реляційний– ці типи джерел є системними таблицями бази даних. Ці системи баз даних зазвичай належать іншим програмам, які створюють і зберігають ці дані. Це може бути база даних керування відносинами з клієнтами, база даних людських ресурсів тощо. Для використання таких джерел в Informatica ми або отримуємо копію цих наборів даних, або отримуємо вибрані привілеї в цих системах.
Плоскі файли – Плоскі файли є найпоширенішими джерелами даних після реляційних баз даних в Informatica. Плоский файл може бути файлом, розділеним комами, файлом із роздільниками табуляцією або файлом фіксованої ширини. Informatica підтримує будь-які кодові сторінки, такі як ascii або Unicode. Щоб використовувати плоский файл в Informatica, його визначення потрібно імпортувати так само, як ми робимо для реляційних таблиць.
Підсумки
- Загальна архітектура Informatica PowerCenter така Орієнтований на обслуговування Archiтектура (SOA).
- Домен Informatica є основною адміністративною одиницею в інструменті Informatica.
- Репозиторій PowerCenter схожий на реляційну базу даних Oracle, Sybase, сервер SQL і ним керує служба репозиторію.
- Налаштувати домен можна за допомогою консолі адміністратора Informatica.
- Властивості домену в Informatica: час очікування стійкості, період перезапуску, режим відправки, тип бази даних, хост бази даних, порт і ім’я бази даних
- Клієнтські засоби PowerCenter — це засоби розробки, які інстальовано на клієнтських машинах.
- Служба сховища в Informatica підтримує підключення клієнтів PowerCenter до сховища PowerCenter.
- Служба інтеграції є виконавчим механізмом для Informatica, іншими словами, це організація, яка виконує завдання, які ми створюємо в Informatica.