Учебное пособие по Informatica PowerCenter: Archiтектура, Компоненты

Информатика PowerCenter Archiтекстура

Общая архитектура Informatica PowerCenter ориентирована на сервисы. Architecture (SOA). Архитектура инструмента Informatica ETL состоит из следующих служб и компонентов:

  1. Служба репозитория – Отвечает за поддержание метаданных Informatica и обеспечение доступа к ним другим службам.
  2. Служба интеграции – Отвечает за перемещение данных от источников к целям.
  3. Служба отчетности – Позволяет генерировать отчеты
  4. Nodes — Вычислительная платформа, на которой выполняются вышеуказанные услуги
  5. Дизайнер информатики – Используется для создания сопоставлений между источником и целью.
  6. Менеджер рабочего процесса – Используется для создания рабочих процессов и других задач и их выполнения.
  7. Монитор рабочего процесса – Используется для контроля выполнения рабочих процессов.
  8. Менеджер репозитория – Используется для управления объектами в репозитории.
информатика ArchiДиаграмма тектуры
информатика ArchiДиаграмма тектуры

Домен информатики

Домен Informatica — это основная административная единица в инструменте Informatica. Это набор узлов и сервисов. Кроме того, эти узлы и службы можно разделить на папки и подпапки в зависимости от требований администрирования.

Например, на снимке экрана ниже вы можете видеть, что в окне домена создана папка «Domain_Rajesh», в которой мы создали имя узла «node01_rajesh» и службы как «службы интеграции guru99».

Домен в Информатике
Домен в Информатике

Узел — это логическое представление машины внутри домена. Узел необходим для запуска служб и процессов для Informatica.

В домене может быть несколько узлов. В домене вы также найдете узел шлюза.

Узел шлюза отвечает за получение запросов от различных клиентских инструментов и маршрутизацию этих запросов к различным узлам и службам.

В домене есть два типа услуг.

  • Руководитель отдела сервиса: Диспетчер служб управляет операциями домена, такими как аутентификация, авторизация и ведение журнала. Он также запускает службы приложений на узлах, а также управляет пользователями и группами.
  • Службы приложений: Служба приложений представляет собой специфичные для сервера службы, такие как служба интеграции, служба репозитория и служба отчетов. Эти службы работают на разных узлах в зависимости от конфигурации.

Репозиторий Informatica PowerCenter

Репозиторий PowerCenter — это реляционная база данных, например Oracle, SQL сервер и управляется службой репозитория. Он состоит из таблиц базы данных, в которых хранятся метаданные.

В Informatica PowerCenter доступны три клиентских инструмента Informatica. Они Информатика

  • UX/UI дизайнер
  • Монитор рабочего процесса
  • Менеджер рабочего процесса

Эти клиенты могут получить доступ к репозиторию только с помощью службы репозитория.

Для управления репозиторием существует служба Informatica под названием Repository Service. Одна служба репозитория обслуживает только один репозиторий. Кроме того, служба репозитория может выполняться на нескольких узлах для повышения производительности.

Службы репозитория используют блокировки объектов, поэтому несколько пользователей не могут одновременно изменять один и тот же объект.

Вы можете включить контроль версий в репозитории. Благодаря функции контроля версий вы можете поддерживать разные версии одного и того же объекта.

Объекты, созданные в репозитории, могут иметь следующие три состояния:

  • Действительный: Допустимые объекты — это те объекты, синтаксис которых верен согласно Informatica. Эти объекты можно использовать при выполнении рабочих процессов.
  • Недействительный: Недействительными объектами являются те, которые не соответствуют указанным стандартам или правилам. Когда какой-либо объект сохраняется в Informatica, проверяется, действительны ли его синтаксис и свойства, и объекту присваивается соответствующий статус.
  • Ретинированные: Затронутые объекты — это те, чьи дочерние объекты недействительны. Например, если в сопоставлении вы используете повторно используемое преобразование, и этот объект преобразования становится недействительным, то сопоставление будет помечено как затронутое.

Конфигурация домена в Информатике

Как упоминалось ранее, домен является основным административным элементом управления в Informatica. Это родительский объект, который состоит из других служб, таких как служба интеграции, служба репозитория и различные узлы.

Конфигурацию домена можно выполнить с помощью консоли администратора Informatica. Консоль можно запустить с помощью веб-браузеров.

Конфигурация домена в Информатике

При открытии в веб-браузере он запрашивает вход администратора. Пароль устанавливается во время установки Informatica.

Конфигурация домена в Информатике

После входа в домен Informatica домашняя страница выглядит примерно так.

Конфигурация домена в Информатике

На левой панели показаны существующие узлы, службы репозитория и службы интеграции в домене.

В главном окне отображается состояние этих служб, независимо от того, работают они или нет.

Свойства домена в информатике

Нажмите на меню свойств на странице администратора, чтобы просмотреть свойства домена.

Свойства домена в информатике

Свойства домена в информатике

Ниже приведены ключевые свойства домена в Informatica:

Тайм-аут устойчивости – Если какая-либо служба интеграции или служба репозитория выйдет из строя, то время ожидания устойчивости — это количество секунд, в течение которых служба приложения пытается подключиться к этим службам.

Период перезапуска – Это максимальное количество секунд, которое домен тратит на перезапуск службы.

Режим отправки – Это политика, используемая балансировщиком нагрузки для распределения задач по различным узлам.

Тип базы данных – Тип базы данных, в которой настроен домен.

Хост базы данных – Имя хоста машины, на которой настроен домен.

Порт базы данных & имя – Это порт базы данных и имя экземпляра базы данных для домена.

Эти свойства могут быть изменены в зависимости от требований.

Возможность подключения клиента и сервера PowerCenter

Клиентские инструменты PowerCenter — это инструменты разработки, которые устанавливаются на клиентских компьютерах. Конструктор PowerCenter, менеджер рабочих процессов, менеджер репозитория и монитор рабочих процессов являются основными клиентскими инструментами.

Сопоставления и объекты, которые мы создаем в этих клиентских инструментах, сохраняются в репозитории Informatica, который находится на сервере Informatica. Таким образом, клиентские инструменты должны иметь сетевое подключение к серверу.

С другой стороны, клиент PowerCenter подключается к источникам и целям для импорта метаданных и определений структуры источника/цели. Поэтому он также должен иметь возможность подключения к исходной/целевой системе.

  • Для подключения к службе интеграции и службе репозитория клиент PowerCenter использует протоколы TCP/IP и
  • Для подключения к источникам/целям клиент PowerCenter использует драйверы ODBC.

Служба репозитория в информатике

Команда Служба репозитория в Informatica поддерживает соединения клиентов PowerCenter с репозиторием PowerCenter. Это отдельный многопоточный процесс, который извлекает, вставляет и обновляет метаданные внутри репозитория. Он также отвечает за поддержание согласованности метаданных репозитория.

Служба репозитория в информатике
Служба репозитория в информатике

Служба интеграции в Информатике

Служба интеграции — это исполнительный механизм Informatica, другими словами, это объект, который выполняет задачи, которые мы создаем в Informatica. Вот как это работает:

  • Пользователь выполняет рабочий процесс
  • Informatica поручает службе интеграции выполнить рабочий процесс.
  • Служба интеграции считывает сведения о рабочем процессе из репозитория.
  • Сервис интеграции приступает к выполнению задач внутри рабочего процесса
  • После завершения выполнения статус задачи обновляется, т. е. не выполнено, выполнено успешно или прервано.
  • После завершения выполнения создается журнал сеанса и журнал рабочего процесса.
  • Эта служба отвечает за загрузку данных в целевые системы.
  • Сервис интеграции также объединяет данные из разных источников.

Например, он может комбинировать данные из таблицы Oracle и исходного плоского файла.

Итак, вкратце, служба интеграции Informatica — это процесс, находящийся на сервере Informatica и ожидающий назначения задач для выполнения. Когда мы выполняем рабочий процесс, служба интеграции получает уведомление о выполнении рабочего процесса. Затем служба интеграции считывает рабочий процесс, чтобы узнать подробности, например, какие задачи она должна выполнить (например, сопоставления) и в какое время. Затем сервис считывает детали задачи из репозитория и приступает к выполнению.

Источники и Targets

Информатика является ETL и инструмент интеграции данных, вы всегда будете обрабатывать и преобразовывать ту или иную форму данных. Входные данные для наших отображений в Informatica называются исходной системой. Мы импортируем определения источника из источника, а затем подключаемся к нему, чтобы получить исходные данные в наших сопоставлениях. Источники могут быть разных типов и могут располагаться в разных местах. В зависимости от ваших требований целевая система может быть реляционной или плоской файловой системой. Целевые объекты в виде плоских файлов генерируются на сервере Informatica, которые позже можно передать с помощью FTP.

реляционный– этими типами источников являются таблицы системы базы данных. Эти системы баз данных обычно принадлежат другим приложениям, которые создают и поддерживают эти данные. Это может быть база данных управления взаимоотношениями с клиентами, база данных человеческих ресурсов и т. д. Для использования таких источников в Informatica мы либо получаем реплику этих наборов данных, либо получаем права выбора в этих системах.

Плоские файлы – Плоские файлы являются наиболее распространенными источниками данных после реляционных баз данных в Informatica. Плоский файл может быть файлом, разделенным запятыми, файлом с разделителями табуляцией или файлом фиксированной ширины. Informatica поддерживает любую кодовую страницу, например ascii или Unicode. Чтобы использовать плоский файл в Informatica, его определения необходимо импортировать аналогично тому, как мы это делаем для реляционных таблиц.

Итого

  • Общая архитектура Informatica PowerCenter Отличный сервис Archiтекстура (СОА).
  • Домен Informatica — это основная административная единица в инструменте Informatica.
  • Репозиторий PowerCenter — это реляционная база данных, например Oracle, Sybase, SQL-сервер и управляется службой репозитория.
  • Конфигурацию домена можно выполнить с помощью консоли администратора Informatica.
  • Свойства домена в Informatica: тайм-аут устойчивости, период перезапуска, режим отправки, тип базы данных, хост базы данных, а также порт и имя базы данных.
  • Клиентские инструменты PowerCenter — это инструменты разработки, которые устанавливаются на клиентских компьютерах.
  • Служба репозитория в Informatica поддерживает соединения клиентов PowerCenter с репозиторием PowerCenter.
  • Служба интеграции — это исполнительный механизм Informatica, другими словами, это объект, который выполняет задачи, которые мы создаем в Informatica.