Informatica PowerCenter チュートリアル: Archi構造、コンポーネント

Informatica PowerCenter Archi構造

Informatica PowerCenterの全体的なアーキテクチャはサービス指向です。 Archiアーキテクチャ (SOA)。Informatica ETL ツール アーキテクチャは、次のサービスとコンポーネントで構成されています。

  1. リポジトリサービス – Informatica メタデータの保守と、他のサービスへのメタデータへのアクセスの提供を担当します。
  2. 統合サービス – ソースからターゲットへのデータの移動を担当します
  3. レポートサービス – レポートの生成を有効にします
  4. Nodes – 上記のサービスが実行されるコンピューティング プラットフォーム
  5. インフォマティカデザイナー – ソースとターゲット間のマッピングの作成に使用されます
  6. ワークフローマネージャー – ワークフローやその他のタスクとその実行を作成するために使用されます
  7. ワークフローモニター – ワークフローの実行を監視するために使用されます
  8. リポジトリマネージャー – リポジトリ内のオブジェクトを管理するために使用されます
情報 Archi構造図
情報 Archi構造図

インフォマティカ ドメイン

Informatica ドメインは、Informatica ツールの基本的な管理単位です。 これはノードとサービスの集合です。 さらに、このノードとサービスは、管理要件に基づいてフォルダーとサブフォルダーに分類できます。

たとえば、以下のスクリーンショットでは、ドメイン ウィンドウの下にフォルダー「Domain_Rajesh」が作成され、その下にノード名「node01_rajesh」とサービス「guru99 統合サービス」が作成されていることがわかります。

Informatica のドメイン
Informatica のドメイン

ノードは、ドメイン内のマシンを論理的に表現したものです。ノードは、Informatica のサービスとプロセスを実行するために必要です。

ドメイン内に複数のノードを含めることができます。 ドメイン内には、ゲートウェイ ノードもあります。

ゲートウェイ ノードは、さまざまなクライアント ツールからリクエストを受信し、それらのリクエストをさまざまなノードおよびサービスにルーティングする責任があります。

ドメインには XNUMX 種類のサービスがあります

  • サービスマネージャ: サービス マネージャーは、認証、承認、ログ記録などのドメイン操作を管理します。また、ノード上でアプリケーション サービスを実行し、ユーザーとグループを管理します。
  • アプリケーションサービス: アプリケーション サービスは、統合サービス、リポジトリ サービス、レポート サービスなどのサーバー固有のサービスを表します。 これらのサービスは、構成に基づいて異なるノードで実行されます。

Informatica PowerCenterリポジトリ

PowerCenter リポジトリは、次のようなリレーショナル データベースです。 Oracle、サイベース、 SQL サーバーであり、リポジトリ サービスによって管理されます。 これは、メタデータを保存するデータベース テーブルで構成されます。

Informatica PowerCenter では XNUMX つの Informatica Client ツールを使用できます。 彼らはインフォマティカです

  • デザイナー
  • ワークフローモニター
  • ワークフローマネージャー

これらのクライアントは、リポジトリ サービスを使用してのみリポジトリにアクセスできます。

リポジトリを管理するために、Repository Service と呼ばれる Informatica サービスが存在します。 XNUMX つのリポジトリ サービスは XNUMX つのリポジトリのみを排他的に処理します。 また、リポジトリ サービスを複数のノードで実行してパフォーマンスを向上させることもできます。

リポジトリ サービスはオブジェクトのロックを使用するため、複数のユーザーが同じオブジェクトを同時に変更することはできません。

リポジトリでバージョン管理を有効にすることができます。 バージョン管理機能を使用すると、同じオブジェクトの異なるバージョンを管理できます。

リポジトリに作成されたオブジェクトは次の3つの状態を持つことができます

  • 有効な注:有効なオブジェクトとは、Informatica に従って構文が正しいオブジェクトです。 これらのオブジェクトは、ワークフローの実行に使用できます。
  • 「無効」: 無効なオブジェクトとは、指定された標準またはルールに従わないオブジェクトです。 オブジェクトが Informatica に保存されると、その構文とプロパティが有効かどうかがチェックされ、それに応じてオブジェクトにステータスがマークされます。
  • 影響あり: 影響を受けるオブジェクトは、その子オブジェクトが無効であるオブジェクトです。 たとえば、マッピングで再利用可能な変換を使用していて、この変換オブジェクトが無効になると、マッピングは影響を受けるものとしてマークされます。

Informatica でのドメイン構成

前述したように、ドメインは Informatica の基本的な管理制御です。 これは、統合サービス、リポジトリ サービス、さまざまなノードなどの他のサービスで構成される親エンティティです。

ドメインの設定は、Informatica 管理コンソールを使用して行うことができます。 コンソールは Web ブラウザを使用して起動できます。

Informatica でのドメイン構成

Web ブラウザで開くと、管理者ログインを求めるプロンプトが表示されます。 パスワードは、Informatica のインストール時に設定されます。

Informatica でのドメイン構成

Informatica ドメインにログインすると、ホームページは次のようになります。

Informatica でのドメイン構成

左側のペインには、ドメイン内の既存のノード、リポジトリ サービス、統合サービスが表示されます。

メイン ウィンドウには、それらのサービスの状態 (稼働中か停止中) が表示されます。

Informatica のドメインのプロパティ

管理ページのプロパティ メニューをクリックして、ドメインのプロパティを表示します。

Informatica のドメインのプロパティ

Informatica のドメインのプロパティ

Informatica のドメインの主なプロパティは次のとおりです。

復元タイムアウト – 統合サービスまたはリポジトリ サービスのいずれかがダウンした場合、復元タイムアウトは、アプリケーション サービスがそれらのサービスへの接続を試行する秒数です。

再開期間 – これは、ドメインがサービスを再起動するために費やす最大秒数です。

ディスパッチモード – これは、ロード バランサーがタスクをさまざまなノードにディスパッチするために使用するポリシーです。

データベースタイプ – ドメインが構成されているデータベースのタイプ。

データベースホスト – ドメインが設定されているマシンのホスト名。

データベースポート & – これは、ドメインのデータベース ポートとデータベース インスタンス名です。

これらのプロパティは要件に基づいて変更できます。

PowerCenterクライアントとサーバーの接続

PowerCenter クライアント ツールは、クライアント マシンにインストールされる開発ツールです。 PowerCenter デザイナー、ワークフロー マネージャー、リポジトリ マネージャー、およびワークフロー モニターが主要なクライアント ツールです。

これらのクライアント ツールで作成したマッピングとオブジェクトは、Informatica サーバー上にある Informatica リポジトリに保存されます。 したがって、クライアント ツールはサーバーへのネットワーク接続が必要です。

一方、PowerCenter クライアントはソースとターゲットに接続して、メタデータとソース/ターゲット構造定義をインポートします。 したがって、ソース/ターゲット システムへの接続も必要です。

  • 統合サービスとリポジトリ サービスに接続するために、PowerCenter クライアントは TCP/IP プロトコルを使用し、
  • ソース/ターゲットに接続するには、PowerCenter クライアントは ODBC ドライバーを使用します。

Informatica のリポジトリ サービス

この リポジトリサービス Informatica では、PowerCenter クライアントから PowerCenter リポジトリへの接続を維持します。 これは別個のマルチスレッド プロセスであり、リポジトリ内のメタデータを取得、挿入、更新します。 また、リポジトリ メタデータ内の一貫性を維持する責任もあります。

Informatica のリポジトリ サービス
Informatica のリポジトリ サービス

Informatica の統合サービス

統合サービスは、Informatica の実行エンジンです。つまり、Informatica で作成したタスクを実行するエンティティです。 仕組みは次のとおりです。

  • ユーザーがワークフローを実行する
  • Informatica は、統合サービスにワークフローを実行するように指示します。
  • 統合サービスはリポジトリからワークフローの詳細を読み取ります
  • 統合サービスがワークフロー内のタスクの実行を開始します
  • 実行が完了すると、タスクのステータス (失敗、成功、または中止) が更新されます。
  • 実行完了後、セッションログとワークフローログが生成されます。
  • このサービスは、ターゲット システムにデータをロードする役割を果たします。
  • 統合サービスでは、さまざまなソースからのデータも結合されます

たとえば、Oracle テーブルとフラット ファイル ソースのデータを組み合わせることができます。

まとめると、Informatica 統合サービスは、実行のためにタスクが割り当てられるのを待機する Informatica サーバー上のプロセスです。ワークフローを実行すると、統合サービスはワークフローを実行するための通知を受け取ります。次に、統合サービスはワークフローを読み取り、マッピングなどのどのタスクをどのタイミングで実行する必要があるかなどの詳細を把握します。次に、サービスはリポジトリからタスクの詳細を読み取り、実行を続行します。

情報源と Targets

インフォマティカは ETL データ統合ツールを使用する場合、常に何らかの形式のデータを処理および変換する必要があります。Informatica のマッピングへの入力は、ソース システムと呼ばれます。ソースからソース定義をインポートし、それに接続してマッピングのソース データを取得します。ソースにはさまざまなタイプがあり、複数の場所に配置できます。要件に基づいて、ターゲット システムはリレーショナル ファイル システムまたはフラット ファイル システムにすることができます。フラット ファイル ターゲットは Informatica サーバー マシンで生成され、後で ftp を使用して転送できます。

リレーショナル– これらのタイプのソースはデータベース システム テーブルです。 これらのデータベース システムは通常、このデータを作成および維持する他のアプリケーションによって所有されています。 Informatica でそのようなソースを使用する場合は、顧客関係管理データベース、人事データベースなどが考えられます。これらのデータセットのレプリカを取得するか、これらのシステムに対する選択権限を取得します。

フラットファイル – フラット ファイルは、Informatica のリレーショナル データベースに次いで最も一般的なデータ ソースです。 フラット ファイルには、カンマ区切りファイル、タブ区切りファイル、または固定幅ファイルを指定できます。 Informatica は、ASCII や Unicode などのコード ページをサポートします。 Informatica でフラット ファイルを使用するには、リレーショナル テーブルの場合と同様に、その定義をインポートする必要があります。

まとめ

  • Informatica PowerCenterの全体的なアーキテクチャは サービス指向 Archi構造 (SOA)。
  • Informatica ドメインは、Informatica ツールの基本的な管理単位です。
  • PowerCenter リポジトリは、次のようなリレーショナル データベースです。 Oracle、Sybase、SQL サーバー、およびリポジトリ サービスによって管理されます。
  • ドメインの設定は、Informatica 管理コンソールを使用して行うことができます。
  • Informatica のドメインのプロパティ: 復元タイムアウト、再起動期間、ディスパッチ モード、データベース タイプ、データベース ホスト、データベース ポートと名前
  • PowerCenter クライアント ツールは、クライアント マシンにインストールされる開発ツールです。
  • Informatica のリポジトリ サービスは、PowerCenter クライアントから PowerCenter リポジトリへの接続を維持します。
  • 統合サービスは、Informatica の実行エンジンです。つまり、Informatica で作成したタスクを実行するエンティティです。