SAP HANA の DS (データ サービス)
何ですか SAP データサービス?
SAP データ サービスは、異種ソースからターゲット データベースまたはデータ ウェアハウスへのデータ統合、変換、データ品質、データ プロファイリング、テキスト データ処理のための単一のエンタープライズ レベルのソリューションを提供する ETL ツールです。
デザイナーを使用してデータのマッピングや変換を行えるアプリケーション(ジョブ)を作成できます。(最新バージョン SAP BODSは4.2です。
データサービスの特徴
- 高性能の並列変換を提供します。
- 包括的な管理ツールとレポート ツールが備わっています。
- マルチユーザーをサポートします。
- SAP ボディ Web サービスベースのアプリケーションで非常に柔軟です。
- 豊富な関数セットを備えたスクリプト言語を使用できます。
- データサービスは以下と統合できます SAP LTレプリケーションサーバー(SLT)は、トリガーベースのテクノロジーを採用しています。SLTは、すべての SAP または非SAP ソース テーブル。これにより、変更のデータ キャプチャを使用し、ソース テーブルの差分データを転送できます。
- ダッシュボードとプロセス監査によるデータ検証。
- スケジュール機能と監視/ダッシュボードを備えた管理ツール。
- デバッグと組み込みのプロファイリングおよびデータ表示。
- SAP BODS は広範なソースとターゲットをサポートします。
- アプリケーション(例: SAP).
- 一括読み込みと変更データ キャプチャを備えたデータベース
- ファイル: 固定幅、カンマ区切り、COBOL、XML、 Excel.
データサービスのコンポーネント
SAP DATAサービスは以下のコンポーネントで構成されています –
- デザイナー - これは、データ ウェアハウスにデータを取り込むジョブを作成、テスト、実行できる開発ツールです。開発者はこれを使用して、ソースからターゲットへのフロー図でアイコンを選択することでオブジェクトを作成し、それらを構成できます。ワークフローとデータ フローを指定してアプリケーションを作成するために使用されます。データ サービス デザイナーを開くには、次の場所に移動します。 スタートメニュー -> すべてのプログラム -> SAP データ サービス (ここでは 4.2) -> データ サービス デザイナー。
- ジョブサーバー- これは、データ サービス処理エンジンを起動し、エンジンと Data Services Suite へのインターフェイスとして機能するアプリケーションです。
- エンジン- データ サービス エンジンは、アプリケーションで定義された個々のジョブを実行します。
- リポジトリ- リポジトリは、デザイナーの事前定義オブジェクトとユーザー定義オブジェクト (ソースおよびターゲットのメタデータ、変換ルール) を保存するデータベースです。リポジトリには XNUMX つのタイプがあります。
- ローカルリポジトリ (Designer および Job Server によって使用されます)。
- 中央リポジトリ (オブジェクトの共有とバージョン管理に使用されます)
- アクセスサーバー- アクセス サーバーは、Web アプリケーション、データ サービス ジョブ サーバー、およびエンジンの間でメッセージを渡します。
- 管理者- Web Administrator は、データ サービス リソースのブラウザベースの管理を提供します。詳細は次のとおりです。
- リアルタイム サービスの構成、開始、停止。
- バッチジョブのスケジュール、監視、実行。
- Job Server、Access Server、およびリポジトリの使用法を構成します。
- ユーザーの管理。
- Web サービス経由でのバッチ ジョブとリアルタイム サービスの公開
- アダプターの構成と管理。
データサービス Archi構造 –
データサービスアーキテクチャには次のコンポーネントがあります。
- 中央リポジトリ – ジョブ サーバーへのリポジトリ設定、セキュリティ管理、バージョン管理、オブジェクト共有に使用されます。
- デザイナー – プロジェクト、ジョブ、ワークフロー、データ フローの作成と実行に使用されます。
- ローカル リポジトリ (ここで変更を作成し、ジョブ、ワークフロー、データフローを開始できます)。
- ジョブ サーバーとエンジン – ジョブを管理します。
- Access Server – 開発者がリポジトリ内で作成したリアルタイム ジョブを実行するために使用されます。
以下の図では、Data Services とそこにあるコンポーネントの関係が示されています。
SAP ボディ Archi構造
デザイナーウィンドウの詳細: まず、最初の構成要素を見てみましょう SAP データサービス - デザイナー
データサービスデザイナーの各セクションの詳細は以下のとおりです。
- ツールバー (開く、保存、戻る、検証、実行などに使用されます)。
- プロジェクトエリア (ジョブ、ワークフロー、データフローを含む現在のプロジェクトが含まれます。Data Services では、すべてのエンティティはオブジェクトです。
- ワークスペース (オブジェクトを定義、表示、および変更するアプリケーション ウィンドウ領域)。
- ローカルオブジェクトライブラリ (変換、ジョブ、ワークフロー、データフローなどのローカル リポジトリ オブジェクトが含まれます)。
- ツールパレット (ツール パレットのボタンを使用すると、ワークスペースに新しいオブジェクトを追加できます)。
オブジェクト階層
以下の図は、データ サービス内の主要なオブジェクト タイプの階層関係を示しています。
>
注記:
ワークフローと条件付き*はオプションです
使用されるオブジェクト SAP データサービスの詳細は以下の通りです。
オブジェクト | 説明 |
---|---|
プロジェクト | プロジェクトは、デザイナー ウィンドウの最上位のオブジェクトです。 プロジェクトは、Data Services で作成する他のオブジェクトを整理する方法を提供します。一度に開くことができるプロジェクトは XNUMX つだけです (「開く」とは「プロジェクト領域に表示される」ことを意味します)。 |
Job | 「ジョブ」は、独立して実行をスケジュールできる最小の作業単位です。 |
スクリプト | プロシージャ内の行のサブセット。 |
ワークフロー | 「ワークフロー」とは、ジョブ全体の一貫した作業フローに複数のデータ フローを組み込んだものです。 ワークフローはオプションです。 ワークフローとは手順のことです。
|
データフロー | 「データ フロー」とは、ソース データがターゲット データに変換されるプロセスです。 データ フローは再利用可能なオブジェクトです。 常にワークフローまたはジョブから呼び出されます。
|
データストア | Data Services をソース データベースおよびデータストア ターゲット データベースに接続する論理チャネル。
|
Target | Data Services がソースからデータをロードするテーブルまたはファイル。 |
データサービスの例: データをロードする SAP ソーステーブル
データ サービス内のすべてはオブジェクトです。 ソース データベースとターゲット データベースごとにデータ ストアを分ける必要があります。
データを読み込む手順 SAP ソーステーブル – SAP BODS には多くのステップがあり、その中でソースとターゲットのデータ ストアを作成し、それらにマップする必要があります。
- ソースと BODS の間にデータ ストアを作成する
- メタデータ (構造) を BODS にインポートします。
- インポートサーバーの構成
- メタデータを HANA システムにインポートします。
- BODS と HANA の間にデータ ストアを作成します。
- プロジェクトを作成します。
- ジョブの作成 (バッチ/リアルタイム)
- ワークフローの作成
- データフローの作成
- データフローにオブジェクトを追加する
- ジョブを実行する
- HANA でデータ プレビューを確認する
ステップ1) データストアを作成する SAP ソースとBODS
- データを読み込むには SAP ソース SAP HANAを通じて SAP BODS では、データ ストアが必要です。まず、以下に示すようにデータ ストアを作成します – プロジェクト -> 新規 -> データ ストア
- [新しいデータ ストアの作成] ポップアップが表示されるので、以下のように詳細を入力します。
- データストア名「ds_ecc」を入力します。
- データストアタイプ名として「SAP アプリケーション」。
- データベースサーバー名を入力してください
- ユーザー名とパスワード。
- 「適用」ボタンをクリックします。
- 「OK」ボタンをクリックします。
- データ ストアが作成され、以下のように作成されたデータストアが表示されます。
- ローカルオブジェクトライブラリに移動
- 「データストア」タブを選択します。
- データストア「ds_ecc」が表示されます。
ステップ2) メタデータ (構造) を BODS サーバーにインポートします。
ECC から BODS へのデータ ストアを作成しました。 次に、メタデータを ECC から BODS にインポートします。 インポートするには、以下の手順に従ってください –
- データストア「ds_ecc」を選択し、右クリックします。
- 「名前でインポート」オプションを選択します。
名前によるインポートのポップアップが表示されます。以下のように詳細を入力してください。
- [タイプをテーブルとして選択] を選択します。
- インポートするテーブルの名前を入力します。 ここでは KNA1 テーブルをインポートしています。
- 「インポート」ボタンをクリックします。 KNA1 テーブルは、「ds_ecc」データ ソースのテーブル ノードの下に表示されます。
テーブルのメタデータは、以下のようにデータストア ds_ecc にインポートされます –
ステップ3) インポートサーバーの構成
これまで、ECC用に作成された「ds_ecc」データ保存テーブルをインポートしました。 SAP BODS接続。データをインポートするには SAP HANAインポートサーバーを設定する必要があります。
- これを行うには、 クイックビュー -> インポートサーバーの設定 以下のように -
- システム選択のポップアップが表示されるので、 SAP HANA(ここではHDB)システムは以下の通りです。
- 「次へ」ボタンをクリックします。データサービス認証情報の別のポップアップが表示されるので、次の詳細を入力します。
- SAP BODS サーバー アドレス (ここでは BODS:6400)
- Enter SAP BODS リポジトリ名 (HANAUSER リポジトリ名)
- ODBC データ ソース (ZTDS_DS) を入力します。
- デフォルトポートを入力してください SAP BODSサーバー(8080)。
「完了」ボタンをクリックします。
ステップ4) メタデータを HANA システムにインポートする
1. ここまででインポートサーバーの設定は完了です。次はメタデータをインポートします。 SAP BODS サーバー。
- クイックビューで「インポート」オプションをクリックします。
- インポート オプションのポップアップが表示されます。「メタデータの選択インポート」オプションを選択します。
「次へ」ボタンをクリックします。
2. 「メタデータの選択的インポート」のポップアップが表示されるので、そこで対象システムを選択します。
- 選択する SAP HANA システム (ここでは HDB)。
「次へ」ボタンをクリックします。
ステップ5) BODS と HANA の間にデータ ストアを作成する
ご存知のとおり、BODS ではソースとターゲットに個別のデータストアを作成する必要があります。 ソースのデータ ストアはすでに作成しました。次に、ターゲット (BODS と HANA の間) のデータ ストアを作成する必要があります。 そこで、「DS_BODS_HANA」という名前で新しいデータ ストアを作成します。
- [プロジェクト] -> [新規] -> [データストア] に移動します。
- 以下のような「新規データストアの作成」画面が表示されます。
- データストア名 (DS_BODS_HANA) を入力します。
- データストア タイプとして「データベース」を入力します。
- データベースの種類を入力してください SAP ハナ。
- データベースのバージョンを選択します。
- Enter SAP HANA データベース サーバー名。
- ポート名を入力してください SAP HANA データベース。
- ユーザー名とパスワードを入力します。
- 「自動データ転送を有効にする」にチェックを入れます。
「適用」をクリックし、「OK」ボタンをクリックします。
データストア「DS_BODS_HANA」は、ローカルオブジェクトライブラリのデータストアタブの下に表示されます。
未満-
- 次に、データ ストア「DS_BODS_HANA」にテーブルをインポートします。
- データ ストア「DS_BODS_HANA」を選択し、右クリックします。
- 「名前でインポート」を選択します。
- 以下のように、名前によるインポートのポップアップが表示されます。
- 「タイプ」を「テーブル」として選択します。
- 「名前」を「KNA1」と入力します。
- 所有者はHanauserとして表示されます。
- 「インポート」ボタンをクリックします。
テーブルは「DS_BOD_HANA」データストアにインポートされます。テーブル内のデータを表示するには、以下の手順に従います。
- データ ストア「DS_BODS_HANA」のテーブル「KNA1」をクリックします。
- データは表形式で表示されます。
ステップ 6) プロジェクトを定義します。 プロジェクトのグループ化と組織化 関連するオブジェクト。 プロジェクトには、任意の数のジョブ、ワークフロー、データフローを含めることができます。
- デザイナーのプロジェクトメニューに移動します。
- 新しいオプションを選択します。
- プロジェクトオプションを選択します。
以下のような新規プロジェクト作成のポップアップが表示されます。 プロジェクト名を入力し、「作成」ボタンをクリックします。 この例では BODS_DHK のプロジェクト フォルダーが作成されます。
ステップ 7) ジョブを定義します。 ジョブは再利用可能なオブジェクトです。 ワークフローとデータフローが含まれます。 ジョブは手動で実行することも、スケジュールに従って実行することもできます。 BODS プロセスを実行するには、ジョブを定義する必要があります。
ジョブを JOB_Customer として作成します。
- 手順1で作成したプロジェクト(BODS_DHK)を選択し、右クリックして「新規バッチジョブ」を選択します。
- 名前を「JOB_Customer」に変更します。
ステップ 8) ワークフローを定義します。
- プロジェクトエリアでジョブ「JOB_Customer」を選択し、
- ツールパレットの「ワークフロー」ボタンをクリックします。 黒いワークスペース領域をクリックします。 ワークフロー アイコンがワークスペースに表示されます。
- ワークフローの名前を「WF_Customer」に変更します。
ワークフローの名前をクリックすると、ワークフローの空のビューがワークスペースに表示されます。
ステップ 9) データフローを定義します。
- ワークフロー「WF_Customer」をクリックします。
- ツール パレットの [データフロー] ボタンをクリックします。 黒いワークスペース領域をクリックします。 データフロー アイコンがワークスペースに表示されます。
- データフローの名前を「DF_Customer」に変更します。
- データフローは、左側のプロジェクト領域のジョブ名の下にも表示されます。
ステップ 10) データフローにオブジェクトを追加します。
データ フロー内で、ソース データをターゲット テーブルに必要な形式に変換する指示を提供できます。
以下のオブジェクトが表示されます –
- ソースのオブジェクト。
- ターゲットテーブルのオブジェクト。
- クエリ変換用のオブジェクト。 (クエリ変換は列をソースからターゲットにマップします。) データフロー DF_Customer 上で。 以下のように空のワークスペースが表示されます –
- ソースからオブジェクトを指定 – データ ストア「ds_ecc」に移動し、テーブル KNA1 を選択し、以下の画面のようにデータ フローの空白の画面にドラッグ アンド ドロップします。
- オブジェクトを指定 Target- リポジトリからデータ ストア「DS_BODS_HANA」を選択し、テーブル KNA1 を選択します。
- ワークスペースにドラッグアンドドロップし、「作成」を選択します。 Target 「オプション。ソースとターゲットの 2 つのテーブルがあります。ここでは、テーブルをソースとターゲットとして定義します。
- クエリ変換 – これは、ユーザー固有の条件の入力スキーマに基づいてデータを取得し、ソースからターゲットにデータを転送するために使用されるツールです。
- ツール パレットからクエリ変換アイコンを選択し、以下のようにワークスペース内のソース オブジェクトとターゲット オブジェクトの間にドラッグ アンド ドロップします。
- クエリオブジェクトをソースにリンクします。
- クエリオブジェクトをリンク Target 列で番号の横にあるXをクリックします。
- Double 「クエリ」アイコンをクリックします。これにより、列を入力スキーマから出力スキーマにマッピングします。
クエリアイコンをクリックすると、マッピング用の次のウィンドウが表示され、次の手順に従います。
- ソーステーブル KNA1 が選択されています。
- ソーステーブルからすべての列を選択し、右クリックして出力するマップを選択します。
- Target 出力がクエリとして選択され、列がマッピングされます。
5. プロジェクトを保存して検証します。
1. 検証アイコンをクリックします。
2. 検証成功のポップアップが表示されます。
ステップ 11) ジョブの実行 – ジョブを実行するには、以下のパスに従います。
- プロジェクトエリアアイコンを選択してプロジェクトを開き、作成したプロジェクトを選択します。
- ジョブを選択して右クリックします。
- ジョブを実行するには、「実行」オプションを選択します。
- ジョブを実行すると、ジョブ ログ ウィンドウが表示され、ジョブに関するすべてのメッセージが表示されます。
- 最後のメッセージは「ジョブ < > は正常に完了しました」です。
ステップ12) – データの検証/チェック SAP HANA データベース。
- にログインします SAP HANAデータベース経由 SAP ハナスタジオをクリックし、HANAUSER スキーマを選択します。
- テーブルノードでKNA1テーブルを選択します。
- テーブル KNA1 を右クリックし、「データ プレビューを開く」を選択します。
- 表(KNA1)上記のようにBODSプロセスによってロードされたデータは、データプレビュー画面に表示されます。