Pentahoデータ統合チュートリアル

ペンタホBIとは何ですか?

Pentahoの は、顧客に幅広いビジネス インテリジェンス ソリューションを提供するビジネス インテリジェンス ツールです。 Pentaho は、レポート作成、データ分析、データ統合、データ マイニングなどの機能を備えています。Pentaho は、ビジネス パフォーマンスと効率を向上させるための包括的な BI 機能セットも提供します。

ペンタホの特徴

Pentaho の重要な機能は次のとおりです。

  • ビジネス インテリジェンスのニーズに対応する ETL 機能
  • Pentaho レポート デザイナーについて理解する
  • 製品の専門知識
  • 並列サブレポートを提供
  • 新しい機能のロックを解除する
  • プロフェッショナルサポート
  • クエリとレポート
  • 強化された機能を提供
  • データソースからのランタイムメタデータの完全なサポート

ペンタホ BI スイート

次に、この Pentaho チュートリアルで Pentaho BI スイートについて学びます。

ペンタホ BI スイート
ペンタホ BI スイート

Pentaho BI Suite には次のコンポーネントが含まれています。

ペンタホレポート

Pentaho Reporting は JFreeReport プロジェクトに依存しています。 ビジネスレポートのニーズを満たすのに役立ちます。 このコンポーネントは、XLS、PDF、TXT、HTML などの一般的な形式でのスケジュールされたレポートとオンデマンドの両方のレポート発行も提供します。

分析

ピボット テーブル ビューを含む幅広い分析機能を提供します。 このツールは、強化された GUI 機能 (Flash または SVG を使用)、統合されたダッシュボード ウィジェット、ポータル、およびワークフローの統合を提供します。

さらに、Pentaho スプレッドシート サービスを使用すると、ユーザーは MS Excel 内からチャートを参照、ピボット、および使用できます。

ダッシュボード

ダッシュボードは、Pentaho ダッシュボードにコンテンツを提供するレポートと分析を提供します。 セルフサービス ダッシュボード デザイナーには、広範な組み込みダッシュボード テンプレートとレイアウトが含まれています。 ビジネス ユーザーは、少しのトレーニングでパーソナライズされたダッシュボードを構築できます。

データマイニング

データマイニングツール 隠れたパターンや将来のパフォーマンスの指標を発見します。クラスタリング、決定木、ランダムフォレスト、主成分分析、ニューラルネットワークなど、Weka プロジェクトの最も包括的な機械学習アルゴリズムのセットを提供します。

これにより、データをグラフィカルに表示したり、プログラムで操作したり、レポートやさらなる分析、その他のプロセスに複数のデータ ソースを使用したりすることができます。

Pentahoデータ統合

このコンポーネントは、データが存在する場所に関係なくデータを統合するために使用されます。

すぐに使用できる 150 を超えるマッピング オブジェクトを備えた豊富な変換ライブラリ。

30 を超えるオープンソースおよび独自のデータベース プラットフォーム、フラット ファイルを含む幅広いデータ ソースをサポートします。 それも役立ちます ビッグデータ分析 Hadoop データの統合と管理を備えています。

Pentaho BI を使用しているのは誰ですか?

Pentaho BI は、次のような多くのソフトウェア専門家によって広く使用されているツールです。

  • オープンソース ソフトウェア プログラム
  • ビジネスアナリスト兼研究者
  • 大学生
  • ビジネスインテリジェンス評議員

Pentaho を AWS にインストールする方法

以下は、AWS に Pentaho をインストールする手順です。

ステップ1) 「続行」をクリックして購読します
に行く https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro そして「続行」をクリックします

Pentaho を AWS にインストールする

ステップ2) 利用規約に同意する
次のページで、ライセンス契約に同意します

Pentaho を AWS にインストールする

ステップ3) 「設定に進む」をクリックします
設定に進む

Pentaho を AWS にインストールする

ステップ4) 「続行」をクリックして起動します
設定はデフォルトのままにし、クリックして起動します

Pentaho を AWS にインストールする

ステップ5) たとえば起動するまで 5 分間待ちます
使用上の注意を確認して待ちます

Pentaho を AWS にインストールする

ステップ6) パブリックIPを取得する
インスタンスのパブリック IP をコピーします。

Pentaho を AWS にインストールする

ステップ7) ログインにパブリックIPを使用する
Pentaho にアクセスするためのインスタンスのパブリック IP を貼り付けます。

Pentaho を AWS にインストールする

Pentaho の前提条件

  • ハードウェア要件
  • ソフトウェア要件
  • Bl スイートのダウンロードとインストール
  • BLスイートの開始
  • BLスイートの管理

ハードウェア要件

Pentaho Bl Suite ソフトウェアには、ソフトウェアの最小要件を満たすことができる限り、コンピュータまたはネットワーク ハードウェアに対する修正制限はありません。 このビジネス インテリジェンス ツールは簡単にインストールできます。 ただし、推奨されるシステム仕様は次のとおりです。

RAM 最小2GB
ハードドライブスペース 最小1GB
プロセッサ デュアルコアEM64TまたはAMD64

ソフトウェア要件

  • Sun JRE 5.0のインストール
  • 環境は 32 ビットまたは 64 ビットのいずれかです
  • サポート Operaシステム: Linux、 Solaris, Windows、 マック
  • Chrome、Internet Explorer、 Firefox

BLサーバーを起動するには

  • On Windows 最初から、Bl サーバーの開始アイコンをクリックします。
  • Linux OS では、/biserver-ce/directory で start-pentaho スクリプトを実行します。

管理者サーバーを起動するには

  • On Windows スタート ボタンから Bl エンタープライズ サーバーの開始をクリックします。
  • Linux の場合: コマンド ウィンドウに移動し、/biserver-ce/administration-console/directory にある起動スクリプトを実行します。

管理者サーバーを停止するには

  • Windows でサーバーを停止するには、bi-server の停止アイコンをクリックします。
  • Linux 上。 ターミナルに移動し、インストールされたディレクトリに移動して stop.bat を実行する必要があります。

Pentaho 管理コンソール

レポートデザイナー

高度なレポート作成ツールです。 これは、完全なデータドライブ レポートを作成したい場合に最適なツールです。 このツールは、Pentaho ユーザー コンソールのアドホック レポート機能よりも多くの柔軟性と機能を提供します。

デザインスタジオ

それはです Eclipseベースのツール。レポートや分析を手動で編集できます。これは、レポート デザイナーでは追加できない変更を既存のレポートに追加するために広く使用されています。

アグリゲーションデザイナー

このグラフィカル ツールを使用すると、モンドリアン キューブの効率を向上させることができます。

メタデータエディタ

これは、カスタム メタデータ レイヤーを既存のデータ ソースに追加するために使用されます。

Pentahoデータ統合

Kettle の抽出、変換、ロード (ETL) ツール。

Pentaho ツールと BI スタックの比較

ペンタホツール BIスタック
データ統合 (PDI) ETL
メタデータエディターを提供します メタデータ管理を提供します
ペンタホBA アナリティクス
レポート デザイナー Opera地域レポート
サイク アドホックレポート
CDE ダッシュボード
Pentaho ユーザー コンソール (PUC) ガバナンス/モニタリング

ペンタホの利点

この Pentaho データ統合チュートリアルでは、Pentaho ビジネス インテリジェンス ツールのいくつかの利点について学びます。

  • Pentaho BI は非常に直感的なツールです。基本的な概念をいくつか理解すれば、すぐに使いこなすことができます。
  • シンプルで使いやすいビジネス インテリジェンス ツール
  • レポート、ダッシュボード、インタラクティブ分析、データ統合、データマイニングなどを含む幅広い BI 機能を提供します。
  • ユーザーフレンドリーなインターフェースを備え、複数のデータソースからデータを取得するためのさまざまなツールを提供します
  • データを扱う単一のパッケージを提供
  • エンタープライズ エディションに加えて、多くの貢献者がいるコミュニティ エディションがあります。
  • Hadoopクラスタ上で実行できる機能
  • Javaステップ コンポーネントに記述されたスクリプト コードは、他のコンポーネントで再利用できます。

ペンタホのデメリット

Pentaho BI ツールを使用する場合の短所/欠点は次のとおりです。

  • インターフェイスの設計が脆弱になる可能性があり、すべてのコンポーネントに対して統一されたインターフェイスはありません。
  • 他の BI ツールに比べてツールの進化がはるかに遅い。
  • Pentaho Business Analytics が提供するコンポーネントの数は限られています。
  • コミュニティのサポートが不十分です。そのため、動作するコンポーネントが見つからない場合は、次のバージョンがリリースされるまで待つ必要があります。

製品概要

  • Pentaho は、幅広い機能を提供するビジネス インテリジェンス ツールです。 ビジネス・インテリジェンス 顧客へのソリューション
  • ビジネス インテリジェンスのニーズに対応する ETL 機能を提供します。
  • Pentaho スイートは、レポート、分析、ダッシュボード、データ マイニングなどのコンポーネントを提供します
  • Pentaho Business Intelligence は、1) ビジネス アナリスト、2) オープンソース ソフトウェア プログラマー、3) 研究者、4) 大学生によって広く使用されています。
  • Pentaho のインストール プロセスには、1) ハードウェア要件、2) ソフトウェア要件、3) Bl スイートのダウンロード、4) Bl スイートの開始、および 5) Bl スイートの管理が含まれます。
  • Pentaho 管理コンソールの重要なコンポーネントは、1) レポート デザイナー、2) デザイン スタジオ、3) 集計デザイナー、4) メタデータ エディター、5) Pentaho データ統合です。
  • Pentaho はデータ統合 (PDI) ツールですが、BI スタックは ETLツール.
  • Pentaho の最大の利点は、シンプルで使いやすいビジネス インテリジェンス ツールであることです。
  • Pentaho の主な欠点は、他の BI ツールに比べてツールの進化がはるかに遅いことです。