Pentaho データ統合チュートリアル: Pentaho ETL ツールとは

ペンタホBIとは何ですか?

Pentahoの は、顧客に幅広いビジネス インテリジェンス ソリューションを提供するビジネス インテリジェンス ツールです。 Pentaho は、レポート作成、データ分析、データ統合、データ マイニングなどの機能を備えています。Pentaho は、ビジネス パフォーマンスと効率を向上させるための包括的な BI 機能セットも提供します。

ペンタホの特徴

Following、Pentaho の重要な機能:

  • ビジネス インテリジェンスのニーズに対応する ETL 機能
  • Pentaho レポート デザイナーについて理解する
  • 製品の専門知識
  • 並列サブレポートを提供
  • 新しい機能のロックを解除する
  • プロフェッショナルサポート
  • クエリとレポート
  • 強化された機能を提供
  • データソースからのランタイムメタデータの完全なサポート

ペンタホ BI スイート

次に、この Pentaho チュートリアルで Pentaho BI スイートについて学びます。

ペンタホ BI スイート
ペンタホ BI スイート

Pentaho BI Suite には次のものが含まれますwing コンポーネント:

ペンタホレポート

Pentaho Reporting は JFreeReport プロジェクトに依存しています。 ビジネスレポートのニーズを満たすのに役立ちます。 このコンポーネントは、XLS、PDF、TXT、HTML などの一般的な形式でのスケジュールされたレポートとオンデマンドの両方のレポート発行も提供します。

分析

ピボット テーブル ビューを含む幅広い分析機能を提供します。 このツールは、強化された GUI 機能 (Flash または SVG を使用)、統合されたダッシュボード ウィジェット、ポータル、およびワークフローの統合を提供します。

さらに、Pentaho スプレッドシート サービスを使用すると、ユーザーは MS Excel 内からチャートを参照、ピボット、および使用できます。

ダッシュボード

ダッシュボードは、Pentaho ダッシュボードにコンテンツを提供するレポートと分析を提供します。 セルフサービス ダッシュボード デザイナーには、広範な組み込みダッシュボード テンプレートとレイアウトが含まれています。 ビジネス ユーザーは、少しのトレーニングでパーソナライズされたダッシュボードを構築できます。

データマイニング

データマイニングツール 隠れたパターンと将来のパフォーマンスの指標を発見します。 Weka プロジェクトの最も包括的な機械学習アルゴリズムのセットを提供します。これには、クラスタリング、デシジョン ツリー、ランダム フォレスト、主成分分析、ニューラル ネットワークが含まれます。

これにより、データをグラフィカルに表示したり、プログラムで操作したり、レポートやさらなる分析、その他のプロセスに複数のデータ ソースを使用したりすることができます。

Pentahoデータ統合

このコンポーネントは、データが存在する場所に関係なくデータを統合するために使用されます。

150 を超える豊富な変換ライブラリbox マッピングオブジェクト。

30 を超えるオープンソースおよび独自のデータベース プラットフォーム、フラット ファイルを含む幅広いデータ ソースをサポートします。 それも役立ちます ビッグデータ分析 Hadoop データの統合と管理を備えています。

Pentaho BI を使用しているのは誰ですか?

Pentaho BI は、次のような多くのソフトウェア専門家によって広く使用されているツールです。

  • オープンソース ソフトウェア プログラム
  • ビジネスアナリスト兼研究者
  • 大学生
  • ビジネスインテリジェンス評議員

Pentaho を AWS にインストールする方法

Following これは、AWS に Pentaho をインストールする方法に関するステップバイステップのプロセスです。

ステップ1) 「続行」をクリックして購読します
  https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro そして「続行」をクリックします

Pentaho を AWS にインストールする

ステップ2) 利用規約に同意する
次のページで、ライセンス契約に同意します

Pentaho を AWS にインストールする

ステップ3) 「設定に進む」をクリックします
設定に進む

Pentaho を AWS にインストールする

ステップ4) 「続行」をクリックして起動します
設定はデフォルトのままにし、クリックして起動します

Pentaho を AWS にインストールする

ステップ5) たとえば起動するまで 5 分間待ちます
使用上の注意を確認して待ちます

Pentaho を AWS にインストールする

ステップ6) パブリックIPを取得する
インスタンスのパブリック IP をコピーします。

Pentaho を AWS にインストールする

ステップ7) ログインにパブリックIPを使用する
Pentaho にアクセスするためのインスタンスのパブリック IP を貼り付けます。

Pentaho を AWS にインストールする

Pentaho の前提条件

  • ハードウェア要件
  • ソフトウェア要件
  • Bl スイートのダウンロードとインストール
  • BLスイートの開始
  • BLスイートの管理

ハードウェア要件

Pentaho Bl Suite ソフトウェアには、ソフトウェアの最小要件を満たすことができる限り、コンピュータまたはネットワーク ハードウェアに対する修正制限はありません。 このビジネス インテリジェンス ツールは簡単にインストールできます。 ただし、推奨されるシステム仕様は次のとおりです。

RAM 最小2GB
ハードドライブスペース 最小1GB
プロセッサ デュアルコアEM64TまたはAMD64

ソフトウェア要件

  • Sun JRE 5.0のインストール
  • 環境は 32 ビットまたは 64 ビットのいずれかです
  • サポートされているオペレーティング システム: Linux、Solaris、Windows、Mac
  • Chrome、Internet Explorer、 Firefox

BLサーバーを起動するには

  • Windows では、最初から Bl サーバーの起動アイコンをクリックします。
  • Linux OS では、/biserver-ce/directory で start-pentaho スクリプトを実行します。

管理者サーバーを起動するには

  • Windows では、スタート ボタンから Bl エンタープライズ サーバーの開始をクリックします。
  • Linux の場合: コマンド ウィンドウに移動し、/biserver-ce/administration-console/directory にある起動スクリプトを実行します。

管理者サーバーを停止するには

  • Windows でサーバーを停止するには、「二重サーバーの停止」アイコンをクリックします。
  • Linux 上。 ターミナルに移動し、インストールされたディレクトリに移動して stop.bat を実行する必要があります。

Pentaho 管理コンソール

レポートデザイナー

高度なレポート作成ツールです。 これは、完全なデータドライブ レポートを作成したい場合に最適なツールです。 このツールは、Pentaho ユーザー コンソールのアドホック レポート機能よりも多くの柔軟性と機能を提供します。

デザインスタジオ

それはです Eclipseベースのツール。レポートや分析を手動で編集できます。これは、レポート デザイナーでは追加できない変更を既存のレポートに追加するために広く使用されています。

アグリゲーションデザイナー

このグラフィカル ツールを使用すると、モンドリアン キューブの効率を向上させることができます。

メタデータエディタ

これは、カスタム メタデータ レイヤーを既存のデータ ソースに追加するために使用されます。

Pentahoデータ統合

Kettle の抽出、変換、ロード (ETL) ツール。

Pentaho ツールと BI スタックの比較

ペンタホツール BIスタック
データ統合 (PDI) ETL
メタデータエディターを提供します メタデータ管理を提供します
ペンタホBA アナリティクス
レポート デザイナー 運用レポート
サイク アドホックレポート
CDE ダッシュボード
Pentaho ユーザー コンソール (PUC) ガバナンス/モニタリング

ペンタホの利点

この Pentaho データ統合チュートリアルでは、Pentaho ビジネス インテリジェンス ツールのいくつかの利点について学びます。

  • Pentaho BI は非常に直感的なツールです。 いくつかの基本的な概念があれば、それを扱うことができます。
  • シンプルで使いやすいビジネス インテリジェンス ツール
  • レポート、ダッシュボード、インタラクティブ分析、データ統合、データマイニングなどを含む幅広い BI 機能を提供します。
  • ユーザーフレンドリーなインターフェースを備え、複数のデータソースからデータを取得するためのさまざまなツールを提供します
  • データを扱う単一のパッケージを提供
  • Enterprise エディションに加えて、多くの寄稿者が参加するコミュニティ エディションもあります。
  • Hadoop クラスター上で実行できる機能
  • ステップコンポーネントに記述された JavaScript コードは、他のコンポーネントで再利用できます。

ペンタホのデメリット

Pentaho BI ツールを使用する場合の短所/欠点は次のとおりです。

  • インターフェイスの設計が脆弱になる可能性があり、すべてのコンポーネントに対して統一されたインターフェイスはありません。
  • 他の BI ツールに比べてツールの進化がはるかに遅い。
  • Pentaho Business Analytics が提供するコンポーネントの数は限られています。
  • コミュニティのサポートが不十分。 したがって、動作するコンポーネントが入手できない場合は、次のバージョンがリリースされるまで待つ必要があります。

まとめ

  • Pentaho は、幅広い機能を提供するビジネス インテリジェンス ツールです。 ビジネス・インテリジェンス 顧客へのソリューション
  • ビジネス インテリジェンスのニーズに対応する ETL 機能を提供します。
  • Pentaho スイートは、レポート、分析、ダッシュボード、データ マイニングなどのコンポーネントを提供します
  • Pentaho Business Intelligence は、1) ビジネス アナリスト、2) オープンソース ソフトウェア プログラマー、3) 研究者、4) 大学生によって広く使用されています。
  • Pentaho のインストール プロセスには、1) ハードウェア要件、2) ソフトウェア要件、3) Bl スイートのダウンロード、4) Bl スイートの開始、および 5) Bl スイートの管理が含まれます。
  • Pentaho 管理コンソールの重要なコンポーネントは、1) レポート デザイナー、2) デザイン スタジオ、3) 集計デザイナー、4) メタデータ エディター、5) Pentaho データ統合です。
  • Pentaho はデータ統合 (PDI) ツールですが、BI スタックは ETLツール.
  • Pentaho の最大の利点は、シンプルで使いやすいビジネス インテリジェンス ツールであることです。
  • Pentaho の主な欠点は、他の BI ツールに比べてツールの進化がはるかに遅いことです。