OLAPとは何ですか? キューブ、データ ウェアハウスでの分析操作

OLAPとは?

オンライン分析処理(OLAP) ユーザーが複数のデータベース システムからの情報を同時に分析できるようにするソフトウェアのカテゴリです。 アナリストがさまざまな視点からビジネス データを抽出して表示できるようにするテクノロジーです。

アナリストは頻繁にデータをグループ化、集計、結合する必要があります。 データ マイニングにおけるこれらの OLAP 操作は、リソースを大量に消費します。 OLAP を使用すると、データを事前に計算および集計できるため、分析が迅速化されます。

OLAP データベースは XNUMX つ以上のキューブに分割されます。 キューブは、作成して競い合うように設計されています。wing レポートが簡単になります。 OLAP はオンライン分析処理の略です。

OLAPキューブ

OLAP キューブ
OLAP キューブ

OLAP の概念の中核となるのは OLAP Cube です。 OLAP キューブは、非常に高速な処理のために最適化されたデータ構造です。 データ分析.

OLAP キューブは、ディメンションごとに分類されたメジャーと呼ばれる数値ファクトで構成されます。 OLAP キューブは、 ハイパーキューブ.

通常、データの操作と分析は、データ値が行と列の形式で配置される単純なスプレッドシートを使用して実行されます。 これは XNUMX 次元データに最適です。 ただし、OLAP には多次元データが含まれており、データは通常、別の関連性のないソースから取得されます。 スプレッドシートの使用は最適なオプションではありません。 キューブは、多次元データを論理的かつ整然とした方法で保存および分析できます。

システムを教えてください。

データ ウェアハウスは、複数のデータ ソースやテキスト ファイル、Excel シート、マルチメディア ファイルなどの形式から情報を抽出します。

抽出されたデータはクリーンアップされ、変換されます。 データは OLAP サーバー (または OLAP キューブ) にロードされ、さらなる分析のために情報が事前に計算されます。

OLAP の基本的な分析操作

分析 OLAP 操作には次の XNUMX 種類があります。

  1. 巻き上げる
  2. ドリルダウン
  3. スライスとサイコロ
  4. ピボット(回転)

1) ロールアップ:

ロールアップは「統合」または「集約」とも呼ばれます。 ロールアップ操作は2通りの方法で行えます

  1. 寸法の縮小
  2. 概念の階層を登っていきます。 概念階層は、順序またはレベルに基づいて物事をグループ化するシステムです。

以下を検討してくださいwing ダイアグラム

OLAP でのロールアップ操作
OLAP でのロールアップ操作
  • この例では、都市ニュージャージーとロストアングルスが国 USA にロールアップされます。
  • ニュージャージー州とロサンゼルスの販売台数はそれぞれ 440 台と 1560 台です。 ロールアップすると2000になります
  • この集計プロセスでは、データは場所の階層が都市から国へと移動します。
  • ロールアッププロセスでは、少なくとも XNUMX つ以上の寸法を削除する必要があります。 この例では、Cities ディメンションが削除されます。

2) ドリルダウン

ドリルダウンでは、データはより小さな部分に断片化されます。 ロールアッププロセスの逆です。 それは経由で行うことができます

  • 概念階層を下位に移動する
  • 次元を高める
OLAP でのドリルダウン操作
OLAP でのドリルダウン操作

上の図を考えてみましょう

  • 第 1 四半期は、XNUMX 月、XNUMX 月、XNUMX 月までドリルダウンされます。 対応する販売もレジです。
  • この例では、ディメンション月が追加されます。

3) スライス:

ここでは、XNUMX つのディメンションが選択され、新しいサブキューブが作成されます。

Following 図は、スライス操作がどのように実行されるかを説明します。

OLAP でのスライス操作
OLAP でのスライス操作
  • ディメンションタイムは Q1 をフィルターとしてスライスされます。
  • 新しい立方体が完全に作成されます。

それは言います:

この操作はスライスに似ています。 サイコロの違いは、サブキューブを作成する 2 つ以上のディメンションを選択することです。

OLAP でのサイコロ操作
OLAP でのサイコロ操作

4) ピボット

ピボットでは、データ軸を回転して、データの代替表示を提供します。

続きましてwing たとえば、ピボットは項目タイプに基づいています。

OLAP でのピボット操作
OLAP でのピボット操作

OLAP システムの種類

OLAP ハイアarchi計算構造

OLAP システムの種類
OLAP システムの種類
OLAPの種類 説明
リレーショナルOLAP(ROLAP): ROLAP は、標準的なリレーショナル操作を実行するための多次元データ マッピングを備えた拡張 RDBMS です。
多次元 OLAP (MOLAP) MOLAP 多次元データの操作を実装します。
ハイブリッド オンライン分析処理 (HOLAP) HOLAP アプローチでは、集計された合計は多次元データベースに保存され、詳細データはリレーショナル データベースに保存されます。 これにより、ROLAP モデルのデータ効率と MOLAP モデルのパフォーマンスの両方が提供されます。
デスクトップ OLAP (DOLAP) デスクトップ OLAP では、ユーザーはデータベースからデータの一部をローカルまたはデスクトップにダウンロードして分析します。

DOLAP は提供する機能がほとんどないため、比較的安価に導入できます。ares 他の OLAP システムへ。

ウェブOLAP(WOLAP) Web OLAP Web ブラウザからアクセスできる OLAP システムです。 WOLAP は 3 層構造になっています archi構造。これは、クライアント、ミドルウェア、データベース サーバーの 3 つのコンポーネントで構成されます。
モバイルOLAP: モバイル OLAP は、ユーザーがモバイル デバイスを使用して OLAP データにアクセスして分析するのに役立ちます
空間OLAP: SOLAP は、地理情報システム (GIS) における空間データと非空間データの両方の管理を容易にするために作成されました。

ロールラップ

ROLAP は、リレーショナル データベースに存在するデータを操作します。 ファクト テーブルとディメンション テーブルはリレーショナル テーブルとして保存されます。 また、データの多次元分析も可能で、最も高速な分析が可能です。wing OLAP。

ROLAP モデルの利点:

  • 高いデータ効率。 クエリのパフォーマンスとアクセス言語が特に多次元データ分析用に最適化されているため、高いデータ効率が得られます。
  • スケーラビリティ。 このタイプの OLAP システムは、大量のデータを管理するための拡張性を備えており、データが着実に増加している場合でも対応できます。

ROLAP モデルの欠点:

  • より高いリソースの需要: ROLAP では、人的資源、ソフトウェア、ハードウェア リソースを最大限に活用する必要があります。
  • 集合的なデータ制限。 ROLAP ツールの使用 SQL 集計データのすべての計算に使用されます。 ただし、計算を処理するための制限は設定されていません。
  • クエリのパフォーマンスが遅い。 このモデルのクエリのパフォーマンスは、MOLAP と比較すると遅いです

モラップ

MOLAP は、配列ベースの多次元ストレージ エンジンを使用して、データの多次元ビューを表示します。 基本的には OLAP キューブを使用します。

MOLAP について詳しく見る こちらをクリックすると、ツールが開きます。

ハイブリッドOLAP

ハイブリッド OLAP は、ROLAP と MOLAP の両方を組み合わせたものです。 MOLAP の高速計算と ROLAP のより高いスケーラビリティを提供します。 HOLAP は XNUMX つのデータベースを使用します。

  1. 集計または計算されたデータは多次元 OLAP キューブに保存されます
  2. 詳細情報はリレーショナル データベースに保存されます。

ハイブリッド OLAP の利点:

  • この種の OLAP はディスク領域を節約するのに役立ち、またコンパクトなままであるため、アクセス速度と利便性に関連する問題を回避できます。
  • ハイブリッド HOLAP はキューブ テクノロジーを使用しており、あらゆる種類のデータのパフォーマンスを高速化します。
  • ROLAP は即座に更新され、HOLAP ユーザーはこのリアルタイムで即座に更新されるデータにアクセスできます。 MOLAP はデータのクリーニングと変換を実現し、データの関連性を向上させます。 これにより、両方の長所が得られます。

ハイブリッド OLAP の欠点:

  • グレーターコムplexレベル: HOLAP システムの主な欠点は、ROLAP と MOLAP の両方のツールとアプリケーションをサポートしていることです。 したがって、非常に複雑です。
  • 潜在的な重複: 特に機能が重複する可能性が高くなります。

OLAPの利点

  • OLAP は、計画、予算編成、レポート作成、分析など、あらゆる種類のビジネスのためのプラットフォームです。
  • OLAP キューブ内の情報と計算は一貫しています。 これは重要な利点です。
  • 「もしも​​」のシナリオを迅速に作成して分析する
  • OLAP データベースで広範な用語や特定の用語を簡単に検索できます。
  • OLAP は、ビジネス モデリング ツール、データ マイニング ツール、パフォーマンス レポート ツールの構成要素を提供します。
  • ユーザーは、さまざまなディメンション、メジャー、フィルターを使用してキューブ データをスライス アンド ダイスすることができます。
  • 時系列分析に適しています。
  • OLAP を使用すると、クラスターと外れ値を簡単に見つけることができます。
  • これは、より高速な応答時間を提供する強力な視覚化オンライン分析プロセス システムです。

OLAPの欠点

  • OLAP では、データをスター スキーマまたはスノーフレーク スキーマに編成する必要があります。 これらのスキーマは実装と管理が複雑です
  • 単一の OLAP キューブに多数のディメンションを含めることはできません
  • OLAP システムではトランザクション データにアクセスできません。
  • OLAP キューブを変更するには、キューブを完全に更新する必要があります。 これは時間のかかるプロセスです

まとめ

  • OLAP で データウェアハウス は、アナリストがさまざまな視点からビジネス データを抽出して表示できるようにするテクノロジーです。
  • OLAP の概念の中核となるのは OLAP Cube です。
  • さまざまなビジネス アプリケーションやその他のデータ操作には、OLAP Cube の使用が必要です。
  • データ ウェアハウスには主に 1 種類の分析 OLAP 操作があります: 2) ロールアップ、3) ドリルダウン、4) スライス、5) ダイス、XNUMX) ピボット
  • 広く使用されている OLAP システムには、MOLAP、ROLAP、ハイブリッド OLAP の XNUMX 種類があります。
  • デスクトップ OLAP、Web OLAP、およびモバイル OLAP は、他のタイプの OLAP システムです。