OLAPとは何ですか?キューブ、分析 Operaデータ ウェアハウスの機能
OLAPとは?
オンライン分析処理(OLAP) ユーザーが複数のデータベース システムからの情報を同時に分析できるようにするソフトウェアのカテゴリです。 アナリストがさまざまな視点からビジネス データを抽出して表示できるようにするテクノロジーです。
アナリストは頻繁にデータをグループ化、集計、結合する必要があります。データ マイニングにおけるこれらの OLAP 操作はリソースを大量に消費します。OLAP を使用すると、データを事前に計算して集計できるため、分析が高速化されます。
OLAP データベースは 1 つ以上のキューブに分割されます。キューブはレポートの作成と表示が容易になるように設計されています。OLAP は Online Analytical Processing (オンライン分析処理) の略です。
OLAPキューブ
OLAP の概念の中核となるのは OLAP Cube です。 OLAP キューブは、非常に高速な処理のために最適化されたデータ構造です。 データ分析.
OLAP キューブは、ディメンションごとに分類されたメジャーと呼ばれる数値ファクトで構成されます。 OLAP キューブは、 ハイパーキューブ.
通常、データの操作と分析は、データ値が行と列の形式で配置される単純なスプレッドシートを使用して実行されます。これは 2 次元データに最適です。ただし、OLAP には多次元データが含まれており、データは通常、異なる無関係なソースから取得されます。スプレッドシートを使用することは最適なオプションではありません。キューブは、多次元データを論理的かつ整然とした方法で保存および分析できます。
システムを教えてください。
データ ウェアハウスは、複数のデータ ソースやテキスト ファイル、Excel シート、マルチメディア ファイルなどの形式から情報を抽出します。
抽出されたデータはクリーンアップされ、変換されます。 データは OLAP サーバー (または OLAP キューブ) にロードされ、さらなる分析のために情報が事前に計算されます。
OLAPの基本的な分析操作
分析 OLAP 操作には次の 4 つの種類があります。
- 巻き上げる
- ドリルダウン
- スライスとサイコロ
- ピボット(回転)
1) ロールアップ:
ロールアップは「統合」または「集約」とも呼ばれます。ロールアップ操作は2つの方法で実行できます。
- 寸法の縮小
- 概念の階層を登っていきます。 概念階層は、順序またはレベルに基づいて物事をグループ化するシステムです。
次の図を見てください
- この例では、都市ニュージャージーとロストアングルスが国 USA にロールアップされます。
- ニュージャージー州とロサンゼルスの販売台数はそれぞれ 440 台と 1560 台です。 ロールアップすると2000になります
- この集計プロセスでは、データは場所の階層が都市から国へと移動します。
- ロールアッププロセスでは、少なくとも XNUMX つ以上の寸法を削除する必要があります。 この例では、Cities ディメンションが削除されます。
2) ドリルダウン
ドリルダウンでは、データはより小さな部分に断片化されます。 ロールアッププロセスの逆です。 それは経由で行うことができます
- 概念階層を下位に移動する
- 次元を高める
上の図を考えてみましょう
- 第 1 四半期は、XNUMX 月、XNUMX 月、XNUMX 月までドリルダウンされます。 対応する販売もレジです。
- この例では、ディメンション月が追加されます。
3) スライス:
ここでは、XNUMX つのディメンションが選択され、新しいサブキューブが作成されます。
次の図はスライス操作の実行方法を説明しています。
- ディメンションタイムは Q1 をフィルターとしてスライスされます。
- 新しい立方体が完全に作成されます。
それは言います:
この操作はスライスに似ています。ダイスとの違いは、サブキューブを作成する 2 つ以上の次元を選択することです。
4) ピボット
ピボットでは、データ軸を回転して、データの代替表示を提供します。
次の例では、ピボットはアイテムの種類に基づいています。
OLAP システムの種類
OLAP 階層構造
OLAPの種類 | 説明 |
---|---|
リレーショナルOLAP(ROLAP): | ROLAP は、標準的なリレーショナル操作を実行するために多次元データ マッピングを備えた拡張 RDBMS です。 |
多次元 OLAP (MOLAP) | MOLAP は多次元データでの操作を実装します。 |
ハイブリッド オンライン分析処理 (HOLAP) | HOLAP アプローチでは、集計された合計は多次元データベースに保存され、詳細データはリレーショナル データベースに保存されます。 これにより、ROLAP モデルのデータ効率と MOLAP モデルのパフォーマンスの両方が提供されます。 |
デスクトップ OLAP (DOLAP) | デスクトップ OLAP では、ユーザーはデータベースからデータの一部をローカルまたはデスクトップにダウンロードして分析します。
DOLAP は他の OLAP システムに比べて機能が非常に少ないため、導入コストが比較的安価です。 |
ウェブOLAP(WOLAP) | Web OLAP は、Web ブラウザ経由でアクセスできる OLAP システムです。WOLAP は 3 層アーキテクチャです。クライアント、ミドルウェア、データベース サーバーの 3 つのコンポーネントで構成されます。 |
モバイルOLAP: | モバイル OLAP は、ユーザーがモバイル デバイスを使用して OLAP データにアクセスして分析するのに役立ちます |
空間OLAP: | SOLAP は、地理情報システム (GIS) における空間データと非空間データの両方の管理を容易にするために作成されました。 |
ロールラップ
ROLAP は、リレーショナル データベースに存在するデータを処理します。ファクト テーブルとディメンション テーブルは、リレーショナル テーブルとして保存されます。また、データの多次元分析も可能で、最も急速に成長している OLAP です。
ROLAP モデルの利点:
- 高いデータ効率。 クエリのパフォーマンスとアクセス言語が特に多次元データ分析用に最適化されているため、高いデータ効率が得られます。
- スケーラビリティ。 このタイプの OLAP システムは、大量のデータを管理するための拡張性を備えており、データが着実に増加している場合でも対応できます。
ROLAP モデルの欠点:
- より高いリソースの需要: ROLAP では、人的資源、ソフトウェア、ハードウェア リソースを最大限に活用する必要があります。
- 集合的なデータ制限。 ROLAP ツールの使用 SQL 集計データのすべての計算に使用されます。 ただし、計算を処理するための制限は設定されていません。
- クエリのパフォーマンスが遅い。 このモデルのクエリのパフォーマンスは、MOLAP と比較すると遅いです
モラップ
MOLAP は、配列ベースの多次元ストレージ エンジンを使用して、データの多次元ビューを表示します。 基本的には OLAP キューブを使用します。
MOLAP について詳しく見る こちら
ハイブリッドOLAP
ハイブリッド OLAP は、ROLAP と MOLAP の両方を組み合わせたものです。 MOLAP の高速計算と ROLAP のより高いスケーラビリティを提供します。 HOLAP は XNUMX つのデータベースを使用します。
- 集計または計算されたデータは多次元 OLAP キューブに保存されます
- 詳細情報はリレーショナル データベースに保存されます。
ハイブリッド OLAP の利点:
- この種の OLAP はディスク領域を節約するのに役立ち、またコンパクトなままであるため、アクセス速度と利便性に関連する問題を回避できます。
- ハイブリッド HOLAP はキューブ テクノロジーを使用しており、あらゆる種類のデータのパフォーマンスを高速化します。
- ROLAP は即座に更新され、HOLAP ユーザーはこのリアルタイムで即座に更新されるデータにアクセスできます。 MOLAP はデータのクリーニングと変換を実現し、データの関連性を向上させます。 これにより、両方の長所が得られます。
ハイブリッド OLAP の欠点:
- より高い複雑さのレベル: HOLAP システムの主な欠点は、ROLAP と MOLAP の両方のツールとアプリケーションをサポートしていることです。 したがって、非常に複雑です。
- 潜在的な重複: 特に機能が重複する可能性が高くなります。
OLAPの利点
- OLAP は、計画、予算編成、レポート作成、分析など、あらゆる種類のビジネスのためのプラットフォームです。
- OLAP キューブ内の情報と計算は一貫しています。 これは重要な利点です。
- 「もしも」のシナリオを迅速に作成して分析する
- OLAP データベースで広範な用語や特定の用語を簡単に検索できます。
- OLAP は、ビジネス モデリング ツール、データ マイニング ツール、パフォーマンス レポート ツールの構成要素を提供します。
- ユーザーは、さまざまなディメンション、メジャー、フィルターを使用してキューブ データをスライス アンド ダイスすることができます。
- 時系列分析に適しています。
- OLAP を使用すると、クラスターや外れ値を簡単に見つけることができます。
- これは、より高速な応答時間を提供する強力な視覚化オンライン分析プロセス システムです。
OLAPの欠点
- OLAP では、データをスター スキーマまたはスノーフレーク スキーマに編成する必要があります。 これらのスキーマは実装と管理が複雑です
- 単一の OLAP キューブに多数のディメンションを含めることはできません
- OLAP システムではトランザクション データにアクセスできません。
- OLAP キューブを変更するには、キューブを完全に更新する必要があります。 これは時間のかかるプロセスです
まとめ
- OLAP で データウェアハウス は、アナリストがさまざまな視点からビジネス データを抽出して表示できるようにするテクノロジーです。
- OLAP の概念の中核となるのは OLAP Cube です。
- さまざまなビジネス アプリケーションやその他のデータ操作では、OLAP キューブを使用する必要があります。
- データ ウェアハウスにおける分析 OLAP 操作には、主に 1 つの種類があります。2) ロールアップ、3) ドリルダウン、4) スライス、5) ダイス、XNUMX) ピボットです。
- 広く使用されている OLAP システムには、MOLAP、ROLAP、ハイブリッド OLAP の XNUMX 種類があります。
- デスクトップ OLAP、Web OLAP、およびモバイル OLAP は、他のタイプの OLAP システムです。