Что такое ОЛАП? Куб, Аналитический Operaфункции в хранилище данных

Что такое ОЛАП?

Онлайн-аналитическая обработка (OLAP) это категория программного обеспечения, которая позволяет пользователям анализировать информацию из нескольких систем баз данных одновременно. Это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.

Аналитикам часто приходится группировать, агрегировать и объединять данные. Эти операции OLAP при интеллектуальном анализе данных требуют больших ресурсов. С помощью OLAP данные можно предварительно рассчитать и предварительно агрегировать, что ускоряет анализ.

Базы данных OLAP разделены на один или несколько кубов. Кубы спроектированы таким образом, чтобы создавать и просматривать отчеты было легко. OLAP означает онлайн-аналитическую обработку.

OLAP куб

OLAP куб
OLAP куб

В основе концепции OLAP лежит OLAP-куб. Куб OLAP — это структура данных, оптимизированная для очень быстрого анализ данных.

Куб OLAP состоит из числовых фактов, называемых мерами, которые классифицируются по измерениям. OLAP-куб также называют гиперкуба.

Обычно операции с данными и анализ выполняются с использованием простой электронной таблицы, где значения данных расположены в формате строк и столбцов. Это идеально подходит для двумерных данных. Однако OLAP содержит многомерные данные, причем данные обычно получают из другого и несвязанного источника. Использование электронной таблицы не является оптимальным вариантом. Куб может хранить и анализировать многомерные данные логичным и упорядоченным образом.

Как это работает?

Хранилище данных будет извлекать информацию из нескольких источников данных и форматов, таких как текстовые файлы, листы Excel, мультимедийные файлы и т. д.

Извлеченные данные очищаются и преобразуются. Данные загружаются на сервер OLAP (или куб OLAP), где информация заранее рассчитывается для дальнейшего анализа.

Основные аналитические операции OLAP

Четыре типа аналитических операций OLAP:

  1. Свернуть
  2. Детализация
  3. Нарезать и нарезать
  4. Поворот (поворот)

1) Свертывание:

Объединение также известно как «консолидация» или «агрегация». Операцию свертывания можно выполнить двумя способами.

  1. Уменьшение размеров
  2. Восхождение по иерархии понятий. Иерархия понятий — это система группировки вещей на основе их порядка или уровня.

Рассмотрим следующую диаграмму

Операция свертывания в OLAP
Операция свертывания в OLAP
  • В этом примере города Нью-Джерси и Лост-Англс объединены в страну США.
  • Объем продаж в Нью-Джерси и Лос-Анджелесе составляет 440 и 1560 соответственно. После свертывания их станет 2000.
  • В этом процессе агрегирования данные по иерархии местоположений перемещаются вверх от города к стране.
  • В процессе сведения необходимо удалить хотя бы одно или несколько измерений. В этом примере измерение «Города» удалено.

2) Детализация

При детализации данные фрагментируются на более мелкие части. Это противоположность процессу свертывания. Это можно сделать через

  • Спускаемся по иерархии понятий
  • Увеличение размера
Операция детализации в OLAP
Операция детализации в OLAP

Рассмотрим диаграмму выше

  • Первый квартал детализируется до января, февраля и марта. Соответствующие продажи также являются регистрами.
  • В этом примере добавляются месяцы измерения.

3) Срез:

Здесь выбирается одно измерение и создается новый подкуб.

Следующая диаграмма объясняет, как выполняется операция среза:

Операция среза в OLAP
Операция среза в OLAP
  • Время измерения разделено с помощью Q1 в качестве фильтра.
  • Полностью создается новый куб.

Это говорит:

Эта операция аналогична срезу. Разница в том, что вы выбираете 2 или более измерений, в результате чего создается субкуб.

Операция с кубиками в OLAP
Операция с кубиками в OLAP

4) Поворот

В Pivot вы поворачиваете оси данных, чтобы обеспечить альтернативное представление данных.

В следующем примере сводка основана на типах элементов.

Операция Pivot в OLAP
Операция Pivot в OLAP

Типы OLAP-систем

Иерархическая структура OLAP

Типы OLAP-систем
Типы OLAP-систем
Тип OLAP объяснение
Реляционная OLAP(ROLAP): ROLAP — это расширенная СУБД с многомерным отображением данных для выполнения стандартных реляционных операций.
Многомерный OLAP (МОЛАП) MOLAP Реализует работу с многомерными данными.
Гибридная онлайн-аналитическая обработка (HOLAP) В подходе HOLAP агрегированные итоги хранятся в многомерной базе данных, а подробные данные хранятся в реляционной базе данных. Это обеспечивает как эффективность данных модели ROLAP, так и производительность модели MOLAP.
Настольный OLAP (DOLAP) В Desktop OLAP пользователь загружает часть данных из базы данных локально или на свой рабочий стол и анализирует их.

DOLAP относительно дешевле в развертывании, поскольку он предлагает очень мало функций по сравнению с другими системами OLAP.

Веб-OLAP (WOLAP) Web OLAP — система OLAP, доступная через веб-браузер. WOLAP — это трехуровневая архитектура. Он состоит из трех компонентов: клиента, промежуточного программного обеспечения и сервера базы данных.
Мобильная OLAP: Mobile OLAP помогает пользователям получать доступ к данным OLAP и анализировать их с помощью своих мобильных устройств.
Пространственный OLAP: SOLAP создан для облегчения управления как пространственными, так и непространственными данными в географической информационной системе (ГИС).

РОЛАП

ROLAP работает с данными, существующими в реляционной базе данных. Таблицы фактов и измерений хранятся как реляционные таблицы. Он также позволяет осуществлять многомерный анализ данных и является самым быстрорастущим OLAP.

Преимущества модели ROLAP:

  • Высокая эффективность данных. Он обеспечивает высокую эффективность обработки данных, поскольку производительность запросов и язык доступа оптимизированы специально для анализа многомерных данных.
  • Масштабируемость. Этот тип системы OLAP обеспечивает масштабируемость для управления большими объемами данных, даже если объем данных постоянно увеличивается.

Недостатки модели ROLAP:

  • Спрос на более высокие ресурсы: ROLAP требует высокой загрузки человеческих, программных и аппаратных ресурсов.
  • Ограничения совокупных данных. Использование инструментов ROLAP SQL для всех расчетов совокупных данных. Однако не существует установленных ограничений на обработку вычислений.
  • Медленная производительность запросов. Производительность запросов в этой модели медленная по сравнению с MOLAP.

МОЛАП

MOLAP использует многомерные механизмы хранения на основе массивов для отображения многомерных представлений данных. По сути, они используют куб OLAP.

Узнайте больше о MOLAP здесь

Гибридная OLAP

Гибридный OLAP представляет собой смесь ROLAP и MOLAP. Он предлагает быстрое вычисление MOLAP и более высокую масштабируемость ROLAP. HOLAP использует две базы данных.

  1. Агрегированные или вычисленные данные хранятся в многомерном кубе OLAP.
  2. Подробная информация хранится в реляционной базе данных.

Преимущества гибридной OLAP:

  • Этот вид OLAP помогает экономить дисковое пространство, а также остается компактным, что помогает избежать проблем, связанных со скоростью и удобством доступа.
  • Гибридный HOLAP использует технологию куба, которая обеспечивает более высокую производительность для всех типов данных.
  • ROLAP мгновенно обновляются, и пользователи HOLAP имеют доступ к этим мгновенно обновляемым данным в режиме реального времени. MOLAP обеспечивает очистку и преобразование данных, тем самым повышая актуальность данных. Это объединяет лучшее из обоих миров.

Недостатки гибридной OLAP:

  • Повышенный уровень сложности: Основным недостатком систем HOLAP является то, что они поддерживают инструменты и приложения как ROLAP, так и MOLAP. Таким образом, это очень сложно.
  • Возможные совпадения: Существует более высокая вероятность совпадения, особенно в их функциональных возможностях.

Преимущества ОЛАП

  • OLAP — это платформа для всех типов бизнеса, включая планирование, составление бюджета, отчетность и анализ.
  • Информация и вычисления согласованы в кубе OLAP. Это решающее преимущество.
  • Быстро создавайте и анализируйте сценарии «Что, если»
  • Удобный поиск в базе данных OLAP по широким или конкретным терминам.
  • OLAP предоставляет стандартные блоки для инструментов бизнес-моделирования, инструментов интеллектуального анализа данных и инструментов отчетности о производительности.
  • Позволяет пользователям создавать срезы и кубики данных куба по различным измерениям, мерам и фильтрам.
  • Это хорошо для анализа временных рядов.
  • С помощью OLAP легко найти некоторые кластеры и выбросы.
  • Это мощная онлайн-система аналитических процессов визуализации, которая обеспечивает более быстрое время отклика.

Недостатки OLAP

  • OLAP требует организации данных в виде схемы «звезда» или «снежинка». Эти схемы сложны в реализации и администрировании.
  • В одном кубе OLAP не может быть большого количества измерений.
  • Доступ к транзакционным данным невозможно получить с помощью системы OLAP.
  • Любое изменение куба OLAP требует полного обновления куба. Это трудоемкий процесс

Резюме

  • OLAP в информационное хранилище — это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
  • В основе концепции OLAP лежит OLAP-куб.
  • Различные бизнес-приложения и другие операции с данными требуют использования OLAP Cube.
  • Существует пять основных типов аналитических операций OLAP в хранилище данных: 1) Свертывание 2) Детализация 3) Срез 4) Нарезка на кубиках и 5) Поворот
  • Три типа широко используемых систем OLAP — это MOLAP, ROLAP и гибридная OLAP.
  • Desktop OLAP, Web OLAP и Mobile OLAP — это еще несколько типов OLAP-систем.