Что такое ОЛАП? Куб, Аналитический Operaфункции в хранилище данных
Что такое ОЛАП?
Онлайн-аналитическая обработка (OLAP) это категория программного обеспечения, которая позволяет пользователям анализировать информацию из нескольких систем баз данных одновременно. Это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
Аналитикам часто приходится группировать, агрегировать и объединять данные. Эти операции OLAP при интеллектуальном анализе данных требуют больших ресурсов. С помощью OLAP данные можно предварительно рассчитать и предварительно агрегировать, что ускоряет анализ.
Базы данных OLAP разделены на один или несколько кубов. Кубы спроектированы таким образом, чтобы создавать и просматривать отчеты было легко. OLAP означает онлайн-аналитическую обработку.
OLAP куб

В основе концепции OLAP лежит OLAP-куб. Куб OLAP — это структура данных, оптимизированная для очень быстрого анализ данных.
Куб OLAP состоит из числовых фактов, называемых мерами, которые классифицируются по измерениям. OLAP-куб также называют гиперкуба.
Обычно операции с данными и анализ выполняются с использованием простой электронной таблицы, где значения данных расположены в формате строк и столбцов. Это идеально подходит для двумерных данных. Однако OLAP содержит многомерные данные, причем данные обычно получают из другого и несвязанного источника. Использование электронной таблицы не является оптимальным вариантом. Куб может хранить и анализировать многомерные данные логичным и упорядоченным образом.
Как это работает?
Хранилище данных будет извлекать информацию из нескольких источников данных и форматов, таких как текстовые файлы, листы Excel, мультимедийные файлы и т. д.
Извлеченные данные очищаются и преобразуются. Данные загружаются на сервер OLAP (или куб OLAP), где информация заранее рассчитывается для дальнейшего анализа.
Основные аналитические операции OLAP
Четыре типа аналитических операций OLAP:
- Свернуть
- Детализация
- Нарезать и нарезать
- Поворот (поворот)
1) Свертывание:
Объединение также известно как «консолидация» или «агрегация». Операцию свертывания можно выполнить двумя способами.
- Уменьшение размеров
- Восхождение по иерархии понятий. Иерархия понятий — это система группировки вещей на основе их порядка или уровня.
Рассмотрим следующую диаграмму

- В этом примере города Нью-Джерси и Лост-Англс объединены в страну США.
- Объем продаж в Нью-Джерси и Лос-Анджелесе составляет 440 и 1560 соответственно. После свертывания их станет 2000.
- В этом процессе агрегирования данные по иерархии местоположений перемещаются вверх от города к стране.
- В процессе сведения необходимо удалить хотя бы одно или несколько измерений. В этом примере измерение «Города» удалено.
2) Детализация
При детализации данные фрагментируются на более мелкие части. Это противоположность процессу свертывания. Это можно сделать через
- Спускаемся по иерархии понятий
- Увеличение размера

Рассмотрим диаграмму выше
- Первый квартал детализируется до января, февраля и марта. Соответствующие продажи также являются регистрами.
- В этом примере добавляются месяцы измерения.
3) Срез:
Здесь выбирается одно измерение и создается новый подкуб.
Следующая диаграмма объясняет, как выполняется операция среза:

- Время измерения разделено с помощью Q1 в качестве фильтра.
- Полностью создается новый куб.
Это говорит:
Эта операция аналогична срезу. Разница в том, что вы выбираете 2 или более измерений, в результате чего создается субкуб.

4) Поворот
В Pivot вы поворачиваете оси данных, чтобы обеспечить альтернативное представление данных.
В следующем примере сводка основана на типах элементов.

Типы OLAP-систем
Иерархическая структура OLAP

Тип OLAP | объяснение |
---|---|
Реляционная OLAP(ROLAP): | ROLAP — это расширенная СУБД с многомерным отображением данных для выполнения стандартных реляционных операций. |
Многомерный OLAP (МОЛАП) | MOLAP Реализует работу с многомерными данными. |
Гибридная онлайн-аналитическая обработка (HOLAP) | В подходе HOLAP агрегированные итоги хранятся в многомерной базе данных, а подробные данные хранятся в реляционной базе данных. Это обеспечивает как эффективность данных модели ROLAP, так и производительность модели MOLAP. |
Настольный OLAP (DOLAP) | В Desktop OLAP пользователь загружает часть данных из базы данных локально или на свой рабочий стол и анализирует их.
DOLAP относительно дешевле в развертывании, поскольку он предлагает очень мало функций по сравнению с другими системами OLAP. |
Веб-OLAP (WOLAP) | Web OLAP — система OLAP, доступная через веб-браузер. WOLAP — это трехуровневая архитектура. Он состоит из трех компонентов: клиента, промежуточного программного обеспечения и сервера базы данных. |
Мобильная OLAP: | Mobile OLAP помогает пользователям получать доступ к данным OLAP и анализировать их с помощью своих мобильных устройств. |
Пространственный OLAP: | SOLAP создан для облегчения управления как пространственными, так и непространственными данными в географической информационной системе (ГИС). |
РОЛАП
ROLAP работает с данными, существующими в реляционной базе данных. Таблицы фактов и измерений хранятся как реляционные таблицы. Он также позволяет осуществлять многомерный анализ данных и является самым быстрорастущим OLAP.
Преимущества модели ROLAP:
- Высокая эффективность данных. Он обеспечивает высокую эффективность обработки данных, поскольку производительность запросов и язык доступа оптимизированы специально для анализа многомерных данных.
- Масштабируемость. Этот тип системы OLAP обеспечивает масштабируемость для управления большими объемами данных, даже если объем данных постоянно увеличивается.
Недостатки модели ROLAP:
- Спрос на более высокие ресурсы: ROLAP требует высокой загрузки человеческих, программных и аппаратных ресурсов.
- Ограничения совокупных данных. Использование инструментов ROLAP SQL для всех расчетов совокупных данных. Однако не существует установленных ограничений на обработку вычислений.
- Медленная производительность запросов. Производительность запросов в этой модели медленная по сравнению с MOLAP.
МОЛАП
MOLAP использует многомерные механизмы хранения на основе массивов для отображения многомерных представлений данных. По сути, они используют куб OLAP.
Узнайте больше о MOLAP здесь
Гибридная OLAP
Гибридный OLAP представляет собой смесь ROLAP и MOLAP. Он предлагает быстрое вычисление MOLAP и более высокую масштабируемость ROLAP. HOLAP использует две базы данных.
- Агрегированные или вычисленные данные хранятся в многомерном кубе OLAP.
- Подробная информация хранится в реляционной базе данных.
Преимущества гибридной OLAP:
- Этот вид OLAP помогает экономить дисковое пространство, а также остается компактным, что помогает избежать проблем, связанных со скоростью и удобством доступа.
- Гибридный HOLAP использует технологию куба, которая обеспечивает более высокую производительность для всех типов данных.
- ROLAP мгновенно обновляются, и пользователи HOLAP имеют доступ к этим мгновенно обновляемым данным в режиме реального времени. MOLAP обеспечивает очистку и преобразование данных, тем самым повышая актуальность данных. Это объединяет лучшее из обоих миров.
Недостатки гибридной OLAP:
- Повышенный уровень сложности: Основным недостатком систем HOLAP является то, что они поддерживают инструменты и приложения как ROLAP, так и MOLAP. Таким образом, это очень сложно.
- Возможные совпадения: Существует более высокая вероятность совпадения, особенно в их функциональных возможностях.
Преимущества ОЛАП
- OLAP — это платформа для всех типов бизнеса, включая планирование, составление бюджета, отчетность и анализ.
- Информация и вычисления согласованы в кубе OLAP. Это решающее преимущество.
- Быстро создавайте и анализируйте сценарии «Что, если»
- Удобный поиск в базе данных OLAP по широким или конкретным терминам.
- OLAP предоставляет стандартные блоки для инструментов бизнес-моделирования, инструментов интеллектуального анализа данных и инструментов отчетности о производительности.
- Позволяет пользователям создавать срезы и кубики данных куба по различным измерениям, мерам и фильтрам.
- Это хорошо для анализа временных рядов.
- С помощью OLAP легко найти некоторые кластеры и выбросы.
- Это мощная онлайн-система аналитических процессов визуализации, которая обеспечивает более быстрое время отклика.
Недостатки OLAP
- OLAP требует организации данных в виде схемы «звезда» или «снежинка». Эти схемы сложны в реализации и администрировании.
- В одном кубе OLAP не может быть большого количества измерений.
- Доступ к транзакционным данным невозможно получить с помощью системы OLAP.
- Любое изменение куба OLAP требует полного обновления куба. Это трудоемкий процесс
Резюме
- OLAP в информационное хранилище — это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
- В основе концепции OLAP лежит OLAP-куб.
- Различные бизнес-приложения и другие операции с данными требуют использования OLAP Cube.
- Существует пять основных типов аналитических операций OLAP в хранилище данных: 1) Свертывание 2) Детализация 3) Срез 4) Нарезка на кубиках и 5) Поворот
- Три типа широко используемых систем OLAP — это MOLAP, ROLAP и гибридная OLAP.
- Desktop OLAP, Web OLAP и Mobile OLAP — это еще несколько типов OLAP-систем.