Що таке OLAP? Куб, аналітичний Operaу сховищі даних
Що таке OLAP?
Онлайн аналітична обробка (OLAP) це категорія програмного забезпечення, яке дозволяє користувачам аналізувати інформацію з кількох систем баз даних одночасно. Це технологія, яка дозволяє аналітикам отримувати та переглядати бізнес-дані з різних точок зору.
Аналітикам часто потрібно групувати, агрегувати та об’єднувати дані. Ці операції OLAP у інтелектуальному аналізі даних потребують ресурсів. За допомогою OLAP дані можна попередньо обчислити та попередньо агрегувати, що робить аналіз швидшим.
Бази даних OLAP розділені на один або кілька кубів. Кубики розроблені таким чином, що створювати та переглядати звіти стає легко. OLAP розшифровується як Online Analytical Processing.
Куб OLAP

В основі концепції OLAP лежить куб OLAP. Куб OLAP — це структура даних, оптимізована для дуже швидкого аналіз даних.
Куб OLAP складається з числових фактів, які називаються мірами, які класифікуються за розмірами. Куб OLAP також називається гіперкуб.
Зазвичай операції з даними та аналіз виконуються за допомогою простої електронної таблиці, де значення даних упорядковано у форматі рядків і стовпців. Це ідеальний варіант для двовимірних даних. Однак OLAP містить багатовимірні дані, при цьому дані зазвичай отримують з іншого та не пов’язаного джерела. Використання електронної таблиці не є оптимальним варіантом. Куб може зберігати та аналізувати багатовимірні дані логічно та впорядковано.
Як це працює?
Сховище даних витягуватиме інформацію з багатьох джерел даних і форматів, таких як текстові файли, таблиці Excel, мультимедійні файли тощо.
Витягнуті дані очищаються та трансформуються. Дані завантажуються на сервер OLAP (або куб OLAP), де інформація попередньо обчислюється для подальшого аналізу.
Основні аналітичні операції OLAP
Чотири типи аналітичних операцій OLAP:
- Згорнути
- Пробурити
- Нарізати кубиками
- Поворот (обертання)
1) Згортання:
Зведення також відоме як «консолідація» або «агрегація». Операцію згортання можна виконати двома способами
- Зменшення розмірів
- Підйом по ієрархії понять. Ієрархія понять — це система групування речей на основі їх порядку або рівня.
Розгляньте наступну схему
- У цьому прикладі міста Нью-Джерсі та Загублені кути згорнули в країну США
- Показники продажів у Нью-Джерсі та Лос-Анджелесі становлять 440 та 1560 відповідно. Після згортання вони стають 2000
- У цьому процесі агрегування ієрархія розташування даних переміщується вгору від міста до країни.
- У процесі згортання потрібно видалити принаймні один або кілька розмірів. У цьому прикладі параметр «Міста» видалено.
2) Деталізація
Під час деталізації дані фрагментуються на менші частини. Це протилежність процесу згортання. Це можна зробити через
- Переміщення вниз по ієрархії понять
- Збільшення розміру
Розгляньте діаграму вище
- Quater Q1 деталізовано до місяців січня, лютого та березня. Відповідні продажі також є реєстрами.
- У цьому прикладі додано місяці вимірювання.
3) Зріз:
Тут вибрано один вимір і створено новий підкуб.
На наступній діаграмі пояснюється, як виконується операція зрізу:
- Dimension Time розрізається за допомогою Q1 як фільтра.
- Взагалі створюється новий куб.
Кістки:
Ця операція схожа на зріз. Різниця в кубиках полягає в тому, що ви вибираєте 2 або більше вимірів, які призводять до створення підкуба.
4) Опорний
У Pivot ви обертаєте осі даних, щоб забезпечити альтернативне представлення даних.
У наступному прикладі зведена таблиця базується на типах елементів.
Типи систем OLAP
Ієрархічна структура OLAP
Тип OLAP | Пояснення |
---|---|
Реляційний OLAP (ROLAP): | ROLAP — це розширена RDBMS разом із багатовимірним відображенням даних для виконання стандартної реляційної операції. |
Багатовимірний OLAP (MOLAP) | MOLAP Реалізує операції з багатовимірними даними. |
Гібридна онлайн-аналітична обробка (HOLAP) | У підході HOLAP агреговані підсумки зберігаються в багатовимірній базі даних, а детальні дані зберігаються в реляційній базі даних. Це забезпечує як ефективність даних моделі ROLAP, так і продуктивність моделі MOLAP. |
Настільний OLAP (DOLAP) | У Desktop OLAP користувач завантажує частину даних із бази даних локально або на свій робочий стіл і аналізує їх.
DOLAP є відносно дешевшим у розгортанні, оскільки він пропонує дуже мало функціональних можливостей у порівнянні з іншими системами OLAP. |
Web OLAP (WOLAP) | Web OLAP, яка є системою OLAP, доступною через веб-браузер. WOLAP — це трирівнева архітектура. Він складається з трьох компонентів: клієнт, проміжне програмне забезпечення та сервер бази даних. |
Мобільний OLAP: | Мобільний OLAP допомагає користувачам отримувати доступ і аналізувати дані OLAP за допомогою своїх мобільних пристроїв |
Просторовий OLAP: | SOLAP створено для полегшення керування як просторовими, так і непросторовими даними в геоінформаційній системі (ГІС). |
ROLAP
ROLAP працює з даними, які існують у реляційній базі даних. Факти та таблиці вимірювань зберігаються як реляційні таблиці. Він також дозволяє багатовимірний аналіз даних і є OLAP, що розвивається найшвидше.
Переваги моделі ROLAP:
- Висока ефективність даних. Він пропонує високу ефективність даних, оскільки продуктивність запитів і мова доступу оптимізовані спеціально для аналізу багатовимірних даних.
- Масштабованість. Цей тип системи OLAP забезпечує масштабованість для керування великими обсягами даних, навіть коли дані постійно збільшуються.
Недоліки моделі ROLAP:
- Попит на вищі ресурси: ROLAP потребує високого рівня використання робочої сили, програмного та апаратного забезпечення.
- Обмеження сукупних даних. Використання інструментів ROLAP SQL для всіх розрахунків зведених даних. Однак для обробки обчислень немає встановлених обмежень.
- Повільна продуктивність запитів. Продуктивність запитів у цій моделі повільна порівняно з MOLAP
MOLAP
MOLAP використовує механізми багатовимірного зберігання на основі масивів для відображення багатовимірних представлень даних. В основному вони використовують куб OLAP.
Дізнайтеся більше про MOLAP тут
Гібридний OLAP
Гібридний OLAP є сумішшю ROLAP і MOLAP. Він пропонує швидке обчислення MOLAP і вищу масштабованість ROLAP. HOLAP використовує дві бази даних.
- Агреговані або обчислені дані зберігаються в багатовимірному кубі OLAP
- Детальна інформація зберігається в реляційній базі даних.
Переваги гібридного OLAP:
- Цей тип OLAP допомагає економити дисковий простір, а також залишається компактним, що допомагає уникнути проблем, пов’язаних зі швидкістю та зручністю доступу.
- Hybrid HOLAP використовує технологію куба, яка забезпечує швидшу роботу з усіма типами даних.
- ROLAP миттєво оновлюється, а користувачі HOLAP мають доступ до цих миттєво оновлених даних у реальному часі. MOLAP забезпечує очищення та перетворення даних, тим самим покращуючи релевантність даних. Це об’єднує найкраще з обох світів.
Недоліки гібридного OLAP:
- Більший рівень складності: Головним недоліком систем HOLAP є те, що вони підтримують інструменти й програми як ROLAP, так і MOLAP. Таким чином, це дуже складно.
- Потенційні перекриття: Є більша ймовірність збігу, особливо щодо їхніх функцій.
Переваги OLAP
- OLAP — це платформа для всіх типів бізнесу, включаючи планування, бюджетування, звітування та аналіз.
- Інформація та обчислення є узгодженими в кубі OLAP. Це важлива перевага.
- Швидко створюйте та аналізуйте сценарії «Що, якщо».
- Простий пошук у базі даних OLAP за широкими або конкретними термінами.
- OLAP надає будівельні блоки для інструментів бізнес-моделювання, інструментів інтелектуального аналізу даних, інструментів звітування про продуктивність.
- Дозволяє користувачам розрізати дані за різними параметрами, розмірами та фільтрами.
- Це добре для аналізу часових рядів.
- За допомогою OLAP легко знайти деякі кластери та викиди.
- Це потужна система онлайн-аналітичного процесу візуалізації, яка забезпечує швидший час відгуку
Недоліки OLAP
- OLAP вимагає організації даних у вигляді зірки або сніжинки. Ці схеми складні у впровадженні та адмініструванні
- Ви не можете мати велику кількість вимірів в одному кубі OLAP
- Доступ до даних транзакцій за допомогою системи OLAP неможливий.
- Будь-які зміни в кубі OLAP потребують повного оновлення куба. Це трудомісткий процес
Підсумки
- OLAP в сховище даних це технологія, яка дозволяє аналітикам отримувати та переглядати бізнес-дані з різних точок зору.
- В основі концепції OLAP лежить куб OLAP.
- Різні бізнес-додатки та інші операції з даними вимагають використання OLAP Cube.
- Існує п’ять основних типів аналітичних операцій OLAP у сховищі даних: 1) зведення 2) деталізація 3) фрагменти 4) кубики та 5) зведення
- Три типи широко використовуваних систем OLAP: MOLAP, ROLAP і гібридний OLAP.
- Настільний OLAP, веб-OLAP і мобільний OLAP є іншими типами систем OLAP.