Ce este OLAP? Cub, analitic Operaîn Data Warehouse
Ce este OLAP?
Procesare analitică online (OLAP) este o categorie de software care permite utilizatorilor să analizeze informații din mai multe sisteme de baze de date în același timp. Este o tehnologie care permite analiștilor să extragă și să vizualizeze datele de afaceri din diferite puncte de vedere.
Analiștii trebuie frecvent să grupeze, să agreeze și să alăture date. Aceste operațiuni OLAP în data mining necesită resurse intensive. Cu OLAP, datele pot fi precalculate și pre-agregate, făcând analiza mai rapidă.
Bazele de date OLAP sunt împărțite în unul sau mai multe cuburi. Cuburile sunt proiectate în așa fel încât crearea și vizualizarea rapoartelor devin ușoare. OLAP înseamnă procesare analitică online.
cub OLAP

La baza conceptului OLAP se află un cub OLAP. Cubul OLAP este o structură de date optimizată pentru foarte rapid analiza datelor.
Cubul OLAP constă din fapte numerice numite măsuri care sunt clasificate pe dimensiuni. Cubul OLAP mai este numit și hipercub.
De obicei, operațiunile și analiza datelor sunt efectuate folosind foaia de calcul simplă, unde valorile datelor sunt aranjate în format rând și coloană. Acest lucru este ideal pentru date bidimensionale. Cu toate acestea, OLAP conține date multidimensionale, cu date obținute de obicei dintr-o sursă diferită și fără legătură. Utilizarea unei foi de calcul nu este o opțiune optimă. Cubul poate stoca și analiza date multidimensionale într-un mod logic și ordonat.
Cum functioneaza?
Un depozit de date ar extrage informații din mai multe surse și formate de date, cum ar fi fișiere text, foaie Excel, fișiere multimedia etc.
Datele extrase sunt curățate și transformate. Datele sunt încărcate într-un server OLAP (sau cub OLAP) unde informațiile sunt precalculate în prealabil pentru analize ulterioare.
Operații analitice de bază ale OLAP
Patru tipuri de operațiuni analitice OLAP sunt:
- Rulează
- Detalii
- A taia si marunti
- Pivotare (rotire)
1) Roll-up:
Acumularea este cunoscută și sub denumirea de „consolidare” sau „agregare”. Operația Roll-up poate fi efectuată în 2 moduri
- Dimensiuni reduse
- Urcând în ierarhia conceptului. Ierarhia conceptuală este un sistem de grupare a lucrurilor în funcție de ordinea sau nivelul lor.
Luați în considerare următoarea diagramă
- În acest exemplu, orașele New Jersey și Lost Angles și s-au rostogolit în țara SUA
- Cifra de vânzări din New Jersey și Los Angeles este de 440, respectiv 1560. Ele devin 2000 după roll-up
- În acest proces de agregare, datele sunt ierarhia locației se mută în sus de la oraș la țară.
- În procesul de rulare, cel puțin una sau mai multe dimensiuni trebuie îndepărtate. În acest exemplu, dimensiunea Orașe este eliminată.
2) Detaliere
În drill-down, datele sunt fragmentate în părți mai mici. Este opusul procesului de acumulare. Se poate face prin
- Deplasarea în jos în ierarhia conceptului
- Creșterea unei dimensiuni
Luați în considerare diagrama de mai sus
- Trimestrul Q1 este analizat în lunile ianuarie, februarie și martie. Vânzările corespunzătoare sunt, de asemenea, registre.
- În acest exemplu, sunt adăugate dimensiunile luni.
3) felie:
Aici, este selectată o dimensiune și este creat un nou subcub.
Următoarea diagramă explică modul în care s-a efectuat operația de tăiere:
- Dimension Time este tăiat cu Q1 ca filtru.
- Un nou cub este creat cu totul.
Se spune:
Această operație este similară cu o felie. Diferența de zaruri este că selectați 2 sau mai multe dimensiuni care au ca rezultat crearea unui sub-cub.
4) Pivot
În Pivot, rotiți axele de date pentru a oferi o prezentare substitutivă a datelor.
În exemplul următor, pivotul se bazează pe tipuri de articole.
Tipuri de sisteme OLAP
Structura ierarhică OLAP
Tipul OLAP | Explicație |
---|---|
OLAP relațional(ROLAP): | ROLAP este un RDBMS extins împreună cu maparea datelor multidimensionale pentru a efectua operația relațională standard. |
OLAP multidimensional (MOLAP) | MOLAP Implementează operarea în date multidimensionale. |
Procesare analitică online hibridă (HOLAP) | În abordarea HOLAP, totalurile agregate sunt stocate într-o bază de date multidimensională, în timp ce datele detaliate sunt stocate în baza de date relațională. Aceasta oferă atât eficiența datelor a modelului ROLAP, cât și performanța modelului MOLAP. |
Desktop OLAP (DOLAP) | În Desktop OLAP, un utilizator descarcă o parte a datelor din baza de date local sau pe desktopul său și o analizează.
DOLAP este relativ mai ieftin de implementat, deoarece oferă foarte puține funcționalități în comparație cu alte sisteme OLAP. |
Web OLAP (WOLAP) | Web OLAP, care este un sistem OLAP accesibil prin intermediul browserului web. WOLAP este o arhitectură cu trei niveluri. Este format din trei componente: client, middleware și un server de baze de date. |
OLAP mobil: | Mobile OLAP ajută utilizatorii să acceseze și să analizeze datele OLAP folosind dispozitivele lor mobile |
OLAP spațial: | SOLAP este creat pentru a facilita gestionarea datelor spațiale și non-spațiale într-un sistem de informații geografice (GIS) |
ROLAP
ROLAP lucrează cu date care există într-o bază de date relațională. Tabelele de fapte și dimensiuni sunt stocate ca tabele relaționale. De asemenea, permite analiza multidimensională a datelor și este OLAP cu cea mai rapidă creștere.
Avantajele modelului ROLAP:
- Eficiență ridicată a datelor. Oferă o eficiență ridicată a datelor, deoarece performanța interogărilor și limbajul de acces sunt optimizate în special pentru analiza multidimensională a datelor.
- Scalabilitate. Acest tip de sistem OLAP oferă scalabilitate pentru gestionarea unor volume mari de date și chiar și atunci când datele sunt în creștere constantă.
Dezavantajele modelului ROLAP:
- Cererea de resurse mai mari: ROLAP are nevoie de o utilizare ridicată a resurselor de muncă, software și hardware.
- Limitări de date agregate. Utilizarea instrumentelor ROLAP SQL pentru toate calculele de date agregate. Cu toate acestea, nu există limite stabilite pentru gestionarea calculelor.
- Performanță lentă a interogărilor. Performanța interogărilor în acest model este lentă în comparație cu MOLAP
MOLAP
MOLAP folosește motoare de stocare multidimensionale bazate pe matrice pentru a afișa vederi multidimensionale ale datelor. Practic, folosesc un cub OLAP.
Aflați mai multe despre MOLAP aici
OLAP hibrid
OLAP hibrid este un amestec atât de ROLAP, cât și de MOLAP. Oferă calcularea rapidă a MOLAP și scalabilitate mai mare a ROLAP. HOLAP folosește două baze de date.
- Datele agregate sau calculate sunt stocate într-un cub OLAP multidimensional
- Informațiile detaliate sunt stocate într-o bază de date relațională.
Beneficiile OLAP hibrid:
- Acest tip de OLAP ajută la economisirea spațiului pe disc și rămâne, de asemenea, compact, ceea ce ajută la evitarea problemelor legate de viteza și confortul de acces.
- Hybrid HOLAP folosește tehnologia cubului care permite o performanță mai rapidă pentru toate tipurile de date.
- ROLAP sunt actualizate instantaneu, iar utilizatorii HOLAP au acces la aceste date actualizate instantaneu în timp real. MOLAP asigură curățarea și conversia datelor, îmbunătățind astfel relevanța datelor. Acest lucru aduce cel mai bun din ambele lumi.
Dezavantajele OLAP hibrid:
- Nivel de complexitate mai mare: Dezavantajul major al sistemelor HOLAP este că acceptă atât instrumentele și aplicațiile ROLAP, cât și MOLAP. Astfel, este foarte complicat.
- Potențiale suprapuneri: Există șanse mai mari de suprapunere, în special în funcționalitățile lor.
Avantajele OLAP
- OLAP este o platformă pentru toate tipurile de afaceri, inclusiv planificare, bugetare, raportare și analiză.
- Informațiile și calculele sunt consecvente într-un cub OLAP. Acesta este un beneficiu crucial.
- Creați și analizați rapid scenarii „Ce ar fi dacă”.
- Căutați cu ușurință în baza de date OLAP termeni largi sau specifici.
- OLAP oferă elementele de bază pentru instrumente de modelare a afacerilor, instrumente de data mining, instrumente de raportare a performanței.
- Permite utilizatorilor să detalieze și să trimită date cuburilor în funcție de diferite dimensiuni, măsuri și filtre.
- Este bun pentru analiza serii temporale.
- Găsirea unor clustere și valori aberante este ușoară cu OLAP.
- Este un sistem de proces analitic online puternic de vizualizare care oferă timpi de răspuns mai rapid
Dezavantajele OLAP
- OLAP necesită organizarea datelor într-o schemă stea sau fulg de zăpadă. Aceste scheme sunt complicate de implementat și administrat
- Nu puteți avea un număr mare de dimensiuni într-un singur cub OLAP
- Datele tranzacționale nu pot fi accesate cu sistemul OLAP.
- Orice modificare a unui cub OLAP necesită o actualizare completă a cubului. Acesta este un proces care consumă timp
Rezumat
- OLAP în depozit de date este o tehnologie care permite analiștilor să extragă și să vizualizeze datele de afaceri din diferite puncte de vedere.
- La baza conceptului OLAP se află un cub OLAP.
- Diverse aplicații de afaceri și alte operațiuni de date necesită utilizarea OLAP Cube.
- Există cinci tipuri principale de operațiuni OLAP analitice în depozitul de date: 1) Roll-up 2) Drill-down 3) Slice 4) Dice și 5) Pivot
- Trei tipuri de sisteme OLAP utilizate pe scară largă sunt MOLAP, ROLAP și OLAP hibrid.
- Desktop OLAP, Web OLAP și Mobile OLAP sunt alte tipuri de sisteme OLAP.