Što je OLAP? Kocka, analitički Operacije u skladištu podataka
Što je OLAP?
Online analitička obrada (OLAP) je kategorija softvera koja korisnicima omogućuje analizu informacija iz više sustava baza podataka u isto vrijeme. To je tehnologija koja analitičarima omogućuje izdvajanje i pregled poslovnih podataka s različitih točaka gledišta.
Analitičari često moraju grupirati, agregirati i spajati podatke. Ove OLAP operacije u rudarenju podataka zahtijevaju velike resurse. Pomoću OLAP-a podaci se mogu unaprijed izračunati i agregirati, čineći analizu bržom.
OLAP baze podataka podijeljene su u jednu ili više kocki. Kocke su dizajnirane na način da kreiranje i pregledavanje izvješća postaje jednostavno. OLAP je skraćenica za online analitičku obradu.
OLAP kocka
Srž OLAP koncepta je OLAP kocka. OLAP kocka je struktura podataka optimizirana za vrlo brzo Analiza podataka.
OLAP kocka sastoji se od numeričkih činjenica koje se nazivaju mjere koje su kategorizirane po dimenzijama. OLAP kocka se također naziva hiperkocka.
Obično se operacije i analiza podataka izvode pomoću jednostavne proračunske tablice, gdje su vrijednosti podataka raspoređene u formatu retka i stupca. Ovo je idealno za dvodimenzionalne podatke. Međutim, OLAP sadrži višedimenzionalne podatke, s podacima koji se obično dobivaju iz različitih i nepovezanih izvora. Korištenje proračunske tablice nije optimalna opcija. Kocka može pohraniti i analizirati višedimenzionalne podatke na logičan i uredan način.
Kako radi?
Skladište podataka izdvajalo bi informacije iz više izvora podataka i formata kao što su tekstualne datoteke, Excel tablice, multimedijske datoteke itd.
Ekstrahirani podaci se čiste i transformiraju. Podaci se učitavaju u OLAP poslužitelj (ili OLAP kocku) gdje se informacije unaprijed izračunavaju za daljnju analizu.
Osnovne analitičke operacije OLAP-a
Četiri vrste analitičkih OLAP operacija su:
- Zamotavanje
- Bušiti u dubinu
- Narežite na kockice
- Zakretanje (rotiranje)
1) Skupni pregled:
Roll-up je također poznat kao "konsolidacija" ili "agregacija". Operacija skupljanja može se izvesti na 2 načina
- Smanjenje dimenzija
- Penjanje po hijerarhiji pojmova. Hijerarhija pojmova je sustav grupiranja stvari na temelju njihovog reda ili razine.
Razmotrite sljedeći dijagram
- U ovom primjeru, gradovi New Jersey i Lost Angles ušli su u zemlju SAD
- Brojka prodaje u New Jerseyju i Los Angelesu je 440 odnosno 1560. Postaju 2000 nakon roll-upa
- U ovom procesu agregacije podaci se hijerarhijom lokacije pomiču prema gore od grada do zemlje.
- U procesu skupljanja potrebno je ukloniti najmanje jednu ili više dimenzija. U ovom primjeru uklonjena je dimenzija Gradovi.
2) Drill-down
U drill-down podaci su fragmentirani u manje dijelove. To je suprotno od procesa skupljanja. To se može učiniti putem
- Kretanje niz hijerarhiju pojmova
- Povećanje dimenzije
Razmotrite gornji dijagram
- Tromjesečje Q1 analizira se na mjesece siječanj, veljaču i ožujak. Odgovarajuće prodaje također su registri.
- U ovom primjeru dodaju se mjeseci dimenzije.
3) Kriška:
Ovdje je odabrana jedna dimenzija i stvorena je nova podkocka.
Sljedeći dijagram objašnjava kako se izvodi operacija rezanja:
- Dimenzija Vrijeme je isječeno s Q1 kao filtrom.
- Stvorena je potpuno nova kocka.
Piše:
Ova je operacija slična rezanju. Razlika u kockama je u tome što odaberete 2 ili više dimenzija koje rezultiraju stvaranjem podkocke.
4) Zakretanje
U Pivotu rotirate podatkovne osi kako biste pružili zamjensku prezentaciju podataka.
U sljedećem primjeru, pivot se temelji na vrstama stavki.
Vrste OLAP sustava
OLAP hijerarhijska struktura
Vrsta OLAP-a | Objašnjenje |
---|---|
Relacijski OLAP (ROLAP): | ROLAP je prošireni RDBMS zajedno s višedimenzionalnim mapiranjem podataka za izvođenje standardne relacijske operacije. |
Višedimenzionalni OLAP (MOLAP) | MOLAP implementira operaciju u višedimenzionalnim podacima. |
Hibridna online analitička obrada (HOLAP) | U HOLAP pristupu agregirani ukupni iznosi pohranjuju se u višedimenzionalnu bazu podataka, dok se detaljni podaci pohranjuju u relacijsku bazu podataka. To nudi učinkovitost podataka ROLAP modela i performanse MOLAP modela. |
OLAP za radnu površinu (DOLAP) | U Desktop OLAP-u korisnik preuzima dio podataka iz baze podataka lokalno ili na svoju radnu površinu i analizira ih.
DOLAP je relativno jeftiniji za implementaciju jer nudi vrlo malo funkcionalnosti u usporedbi s drugim OLAP sustavima. |
Web OLAP (WOLAP) | Web OLAP koji je OLAP sustav kojem se pristupa putem web preglednika. WOLAP je troslojna arhitektura. Sastoji se od tri komponente: klijenta, međuprograma i poslužitelja baze podataka. |
Mobilni OLAP: | Mobilni OLAP pomaže korisnicima da pristupe i analiziraju OLAP podatke koristeći svoje mobilne uređaje |
Prostorni OLAP: | SOLAP je stvoren kako bi olakšao upravljanje prostornim i neprostornim podacima u Geografskom informacijskom sustavu (GIS) |
ROLAP
ROLAP radi s podacima koji postoje u relacijskoj bazi podataka. Činjenice i tablice dimenzija pohranjuju se kao relacijske tablice. Također omogućuje višedimenzionalnu analizu podataka i najbrže je rastući OLAP.
Prednosti ROLAP modela:
- Visoka podatkovna učinkovitost. Nudi visoku podatkovnu učinkovitost jer su izvedba upita i pristupni jezik optimizirani posebno za višedimenzionalnu analizu podataka.
- Skalabilnost. Ova vrsta OLAP sustava nudi skalabilnost za upravljanje velikim količinama podataka, čak i kada podaci stalno rastu.
Nedostaci ROLAP modela:
- Potražnja za većim resursima: ROLAP zahtijeva visoku iskorištenost radne snage, softverskih i hardverskih resursa.
- Ograničenja skupnih podataka. Korištenje ROLAP alata SQL za sve izračune zbirnih podataka. Međutim, nema postavljenih ograničenja za rukovanje izračunima.
- Spora izvedba upita. Izvedba upita u ovom modelu je spora u usporedbi s MOLAP-om
MOLAP
MOLAP koristi višedimenzionalne mehanizme za pohranu temeljene na nizu za prikaz višedimenzionalnih prikaza podataka. U osnovi, koriste OLAP kocku.
Saznajte više o MOLAP-u ovdje
Hibridni OLAP
Hibridni OLAP je mješavina ROLAP-a i MOLAP-a. Nudi brzo izračunavanje MOLAP-a i veću skalabilnost ROLAP-a. HOLAP koristi dvije baze podataka.
- Skupni ili izračunati podaci pohranjuju se u višedimenzionalnu OLAP kocku
- Detaljne informacije pohranjuju se u relacijsku bazu podataka.
Prednosti hibridnog OLAP-a:
- Ova vrsta OLAP-a pomaže u štednji prostora na disku, a također ostaje kompaktan što pomaže u izbjegavanju problema povezanih s brzinom pristupa i praktičnošću.
- Hibridni HOLAP koristi tehnologiju kocke koja omogućuje brže performanse za sve vrste podataka.
- ROLAP se trenutačno ažurira, a HOLAP korisnici imaju pristup ovim podacima koji se trenutno ažuriraju u stvarnom vremenu. MOLAP donosi čišćenje i konverziju podataka čime se poboljšava relevantnost podataka. Ovo donosi najbolje od oba svijeta.
Nedostaci hibridnog OLAP-a:
- Veća razina složenosti: Glavni nedostatak HOLAP sustava je da podržava i ROLAP i MOLAP alate i aplikacije. Dakle, vrlo je komplicirano.
- Moguća preklapanja: Veće su šanse za preklapanje, posebno u njihovim funkcionalnostima.
Prednosti OLAP-a
- OLAP je platforma za sve vrste poslovanja uključujući planiranje, proračun, izvješćivanje i analizu.
- Informacije i izračuni dosljedni su u OLAP kocki. Ovo je ključna korist.
- Brzo izradite i analizirajte scenarije "Što ako".
- Jednostavno pretražite OLAP bazu podataka za široke ili specifične pojmove.
- OLAP pruža građevne blokove za alate za poslovno modeliranje, alate za rudarenje podataka, alate za izvješćivanje o izvedbi.
- Omogućuje korisnicima izradu podataka o rezanju i kockicama prema različitim dimenzijama, mjerama i filtrima.
- Dobar je za analizu vremenskih serija.
- Pronalaženje nekih klastera i outliera jednostavno je uz OLAP.
- To je moćan vizualizacijski online analitički procesni sustav koji pruža brže vrijeme odziva
Nedostaci OLAP-a
- OLAP zahtijeva organiziranje podataka u shemu zvijezda ili pahuljica. Ove sheme su komplicirane za implementaciju i administraciju
- Ne možete imati veliki broj dimenzija u jednoj OLAP kocki
- Transakcijskim podacima nije moguće pristupiti putem OLAP sustava.
- Svaka izmjena u OLAP kocki zahtijeva potpuno ažuriranje kocke. Ovo je dugotrajan proces
rezime
- OLAP in skladište podataka je tehnologija koja analitičarima omogućuje izdvajanje i pregled poslovnih podataka s različitih točaka gledišta.
- Srž OLAP koncepta je OLAP kocka.
- Razne poslovne aplikacije i druge operacije podataka zahtijevaju korištenje OLAP Cubea.
- Postoji pet primarnih tipova analitičkih OLAP operacija u skladištu podataka: 1) Roll-up 2) Drill-down 3) Slice 4) Dice i 5) Pivot
- Tri tipa naširoko korištenih OLAP sustava su MOLAP, ROLAP i hibridni OLAP.
- Desktop OLAP, Web OLAP i Mobile OLAP neke su druge vrste OLAP sustava.