Cos'è l'OLAP? Cubo, analitico Operazioni nel Data Warehouse
Cos'è l'OLAP?
Elaborazione analitica in linea (OLAP) è una categoria di software che consente agli utenti di analizzare informazioni da più sistemi di database contemporaneamente. È una tecnologia che consente agli analisti di estrarre e visualizzare i dati aziendali da diversi punti di vista.
Gli analisti hanno spesso bisogno di raggruppare, aggregare e unire i dati. Queste operazioni OLAP nel data mining richiedono molte risorse. Con OLAP i dati possono essere precalcolati e preaggregati, rendendo l'analisi più rapida.
I database OLAP sono divisi in uno o più cubi. I cubi sono progettati in modo tale che creare e visualizzare report diventi facile. OLAP sta per Online Analytical Processing.
Cubo OLAP

Al centro del concetto OLAP c'è un cubo OLAP. Il cubo OLAP è una struttura dati ottimizzata per operazioni molto veloci analisi dei dati.
Il cubo OLAP è costituito da fatti numerici chiamati misure, classificati in base alle dimensioni. Il cubo OLAP è anche chiamato ipercubo.
Di solito, le operazioni e le analisi sui dati vengono eseguite utilizzando un semplice foglio di calcolo, in cui i valori dei dati sono disposti in formato riga e colonna. Questo è l'ideale per i dati bidimensionali. Tuttavia, OLAP contiene dati multidimensionali, con dati solitamente ottenuti da una fonte diversa e non correlata. L'uso di un foglio di calcolo non è un'opzione ottimale. Il cubo può archiviare e analizzare dati multidimensionali in modo logico e ordinato.
Come funziona?
Un data warehouse estrarrebbe informazioni da più origini dati e formati come file di testo, fogli Excel, file multimediali, ecc.
I dati estratti vengono puliti e trasformati. I dati vengono caricati in un server OLAP (o cubo OLAP) dove le informazioni vengono precalcolate in anticipo per ulteriori analisi.
Operazioni analitiche di base di OLAP
Quattro tipi di operazioni OLAP analitiche sono:
- arrotolare
- Scavare a fondo
- Fare a pezzi
- Perno (ruotare)
1) Arrotolare:
Il roll-up è noto anche come “consolidamento” o “aggregazione”. L'operazione di avvolgimento può essere eseguita in 2 modi
- Riduzione delle dimensioni
- Scalare la gerarchia dei concetti. La gerarchia dei concetti è un sistema di raggruppamento delle cose in base al loro ordine o livello.
Considerare il seguente diagramma
- In questo esempio, le città del New Jersey e Lost Angles vengono raggruppate nel paese degli Stati Uniti
- Le cifre di vendita del New Jersey e di Los Angeles sono rispettivamente 440 e 1560. Diventano 2000 dopo il roll-up
- In questo processo di aggregazione, i dati corrispondono alla gerarchia delle posizioni che si sposta dalla città al paese.
- Nel processo di roll-up è necessario rimuovere almeno una o più dimensioni. In questo esempio, la dimensione Città viene rimossa.
2) Approfondimento
Nel drill-down i dati vengono frammentati in parti più piccole. È l'opposto del processo di rollup. Può essere fatto tramite
- Scendendo nella gerarchia dei concetti
- Aumentare una dimensione
Considera il diagramma sopra
- Il primo trimestre è suddiviso nei mesi di gennaio, febbraio e marzo. Anche le vendite corrispondenti sono registri.
- In questo esempio vengono aggiunti i mesi della dimensione.
3) Fetta:
Qui viene selezionata una dimensione e viene creato un nuovo sottocubo.
Il diagramma seguente spiega come viene eseguita l'operazione di slice:
- La dimensione temporale viene suddivisa con Q1 come filtro.
- Viene creato completamente un nuovo cubo.
egli dice:
Questa operazione è simile ad una fetta. La differenza nei dadi è che selezioni 2 o più dimensioni che danno come risultato la creazione di un sottocubo.
4) Perno
In Pivot si ruotano gli assi dei dati per fornire una presentazione sostitutiva dei dati.
Nell'esempio seguente, il pivot si basa sui tipi di elemento.
Tipi di sistemi OLAP
Struttura gerarchica OLAP
Tipo di OLAP | Spiegazione |
---|---|
OLAP relazionale(ROLAP): | ROLAP è un RDBMS esteso insieme alla mappatura dei dati multidimensionali per eseguire l'operazione relazionale standard. |
OLAP multidimensionale (MOLAP) | MOLAP Implementa l'operazione in dati multidimensionali. |
Elaborazione analitica online ibrida (HOLAP) | Nell'approccio HOLAP i totali aggregati vengono archiviati in un database multidimensionale mentre i dati dettagliati sono archiviati nel database relazionale. Ciò offre sia l'efficienza dei dati del modello ROLAP che le prestazioni del modello MOLAP. |
Desktop OLAP (DOLAP) | In Desktop OLAP, un utente scarica una parte dei dati dal database localmente o sul proprio desktop e li analizza.
DOLAP è relativamente più economico da implementare poiché offre pochissime funzionalità rispetto ad altri sistemi OLAP. |
WebOLAP (WOLAP) | Web OLAP, ovvero un sistema OLAP accessibile tramite browser web. WOLAP è un'architettura a tre livelli. È composta da tre componenti: client, middleware e un server di database. |
OLAP mobile: | Mobile OLAP aiuta gli utenti ad accedere e analizzare i dati OLAP utilizzando i propri dispositivi mobili |
OLAP spaziale: | SOLAP è stato creato per facilitare la gestione dei dati spaziali e non spaziali in un sistema di informazione geografica (GIS) |
ROLA
ROLAP lavora con dati che esistono in un database relazionale. I fatti e le tabelle dimensionali sono archiviati come tabelle relazionali. Consente inoltre l'analisi multidimensionale dei dati ed è l'OLAP in più rapida crescita.
Vantaggi del modello ROLAP:
- Elevata efficienza dei dati. Offre un'elevata efficienza dei dati perché le prestazioni delle query e il linguaggio di accesso sono ottimizzati in particolare per l'analisi dei dati multidimensionali.
- Scalabilità. Questo tipo di sistema OLAP offre scalabilità per la gestione di grandi volumi di dati e anche quando i dati sono in costante aumento.
Svantaggi del modello ROLAP:
- Domanda di maggiori risorse: ROLAP necessita di un elevato utilizzo di risorse umane, software e hardware.
- Limitazioni dei dati aggregati. Utilizzo degli strumenti ROLAP SQL per tutti i calcoli dei dati aggregati. Tuttavia, non ci sono limiti stabiliti per la gestione dei calcoli.
- Prestazioni lente delle query. Le prestazioni delle query in questo modello sono lente rispetto a MOLAP
MOLAPA
MOLAP utilizza motori di archiviazione multidimensionali basati su array per visualizzare visualizzazioni multidimensionali dei dati. Fondamentalmente, usano un cubo OLAP.
Ulteriori informazioni su MOLAP qui
OLAP ibrido
OLAP ibrido è una miscela di ROLAP e MOLAP. Offre un calcolo veloce di MOLAP e una maggiore scalabilità di ROLAP. HOLAP utilizza due database.
- I dati aggregati o calcolati vengono archiviati in un cubo OLAP multidimensionale
- Le informazioni dettagliate sono archiviate in un database relazionale.
Vantaggi dell'OLAP ibrido:
- Questo tipo di OLAP aiuta a risparmiare lo spazio su disco e rimane anche compatto, il che aiuta a evitare problemi legati alla velocità e alla comodità di accesso.
- L'HOLAP ibrido utilizza la tecnologia cubica che consente prestazioni più veloci per tutti i tipi di dati.
- I ROLAP vengono aggiornati istantaneamente e gli utenti HOLAP hanno accesso a questi dati aggiornati istantaneamente in tempo reale. MOLAP consente la pulizia e la conversione dei dati, migliorando così la pertinenza dei dati. Questo porta il meglio di entrambi i mondi.
Svantaggi dell'OLAP ibrido:
- Maggiore livello di complessità: Lo svantaggio principale dei sistemi HOLAP è che supporta strumenti e applicazioni sia ROLAP che MOLAP. Quindi è molto complicato.
- Potenziali sovrapposizioni: Ci sono maggiori possibilità di sovrapposizione soprattutto nelle loro funzionalità.
Vantaggi dell'OLAP
- OLAP è una piattaforma per tutti i tipi di attività che include pianificazione, budget, reporting e analisi.
- Le informazioni e i calcoli sono coerenti in un cubo OLAP. Questo è un vantaggio cruciale.
- Crea e analizza rapidamente scenari "What if".
- Cerca facilmente nel database OLAP termini generici o specifici.
- OLAP fornisce gli elementi costitutivi per strumenti di modellazione aziendale, strumenti di data mining e strumenti di reporting delle prestazioni.
- Consente agli utenti di suddividere e dividere i dati del cubo in base a varie dimensioni, misure e filtri.
- È utile per analizzare le serie temporali.
- Trovare alcuni cluster e valori anomali è facile con OLAP.
- È un potente sistema di processo analitico di visualizzazione online che fornisce tempi di risposta più rapidi
Svantaggi dell'OLAP
- OLAP richiede l'organizzazione dei dati in uno schema a stella o a fiocco di neve. Questi schemi sono complicati da implementare e amministrare
- Non è possibile avere un numero elevato di dimensioni in un singolo cubo OLAP
- Non è possibile accedere ai dati transazionali con il sistema OLAP.
- Qualsiasi modifica in un cubo OLAP richiede un aggiornamento completo del cubo. Questo è un processo che richiede tempo
Sommario
- OLAP inserito data warehouse è una tecnologia che consente agli analisti di estrarre e visualizzare i dati aziendali da diversi punti di vista.
- Al centro del concetto OLAP c'è un cubo OLAP.
- Varie applicazioni aziendali e altre operazioni sui dati richiedono l'utilizzo di OLAP Cube.
- Esistono cinque tipi principali di operazioni OLAP analitiche nel data warehouse: 1) Roll-up 2) Drill-down 3) Slice 4) Dice e 5) Pivot
- Tre tipi di sistemi OLAP ampiamente utilizzati sono MOLAP, ROLAP e OLAP ibrido.
- Desktop OLAP, Web OLAP e Mobile OLAP sono altri tipi di sistemi OLAP.