Cos'è l'OLAP? Cubo, analitico Operazioni nel Data Warehouse

Cos'è l'OLAP?

Elaborazione analitica in linea (OLAP) è una categoria di software che consente agli utenti di analizzare informazioni da più sistemi di database contemporaneamente. È una tecnologia che consente agli analisti di estrarre e visualizzare i dati aziendali da diversi punti di vista.

Gli analisti hanno spesso bisogno di raggruppare, aggregare e unire i dati. Queste operazioni OLAP nel data mining richiedono molte risorse. Con OLAP i dati possono essere precalcolati e preaggregati, rendendo l'analisi più rapida.

I database OLAP sono divisi in uno o più cubi. I cubi sono progettati in modo tale che creare e visualizzare report diventi facile. OLAP sta per Online Analytical Processing.

Cubo OLAP

Cubo OLAP
Cubo OLAP

Al centro del concetto OLAP c'è un cubo OLAP. Il cubo OLAP è una struttura dati ottimizzata per operazioni molto veloci analisi dei dati.

Il cubo OLAP è costituito da fatti numerici chiamati misure, classificati in base alle dimensioni. Il cubo OLAP è anche chiamato ipercubo.

Di solito, le operazioni e le analisi sui dati vengono eseguite utilizzando un semplice foglio di calcolo, in cui i valori dei dati sono disposti in formato riga e colonna. Questo è l'ideale per i dati bidimensionali. Tuttavia, OLAP contiene dati multidimensionali, con dati solitamente ottenuti da una fonte diversa e non correlata. L'uso di un foglio di calcolo non è un'opzione ottimale. Il cubo può archiviare e analizzare dati multidimensionali in modo logico e ordinato.

Come funziona?

Un data warehouse estrarrebbe informazioni da più origini dati e formati come file di testo, fogli Excel, file multimediali, ecc.

I dati estratti vengono puliti e trasformati. I dati vengono caricati in un server OLAP (o cubo OLAP) dove le informazioni vengono precalcolate in anticipo per ulteriori analisi.

Operazioni analitiche di base di OLAP

Quattro tipi di operazioni OLAP analitiche sono:

  1. arrotolare
  2. Scavare a fondo
  3. Fare a pezzi
  4. Perno (ruotare)

1) Arrotolare:

Il roll-up è noto anche come “consolidamento” o “aggregazione”. L'operazione di avvolgimento può essere eseguita in 2 modi

  1. Riduzione delle dimensioni
  2. Scalare la gerarchia dei concetti. La gerarchia dei concetti è un sistema di raggruppamento delle cose in base al loro ordine o livello.

Considerare il seguente diagramma

Operazione di roll-up in OLAP
Operazione di roll-up in OLAP
  • In questo esempio, le città del New Jersey e Lost Angles vengono raggruppate nel paese degli Stati Uniti
  • Le cifre di vendita del New Jersey e di Los Angeles sono rispettivamente 440 e 1560. Diventano 2000 dopo il roll-up
  • In questo processo di aggregazione, i dati corrispondono alla gerarchia delle posizioni che si sposta dalla città al paese.
  • Nel processo di roll-up è necessario rimuovere almeno una o più dimensioni. In questo esempio, la dimensione Città viene rimossa.

2) Approfondimento

Nel drill-down i dati vengono frammentati in parti più piccole. È l'opposto del processo di rollup. Può essere fatto tramite

  • Scendendo nella gerarchia dei concetti
  • Aumentare una dimensione
Operazione di drill-down in OLAP
Operazione di drill-down in OLAP

Considera il diagramma sopra

  • Il primo trimestre è suddiviso nei mesi di gennaio, febbraio e marzo. Anche le vendite corrispondenti sono registri.
  • In questo esempio vengono aggiunti i mesi della dimensione.

3) Fetta:

Qui viene selezionata una dimensione e viene creato un nuovo sottocubo.

Il diagramma seguente spiega come viene eseguita l'operazione di slice:

Operazione di suddivisione in OLAP
Operazione di suddivisione in OLAP
  • La dimensione temporale viene suddivisa con Q1 come filtro.
  • Viene creato completamente un nuovo cubo.

egli dice:

Questa operazione è simile ad una fetta. La differenza nei dadi è che selezioni 2 o più dimensioni che danno come risultato la creazione di un sottocubo.

Operazione dei dadi in OLAP
Operazione dei dadi in OLAP

4) Perno

In Pivot si ruotano gli assi dei dati per fornire una presentazione sostitutiva dei dati.

Nell'esempio seguente, il pivot si basa sui tipi di elemento.

Operazione pivot in OLAP
Operazione pivot in OLAP

Tipi di sistemi OLAP

Struttura gerarchica OLAP

Tipi di sistemi OLAP
Tipi di sistemi OLAP
Tipo di OLAP Spiegazione
OLAP relazionale(ROLAP): ROLAP è un RDBMS esteso insieme alla mappatura dei dati multidimensionali per eseguire l'operazione relazionale standard.
OLAP multidimensionale (MOLAP) MOLAP Implementa l'operazione in dati multidimensionali.
Elaborazione analitica online ibrida (HOLAP) Nell'approccio HOLAP i totali aggregati vengono archiviati in un database multidimensionale mentre i dati dettagliati sono archiviati nel database relazionale. Ciò offre sia l'efficienza dei dati del modello ROLAP che le prestazioni del modello MOLAP.
Desktop OLAP (DOLAP) In Desktop OLAP, un utente scarica una parte dei dati dal database localmente o sul proprio desktop e li analizza.

DOLAP è relativamente più economico da implementare poiché offre pochissime funzionalità rispetto ad altri sistemi OLAP.

WebOLAP (WOLAP) Web OLAP, ovvero un sistema OLAP accessibile tramite browser web. WOLAP è un'architettura a tre livelli. È composta da tre componenti: client, middleware e un server di database.
OLAP mobile: Mobile OLAP aiuta gli utenti ad accedere e analizzare i dati OLAP utilizzando i propri dispositivi mobili
OLAP spaziale: SOLAP è stato creato per facilitare la gestione dei dati spaziali e non spaziali in un sistema di informazione geografica (GIS)

ROLA

ROLAP lavora con dati che esistono in un database relazionale. I fatti e le tabelle dimensionali sono archiviati come tabelle relazionali. Consente inoltre l'analisi multidimensionale dei dati ed è l'OLAP in più rapida crescita.

Vantaggi del modello ROLAP:

  • Elevata efficienza dei dati. Offre un'elevata efficienza dei dati perché le prestazioni delle query e il linguaggio di accesso sono ottimizzati in particolare per l'analisi dei dati multidimensionali.
  • Scalabilità. Questo tipo di sistema OLAP offre scalabilità per la gestione di grandi volumi di dati e anche quando i dati sono in costante aumento.

Svantaggi del modello ROLAP:

  • Domanda di maggiori risorse: ROLAP necessita di un elevato utilizzo di risorse umane, software e hardware.
  • Limitazioni dei dati aggregati. Utilizzo degli strumenti ROLAP SQL per tutti i calcoli dei dati aggregati. Tuttavia, non ci sono limiti stabiliti per la gestione dei calcoli.
  • Prestazioni lente delle query. Le prestazioni delle query in questo modello sono lente rispetto a MOLAP

MOLAPA

MOLAP utilizza motori di archiviazione multidimensionali basati su array per visualizzare visualizzazioni multidimensionali dei dati. Fondamentalmente, usano un cubo OLAP.

Ulteriori informazioni su MOLAP qui

OLAP ibrido

OLAP ibrido è una miscela di ROLAP e MOLAP. Offre un calcolo veloce di MOLAP e una maggiore scalabilità di ROLAP. HOLAP utilizza due database.

  1. I dati aggregati o calcolati vengono archiviati in un cubo OLAP multidimensionale
  2. Le informazioni dettagliate sono archiviate in un database relazionale.

Vantaggi dell'OLAP ibrido:

  • Questo tipo di OLAP aiuta a risparmiare lo spazio su disco e rimane anche compatto, il che aiuta a evitare problemi legati alla velocità e alla comodità di accesso.
  • L'HOLAP ibrido utilizza la tecnologia cubica che consente prestazioni più veloci per tutti i tipi di dati.
  • I ROLAP vengono aggiornati istantaneamente e gli utenti HOLAP hanno accesso a questi dati aggiornati istantaneamente in tempo reale. MOLAP consente la pulizia e la conversione dei dati, migliorando così la pertinenza dei dati. Questo porta il meglio di entrambi i mondi.

Svantaggi dell'OLAP ibrido:

  • Maggiore livello di complessità: Lo svantaggio principale dei sistemi HOLAP è che supporta strumenti e applicazioni sia ROLAP che MOLAP. Quindi è molto complicato.
  • Potenziali sovrapposizioni: Ci sono maggiori possibilità di sovrapposizione soprattutto nelle loro funzionalità.

Vantaggi dell'OLAP

  • OLAP è una piattaforma per tutti i tipi di attività che include pianificazione, budget, reporting e analisi.
  • Le informazioni e i calcoli sono coerenti in un cubo OLAP. Questo è un vantaggio cruciale.
  • Crea e analizza rapidamente scenari "What if".
  • Cerca facilmente nel database OLAP termini generici o specifici.
  • OLAP fornisce gli elementi costitutivi per strumenti di modellazione aziendale, strumenti di data mining e strumenti di reporting delle prestazioni.
  • Consente agli utenti di suddividere e dividere i dati del cubo in base a varie dimensioni, misure e filtri.
  • È utile per analizzare le serie temporali.
  • Trovare alcuni cluster e valori anomali è facile con OLAP.
  • È un potente sistema di processo analitico di visualizzazione online che fornisce tempi di risposta più rapidi

Svantaggi dell'OLAP

  • OLAP richiede l'organizzazione dei dati in uno schema a stella o a fiocco di neve. Questi schemi sono complicati da implementare e amministrare
  • Non è possibile avere un numero elevato di dimensioni in un singolo cubo OLAP
  • Non è possibile accedere ai dati transazionali con il sistema OLAP.
  • Qualsiasi modifica in un cubo OLAP richiede un aggiornamento completo del cubo. Questo è un processo che richiede tempo

Sommario

  • OLAP inserito data warehouse è una tecnologia che consente agli analisti di estrarre e visualizzare i dati aziendali da diversi punti di vista.
  • Al centro del concetto OLAP c'è un cubo OLAP.
  • Varie applicazioni aziendali e altre operazioni sui dati richiedono l'utilizzo di OLAP Cube.
  • Esistono cinque tipi principali di operazioni OLAP analitiche nel data warehouse: 1) Roll-up 2) Drill-down 3) Slice 4) Dice e 5) Pivot
  • Tre tipi di sistemi OLAP ampiamente utilizzati sono MOLAP, ROLAP e OLAP ibrido.
  • Desktop OLAP, Web OLAP e Mobile OLAP sono altri tipi di sistemi OLAP.