Qu’est-ce qu’OLAP ? Cube, opérations analytiques dans l'entrepôt de données

Qu'est-ce qu'OLAP ?

Traitement analytique en ligne (OLAP) est une catégorie de logiciels qui permet aux utilisateurs d'analyser les informations de plusieurs systèmes de bases de données en même temps. Il s'agit d'une technologie qui permet aux analystes d'extraire et de visualiser des données commerciales sous différents points de vue.

Les analystes doivent fréquemment regrouper, agréger et joindre des données. Ces opérations OLAP dans l'exploration de données sont gourmandes en ressources. Avec OLAP, les données peuvent être pré-calculées et pré-agrégées, ce qui accélère l'analyse.

Les bases de données OLAP sont divisées en un ou plusieurs cubes. Les cubes sont conçus de telle manière que créer et vivrewing les rapports deviennent faciles. OLAP signifie Traitement analytique en ligne.

Cube OLAP

Cube OLAP
Cube OLAP

Au cœur du concept OLAP se trouve un cube OLAP. Le cube OLAP est une structure de données optimisée pour des opérations très rapides l'analyse des données.

Le cube OLAP se compose de faits numériques appelés mesures qui sont classés par dimensions. OLAP Cube est également appelé le hypercube.

Habituellement, les opérations et l’analyse des données sont effectuées à l’aide d’une simple feuille de calcul, où les valeurs des données sont organisées au format ligne et colonne. C’est idéal pour les données bidimensionnelles. Cependant, OLAP contient des données multidimensionnelles, généralement obtenues à partir d'une source différente et sans rapport. L'utilisation d'une feuille de calcul n'est pas une option optimale. Le cube peut stocker et analyser des données multidimensionnelles de manière logique et ordonnée.

Comment cela fonctionne ? 

Un entrepôt de données extrairait des informations de plusieurs sources et formats de données tels que des fichiers texte, une feuille Excel, des fichiers multimédias, etc.

Les données extraites sont nettoyées et transformées. Les données sont chargées dans un serveur OLAP (ou cube OLAP) où les informations sont pré-calculées à l'avance pour une analyse plus approfondie.

Opérations analytiques de base d’OLAP

Quatre types d'opérations analytiques OLAP sont :

  1. Enroulement
  2. Explorer
  3. Émincer
  4. Pivoter (faire pivoter)

1) Enroulage :

Le roll-up est également appelé « consolidation » ou « agrégation ». L'opération Roll-up peut être effectuée de 2 manières

  1. Réduire les dimensions
  2. Grimper dans la hiérarchie des concepts. La hiérarchie des concepts est un système de regroupement d'éléments en fonction de leur ordre ou de leur niveau.

Considérez ce qui suitwing diagramme

Opération de cumul dans OLAP
Opération de cumul dans OLAP
  • Dans cet exemple, les villes du New Jersey et de Lost Angles sont regroupées dans le pays des États-Unis.
  • Les chiffres de ventes du New Jersey et de Los Angeles sont respectivement de 440 et 1560 2000. Ils deviennent après roll-up
  • Dans ce processus d'agrégation, les données progressent dans la hiérarchie de localisation de la ville au pays.
  • Lors du processus de cumul, au moins une ou plusieurs dimensions doivent être supprimées. Dans cet exemple, la dimension Villes est supprimée.

2) Exploration vers le bas

Dans l'analyse approfondie, les données sont fragmentées en parties plus petites. C'est l'opposé du processus de cumul. Cela peut être fait via

  • Descendre dans la hiérarchie des concepts
  • Augmenter une dimension
Opération d'exploration dans OLAP
Opération d'exploration dans OLAP

Considérez le schéma ci-dessus

  • Le premier trimestre est détaillé jusqu'aux mois de janvier, février et mars. Les ventes correspondantes sont également des registres.
  • Dans cet exemple, les mois de dimension sont ajoutés.

3) Tranche :

Ici, une dimension est sélectionnée et un nouveau sous-cube est créé.

Following Le diagramme explique comment l'opération de tranche est effectuée :

Opération de tranche dans OLAP
Opération de tranche dans OLAP
  • Le temps de dimension est découpé avec Q1 comme filtre.
  • Un nouveau cube est complètement créé.

dit-il:

Cette opération est similaire à une tranche. La différence entre les dés est que vous sélectionnez 2 dimensions ou plus qui aboutissent à la création d'un sous-cube.

Opération de dés dans OLAP
Opération de dés dans OLAP

4) Pivoter

Dans Pivot, vous faites pivoter les axes de données pour fournir une présentation de substitution des données.

Dans la suitewing Par exemple, le pivot est basé sur les types d'éléments.

Opération de pivotement dans OLAP
Opération de pivotement dans OLAP

Types de systèmes OLAP

OLAP iciarchiStructure cal

Types de systèmes OLAP
Types de systèmes OLAP
Type d'OLAP Explication
OLAP relationnel(ROLAP) : ROLAP est un SGBDR étendu avec mappage de données multidimensionnel pour effectuer l'opération relationnelle standard.
OLAP multidimensionnel (MOLAP) MOLAP Implémente une opération dans des données multidimensionnelles.
Traitement analytique en ligne hybride (HOLAP) Dans l'approche HOLAP, les totaux agrégés sont stockés dans une base de données multidimensionnelle tandis que les données détaillées sont stockées dans la base de données relationnelle. Cela offre à la fois l'efficacité des données du modèle ROLAP et les performances du modèle MOLAP.
Bureau OLAP (DOLAP) Dans Desktop OLAP, un utilisateur télécharge une partie des données de la base de données localement ou sur son bureau et les analyse.

DOLAP est relativement moins cher à déployer car il offre très peu de fonctionnalités.ares à d’autres systèmes OLAP.

WebOLAP (WOLAP) Web OLAP qui est le système OLAP accessible via le navigateur Web. WOLAP est un système à trois niveaux architecture. Il se compose de trois composants : un client, un middleware et un serveur de base de données.
OLAP mobile : Mobile OLAP aide les utilisateurs à accéder et à analyser les données OLAP à l'aide de leurs appareils mobiles
OLAP spatial : SOLAP est créé pour faciliter la gestion des données spatiales et non spatiales dans un système d'information géographique (SIG).

ROLAP

ROLAP fonctionne avec des données qui existent dans une base de données relationnelle. Les tableaux de faits et de dimensions sont stockés sous forme de tableaux relationnels. Il permet également une analyse multidimensionnelle des données et constitue le développement le plus rapide.wing OLAP.

Avantages du modèle ROLAP :

  • Haute efficacité des données. Il offre une efficacité élevée des données car les performances des requêtes et le langage d'accès sont optimisés en particulier pour l'analyse des données multidimensionnelles.
  • Évolutivité Ce type de système OLAP offre une évolutivité pour gérer de gros volumes de données, et même lorsque les données augmentent régulièrement.

Inconvénients du modèle ROLAP :

  • Demande de ressources plus élevées : ROLAP nécessite une utilisation élevée des ressources humaines, logicielles et matérielles.
  • Limites globales des données. Utilisation des outils ROLAP SQL pour tout calcul de données agrégées. Cependant, il n’y a pas de limites définies à la gestion des calculs.
  • Performances de requête lentes. Les performances des requêtes dans ce modèle sont lentes par rapport à MOLAP

MOLAP

MOLAP utilise des moteurs de stockage multidimensionnels basés sur des tableaux pour afficher des vues multidimensionnelles des données. Fondamentalement, ils utilisent un cube OLAP.

En savoir plus sur MOLAP ici

OLAP hybride

L'OLAP hybride est un mélange de ROLAP et de MOLAP. Il offre un calcul rapide de MOLAP et une évolutivité plus élevée de ROLAP. HOLAP utilise deux bases de données.

  1. Les données agrégées ou calculées sont stockées dans un cube OLAP multidimensionnel
  2. Les informations détaillées sont stockées dans une base de données relationnelle.

Avantages de l'OLAP hybride :

  • Ce type d'OLAP permet d'économiser de l'espace disque et reste également compact, ce qui permet d'éviter les problèmes liés à la vitesse d'accès et à la commodité.
  • Hybrid HOLAP utilise la technologie cube qui permet des performances plus rapides pour tous les types de données.
  • ROLAP est instantanément mis à jour et les utilisateurs HOLAP ont accès à ces données mises à jour instantanément en temps réel. MOLAP apporte le nettoyage et la conversion des données, améliorant ainsi la pertinence des données. Cela apporte le meilleur des deux mondes.

Inconvénients de l'OLAP hybride :

  • Une plus grande complexniveau de ville: L'inconvénient majeur des systèmes HOLAP est qu'ils prennent en charge les outils et applications ROLAP et MOLAP. C’est donc très compliqué.
  • Chevauchements potentiels: Il y a plus de chances de se chevaucher, notamment dans leurs fonctionnalités.

Avantages d'OLAP

  • OLAP est une plate-forme pour tout type d'entreprise, y compris la planification, la budgétisation, le reporting et l'analyse.
  • Les informations et les calculs sont cohérents dans un cube OLAP. Il s’agit d’un avantage crucial.
  • Créez et analysez rapidement des scénarios « Et si »
  • Recherchez facilement dans la base de données OLAP des termes généraux ou spécifiques.
  • OLAP fournit les éléments de base des outils de modélisation commerciale, des outils d'exploration de données et des outils de reporting de performances.
  • Permet aux utilisateurs de découper et de découper des données en cubes selon différentes dimensions, mesures et filtres.
  • C'est bon pour analyser des séries chronologiques.
  • Trouver des clusters et des valeurs aberrantes est facile avec OLAP.
  • Il s'agit d'un puissant système de visualisation en ligne du processus analytique qui offre des temps de réponse plus rapides.

Inconvénients d'OLAP

  • OLAP nécessite d'organiser les données dans un schéma en étoile ou en flocon de neige. Ces schémas sont compliqués à mettre en œuvre et à administrer
  • Vous ne pouvez pas avoir un grand nombre de dimensions dans un seul cube OLAP
  • Les données transactionnelles ne sont pas accessibles avec le système OLAP.
  • Toute modification dans un cube OLAP nécessite une mise à jour complète du cube. C'est un processus qui prend du temps

Résumé

  • OLAP dans entrepôt de données est une technologie qui permet aux analystes d'extraire et de visualiser des données commerciales sous différents points de vue.
  • Au cœur du concept OLAP se trouve un cube OLAP.
  • Diverses applications métiers et autres opérations de données nécessitent l'utilisation d'OLAP Cube.
  • Il existe cinq principaux types d'opérations analytiques OLAP dans l'entrepôt de données : 1) Roll-up 2) Drill-down 3) Slice 4) Dés et 5) Pivot
  • Trois types de systèmes OLAP largement utilisés sont MOLAP, ROLAP et Hybrid OLAP.
  • Desktop OLAP, Web OLAP et Mobile OLAP sont d'autres types de systèmes OLAP.