Qu'est-ce que le schéma en étoile dans la modélisation d'un entrepôt de données ?

Qu'est-ce qu'un schéma en étoile ?

Schéma en étoile dans l'entrepôt de données, est un schéma dans lequel le centre de l'étoile peut avoir une table de faits et un certain nombre de tables de dimensions associées. Il est connu sous le nom de schéma en étoile car sa structure ressemble à une étoile. Le modèle de données Star Schema est le type le plus simple de schéma Data Warehouse. Il est également connu sous le nom de Star Join Schema et est optimisé pour interroger de grands ensembles de données.

Qu’est-ce qu’un schéma multidimensionnel ?

Schéma multidimensionnel est spécialement conçu pour modéliser les systèmes d’entrepôt de données. Les schémas sont conçus pour répondre aux besoins uniques des très grandes bases de données conçues à des fins analytiques (OLAP).

Types de schéma d'entrepôt de données :

Voici trois principaux types de schémas multidimensionnels, chacun ayant ses avantages uniques.

Exemple de modélisation de données de schéma en étoile

Dans l'exemple de schéma en étoile suivant, la table de faits se trouve au centre et contient les clés de chaque table de dimension comme Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID et d'autres attributs tels que les unités vendues et les revenus.

Modélisation des données du schéma en étoile
Exemple de diagramme de schéma en étoile

Tableaux de faits

Une table de faits dans un schéma en étoile contient des faits et est connectée à des dimensions. Une table de faits comporte deux types de colonnes :

  • Une colonne qui comprend des faits
  • Clé étrangère du tableau des dimensions

Généralement, la clé primaire d'une table de faits est une clé composite composée de toutes les clés étrangères qui composent la table.

Les tables de faits peuvent contenir des faits de niveau détail ou des faits agrégés. Les tableaux de faits qui incluent des faits agrégés sont souvent appelés tableaux récapitulatifs. Les tableaux de faits contiennent généralement des faits qui ont été agrégés à un certain niveau.

Tables de dimensions

Une dimension est une architecture qui catégorise les données dans une hiérarchie. Une dimension sans hiérarchies ni niveaux est appelée dimension plate ou liste. La clé primaire de chaque table de dimensions fait partie de la clé primaire composite de la table de faits. Un attribut de dimension est un attribut textuel descriptif qui permet de décrire une valeur dimensionnelle. Les tables de faits sont généralement plus grandes que les tables de dimensions.

Caractéristiques du schéma en étoile

  • Chaque dimension d'un schéma en étoile est représentée par le seul tableau à une dimension.
  • La table de dimensions doit contenir l'ensemble des attributs.
  • La table de dimensions est jointe à la table de faits à l'aide d'une clé étrangère
  • Les tables de dimensions ne sont pas jointes les unes aux autres
  • La table de faits contiendrait la clé et la mesure
  • Le schéma Star est facile à comprendre et permet une utilisation optimale du disque.
  • Les tableaux de dimensions ne sont pas normalisés. Par exemple, dans la figure ci-dessus, Country_ID n'a pas de table de recherche de pays comme l'aurait fait une conception OLTP.
  • Le schéma est largement pris en charge par BI Tools

Avantages du schéma en étoile

  • Les schémas en étoile ont une logique de jointure plus simple que les autres schémas pour récupérer des données à partir de schémas transactionnels hautement normalisés.
  • Contrairement aux schémas transactionnels hautement normalisés, le schéma en étoile simplifie la logique de reporting métier courante, telle que le reporting et la période sur période.
  • Les schémas en étoile sont largement utilisés par les systèmes OLAP pour concevoir efficacement des cubes. Un schéma en étoile peut être utilisé comme source sans concevoir de structure cubique dans la plupart des principaux systèmes OLAP.
  • En activant des schémas de performances spécifiques pouvant être appliqués aux requêtes, le logiciel de processeur de requêtes de Star Schema peut offrir de meilleurs plans d'exécution.

Inconvénient du schéma en étoile

  • Le schéma étant fortement dénormalisé, l’intégrité des données n’est pas correctement appliquée.
  • Pas flexible en termes de besoins analytiques.
  • Les schémas en étoile ne renforcent pas les relations plusieurs-à-plusieurs au sein des entités commerciales.