Schéma de flocon de neige dans le modèle d'entrepôt de données
Qu'est-ce qu'un schéma de flocon de neige?
Schéma de flocon de neige dans un entrepôt de données est un agencement logique de tables dans une base de données multidimensionnelle telle que diagramme ER ressemble à une forme de flocon de neige. Un schéma Snowflake est une extension d'un schéma en étoile et ajoute des dimensions supplémentaires. Les tables de dimensions sont normalisées, ce qui divise les données en tables supplémentaires.
Exemple de schéma de flocon de neige
Dans l’exemple de schéma Snowflake suivant, Country est ensuite normalisé dans une table individuelle.

Caractéristiques du schéma en flocon de neige
- Le principal avantage du schéma Snowflake est qu’il utilise un espace disque plus petit.
- Plus facile à mettre en œuvre, une dimension est ajoutée au schéma
- En raison de plusieurs tables, les performances des requêtes sont réduites
- Le principal défi auquel vous serez confronté lors de l'utilisation du schéma en flocon de neige est que vous devez effectuer davantage d'efforts de maintenance en raison du plus grand nombre de tables de recherche.
Avantage du schéma flocon de neige
- Le principal avantage du schéma Snowflake est sa capacité à réduire les besoins de stockage sur disque et à joindre des tables de recherche plus petites, améliorant ainsi les performances des requêtes.
- Offre une plus grande évolutivité dans la relation entre les composants et les niveaux de dimension.
- Il n’y a pas de redondance, donc c’est plus facile à maintenir.
Inconvénient du schéma flocon de neige
- Un inconvénient important du schéma en flocon de neige est la maintenance accrue requise.
- Les requêtes complexes sont difficiles à comprendre.
- Un plus grand nombre de tables signifie plus de jointures, donc un temps d'exécution des requêtes plus long.
Qu'est-ce qu'un schéma Galaxy ?
A Schéma de la galaxie contient deux tables de faits qui partagent des tables de dimensions entre elles. Il est également appelé schéma de constellation de faits. Le schéma est considéré comme une collection d’étoiles, d’où le nom Galaxy Schema.

Comme vous pouvez le voir dans l'exemple ci-dessus, il existe deux tableaux de faits
- Revenue
- Produit.
Dans le schéma Galaxy, les dimensions des partages sont appelées dimensions conformes.
Caractéristiques du schéma Galaxy
- Les dimensions de ce schéma sont séparées en dimensions distinctes en fonction des différents niveaux de hiérarchie.
- Par exemple, si la géographie comporte quatre niveaux de hiérarchie comme la région, le pays, l'état et la ville, le schéma Galaxy doit avoir quatre dimensions.
- De plus, il est possible de construire ce type de schéma en divisant le schéma à une étoile en plusieurs schémas en étoile.
- Les dimensions sont grandes dans ce schéma qu'il faut construire en fonction des niveaux de hiérarchie.
- Ce schéma est utile pour agréger les tableaux de faits pour une meilleure compréhension.
Qu'est-ce que l'étoile Cluster Schéma?
Le schéma Snowflake contient des hiérarchies entièrement développées. Cependant, cela peut ajouter de la complexité au schéma et nécessiter des jointures supplémentaires. D'autre part, schéma en étoile contient des hiérarchies entièrement réduites, ce qui peut conduire à une redondance. La meilleure solution peut donc être un équilibre entre ces deux schémas, c'est-à-dire Star Cluster Conception de schéma.

Les dimensions qui se chevauchent peuvent être trouvées sous forme de fourches dans les hiérarchies. Un fork se produit lorsqu'une entité agit en tant que parent dans deux hiérarchies dimensionnelles différentes. Les entités Fork sont ensuite identifiées comme une classification avec des relations un-à-plusieurs.
