Τι είναι το Star Schema στη μοντελοποίηση της αποθήκης δεδομένων;

Τι είναι το Star Schema;

Σχήμα αστεριών στην αποθήκη δεδομένων, είναι ένα σχήμα στο οποίο το κέντρο του αστεριού μπορεί να έχει έναν πίνακα γεγονότων και έναν αριθμό σχετικών πινάκων διαστάσεων. Είναι γνωστό ως σχήμα αστεριών καθώς η δομή του μοιάζει με αστέρι. Το μοντέλο δεδομένων Star Schema είναι ο απλούστερος τύπος σχήματος Data Warehouse. Είναι επίσης γνωστό ως Star Join Schema και είναι βελτιστοποιημένο για την αναζήτηση μεγάλων συνόλων δεδομένων.

Τι είναι το Πολυδιάστατο σχήμα;

Πολυδιάστατο σχήμα έχει σχεδιαστεί ειδικά για τη μοντελοποίηση συστημάτων αποθήκης δεδομένων. Τα σχήματα έχουν σχεδιαστεί για να καλύπτουν τις μοναδικές ανάγκες πολύ μεγάλων βάσεων δεδομένων που έχουν σχεδιαστεί για αναλυτικό σκοπό (OLAP).

Τύποι σχήματος αποθήκης δεδομένων:

Ακολουθούν 3 κύριοι τύποι πολυδιάστατων σχημάτων που το καθένα έχει τα μοναδικά του πλεονεκτήματα.

Παράδειγμα μοντελοποίησης δεδομένων σχήματος αστεριού

Στο ακόλουθο παράδειγμα Σχήματος αστεριών, ο πίνακας γεγονότων βρίσκεται στο κέντρο, ο οποίος περιέχει κλειδιά για κάθε πίνακα διαστάσεων, όπως Αναγνωριστικό_πωλητή, Αναγνωριστικό μοντέλου, Ημερομηνία_Αναγνωριστικό, Αναγνωριστικό_προϊόντος, Αναγνωριστικό_κλαδιού και άλλα χαρακτηριστικά όπως Πωλήσεις μονάδων και έσοδα.

Μοντελοποίηση δεδομένων αστεριού σχήματος
Παράδειγμα διαγράμματος σχήματος αστεριού

Πίνακες γεγονότων

Ένας πίνακας γεγονότων σε ένα σχήμα αστεριού περιέχει γεγονότα και συνδέεται με διαστάσεις. Ένας πίνακας δεδομένων έχει δύο τύπους στηλών:

  • Μια στήλη που περιλαμβάνει Γεγονότα
  • Ξένο κλειδί για τον πίνακα διαστάσεων

Γενικά, το πρωτεύον κλειδί ενός πίνακα γεγονότων είναι ένα σύνθετο κλειδί που αποτελείται από όλα τα ξένα κλειδιά που αποτελούν τον πίνακα.

Οι πίνακες δεδομένων μπορεί να περιέχουν γεγονότα σε επίπεδο λεπτομέρειας ή συγκεντρωτικά γεγονότα. Οι πίνακες δεδομένων που περιλαμβάνουν συγκεντρωτικά γεγονότα ονομάζονται συχνά συνοπτικοί πίνακες. Οι πίνακες στοιχείων συνήθως περιέχουν γεγονότα που έχουν συγκεντρωθεί σε κάποιο επίπεδο.

Πίνακες διαστάσεων

Μια διάσταση είναι μια αρχιτεκτονική που κατηγοριοποιεί τα δεδομένα σε μια ιεραρχία. Μια διάσταση χωρίς ιεραρχίες και επίπεδα ονομάζεται επίπεδη διάσταση ή λίστα. Το πρωτεύον κλειδί κάθε πίνακα διαστάσεων είναι μέρος του σύνθετου πρωτεύοντος κλειδιού του πίνακα γεγονότων. Ένα χαρακτηριστικό διάστασης είναι ένα περιγραφικό, κειμενικό χαρακτηριστικό που βοηθά στην περιγραφή μιας τιμής διαστάσεων. Οι πίνακες πληροφοριών είναι συνήθως μεγαλύτεροι από τους πίνακες διαστάσεων.

Χαρακτηριστικά του Star Schema

  • Κάθε διάσταση σε ένα σχήμα αστεριού αντιπροσωπεύεται με τον μοναδικό μονοδιάστατο πίνακα.
  • Ο πίνακας διαστάσεων πρέπει να περιέχει το σύνολο των χαρακτηριστικών.
  • Ο πίνακας διαστάσεων ενώνεται με τον πίνακα γεγονότων χρησιμοποιώντας ένα ξένο κλειδί
  • Ο πίνακας διαστάσεων δεν είναι ενωμένος μεταξύ τους
  • Ο πίνακας στοιχείων θα περιέχει το κλειδί και το μέτρο
  • Το σχήμα Star είναι εύκολο να κατανοηθεί και παρέχει τη βέλτιστη χρήση του δίσκου.
  • Οι πίνακες διαστάσεων δεν είναι κανονικοποιημένοι. Για παράδειγμα, στο παραπάνω σχήμα, το Country_ID δεν έχει πίνακα αναζήτησης χώρας όπως θα είχε μια σχεδίαση OLTP.
  • Το σχήμα υποστηρίζεται ευρέως από τα BI Tools

Πλεονεκτήματα του Star Schema

  • Τα σχήματα αστεριών έχουν μια πιο απλή λογική σύνδεσης σε σύγκριση με άλλα σχήματα για την ανάκτηση δεδομένων από εξαιρετικά κανονικοποιημένα σχήματα συναλλαγών.
  • Σε αντίθεση με τα εξαιρετικά κανονικοποιημένα σχήματα συναλλαγών, το σχήμα αστεριού απλοποιεί την κοινή λογική επιχειρηματικών αναφορών, όπως η αναφορά και η περίοδος ανά περίοδο.
  • Τα σχήματα αστεριών χρησιμοποιούνται ευρέως από τα συστήματα OLAP για τον αποτελεσματικό σχεδιασμό κύβων. Ένα σχήμα αστεριού μπορεί να χρησιμοποιηθεί ως πηγή χωρίς σχεδιασμό δομής κύβου στα περισσότερα μεγάλα συστήματα OLAP.
  • Ενεργοποιώντας συγκεκριμένα σχήματα απόδοσης που μπορούν να εφαρμοστούν σε ερωτήματα, το λογισμικό επεξεργασίας ερωτημάτων στο Star Schema μπορεί να προσφέρει καλύτερα σχέδια εκτέλεσης.

Μειονέκτημα του Star Schema

  • Δεδομένου ότι το σχήμα είναι εξαιρετικά αποκανονικοποιημένο, η ακεραιότητα των δεδομένων δεν επιβάλλεται καλά.
  • Δεν είναι ευέλικτο ως προς τις αναλυτικές ανάγκες.
  • Τα σχήματα αστεριών δεν ενισχύουν πολλές-προς-πολλές σχέσεις εντός των επιχειρηματικών οντοτήτων.