Τι είναι η μοντελοποίηση διαστάσεων στην αποθήκη δεδομένων; Μάθετε τύπους

Μοντελοποίηση διαστάσεων

Μοντελοποίηση διαστάσεων (DM) είναι μια τεχνική δομής δεδομένων βελτιστοποιημένη για αποθήκευση δεδομένων σε μια αποθήκη δεδομένων. Ο σκοπός της μοντελοποίησης διαστάσεων είναι η βελτιστοποίηση της βάσης δεδομένων για ταχύτερη ανάκτηση δεδομένων. Η έννοια του Dimensional Modeling αναπτύχθηκε από τον Ralph Kimball και αποτελείται από πίνακες «γεγονότων» και «διαστάσεων».

Ένα μοντέλο διαστάσεων στην αποθήκη δεδομένων έχει σχεδιαστεί για να διαβάζει, να συνοψίζει, να αναλύει αριθμητικές πληροφορίες όπως τιμές, υπόλοιπα, μετρήσεις, βάρη κ.λπ. σε μια αποθήκη δεδομένων. Αντίθετα, τα μοντέλα σχέσεων είναι βελτιστοποιημένα για προσθήκη, ενημέρωση και διαγραφή δεδομένων σε ένα διαδικτυακό σύστημα συναλλαγών σε πραγματικό χρόνο.

Αυτά τα διαστατικά και σχεσιακά μοντέλα έχουν τον μοναδικό τρόπο αποθήκευσης δεδομένων που έχει συγκεκριμένα πλεονεκτήματα.

Για παράδειγμα, στη σχεσιακή λειτουργία, τα μοντέλα κανονικοποίησης και ER μειώνουν τον πλεονασμό στα δεδομένα. Αντίθετα, το μοντέλο διαστάσεων στην αποθήκη δεδομένων τακτοποιεί τα δεδομένα με τέτοιο τρόπο ώστε να είναι ευκολότερη η ανάκτηση πληροφοριών και η δημιουργία αναφορών.

Ως εκ τούτου, χρησιμοποιούνται μοντέλα διαστάσεων συστήματα αποθήκης δεδομένων και δεν ταιριάζει καλά για σχεσιακά συστήματα.

Στοιχεία Μοντέλου Διαστάσεων Δεδομένων

Γεγονός

Τα γεγονότα είναι οι μετρήσεις/μετρήσεις ή τα γεγονότα από την επιχειρηματική σας διαδικασία. Για μια επιχειρηματική διαδικασία πωλήσεων, μια μέτρηση θα είναι ο τριμηνιαίος αριθμός πωλήσεων

Διάσταση

Το Dimension παρέχει το πλαίσιο που περιβάλλει ένα γεγονός επιχειρηματικής διαδικασίας. Με απλά λόγια, δίνουν ποιος, τι, πού από ένα γεγονός. Στην επιχειρηματική διαδικασία πωλήσεων, για τον αριθμό τριμηνιαίων πωλήσεων, οι διαστάσεις θα ήταν

  • Ποιος – Ονόματα πελατών
  • Πού – Τοποθεσία
  • Τι – Όνομα προϊόντος

Με άλλα λόγια, μια διάσταση είναι ένα παράθυρο για την προβολή πληροφοριών στα γεγονότα.

Γνωρίσματα

Τα χαρακτηριστικά είναι τα διάφορα χαρακτηριστικά της διάστασης στη μοντελοποίηση δεδομένων διαστάσεων.

Στην ιδιότητα Τοποθεσία, τα χαρακτηριστικά μπορούν να είναι

  • Κατάσταση
  • Χώρα
  • Ταχυδρομικός κώδικας κλπ.

Τα χαρακτηριστικά χρησιμοποιούνται για αναζήτηση, φιλτράρισμα ή ταξινόμηση γεγονότων. Οι πίνακες διαστάσεων περιέχουν χαρακτηριστικά

Πίνακας γεγονότων

Ένας πίνακας γεγονότων είναι ένας πρωτεύων πίνακας στη μοντελοποίηση διαστάσεων.

Ένας Πίνακας Δεδομένων περιέχει

  1. Μετρήσεις/γεγονότα
  2. Ξένο κλειδί σε πίνακα διαστάσεων

Πίνακας διαστάσεων

  • Ένας πίνακας διαστάσεων περιέχει διαστάσεις ενός γεγονότος.
  • Συνδέονται στον πίνακα γεγονότων μέσω ενός ξένου κλειδιού.
  • Οι πίνακες διαστάσεων είναι πίνακες που έχουν αποσυναρμολογηθεί.
  • Τα χαρακτηριστικά διάστασης είναι οι διάφορες στήλες σε έναν πίνακα διαστάσεων
  • Το Dimensions προσφέρει περιγραφικά χαρακτηριστικά των γεγονότων με τη βοήθεια των ιδιοτήτων τους
  • Δεν έχει οριστεί όριο για τον αριθμό των διαστάσεων
  • Η διάσταση μπορεί επίσης να περιέχει μία ή περισσότερες ιεραρχικές σχέσεις

Τύποι διαστάσεων στην αποθήκη δεδομένων

Ακολουθούν τα Τύποι διαστάσεων στην αποθήκη δεδομένων:

  • Συμμορφωμένη διάσταση
  • Διάσταση εξωθητήρα
  • Συρρικνωμένη διάσταση
  • Διάσταση παιχνιδιού ρόλων
  • Πίνακας διάστασης σε διάσταση
  • Διάσταση σκουπιδιών
  • Εκφυλισμένη Διάσταση
  • Ανταλλάξιμη διάσταση
  • Διάσταση Βήματος

Βήματα Μοντελοποίησης Διαστάσεων

Η ακρίβεια στη δημιουργία της μοντελοποίησης διαστάσεων καθορίζει την επιτυχία της υλοποίησης της αποθήκης δεδομένων σας. Ακολουθούν τα βήματα για τη δημιουργία Μοντέλου Διαστάσεων

  1. Προσδιορισμός Επιχειρηματικής Διαδικασίας
  2. Προσδιορισμός κόκκων (επίπεδο λεπτομέρειας)
  3. Προσδιορισμός Διαστάσεων
  4. Προσδιορίστε γεγονότα
  5. Κατασκευάστε το αστέρι

Το μοντέλο θα πρέπει να περιγράφει το Γιατί, πόσο, Πότε/Πού/Ποιος και Τι της επιχειρηματικής σας διαδικασίας

Βήματα Μοντελοποίησης Διαστάσεων

Βήμα 1) Προσδιορίστε την Επιχειρηματική Διαδικασία

Προσδιορισμός της πραγματικής επιχειρηματικής διαδικασίας που πρέπει να καλύπτει ένα datarehouse. Αυτό θα μπορούσε να είναι Μάρκετινγκ, Πωλήσεις, Ανθρώπινο Δυναμικό κ.λπ. σύμφωνα με το ανάλυση δεδομένων ανάγκες του οργανισμού. Η επιλογή της επιχειρηματικής διαδικασίας εξαρτάται επίσης από την ποιότητα των δεδομένων που είναι διαθέσιμα για αυτήν τη διαδικασία. Είναι το πιο σημαντικό βήμα της διαδικασίας μοντελοποίησης δεδομένων και μια αποτυχία εδώ θα είχε διαδοχικά και ανεπανόρθωτα ελαττώματα.

Για να περιγράψετε την επιχειρηματική διαδικασία, μπορείτε να χρησιμοποιήσετε απλό κείμενο ή να χρησιμοποιήσετε τη βασική σημειογραφία μοντελοποίησης επιχειρηματικής διαδικασίας (BPMN) ή την ενοποιημένη γλώσσα μοντελοποίησης (UML).

Βήμα 2) Προσδιορίστε το Grain

Το Grain περιγράφει το επίπεδο λεπτομέρειας για το επιχειρηματικό πρόβλημα/λύση. Είναι η διαδικασία προσδιορισμού του χαμηλότερου επιπέδου πληροφοριών για οποιονδήποτε πίνακα στην αποθήκη δεδομένων σας. Εάν ένας πίνακας περιέχει δεδομένα πωλήσεων για κάθε μέρα, τότε θα πρέπει να είναι ημερήσια ευαισθησία. Εάν ένας πίνακας περιέχει δεδομένα συνολικών πωλήσεων για κάθε μήνα, τότε έχει μηνιαία ευαισθησία.

Σε αυτό το στάδιο, απαντάτε σε ερωτήσεις όπως

  1. Χρειάζεται να αποθηκεύσουμε όλα τα διαθέσιμα προϊόντα ή μόνο μερικά είδη προϊόντων; Αυτή η απόφαση βασίζεται στις επιχειρηματικές διαδικασίες που επιλέχθηκαν για το Datawarehouse
  2. Αποθηκεύουμε τις πληροφορίες πώλησης προϊόντων σε μηνιαία, εβδομαδιαία, ημερήσια ή ωριαία βάση; Η απόφαση αυτή εξαρτάται από τη φύση των αναφορών που ζητούνται από τα στελέχη
  3. Πώς επηρεάζουν οι δύο παραπάνω επιλογές το μέγεθος της βάσης δεδομένων;

Παράδειγμα σιτηρών:

Ο Διευθύνων Σύμβουλος σε μια MNC θέλει να βρίσκει τις πωλήσεις για συγκεκριμένα προϊόντα σε διαφορετικές τοποθεσίες σε καθημερινή βάση.

Έτσι, το σιτάρι είναι «πληροφορίες πώλησης προϊόντων ανά τοποθεσία, μέρα με τη μέρα».

Βήμα 3) Προσδιορίστε τις Διαστάσεις

Οι διαστάσεις είναι ουσιαστικά όπως ημερομηνία, κατάστημα, απόθεμα κ.λπ. Αυτές οι διαστάσεις είναι εκεί που πρέπει να αποθηκεύονται όλα τα δεδομένα. Για παράδειγμα, η ιδιότητα ημερομηνίας μπορεί να περιέχει δεδομένα όπως έτος, μήνας και ημέρα της εβδομάδας.

Παράδειγμα Διαστάσεων:

Ο Διευθύνων Σύμβουλος σε μια MNC θέλει να βρίσκει τις πωλήσεις για συγκεκριμένα προϊόντα σε διαφορετικές τοποθεσίες σε καθημερινή βάση.

Διαστάσεις: Προϊόν, Τοποθεσία και Χρόνος

Χαρακτηριστικά: Για Προϊόν: Κλειδί προϊόντος (Ξένο κλειδί), Όνομα, Τύπος, Προδιαγραφές

Ιεραρχίες: Για Τοποθεσία: Χώρα, Πολιτεία, Πόλη, Διεύθυνση Οδού, Όνομα

Βήμα 4) Προσδιορίστε το Γεγονός

Αυτό το βήμα συνδέεται από κοινού με τους επιχειρησιακούς χρήστες του συστήματος, επειδή εκεί αποκτούν πρόσβαση στα δεδομένα που είναι αποθηκευμένα στην αποθήκη δεδομένων. Οι περισσότερες από τις σειρές του πίνακα γεγονότων είναι αριθμητικές τιμές όπως τιμή ή κόστος ανά μονάδα κ.λπ.

Παράδειγμα γεγονότων:

Ο Διευθύνων Σύμβουλος σε μια MNC θέλει να βρίσκει τις πωλήσεις για συγκεκριμένα προϊόντα σε διαφορετικές τοποθεσίες σε καθημερινή βάση.

Το γεγονός εδώ είναι το άθροισμα των πωλήσεων ανά προϊόν ανά τοποθεσία και χρόνο.

Βήμα 5) Δημιουργία σχήματος

Σε αυτό το βήμα, υλοποιείτε το Μοντέλο Διαστάσεων. Ένα σχήμα δεν είναι παρά η δομή της βάσης δεδομένων (διάταξη των πινάκων). Υπάρχουν δύο δημοφιλή σχήματα

  1. Σχήμα αστεριών

Η αρχιτεκτονική του σχήματος αστεριών είναι εύκολο να σχεδιαστεί. Ονομάζεται σχήμα αστεριού επειδή το διάγραμμα μοιάζει με αστέρι, με σημεία που ακτινοβολούν από ένα κέντρο. Το κέντρο του αστεριού αποτελείται από τον πίνακα γεγονότων και τα σημεία του αστεριού είναι πίνακες διαστάσεων.

Οι πίνακες γεγονότων σε ένα σχήμα αστεριού που είναι η τρίτη κανονική μορφή, ενώ οι πίνακες διαστάσεων αποκανονικοποιούνται.

  1. Σχέδιο νιφάδας χιονιού

Το σχήμα νιφάδα χιονιού είναι μια επέκταση του σχήματος αστεριών. Σε ένα σχήμα νιφάδας χιονιού, κάθε διάσταση κανονικοποιείται και συνδέεται με περισσότερους πίνακες διαστάσεων.

Ελέγξτε επίσης: - Σχήμα Star and Snowflake in Data Warehouse με Παραδείγματα Μοντέλων

Κανόνες για Διαστατική Μοντελοποίηση

Ακολουθούν οι κανόνες και οι αρχές της Μοντελοποίησης Διαστάσεων:

  • Φόρτωση ατομικών δεδομένων σε δομές διαστάσεων.
  • Δημιουργήστε μοντέλα διαστάσεων γύρω από τις επιχειρηματικές διαδικασίες.
  • Πρέπει να διασφαλιστεί ότι κάθε πίνακας στοιχείων έχει έναν συσχετισμένο πίνακα διαστάσεων ημερομηνίας.
  • Βεβαιωθείτε ότι όλα τα γεγονότα σε έναν ενιαίο πίνακα γεγονότων βρίσκονται στο ίδιο επίπεδο ή επίπεδο λεπτομέρειας.
  • Είναι σημαντικό να αποθηκεύετε ετικέτες αναφορών και να φιλτράρετε τιμές τομέα σε πίνακες διαστάσεων
  • Πρέπει να διασφαλιστεί ότι οι πίνακες διαστάσεων χρησιμοποιούν ένα υποκατάστατο κλειδί
  • Εξισορροπούν συνεχώς απαιτήσεις και πραγματικότητες για την παροχή επιχειρηματικών λύσεων για την υποστήριξη της λήψης αποφάσεων

Οφέλη της Μοντελοποίησης Διαστάσεων

  • Η τυποποίηση των διαστάσεων επιτρέπει την εύκολη αναφορά σε όλους τους τομείς της επιχείρησης.
  • Οι πίνακες διαστάσεων αποθηκεύουν το ιστορικό των πληροφοριών διαστάσεων.
  • Επιτρέπει την εισαγωγή εντελώς νέας διάστασης χωρίς μεγάλες διαταραχές στον πίνακα γεγονότων.
  • Διαστάσεις επίσης για την αποθήκευση δεδομένων με τέτοιο τρόπο ώστε να είναι ευκολότερη η ανάκτηση των πληροφοριών από τα δεδομένα αφού τα δεδομένα αποθηκεύονται στη βάση δεδομένων.
  • Σε σύγκριση με το κανονικοποιημένο μοντέλο, ο πίνακας διαστάσεων είναι πιο κατανοητός.
  • Οι πληροφορίες ομαδοποιούνται σε σαφείς και απλές επιχειρηματικές κατηγορίες.
  • Το μοντέλο διαστάσεων είναι πολύ κατανοητό από την επιχείρηση. Αυτό το μοντέλο βασίζεται σε επιχειρηματικούς όρους, έτσι ώστε η επιχείρηση να γνωρίζει τι σημαίνει κάθε γεγονός, διάσταση ή χαρακτηριστικό.
  • Τα μοντέλα διαστάσεων παραμορφώνονται και βελτιστοποιούνται για γρήγορη αναζήτηση δεδομένων. Πολλές πλατφόρμες σχεσιακών βάσεων δεδομένων αναγνωρίζουν αυτό το μοντέλο και βελτιστοποιούν τα σχέδια εκτέλεσης ερωτημάτων για να βοηθήσουν στην απόδοση.
  • Η μοντελοποίηση διαστάσεων στην αποθήκη δεδομένων δημιουργεί ένα σχήμα το οποίο είναι βελτιστοποιημένο για υψηλή απόδοση. Σημαίνει λιγότερες ενώσεις και βοηθά στην ελαχιστοποίηση του πλεονασμού δεδομένων.
  • Το μοντέλο διαστάσεων συμβάλλει επίσης στην ενίσχυση της απόδοσης των ερωτημάτων. Είναι πιο αποκανονικοποιημένο, επομένως είναι βελτιστοποιημένο για αναζήτηση.
  • Τα μοντέλα διαστάσεων μπορούν να υποδεχτούν άνετα την αλλαγή. Στους πίνακες ιδιοτήτων μπορούν να προστεθούν περισσότερες στήλες χωρίς να επηρεαστούν οι υπάρχουσες εφαρμογές επιχειρηματικής ευφυΐας που χρησιμοποιούν αυτούς τους πίνακες.

Τι είναι το πολυδιάστατο μοντέλο δεδομένων στην αποθήκη δεδομένων;

Πολυδιάστατο μοντέλο δεδομένων στην αποθήκη δεδομένων είναι ένα μοντέλο που αναπαριστά δεδομένα με τη μορφή κύβων δεδομένων. Επιτρέπει τη μοντελοποίηση και προβολή των δεδομένων σε πολλαπλές διαστάσεις και ορίζεται από διαστάσεις και γεγονότα. Το πολυδιάστατο μοντέλο δεδομένων κατηγοριοποιείται γενικά γύρω από ένα κεντρικό θέμα και αντιπροσωπεύεται από έναν πίνακα γεγονότων.

Περίληψη

  • Ένα μοντέλο διαστάσεων είναι μια τεχνική δομής δεδομένων βελτιστοποιημένη για Εργαλεία αποθήκευσης δεδομένων.
  • Τα γεγονότα είναι οι μετρήσεις/μετρήσεις ή τα γεγονότα από την επιχειρηματική σας διαδικασία.
  • Το Dimension παρέχει το πλαίσιο που περιβάλλει ένα γεγονός επιχειρηματικής διαδικασίας.
  • Χαρακτηριστικά είναι τα διάφορα χαρακτηριστικά της μοντελοποίησης διαστάσεων.
  • Ένας πίνακας γεγονότων είναι ένας πρωτεύων πίνακας σε ένα μοντέλο διαστάσεων.
  • Ένας πίνακας διαστάσεων περιέχει διαστάσεις ενός γεγονότος.
  • Υπάρχουν τρεις τύποι γεγονότων 1. Προσθετικό 2. Μη πρόσθετο 3. Ημι-προσθετικό.
  • Οι τύποι διαστάσεων είναι Διαστάσεις Conformed, Outrigger, Shrunken, Role-playing, Dimension to Dimension Table, Junk, Degenerate, Swappable και Step.
  • Πέντε βήματα της μοντελοποίησης διαστάσεων είναι 1. Προσδιορισμός επιχειρηματικής διαδικασίας 2. Προσδιορισμός κόκκων (επίπεδο λεπτομέρειας) 3. Προσδιορισμός διαστάσεων 4. Προσδιορισμός γεγονότων 5. Δημιουργία αστεριού
  • Για τη μοντελοποίηση διαστάσεων στην αποθήκη δεδομένων, υπάρχει ανάγκη να διασφαλιστεί ότι κάθε πίνακας στοιχείων έχει έναν σχετικό πίνακα διαστάσεων ημερομηνίας.