Ευρετηρίαση σε DBMS: Τι είναι, Τύποι ευρετηρίων με ΠΑΡΑΔΕΙΓΜΑΤΑ
Τι είναι η ευρετηρίαση;
Ευρετηρίαση είναι μια τεχνική δομής δεδομένων που σας επιτρέπει να ανακτάτε γρήγορα εγγραφές από ένα αρχείο βάσης δεδομένων. Ένα ευρετήριο είναι ένας μικρός πίνακας που έχει μόνο δύο στήλες. Η πρώτη στήλη περιλαμβάνει ένα αντίγραφο του πρωτεύοντος ή υποψήφιου κλειδιού ενός πίνακα. Η δεύτερη στήλη του περιέχει ένα σύνολο από δείκτες για τη διατήρηση της διεύθυνσης του μπλοκ δίσκου όπου είναι αποθηκευμένη η συγκεκριμένη τιμή κλειδιού.
Ένας δείκτης -
- Λαμβάνει ένα κλειδί αναζήτησης ως είσοδο
- Επιστρέφει αποτελεσματικά μια συλλογή από αντίστοιχες εγγραφές.
Τύποι ευρετηρίασης στο DBMS
Η ευρετηρίαση στη βάση δεδομένων ορίζεται με βάση τα χαρακτηριστικά ευρετηρίασής της. Δύο κύριοι τύποι μεθόδων ευρετηρίασης είναι:
- Πρωτογενής Ευρετηρίαση
- Δευτερεύουσα Ευρετηρίαση
Πρωτεύον ευρετήριο στο DBMS
Το Primary Index είναι ένα ταξινομημένο αρχείο με σταθερό μέγεθος με δύο πεδία. Το πρώτο πεδίο είναι το ίδιο πρωτεύον κλειδί και το δεύτερο, το αρχείο υποδεικνύεται σε αυτό το συγκεκριμένο μπλοκ δεδομένων. Στο πρωτεύον ευρετήριο, υπάρχει πάντα μία προς μία σχέση μεταξύ των εγγραφών στον πίνακα ευρετηρίου.
Η κύρια ευρετηρίαση στο DBMS χωρίζεται επίσης περαιτέρω σε δύο τύπους.
- Πυκνός δείκτης
- Αραιός δείκτης
Πυκνός δείκτης
Σε ένα πυκνό ευρετήριο, δημιουργείται μια εγγραφή για κάθε κλειδί αναζήτησης που έχει αξία στη βάση δεδομένων. Αυτό σας βοηθά να αναζητάτε πιο γρήγορα, αλλά χρειάζεται περισσότερο χώρο για την αποθήκευση εγγραφών ευρετηρίου. Σε αυτήν την ευρετηρίαση, οι εγγραφές μεθόδου περιέχουν τιμή κλειδιού αναζήτησης και δείχνουν την πραγματική εγγραφή στο δίσκο.
Αραιός δείκτης
Είναι μια εγγραφή ευρετηρίου που εμφανίζεται μόνο για ορισμένες από τις τιμές του αρχείου. Το Sparse Index σάς βοηθά να επιλύσετε τα ζητήματα της πυκνής ευρετηρίασης DBMS. Σε αυτήν τη μέθοδο ευρετηρίασης τεχνικής, μια σειρά στηλών ευρετηρίου αποθηκεύει την ίδια διεύθυνση μπλοκ δεδομένων και όταν πρέπει να ανακτηθούν δεδομένα, θα ληφθεί η διεύθυνση μπλοκ.
Ωστόσο, το αραιό Ευρετήριο αποθηκεύει εγγραφές ευρετηρίου μόνο για ορισμένες τιμές κλειδιού αναζήτησης. Χρειάζεται λιγότερο χώρο, λιγότερα έξοδα συντήρησης για εισαγωγή και διαγραφές, αλλά είναι πιο αργό σε σύγκριση με το πυκνό Ευρετήριο για τον εντοπισμό εγγραφών.
Παρακάτω είναι ένα ευρετήριο βάσης δεδομένων Παράδειγμα Sparse Index
Δευτερεύων ευρετήριο στο DBMS
Το δευτερεύον ευρετήριο στο DBMS μπορεί να δημιουργηθεί από ένα πεδίο που έχει μια μοναδική τιμή για κάθε εγγραφή και θα πρέπει να είναι υποψήφιο κλειδί. Είναι επίσης γνωστός ως δείκτης μη ομαδοποίησης.
Αυτή η τεχνική ευρετηρίασης βάσεων δεδομένων δύο επιπέδων χρησιμοποιείται για τη μείωση του μεγέθους αντιστοίχισης του πρώτου επιπέδου. Για το πρώτο επίπεδο, επιλέγεται ένα μεγάλο εύρος αριθμών εξαιτίας αυτού. το μέγεθος χαρτογράφησης παραμένει πάντα μικρό.
Παράδειγμα δευτερεύοντος δείκτη
Ας κατανοήσουμε τη δευτερεύουσα ευρετηρίαση με ένα παράδειγμα ευρετηρίου βάσης δεδομένων:
Σε μια βάση δεδομένων τραπεζικού λογαριασμού, τα δεδομένα αποθηκεύονται διαδοχικά από το acc_no. μπορεί να θέλετε να βρείτε όλους τους λογαριασμούς σε ένα συγκεκριμένο υποκατάστημα της τράπεζας ABC.
Εδώ, μπορείτε να έχετε ένα δευτερεύον ευρετήριο στο DBMS για κάθε κλειδί αναζήτησης. Η εγγραφή ευρετηρίου είναι ένα σημείο εγγραφής σε έναν κάδο που περιέχει δείκτες σε όλες τις εγγραφές με τη συγκεκριμένη τιμή κλειδιού αναζήτησης.
Clusterευρετήριο στο DBMS
Σε ένα ομαδοποιημένο ευρετήριο, οι ίδιες οι εγγραφές αποθηκεύονται στο Ευρετήριο και όχι στους δείκτες. Μερικές φορές το Ευρετήριο δημιουργείται σε στήλες μη πρωτεύοντος κλειδιού που μπορεί να μην είναι μοναδικές για κάθε εγγραφή. Σε μια τέτοια περίπτωση, μπορείτε να ομαδοποιήσετε δύο ή περισσότερες στήλες για να λάβετε τις μοναδικές τιμές και να δημιουργήσετε ένα ευρετήριο που ονομάζεται ευρετήριο συμπλέγματος. Αυτό σας βοηθά επίσης να αναγνωρίσετε την εγγραφή πιο γρήγορα.
Παράδειγμα:
Ας υποθέσουμε ότι μια εταιρεία προσέλαβε πολλούς υπαλλήλους σε διάφορα τμήματα. Σε αυτήν την περίπτωση, η ευρετηρίαση ομαδοποίησης στο DBMS θα πρέπει να δημιουργηθεί για όλους τους υπαλλήλους που ανήκουν στο ίδιο τμήμα.
Θεωρείται σε ένα ενιαίο σύμπλεγμα και τα σημεία δείκτη δείχνουν το σύμπλεγμα ως σύνολο. Εδώ, το Department _no είναι ένα μη μοναδικό κλειδί.
Τι είναι ο Πολυεπίπεδος Δείκτης;
Πολυεπίπεδη ευρετηρίαση σε βάση δεδομένων δημιουργείται όταν ένα πρωτεύον ευρετήριο δεν χωράει στη μνήμη. Σε αυτόν τον τύπο μεθόδου ευρετηρίασης, μπορείτε να μειώσετε τον αριθμό των προσβάσεων στο δίσκο για να συντομεύσετε οποιαδήποτε εγγραφή και να διατηρείται σε έναν δίσκο ως διαδοχικό αρχείο και να δημιουργήσετε μια αραιή βάση σε αυτό το αρχείο.
Δείκτης B-Tree
Ο δείκτης B-tree είναι οι ευρέως χρησιμοποιούμενες δομές δεδομένων για την ευρετηρίαση βάσει δέντρων στο DBMS. Είναι μια πολυεπίπεδη μορφή δενδρικής ευρετηρίασης στην τεχνική DBMS που έχει ισορροπήσει δυαδικά δέντρα αναζήτησης. Όλοι οι κόμβοι φύλλων του δέντρου Β υποδηλώνουν πραγματικούς δείκτες δεδομένων.
Επιπλέον, όλοι οι κόμβοι φύλλων διασυνδέονται με μια λίστα συνδέσμων, η οποία επιτρέπει σε ένα δέντρο Β να υποστηρίζει τόσο τυχαία όσο και διαδοχική πρόσβαση.
- Οι κύριοι κόμβοι πρέπει να έχουν μεταξύ 2 και 4 τιμές.
- Κάθε μονοπάτι από τη ρίζα στο φύλλο είναι ως επί το πλείστον σε ίσο μήκος.
- Οι μη φυλλικοί κόμβοι εκτός από τον ριζικό κόμβο έχουν μεταξύ 3 και 5 παιδικούς κόμβους.
- Κάθε κόμβος που δεν είναι ρίζα ή φύλλο έχει μεταξύ n/2] και n παιδιά.
Πλεονεκτήματα της ευρετηρίασης
Σημαντικά πλεονεκτήματα/πλεονεκτήματα της ευρετηρίασης είναι:
- Σας βοηθά να μειώσετε τον συνολικό αριθμό των λειτουργιών I/O που απαιτούνται για την ανάκτηση αυτών των δεδομένων, ώστε να μην χρειάζεται να έχετε πρόσβαση σε μια σειρά στη βάση δεδομένων από μια δομή ευρετηρίου.
- Προσφέρει ταχύτερη αναζήτηση και ανάκτηση δεδομένων στους χρήστες.
- Η ευρετηρίαση σάς βοηθά επίσης να μειώσετε τον χώρο του πίνακα, καθώς δεν χρειάζεται να συνδέσετε μια σειρά σε έναν πίνακα, καθώς δεν χρειάζεται να αποθηκεύσετε το ROWID στο Ευρετήριο. Έτσι θα μπορέσετε να μειώσετε τον χώρο του τραπεζιού.
- Δεν μπορείτε να ταξινομήσετε δεδομένα στους κύριους κόμβους καθώς η τιμή του πρωτεύοντος κλειδιού τα ταξινομεί.
Μειονεκτήματα της ευρετηρίασης
Σημαντικά μειονεκτήματα/μειονεκτήματα της ευρετηρίασης είναι:
- Για να εκτελέσετε το σύστημα διαχείρισης βάσεων δεδομένων ευρετηρίου, χρειάζεστε ένα πρωτεύον κλειδί στον πίνακα με μια μοναδική τιμή.
- Δεν μπορείτε να εκτελέσετε άλλα ευρετήρια στη βάση δεδομένων στα δεδομένα ευρετηρίου.
- Δεν επιτρέπεται να χωρίσετε έναν πίνακα οργανωμένο με ευρετήριο.
- Ευρετηρίαση SQL Μειώστε την απόδοση στο ερώτημα INSERT, DELETE και UPDATE.
Σύνοψη
- Η ευρετηρίαση είναι ένας μικρός πίνακας που αποτελείται από δύο στήλες.
- Δύο κύριοι τύποι μεθόδων ευρετηρίασης είναι 1) Πρωτογενής Ευρετηρίαση 2) Δευτερεύουσα Ευρετηρίαση.
- Το Primary Index είναι ένα ταξινομημένο αρχείο με σταθερό μέγεθος με δύο πεδία.
- Η κύρια ευρετηρίαση χωρίζεται επίσης σε δύο τύπους 1) Πυκνός Δείκτης 2) Αραιός Δείκτης.
- Σε ένα πυκνό ευρετήριο, δημιουργείται μια εγγραφή για κάθε κλειδί αναζήτησης που έχει αξία στη βάση δεδομένων.
- Μια αραιή μέθοδος ευρετηρίασης σάς βοηθά να επιλύσετε τα ζητήματα της πυκνής ευρετηρίασης.
- Το δευτερεύον ευρετήριο στο DBMS είναι μια μέθοδος ευρετηρίασης της οποίας το κλειδί αναζήτησης καθορίζει μια σειρά διαφορετική από τη διαδοχική σειρά του αρχείου.
- ClusterΤο ευρετήριο ing ορίζεται ως αρχείο δεδομένων παραγγελίας.
- Η πολυεπίπεδη ευρετηρίαση δημιουργείται όταν ένα πρωτεύον ευρετήριο δεν χωράει στη μνήμη.
- Το μεγαλύτερο πλεονέκτημα του Indexing είναι ότι σας βοηθά να μειώσετε τον συνολικό αριθμό των λειτουργιών I/O που απαιτούνται για την ανάκτηση αυτών των δεδομένων.
- Το μεγαλύτερο μειονέκτημα για την εκτέλεση του συστήματος διαχείρισης βάσεων δεδομένων ευρετηρίου, χρειάζεστε ένα πρωτεύον κλειδί στον πίνακα με μοναδική τιμή.