Εκμάθηση Teradata: Τι είναι το Teradata SQL; Βάση δεδομένων Archiδομή
Τι είναι το Teradata;
Τερατάτα είναι ένα σύστημα διαχείρισης βάσεων δεδομένων ανοιχτού κώδικα για την ανάπτυξη εφαρμογών αποθήκευσης δεδομένων μεγάλης κλίμακας. Αυτό το εργαλείο παρέχει υποστήριξη για πολλαπλές λειτουργίες αποθήκης δεδομένων ταυτόχρονα χρησιμοποιώντας την έννοια του παραλληλισμού. Το Teradata είναι ένα μαζικά ανοιχτό σύστημα επεξεργασίας που υποστηρίζει Unix/Linux/Windows πλατφόρμες διακομιστών.
Το λογισμικό Teradata αναπτύσσεται από την Teradata Corporation, η οποία είναι μια αμερικανική εταιρεία πληροφορικής. Είναι προμηθευτής πλατφορμών δεδομένων αναλυτικών στοιχείων, εφαρμογών και άλλων σχετικών υπηρεσιών. Η εταιρεία αναπτύσσει ένα προϊόν για να ενοποιήσει δεδομένα από διάφορες πηγές και να καταστήσει τα δεδομένα διαθέσιμα για ανάλυση.
Ιστορία των Teradata
Η Teradata ήταν τμήμα της NCR Corporation. Ιδρύθηκε το 1979 αλλά αποχώρησε από την NCR τον Οκτώβριο του 2007. Ο Michael Koehler έγινε ο πρώτος Διευθύνων Σύμβουλος της Teradata.
Ορόσημα της Teradata Corporation:
- 1979 – Ιδρύεται η Teradata
- 1984 – Κυκλοφορία του πρώτου υπολογιστή βάσης δεδομένων DBC/1012
- 1986 – Το περιοδικό Fortune ανακηρύσσει το Teradata ως «Προϊόν της Χρονιάς»
- 1999 – Η μεγαλύτερη βάση δεδομένων που δημιουργήθηκε με χρήση Teradata με 130 Terabyte
- 2002 – Έκδοση Teradata V2R5 με συμπίεση και Partition Primary
- 2006 – Παρουσίαση της λύσης Teradata Master Data Management
- 2008 – Κυκλοφόρησε το Teradata 13.0 με το Active Data Warehousing
- 2011 – Αποκτά το Teradata Aster και βυθίζεται στο Advanced Analytics Space
- 2012 – Παρουσιάστηκε το Teradata 14.0
- 2014 – Παρουσιάστηκε το Teradata 15.0
- 2015- Η Teradata αγοράζει Apps Marketing Platform Appoxee
- 2016- Η Terada ενώνει τα χέρια με τα Big data
- 2017- Η Teradata αποκτά το StackIQ του Σαν Ντιέγκο
Γιατί Teradata;
- Η Teradata προσφέρει μια πλήρη σειρά υπηρεσιών που εστιάζει σε Αποθήκευση δεδομένων
- Το σύστημα είναι χτισμένο σε ανοιχτή αρχιτεκτονική. Έτσι, κάθε φορά που διατίθενται ταχύτερες συσκευές, μπορεί να ενσωματωθεί στην ήδη κατασκευασμένη αρχιτεκτονική.
- Το Teradata υποστηρίζει 50+ petabyte δεδομένων.
- Προβολή μονής λειτουργίας για ένα μεγάλο σύστημα πολλαπλών κόμβων Teradata που χρησιμοποιεί σταθμό εργασίας υπηρεσίας
- Συμβατό με μεγάλη γκάμα από εργαλείο BI για ανάκτηση δεδομένων.
- Μπορεί να λειτουργήσει ως ένα ενιαίο σημείο ελέγχου για το DBA για τη διαχείριση του βάση δεδομένων.
- Υψηλή απόδοση, ποικίλα ερωτήματα, αναλυτικά στοιχεία στη βάση δεδομένων και εξελιγμένη διαχείριση φόρτου εργασίας
- Το Teradata σάς επιτρέπει να λαμβάνετε τα ίδια δεδομένα σε πολλαπλές επιλογές ανάπτυξης
Στη συνέχεια, σε αυτό το σεμινάριο Teradata, θα μάθουμε για τις δυνατότητες του Teradata.
Χαρακτηριστικά του Teradata SQL
Το Teradata προσφέρει τα ακόλουθα ισχυρά χαρακτηριστικά:
- Γραμμική επεκτασιμότητα: Προσφέρει γραμμική επεκτασιμότητα όταν ασχολείστε με μεγάλους όγκους δεδομένων προσθέτοντας κόμβους για να αυξήσετε την απόδοση του συστήματος.
- Απεριόριστος Παραλληλισμός: Το Teradata βασίζεται σε MPP (Massively Parallel Processing Archiδομή). Έτσι, είναι σχεδιασμένο να είναι παράλληλο από την αρχή. Μπορεί να χωρίσει μια μεγάλη εργασία σε μικρότερες εργασίες και να τις εκτελέσει παράλληλα
- Mature Optimizer: Το Teradata Optimizer μπορεί να χειριστεί έως και 64 ενώσεις σε ένα ερώτημα.
- Χαμηλό TCO: Τα δεδομένα Tera έχουν χαμηλό συνολικό κόστος ιδιοκτησίας. Είναι εύκολο στη ρύθμιση, τη συντήρηση και τη διαχείριση.
- Φόρτωση και εκφόρτωση βοηθητικών προγραμμάτων: Η Teradata παρέχει βοηθητικά προγράμματα φόρτωσης και εκφόρτωσης για τη μεταφορά δεδομένων προς/από το σύστημα Teradata.
- Συνδεσιμότητα: Αυτό το σύστημα MPP μπορεί να συνδεθεί με συστήματα που συνδέονται με κανάλια, όπως ένα κεντρικό σύστημα ή συστήματα που συνδέονται με το δίκτυο.
- SQL: Το Teradata υποστηρίζει SQL για αλληλεπίδραση με τα δεδομένα που είναι αποθηκευμένα σε πίνακες. Παρέχει την επέκτασή του.
- Ισχυρά βοηθητικά προγράμματα: Το Teradata παρέχει ισχυρά βοηθητικά προγράμματα για την εισαγωγή/εξαγωγή δεδομένων από/προς τα συστήματα Teradata όπως τα FastExport, FastLoad, MultiLoad και TPT.
- Αυτόματη διανομή: Τερατάτα μπορεί να διανείμει τα δεδομένα στους δίσκους αυτόματα χωρίς χειροκίνητη παρέμβαση.
Στη συνέχεια, σε αυτό το σεμινάριο Teradata SQL, θα μάθουμε για το Teradata Archiδομή.
Τερατάτα Archiδομή
Η αρχιτεκτονική Teradata είναι μια μαζικά παράλληλη επεξεργασία Archiδομή.
Τρία σημαντικά στοιχεία του Teradata είναι:
- Μηχανή ανάλυσης
- BYNET
- Access Module Processors (AMP)
Αποθήκευση Teradata Architecture βάση δεδομένων ArchiΔιάγραμμα δομής:
Αποθήκευση Teradata Archiδομή
Μηχανή ανάλυσης:
Η μηχανή ανάλυσης αναλύει τα ερωτήματα και προετοιμάζει το σχέδιο εκτέλεσης. Διαχειρίζεται συνεδρίες για χρήστες. Βελτιστοποιεί και στέλνει ένα αίτημα στους χρήστες.
Έτσι, όταν ο πελάτης εκτελεί ερωτήματα για την εισαγωγή εγγραφών, το Parsing Engine στέλνει τις εγγραφές στο επίπεδο Passage Message. Το επίπεδο διέλευσης μηνυμάτων ή BYNET είναι ένα στοιχείο λογισμικού και υλικού. Προσφέρει δυνατότητα δικτύωσης. Επίσης, ανακτά τις εγγραφές και στέλνει τη σειρά στο στόχο AMP.
ΑΜΠΕΡΑΖ:
Το AMP σημαίνει Access Module Processor. Αποθηκεύει εγγραφές σε αυτούς τους δίσκους. Οι AMP διεξάγουν τις ακόλουθες δραστηριότητες:
- Διαχειρίζεται ένα τμήμα της βάσης δεδομένων
- Διαχειρίζεται ένα τμήμα κάθε τραπεζιού
- Εκτελέστε όλες τις εργασίες που σχετίζονται με τη δημιουργία συνόλου αποτελεσμάτων όπως ταξινόμηση, συνάθροιση και ένωση
- Εκτελέστε διαχείριση κλειδώματος και χώρου
Ανάκτηση Teradata Archiδομή
Όταν ο πελάτης εκτελεί ερωτήματα για την ανάκτηση εγγραφών, η μηχανή ανάλυσης στέλνει ένα αίτημα στο BYNET. Στη συνέχεια, το BYNET στέλνει το αίτημα ανάκτησης σε κατάλληλα AMP.
Τα AMP αναζητούν τους δίσκους τους παράλληλα και αναγνωρίζουν τις απαιτούμενες εγγραφές και τις στέλνουν στο BYNET. Το BYNET στέλνει τις εγγραφές στο Parsing Engine, το οποίο με τη σειρά του θα σταλεί στον πελάτη.
Στη συνέχεια, σε αυτό το σεμινάριο Teradata Database, θα μάθουμε για τις εντολές Teradata SQL.
Τύποι εντολών Teradata SQL
Η βάση δεδομένων Teradata υποστηρίζει τις ακόλουθες βασικές εντολές SQL:
- Εντολές Γλώσσας Ορισμού Δεδομένων (DDL).
- Εντολές γλώσσας ελέγχου δεδομένων (DCL).
- Εντολές γλώσσας χειρισμού δεδομένων (DML).
Εντολές γλώσσας ορισμού δεδομένων
ΕΝΤΟΛΗ | Descriptιόν |
---|---|
ΔΗΜΙΟΥΡΓΩ | Δημιουργεί νέα βάση δεδομένων, πίνακα, χρήστη κ.λπ. |
DROP | Αφαιρεί μια νέα βάση δεδομένων, πίνακα, χρήστη κ.λπ. |
ALTER | Αλλάζει έναν πίνακα, στήλη, έναυσμα κ.λπ. |
ΤΡΟΠΟΠΟΙΩ | Αλλάζει μια βάση δεδομένων ή έναν ορισμό χρήστη |
ΜΕΤΟΝΟΜΑΖΩ | Αλλάζει το όνομα των πινάκων, των προβολών, των μακροεντολών κ.λπ. |
Εντολές γλώσσας ελέγχου δεδομένων
ΕΝΤΟΛΗ | Descriptιόν |
---|---|
ΧΟΡΗΓΗΣΗ/ΑΝΑΚΛΗΣΗ | Χρησιμοποιείται για τον έλεγχο των προνομίων ενός χρήστη σε ένα αντικείμενο |
ΠΑΡΑΧΩΡΗΣΗ ΣΥΝΔΕΣΗΣ/ΑΝΑΚΛΗΣΗ ΣΥΝΔΕΣΗΣ | Χρησιμοποιείται για τον έλεγχο των δικαιωμάτων σύνδεσης σε έναν κεντρικό υπολογιστή ή μια ομάδα κεντρικού υπολογιστή |
ΔΙΝΩ | Χρησιμοποιείται για να δώσει ένα αντικείμενο βάσης δεδομένων σε άλλο αντικείμενο βάσης δεδομένων |
Εντολές γλώσσας χειρισμού δεδομένων Teradata Database SQL
ΕΝΤΟΛΗ | Descriptιόν |
---|---|
ΔΙΑΓΡΑΦΗ | Αφαιρεί μια σειρά από τον πίνακα |
ECHO | Χρησιμοποιείται για την επαναφορά μιας συμβολοσειράς ή εντολής στον πελάτη |
ΣΗΜΕΙΟ ΕΛΕΓΧΟΥ | Καθορίζει ένα σημείο ανάκτησης στο ημερολόγιο που μπορεί να χρησιμοποιηθεί αργότερα για την επαναφορά του περιεχομένου του πίνακα |
SELECT | Χρησιμοποιείται για την επιστροφή δεδομένων συγκεκριμένης γραμμής σε μορφή πίνακα |
ΕΚΣΥΓΧΡΟΝΊΖΩ | Τροποποιεί δεδομένα σε μία ή περισσότερες σειρές ενός πίνακα |
Εφαρμογές Βάσης Δεδομένων Teradata
Ακολουθούν οι δημοφιλείς εφαρμογές Teradata:
- Διαχείριση δεδομένων πελατών: Βοηθά στη διατήρηση μακροχρόνιων σχέσεων με τους πελάτες.
- Κύρια διαχείριση δεδομένων: Βοηθά στην ανάπτυξη ενός περιβάλλοντος όπου τα κύρια δεδομένα μπορούν να χρησιμοποιηθούν, να συγχρονιστούν και να αποθηκευτούν.
- Διαχείριση Οικονομικών και Απόδοσης: Βοηθά τον οργανισμό να βελτιώσει την ταχύτητα και την ποιότητα των οικονομικών αναφορών. Μειώνει το κόστος της χρηματοοικονομικής υποδομής και διαχειρίζεται προληπτικά την απόδοση της επιχείρησης.
- Διαχείριση εφοδιαστικής αλυσίδας: Βελτιώστε τις λειτουργίες της εφοδιαστικής αλυσίδας που συμβάλλουν στη βελτίωση της εξυπηρέτησης πελατών, στη μείωση των χρόνων κύκλου και στη μείωση των αποθεμάτων.
- Διαχείριση αλυσίδας ζήτησης: Βοηθά στην αύξηση των επιπέδων εξυπηρέτησης πελατών και των πωλήσεων. Βοηθά επίσης τις εταιρείες να προβλέψουν με ακρίβεια τη ζήτηση για το είδος του καταστήματός τους.
Στη συνέχεια, σε αυτό το σεμινάριο Teradata για αρχάριους, θα μάθουμε για τη διαφορά μεταξύ Teradata και άλλων RDBMS.
Διαφορά μεταξύ Teradata και άλλων RDBMS
Παράμετρος | TERA DATA | RDBMS |
---|---|---|
Archiτεχνολογίες | Ακολουθεί το κοινόχρηστο τίποτα Archiδομή. | Μοιράστηκε τα πάντα και επιτρέπει τη διαμάχη πόρων. |
διεργασίες | MIPS [Εκατομμύρια οδηγίες/δευτ.] | KIPS [Χιλιάδες ιδρύματα/δευτ.] |
Δείκτες | Καλύτερη Διανομή και Ανάκτηση | Προσφέρει μόνο FASI Retrieval |
Παραλληλισμός | Υποστηρίζει τον παραλληλισμό χωρίς όρους. | Ο παραλληλισμός είναι υπό όρους και απρόβλεπτος |
Μαζικό φορτίο | Το Teradata επιτρέπει τη μαζική φόρτωση. | Επιτρέπει μόνο περιορισμένο φορτίο χύδην. |
Απεριόριστες δυνατότητες | Γραμμική επεκτασιμότητα με κλίση ενός | Επεκτασιμότητα με φθίνουσες αποδόσεις |
Προσωρινή μνήμη βάσης δεδομένων | Ένα ενιαίο buffer βάσης δεδομένων που χρησιμοποιείται από όλα τα UoP. (Μια ενότητα παραλληλισμού). Ένα ενιαίο χώρο αποθήκευσης δεδομένων στο οποίο έχουν πρόσβαση όλα τα UoP | Ο Ελεγκτής ερωτημάτων αποστέλλει λειτουργίες σε UoP που κατέχουν τα δεδομένα |
Καταστήματα | Αποθηκεύει TERA BYTES[Billιόντα σειρών] | GIGA BYTES[Εκατομμύρια σειρές] |
MPP εναντίον SMP
MPP | ΑΓΣ |
---|---|
MPP – Μαζική παράλληλη επεξεργασία. Είναι ένα σύστημα υπολογιστή που συνδέεται με πολλές ανεξάρτητες αριθμητικές μονάδες ή ολόκληρους μικροεπεξεργαστές, που λειτουργούν παράλληλα. | Συμμετρική Πολυεπεξεργασία. Σε ένα σύστημα επεξεργασίας SMP, οι CPU μοιράζονται την ίδια μνήμη και ως αποτέλεσμα ο κώδικας που εκτελείται σε ένα σύστημα μπορεί να επηρεάσει τη μνήμη που χρησιμοποιείται από ένα άλλο. |
Οι βάσεις δεδομένων μπορούν να επεκταθούν με την προσθήκη νέων CPU. | Οι βάσεις δεδομένων SMP χρησιμοποιούν γενικά μία CPU για την εκτέλεση αναζητήσεων στη βάση δεδομένων. |
Σε ένα περιβάλλον MPP, η απόδοση βελτιώνεται επειδή δεν πρέπει να μοιράζονται πόροι μεταξύ φυσικών υπολογιστών. | Ο φόρτος εργασίας για μια παράλληλη εργασία κατανέμεται στους επεξεργαστές του συστήματος. |
Η απόδοση ενός συστήματος μαζικής παράλληλης επεξεργασίας είναι γραμμική. Ωστόσο, θα αυξηθεί ανάλογα με τον αριθμό των κόμβων. | Οι βάσεις δεδομένων SMP μπορούν να εκτελεστούν σε πολλούς διακομιστές. Ωστόσο, θα μοιραστεί έναν άλλο πόρο. |
Σύνοψη
- Teradata που σημαίνει: Το Teradata είναι ανοιχτού κώδικα Σύστημα διαχείρισης βάσης δεδομένων για την ανάπτυξη εφαρμογών αποθήκευσης δεδομένων μεγάλης κλίμακας.
- Η Teradata ήταν τμήμα της NCR Corporation. Ιδρύθηκε το 1979 αλλά αποχώρησε από το NCR τον Οκτώβριο του 2007
- Η Teradata προσφέρει μια πλήρη σειρά υπηρεσιών που επικεντρώνεται στην αποθήκευση δεδομένων
- Το Teradata προσφέρει γραμμική επεκτασιμότητα όταν αντιμετωπίζετε μεγάλους όγκους δεδομένων προσθέτοντας κόμβους για να αυξήσετε την απόδοση του συστήματος.
- Τρία σημαντικά στοιχεία του Teradata είναι 1) Μηχανή ανάλυσης 2) MPP 3) Επεξεργαστές μονάδων πρόσβασης (AMP)
- Η Teradata προσφέρει μια πλήρη σειρά προϊόντων για την κάλυψη των αναγκών αποθήκευσης δεδομένων και ETL οποιουδήποτε οργανισμού
- Η εφαρμογή Teradata χρησιμοποιείται κυρίως για διαχείριση αλυσίδας εφοδιασμού, διαχείριση βασικών δεδομένων, διαχείριση αλυσίδας ζήτησης κ.λπ.