Teradata-Tutorial: Was ist Teradata SQL? Datenbank Architektur

Was ist Teradata?

Teradata ist ein Open-Source-Datenbankverwaltungssystem für die Entwicklung umfangreicher Data-Warehousing-Anwendungen. Dieses Tool unterstützt mehrere Data-Warehouse-Operationen gleichzeitig mithilfe des Konzepts der Parallelität. Teradata ist ein massiv offenes Verarbeitungssystem, das Unix/Linux/ unterstützt.Windows Serverplattformen.

Teradata-Software wird von der Teradata Corporation entwickelt, einem amerikanischen IT-Unternehmen. Es ist ein Anbieter von Analysedatenplattformen, Anwendungen und anderen damit verbundenen Dienstleistungen. Das Unternehmen entwickelt ein Produkt, um Daten aus verschiedenen Quellen zu konsolidieren und für die Analyse verfügbar zu machen.

Geschichte von Teradata

Teradata war ein Geschäftsbereich der NCR Corporation. Das Unternehmen wurde 1979 gegründet, trennte sich jedoch im Oktober 2007 von NCR. Michael Koehler wurde der erste CEO von Teradata.

Meilensteine ​​der Teradata Corporation:

  • 1979 – Teradata wurde gegründet
  • 1984 – Veröffentlichung des ersten Datenbankcomputers DBC/1012
  • 1986 – Das Fortune-Magazin erklärt Teradata zum „Produkt des Jahres“
  • 1999 – Größte mit Teradata erstellte Datenbank mit 130 Terabyte
  • 2002 – Veröffentlichung der Teradata V2R5-Version mit Komprimierung und primärer Partitionierung
  • 2006 – Einführung der Teradata Master Data Management-Lösung
  • 2008 – Teradata 13.0 mit Active Data Warehousing veröffentlicht
  • 2011 – Übernahme von Teradata Aster und Einstieg in den Bereich Advanced Analytics
  • 2012 – Teradata 14.0 eingeführt
  • 2014 – Teradata 15.0 eingeführt
  • 2015 – Teradata kauft die Apps-Marketingplattform Appoxee
  • 2016 – Terada schließt sich Big Data an
  • 2017 – Teradata übernimmt StackIQ aus San Diego

Warum Teradata?

  • Teradata bietet ein umfassendes Servicepaket mit Schwerpunkt auf Data Warehousing
  • Das System basiert auf einer offenen Architektur. Wenn also schnellere Geräte verfügbar werden, können diese in die bereits vorhandene Architektur integriert werden.
  • Teradata unterstützt mehr als 50 Petabyte an Daten.
  • Einzelbetriebsansicht für ein großes Teradata-Mehrknotensystem mit Service Workstation
  • Kompatibel mit einer Vielzahl von BI-Tool um Daten abzurufen.
  • Es kann als zentraler Kontrollpunkt für den DBA fungieren, um das zu verwalten Database.
  • Hohe Leistung, vielfältige Abfragen, datenbankinterne Analysen und ausgefeiltes Workload-Management
  • Mit Teradata können Sie dieselben Daten für mehrere Bereitstellungsoptionen abrufen

Als Nächstes lernen wir in diesem Teradata-Tutorial die Funktionen von Teradata kennen.

Funktionen von Teradata SQL

Teradata bietet die folgenden leistungsstarken Funktionen:

  • Lineare Skalierbarkeit: Bietet lineare Skalierbarkeit bei der Verarbeitung großer Datenmengen durch Hinzufügen von Knoten, um die Leistung des Systems zu steigern.
  • Unbegrenzte Parallelität: Teradata basiert auf MPP (Massively Parallel Processing). Archi(Textur). Es ist also von Anfang an auf Parallelität ausgelegt. Es kann eine große Aufgabe in kleinere Aufgaben aufteilen und diese parallel ausführen
  • Ausgereifter Optimierer: Teradata Optimizer kann bis zu 64 Verknüpfungen in einer Abfrage verarbeiten.
  • Niedrige Gesamtbetriebskosten: Tera-Daten haben niedrige Gesamtbetriebskosten. Es ist einfach einzurichten, zu warten und zu verwalten.
  • Dienstprogramme laden und entladen: Teradata bietet Lade- und Entladeprogramme zum Verschieben von Daten in das/aus dem Teradata-System.
  • Konnektivität: Dieses MPP-System kann mit kanalgebundenen Systemen wie einem Mainframe oder netzwerkgebundenen Systemen verbunden werden.
  • SQL: Teradata unterstützt SQL um mit den in Tabellen gespeicherten Daten zu interagieren. Es bietet seine Erweiterung.
  • Robuste Dienstprogramme: Teradata bietet robuste Dienstprogramme zum Importieren/Exportieren von Daten aus/in Teradata-Systeme wie FastExport, FastLoad, MultiLoad und TPT.
  • Automatische Verteilung: Teradata kann die Daten automatisch und ohne manuellen Eingriff auf die Festplatten verteilen.

Als nächstes lernen wir in diesem Teradata SQL-Tutorial etwas über Teradata ArchiStruktur.

Teradata Architektur

Die Teradata-Architektur ist eine Massively Parallel Processing ArchiStruktur.

Drei wichtige Komponenten von Teradata sind:

  • Parsing-Engine
  • BYNET
  • Zugriffsmodulprozessoren (AMPs)

Teradatenspeicher Architecture-Datenbank ArchiStrukturdiagramm:

Teradata Architektur
Teradata ArchiStrukturdiagramm

Teradatenspeicher Architektur

Parsing-Engine:

Die Parsing Engine analysiert die Abfragen und bereitet den Ausführungsplan vor. Sie verwaltet Sitzungen für Benutzer. Sie optimiert und sendet eine Anfrage an die Benutzer.

Wenn der Client also Abfragen zum Einfügen von Datensätzen ausführt, sendet die Parsing Engine die Datensätze an die Message Passing-Schicht. Message Passing Layer oder BYNET ist eine Software- und Hardwarekomponente. Es bietet Netzwerkfähigkeit. Außerdem werden die Datensätze abgerufen und die Zeile an den Ziel-AMP gesendet.

AMPERE:

AMP steht für Access Module Processor. Es speichert Datensätze auf diesen Festplatten. AMP führt folgende Aktivitäten durch:

  • Verwaltet einen Teil der Datenbank
  • Verwaltet einen Teil jeder Tabelle
  • Führen Sie alle mit der Generierung des Ergebnissatzes verbundenen Aufgaben aus, z. B. Sortieren, Aggregation und Verknüpfung
  • Führen Sie die Sperr- und Speicherplatzverwaltung durch

Teradata-Abruf Architektur

Wenn der Client Abfragen zum Abrufen von Datensätzen ausführt, sendet die Parsing-Engine eine Anfrage an BYNET. Anschließend sendet BYNET die Abrufanfrage an die entsprechenden AMPs.

AMPs durchsuchen parallel ihre Festplatten, erkennen die erforderlichen Datensätze und senden sie an BYNET. BYNET sendet die Datensätze an die Parsing Engine, die wiederum an den Client gesendet wird.

Als nächstes lernen wir in diesem Teradata-Datenbank-Tutorial etwas über Teradata-SQL-Befehle.

Arten von Teradata SQL-Befehlen

Die Teradata-Datenbank unterstützt die folgenden grundlegenden SQL-Befehle:

  1. DDL-Befehle (Data Definition Language).
  2. DCL-Befehle (Data Control Language).
  3. DML-Befehle (Data Manipulation Language).

Befehle der Datendefinitionssprache

COMMAND Beschreibung
CREATE Erstellt eine neue Datenbank, Tabelle, einen neuen Benutzer usw.
DROP Entfernt eine neue Datenbank, Tabelle, einen neuen Benutzer usw.
ALTER Ändert eine Tabelle, Spalte, einen Trigger usw.
ÄNDERN Ändert eine Datenbank oder Benutzerdefinition
UMBENENNEN Ändert Namen von Tabellen, Ansichten, Makros usw.

Befehle der Datenkontrollsprache

COMMAND Beschreibung
GEWÄHRUNG/WIDERRUFEN Wird verwendet, um die Berechtigungen eines Benutzers für ein Objekt zu steuern
ANMELDUNG GEWÄHREN/ANMELDUNG WIDERRUFEN Wird zur Steuerung der Anmeldeberechtigungen für einen Host oder eine Hostgruppe verwendet
GEBEN Wird verwendet, um ein Datenbankobjekt einem anderen Datenbankobjekt zuzuweisen

Befehle der Teradata Database SQL Data Manipulation Language

COMMAND Beschreibung
LÖSCHEN Entfernt eine Zeile aus der Tabelle
ECHO Wird verwendet, um eine Zeichenfolge oder einen Befehl an den Client zurückzugeben
KONTROLLPUNKT Definiert einen Wiederherstellungspunkt im Journal, der später zum Wiederherstellen des Tabelleninhalts verwendet werden kann
SELECT Wird verwendet, um bestimmte Zeilendaten in Tabellenform zurückzugeben
AKTUALISIEREN Ändert Daten in einer oder mehreren Zeilen einer Tabelle

Anwendungen der Teradata-Datenbank

Im Folgenden sind die beliebten Teradata-Anwendungen aufgeführt:

  • Kundendatenmanagement: Trägt dazu bei, langfristige Kundenbeziehungen aufrechtzuerhalten.
  • Stammdatenverwaltung: Hilft bei der Entwicklung einer Umgebung, in der Stammdaten verwendet, synchronisiert und gespeichert werden können.
  • Finanz- und Leistungsmanagement: Hilft Unternehmen dabei, die Geschwindigkeit und Qualität der Finanzberichterstattung zu verbessern. Es reduziert die Kosten für die Finanzinfrastruktur und verwaltet die Unternehmensleistung proaktiv.
  • Leitung der Lieferkette: Verbessern Sie die Abläufe in der Lieferkette, um den Kundenservice zu verbessern, Durchlaufzeiten zu verkürzen und die Lagerbestände zu senken.
  • Nachfragekettenmanagement: Trägt dazu bei, den Kundenservice und den Umsatz zu steigern. Es hilft Unternehmen auch dabei, die Nachfrage nach ihren Ladenartikeln genau vorherzusagen.

Als nächstes lernen wir in diesem Teradata-Tutorial für Anfänger den Unterschied zwischen Teradata und anderen kennen RDBMS.

Unterschied zwischen Teradata und anderen RDBMS

Parameter TERA-DATEN RDBMS
Architekturen Folgt Shared Nothing ArchiStruktur. Alles geteilt und Ressourcenkonflikte zugelassen.
Prozesse MIPS [Millionen Anweisungen/Sek.] KIPS [Tausende Institutionen/Sek.]
Indizes Bessere Verteilung und Abruf Bietet nur FASI-Abruf
Parallelität Unterstützt bedingungslose Parallelität. Parallelität ist bedingt und unvorhersehbar
Große Ladung Teradata ermöglicht Massenladen. Ermöglicht nur begrenztes Massenladen.
Skalierbarkeit Lineare Skalierbarkeit mit einer Steigung von eins Skalierbarkeit bei sinkenden Erträgen
Datenbankpuffer Ein einziger Datenbankpuffer, der von allen UoPs verwendet wird. (Eine Einheit der Parallelität). Ein einziger Datenspeicher, auf den alle UoPs zugreifen Query Controller sendet Funktionen an UoPs, die Eigentümer der Daten sind
Shops Es speichert TERA BYTES[BillIonen von Reihen] GIGA BYTES[Millionen Zeilen]

MPP vs. SMP

MPP SMP
MPP – Massively Parallel Processing. Es handelt sich um ein Computersystem, das mit vielen unabhängigen Recheneinheiten oder ganzen Mikroprozessoren verbunden ist, die parallel laufen. Symmetrisches Multi-Processing. In einem SMP-Verarbeitungssystem teilen sich die CPUs denselben Speicher. Daher kann sich Code, der in einem System ausgeführt wird, auf den von einem anderen System verwendeten Speicher auswirken.
Datenbanken können durch das Hinzufügen neuer CPUs erweitert werden. SMP-Datenbanken verwenden im Allgemeinen eine CPU, um Datenbanksuchen durchzuführen.
In einer MPP-Umgebung wird die Leistung verbessert, da keine Ressourcen zwischen physischen Computern geteilt werden müssen. Die Arbeitslast für einen parallelen Job wird auf die Prozessoren im System verteilt.
Die Leistung eines Massive-Parallelverarbeitungssystems ist linear. Sie wird jedoch proportional zur Anzahl der Knoten zunehmen. SMP-Datenbanken können auf mehreren Servern laufen. Allerdings wird eine andere Ressource geteilt.

Zusammenfassung

  • Teradata-Bedeutung: Teradata ist eine Open-Source-Lösung Datenbankverwaltungssystem für die Entwicklung umfangreicher Data-Warehousing-Anwendungen.
  • Teradata war ein Geschäftsbereich der NCR Corporation. Es wurde 1979 gegründet, trennte sich jedoch im Oktober 2007 von NCR
  • Teradata bietet ein umfassendes Servicepaket mit Schwerpunkt auf Data Warehousing
  • Teradata bietet lineare Skalierbarkeit bei der Verarbeitung großer Datenmengen durch das Hinzufügen von Knoten, um die Leistung des Systems zu steigern.
  • Drei wichtige Komponenten von Teradata sind 1) Parsing Engine 2) MPP 3) Access Module Processors (AMPs)
  • Teradata bietet eine komplette Produktpalette, um die Data Warehousing- und ETL-Anforderungen jedes Unternehmens zu erfüllen
  • Teradata-Anwendung, die hauptsächlich für Supply Chain Management, Master Data Management, Demand Chain Management usw. verwendet wird.