Teradata Tutorial: Vad är Teradata SQL? Databas Architecture

Vad är Teradata?

Teradata är ett databashanteringssystem med öppen källkod för utveckling av storskaliga datalagringsapplikationer. Detta verktyg ger stöd för flera datalageroperationer samtidigt genom att använda konceptet parallellism. Teradata är ett massivt öppet bearbetningssystem som stöder Unix/Linux/Windows serverplattformar.

Teradata-mjukvaran är utvecklad av Teradata Corporation, som är ett amerikanskt IT-företag. Det är en leverantör av analysdataplattformar, applikationer och andra relaterade tjänster. Företaget utvecklar en produkt för att konsolidera data från olika källor och göra data tillgänglig för analys.

Teradatas historia

Teradata var en division av NCR Corporation. Det bildades 1979 men skildes från NCR i oktober 2007. Michael Koehler blev Teradatas första VD.

Milstolpar för Teradata Corporation:

  • 1979 – Teradata införlivades
  • 1984 – Release av första databasdatorn DBC/1012
  • 1986 – Tidningen Fortune utropade Teradata till "Årets produkt"
  • 1999 – Största databasen byggd med Teradata med 130 Terabyte
  • 2002 – Teradata V2R5 version med komprimering och Partition Primary
  • 2006 – Lansering av Teradata Master Data Management-lösning
  • 2008 – Teradata 13.0 släpptes med Active Data Warehousing
  • 2011 – Skaffar Teradata Aster och kastar sig in i Advanced Analytics Space
  • 2012 – Teradata 14.0 introduceras
  • 2014 – Teradata 15.0 introduceras
  • 2015- Teradata köper Apps Marketing Platform Appoxee
  • 2016- Terada samarbetar med Big data
  • 2017- Teradata förvärvar San Diegos StackIQ

Varför Teradata?

  • Teradata erbjuder ett komplett utbud av tjänster som fokuserar på Datalagring
  • Systemet är byggt på öppen arkitektur. Så närhelst några snabbare enheter görs tillgängliga kan de integreras i den redan byggda arkitekturen.
  • Teradata stöder 50+ petabyte data.
  • En operationsvy för ett stort Teradata multi-nodsystem som använder Service Workstation
  • Kompatibel med ett brett utbud av BI-verktyg för att hämta data.
  • Det kan fungera som en enda kontrollpunkt för DBA att hantera Databas.
  • Hög prestanda, olika frågor, analys i databasen och sofistikerad arbetsbelastningshantering
  • Teradata låter dig få samma data om flera distributionsalternativ

Nästa i denna Teradata-handledning kommer vi att lära oss om funktionerna i Teradata.

Funktioner i Teradata SQL

Teradata erbjuder följande kraftfulla funktioner:

  • Linjär skalbarhet: Erbjuder linjär skalbarhet vid hantering av stora datamängder genom att lägga till noder för att öka systemets prestanda.
  • Obegränsad parallellism: Teradata är baserat på MPP (Massively Parallel Processing). Architecture). Så den är designad för att vara parallell sedan början. Den kan dela upp en stor uppgift i mindre uppgifter och köra dem parallellt
  • Mature Optimizer: Teradata Optimizer kan hantera upp till 64 kopplingar i en fråga.
  • Låg TCO: Tera-data har en låg total ägandekostnad. Det är lätt att installera, underhålla och administrera.
  • Ladda och lossa verktyg: Teradata tillhandahåller laddnings- och avlastningsverktyg för att flytta data till/från Teradata System.
  • Anslutningar: Detta MPP-system kan ansluta till kanalanslutna system som en stordator eller nätverksanslutna system.
  • SQL: Teradata stöder SQL att interagera med data som lagras i tabeller. Det ger sin förlängning.
  • Robusta verktyg: Teradata tillhandahåller robusta verktyg för att importera/exportera data från/till Teradata-system som FastExport, FastLoad, MultiLoad och TPT.
  • Automatisk distribution: Teradata kan distribuera data till diskarna automatiskt utan manuell inblandning.

Nästa i denna Teradata SQL-handledning kommer vi att lära oss om Teradata Architecture.

Teradata Architecture

Teradata-arkitektur är en massivt parallell bearbetning Architecture.

Tre viktiga komponenter i Teradata är:

  • Parsingmotor
  • BYNET
  • Access Module Processorer (AMP)

Teradata-lagring Architecture Database ArchiTecture Diagram:

Teradata Architecture
Teradata ArchiTecture Diagram

Teradata-lagring Architecture

Parsing Engine:

Parsing Engine analyserar frågorna och förbereder exekveringsplanen. Den hanterar sessioner för användare. Den optimerar och skickar en förfrågan till användarna.

Så när klienten kör frågor för att infoga poster, skickar Parsing Engine posterna till lagret Message Passing. Message passing layer eller BYNET är en mjukvaru- och hårdvarukomponent. Det erbjuder nätverkskapacitet. Den hämtar också posterna och skickar raden till mål-AMP.

AMP:

AMP står för Access Module Processor. Den lagrar poster på dessa diskar. AMP bedriver följande aktiviteter:

  • Hanterar en del av databasen
  • Hanterar en del av varje bord
  • Utför alla uppgifter som är associerade med att generera resultatuppsättningar som sortering, aggregering och sammanfogning
  • Utför lås- och utrymmeshantering

Teradata hämtning Architecture

När klienten kör frågor för att hämta poster skickar Parsing-motorn en begäran till BYNET. Sedan skickar BYNET hämtningsförfrågan till lämpliga AMP-enheter.

AMPs söker sina diskar parallellt och känner igen de nödvändiga posterna och skickar dem till BYNET. BYNET skickar posterna till Parsing Engine, som i sin tur kommer att skickas till klienten.

Nästa i denna Teradata Database-handledning kommer vi att lära oss om Teradata SQL-kommandon.

Typer av Teradata SQL-kommandon

Teradata Database stöder följande grundläggande SQL-kommandon:

  1. Data Definition Language (DDL) kommandon
  2. Data Control Language (DCL) kommandon
  3. Data Manipulation Language (DML) kommandon

Data Definition Language kommandon

KOMMANDO Systembeskrivningar
SKAPA Skapar en ny databas, tabell, användare osv.
FALLA Tar bort en ny databas, tabell, användare osv.
ÄNDRA Ändrar en tabell, kolumn, utlösare, etc.
ÄNDRA Ändrar en databas eller användardefinition
DÖPA OM Ändrar namn på tabeller, vyer, makron, etc.

Kommandon för datakontrollspråk

KOMMANDO Systembeskrivningar
BEVILJA/ÅTERKALLA Används för att kontrollera privilegier för en användare på ett objekt
BILJA LOGON/ÅTERVÄLJ LOGON Används för att styra inloggningsprivilegier till en värd eller värdgrupp
GE Används för att ge ett databasobjekt till ett annat databasobjekt

Teradata Database SQL Data Manipulation Language kommandon

KOMMANDO Systembeskrivningar
RADERA Tar bort en rad från tabellen
ECHO Används för att eka en sträng eller ett kommando till klienten
KONTROLLSTATION Definierar en återställningspunkt i journalen som kan användas senare för att återställa tabellinnehållet
VÄLJA Används för att returnera en specifik raddata i en tabellform
UPPDATERING Ändrar data i en eller flera rader i en tabell

Tillämpningar av Teradata Database

Följande är de populära Teradata-applikationerna:

  • Kunddatahantering: Hjälper till att upprätthålla långvariga relationer med kunder.
  • Master Data Management: Hjälper till att utveckla en miljö där masterdata kan användas, synkroniseras och lagras.
  • Ekonomi och resultatstyrning: Hjälper organisationen att förbättra hastigheten och kvaliteten på den finansiella rapporteringen. Det minskar kostnaderna för finansieringsinfrastruktur och hanterar proaktivt företagets prestanda.
  • Supply Chain Management: Förbättra driften i leveranskedjan som bidrar till förbättrad kundservice, minskade cykeltider och lägre lager.
  • Demand Chain Management: Hjälper till att öka kundservicenivåer och försäljning. Det hjälper också företag att förutsäga efterfrågan på sina butiksartiklar korrekt.

Nästa i denna handledning för Teradata för nybörjare kommer vi att lära oss om skillnaden mellan Teradata och andra RDBMS.

Skillnad mellan Teradata och andra RDBMS

Parameter TERA DATA RDBMS
Architectures Följer Shared Nothing Architecture. Delade allt och tillåter resursstrid.
Processer MIPS [miljontals instruktioner/sek.] KIPS [Tusentals institutioner/sek]
Index Bättre distribution och hämtning Erbjuder endast FASI Retrieval
parallel~~POS=TRUNC Stöder ovillkorlig parallellism. Parallellism är villkorlig och oförutsägbar
Bulkbelastning Teradata tillåter bulkbelastning. Tillåter endast begränsad bulklast.
Skalbarhet Linjär skalbarhet med en lutning på ett Skalbarhet med minskande avkastning
Databasbuffert En enda databasbuffert som används av alla UoP. (En enhet av parallellism). Ett enda datalager nås av alla UoP Query Controller skickar funktioner till UoP:er som äger data
butiker Den lagrar TERA BYTES[Billjoner av rader] GIGA BYTES[Miljoner rader]

MPP vs. SMP

MPP SMP
MPP – Massivt parallell bearbetning. Det är ett datorsystem som är kopplat till många oberoende aritmetiska enheter eller hela mikroprocessorer som körs parallellt. Symmetrisk multibearbetning. I ett SMP-bearbetningssystem delar CPU:erna samma minne, och som ett resultat kan kod som körs i ett system påverka minnet som används av ett annat.
Databaser kan utökas genom att lägga till nya processorer. SMP-databaser använder vanligtvis en CPU för att utföra databassökningar.
I en MPP-miljö förbättras prestandan eftersom inga resurser får delas mellan fysiska datorer. Arbetsbelastningen för ett parallellt jobb fördelas över processorerna i systemet.
Prestanda för ett massivt parallellt bearbetningssystem är linjärt. Det kommer dock att öka i proportion till antalet noder. SMP-databaser kan köras på flera servrar. Kommer dock att dela en annan resurs.

Sammanfattning

  • Teradata betyder: Teradata är en öppen källkod Database Management System för utveckling av storskaliga datalagerapplikationer.
  • Teradata var en division av NCR Corporation. Det införlivades 1979 men skildes från NCR i oktober 2007
  • Teradata erbjuder ett komplett utbud av tjänster som fokuserar på Data Warehousing
  • Teradata erbjuder linjär skalbarhet vid hantering av stora datavolymer genom att lägga till noder för att öka systemets prestanda.
  • Tre viktiga komponenter i Teradata är 1) Parsing Engine 2) MPP 3) Access Module Processors (AMP)
  • Teradata erbjuder ett komplett utbud av produktpaket för att möta datalager och ETL-behov hos alla organisationer
  • Teradata-applikationen används huvudsakligen för Supply Chain Management, Master Data Management, Demand Chain Management, etc.