Teradata Tutorial: Hvad er Teradata SQL? Database Architecture

Hvad er Teradata?

Teradata er et open source-databasestyringssystem til udvikling af store data warehousing-applikationer. Dette værktøj giver støtte til flere datavarehusoperationer samtidigt ved at bruge konceptet parallelisme. Teradata er et massivt åbent behandlingssystem, der understøtter Unix/Linux/Windows server platforme.

Teradata software er udviklet af Teradata Corporation, som er et amerikansk it-firma. Det er en leverandør af analytiske dataplatforme, applikationer og andre relaterede tjenester. Firmaet udvikler et produkt til at konsolidere data fra forskellige kilder og gøre dataene tilgængelige for analyse.

Teradatas historie

Teradata var en afdeling af NCR Corporation. Det blev indlemmet i 1979, men skiltes fra NCR i oktober 2007. Michael Koehler blev den første administrerende direktør for Teradata.

Teradata Corporations milepæle:

  • 1979 – Teradata blev inkorporeret
  • 1984 – Frigivelse af første databasecomputer DBC/1012
  • 1986 - Fortune magazine erklærede Teradata som 'Årets produkt'
  • 1999 – Største database bygget ved hjælp af Teradata med 130 Terabyte
  • 2002 – Teradata V2R5 versionsudgivelse med komprimering og Partition Primary
  • 2006 – Lancering af Teradata Master Data Management-løsning
  • 2008 – Teradata 13.0 udgivet med Active Data Warehousing
  • 2011 – Køber Teradata Aster og kaster sig ud i Advanced Analytics Space
  • 2012 – Teradata 14.0 introduceret
  • 2014 – Teradata 15.0 introduceret
  • 2015- Teradata køber Apps Marketing Platform Appoxee
  • 2016- Terada går sammen med Big data
  • 2017- Teradata erhverver San Diegos StackIQ

Hvorfor Teradata?

  • Teradata tilbyder en komplet pakke af tjenester, der fokuserer på Datavarehousing
  • Systemet er bygget på åben arkitektur. Så hver gang hurtigere enheder stilles til rådighed, kan de indarbejdes i den allerede opbyggede arkitektur.
  • Teradata understøtter 50+ petabyte data.
  • Enkeltbetjeningsvisning for et stort Teradata multi-node system ved hjælp af Service Workstation
  • Kompatibel med en bred vifte af BI værktøj at hente data.
  • Det kan fungere som et enkelt kontrolpunkt for DBA til at styre Database.
  • Høj ydeevne, forskellige forespørgsler, analyse i databasen og sofistikeret styring af arbejdsbelastning
  • Teradata giver dig mulighed for at få de samme data på flere implementeringsmuligheder

Næste i denne Teradata-tutorial lærer vi om funktionerne i Teradata.

Funktioner i Teradata SQL

Teradata tilbyder følgende kraftfulde funktioner:

  • Lineær skalerbarhed: Tilbyder lineær skalerbarhed ved håndtering af store mængder data ved at tilføje noder for at øge systemets ydeevne.
  • Ubegrænset parallelisme: Teradata er baseret på MPP (Massively Parallel Processing). Architecture). Så det er designet til at være parallelt siden begyndelsen. Den kan dele en stor opgave op i mindre opgaver og køre dem parallelt
  • Mature Optimizer: Teradata Optimizer kan håndtere op til 64 joinforbindelser i en forespørgsel.
  • Lav TCO: Tera-data har lave samlede ejeromkostninger. Det er nemt at konfigurere, vedligeholde og administrere.
  • Indlæs og aflæs hjælpeprogrammer: Teradata leverer ind- og udlæsningsværktøjer til at flytte data ind i/fra Teradata System.
  • Tilslutning: Dette MPP-system kan oprette forbindelse til kanaltilknyttede systemer som en mainframe eller netværkstilsluttede systemer.
  • SQL: Teradata understøtter SQL at interagere med de data, der er gemt i tabeller. Det giver sin forlængelse.
  • Robuste hjælpeprogrammer: Teradata leverer robuste værktøjer til at importere/eksportere data fra/til Teradata-systemer som FastExport, FastLoad, MultiLoad og TPT.
  • Automatisk distribution: Teradata kan distribuere dataene til diskene automatisk uden manuel indgriben.

Næste i denne Teradata SQL-tutorial lærer vi om Teradata Architecture.

Teradata Architecture

Teradata-arkitektur er en massivt parallel behandling Architecture.

Tre vigtige komponenter i Teradata er:

  • Parsing Engine
  • BYNET
  • Access Module Processorer (AMP'er)

Teradata lagring Architecture Database ArchiTecture Diagram:

Teradata Architecture
Teradata Architecture diagram

Teradata lagring Architecture

Parsing Engine:

Parsing Engine analyserer forespørgslerne og forbereder udførelsesplanen. Det administrerer sessioner for brugere. Det optimerer og sender en anmodning til brugerne.

Så når klienten udfører forespørgsler for at indsætte poster, sender Parsing Engine posterne til Message Passing-laget. Message passing layer eller BYNET er en software- og hardwarekomponent. Det tilbyder netværkskapacitet. Den henter også posterne og sender rækken til mål-AMP.

Amp:

AMP står for Access Module Processor. Det gemmer poster på disse diske. AMP udfører følgende aktiviteter:

  • Styrer en del af databasen
  • Styrer en del af hvert bord
  • Udfør alle de opgaver, der er forbundet med at generere resultatsæt, såsom sortering, aggregering og joinforbindelse
  • Udfør låse- og pladsstyring

Teradata-hentning Architecture

Når klienten kører forespørgsler for at hente poster, sender parsing-motoren en anmodning til BYNET. Derefter sender BYNET genfindingsanmodningen til passende AMP'er.

AMP'er søger parallelt på deres diske og genkender de nødvendige poster og sender dem til BYNET. BYNET sender posterne til Parsing Engine, som igen vil blive sendt til klienten.

Dernæst i denne Teradata Database-øvelse lærer vi om Teradata SQL-kommandoer.

Typer af Teradata SQL-kommandoer

Teradata Database understøtter følgende grundlæggende SQL-kommandoer:

  1. Data Definition Language (DDL) kommandoer
  2. Data Control Language (DCL) kommandoer
  3. Data Manipulation Language (DML) kommandoer

Data Definition Language kommandoer

KOMMANDO Description
SKAB Opretter en ny database, tabel, bruger osv.
DROP Fjerner en ny database, tabel, bruger osv.
ÆNDRE Ændrer en tabel, kolonne, trigger osv.
MODIFICERE Ændrer en database eller brugerdefinition
OMDØB Ændrer navn på tabeller, visninger, makroer osv.

Sprogkommandoer for datakontrol

KOMMANDO Description
TILDEL/ TILBAGETRÆKKE Bruges til at kontrollere privilegier for en bruger på et objekt
TILDEL LOGON/TILBAGE LOGON Bruges til at kontrollere logonrettigheder til en vært eller værtsgruppe
GIVE Bruges til at give et databaseobjekt til et andet databaseobjekt

Teradata Database SQL Data Manipulation Language kommandoer

KOMMANDO Description
SLET Fjerner en række fra tabellen
ECHO Bruges til at ekko en streng eller kommando til klienten
KONTROLPUNKT Definerer et gendannelsespunkt i journalen, der senere kan bruges til at gendanne tabelindholdet
SELECT Bruges til at returnere bestemte rækkedata i en tabelform
OPDATER Ændrer data i en eller flere rækker i en tabel

Anvendelser af Teradata-databasen

Følgende er de populære Teradata-applikationer:

  • Kundedatahåndtering: Hjælper med at opretholde langvarige relationer med kunder.
  • Master Data Management: Hjælper med at udvikle et miljø, hvor stamdata kan bruges, synkroniseres og gemmes.
  • Økonomi og resultatstyring: Hjælper organisationen med at forbedre hastigheden og kvaliteten af ​​finansiel rapportering. Det reducerer omkostningerne til finansieringsinfrastruktur og styrer virksomhedens ydeevne proaktivt.
  • Supply Chain Management: Forbedre forsyningskædedriften, som hjælper til forbedret kundeservice, reducerede cyklustider og lavere varebeholdninger.
  • Efterspørgselskædestyring: Hjælper med at øge kundeserviceniveauer og salg. Det hjælper også virksomheder med at forudsige efterspørgslen efter deres butiksvarer nøjagtigt.

Næste i denne Teradata for begyndere tutorial, vil vi lære om forskellen mellem Teradata og andre RDBMS.

Forskellen mellem Teradata og andre RDBMS

Parameter TERA DATA RDBMS
Architectures Følger Shared Nothing Architecture. Delte alt og tillader ressourcestrid.
Processer MIPS [Millioner af instruktioner/sek.] KIPS [Tusindvis af institutioner/sek.]
Indexes Bedre distribution og genfinding Tilbyder kun FASI Retrieval
parallelitet Understøtter ubetinget parallelisme. Parallelisme er betinget og uforudsigelig
Bulk belastning Teradata tillader bulk load. Tillader kun begrænset bulkbelastning.
Skalerbarhed Lineær skalerbarhed med en hældning på én Skalerbarhed med faldende afkast
Database buffer En enkelt databasebuffer brugt af alle UoP'er. (En enhed af parallelisme). Et enkelt datalager, som alle UoP'er har adgang til Query Controller sender funktioner til UoP'er, der ejer dataene
butikker Det gemmer TERA BYTES[Billioner af rækker] GIGA BYTES[Millioner af rækker]

MPP vs. SMP

MPP SMP
MPP – Massively Parallel Processing. Det er computersystem, som er knyttet til mange uafhængige aritmetiske enheder eller hele mikroprocessorer, der kører parallelt. Symmetrisk multi-behandling. I et SMP-behandlingssystem deler CPU'erne den samme hukommelse, og som et resultat kan kode, der kører i et system, påvirke den hukommelse, der bruges af et andet.
Databaser kan udvides ved at tilføje nye CPU'er. SMP-databaser bruger generelt én CPU til at udføre databasesøgninger.
I et MPP-miljø forbedres ydeevnen, fordi ingen ressourcer skal deles mellem fysiske computere. Arbejdsbyrden for et paralleljob er fordelt på tværs af processorerne i systemet.
Ydeevnen af ​​et massivt parallelt behandlingssystem er lineært. Det vil dog stige i forhold til antallet af noder. SMP-databaser kan køre på flere servere. Vil dog dele en anden ressource.

Resumé

  • Teradata betydning: Teradata er en open source Databasestyringssystem til udvikling af store data warehousing applikationer.
  • Teradata var en afdeling af NCR Corporation. Det blev indlemmet i 1979, men skiltes fra NCR i oktober 2007
  • Teradata tilbyder en komplet pakke af tjenester, der fokuserer på Data Warehousing
  • Teradata tilbyder lineær skalerbarhed, når de håndterer store mængder data ved at tilføje noder for at øge systemets ydeevne.
  • Tre vigtige komponenter i Teradata er 1) Parsing Engine 2) MPP 3) Access Module Processorer (AMP'er)
  • Teradata tilbyder et komplet udvalg af produktsuiter til at opfylde data warehousing og ETL behov i enhver organisation
  • Teradata-applikation bruges hovedsageligt til Supply Chain Management, Master Data Management, Demand Chain Management osv.