Teradata Tutorial: Hvad er Teradata SQL? Database Architecture
Hvad er Teradata?
Teradata er et open source-databasestyringssystem til udvikling af store data warehousing-applikationer. Dette værktøj giver støtte til flere datavarehusoperationer samtidigt ved at bruge konceptet parallelisme. Teradata er et massivt åbent behandlingssystem, der understøtter Unix/Linux/Windows server platforme.
Teradata software er udviklet af Teradata Corporation, som er et amerikansk it-firma. Det er en leverandør af analytiske dataplatforme, applikationer og andre relaterede tjenester. Firmaet udvikler et produkt til at konsolidere data fra forskellige kilder og gøre dataene tilgængelige for analyse.
Teradatas historie
Teradata var en afdeling af NCR Corporation. Det blev indlemmet i 1979, men skiltes fra NCR i oktober 2007. Michael Koehler blev den første administrerende direktør for Teradata.
Teradata Corporations milepæle:
- 1979 – Teradata blev inkorporeret
- 1984 – Frigivelse af første databasecomputer DBC/1012
- 1986 - Fortune magazine erklærede Teradata som 'Årets produkt'
- 1999 – Største database bygget ved hjælp af Teradata med 130 Terabyte
- 2002 – Teradata V2R5 versionsudgivelse med komprimering og Partition Primary
- 2006 – Lancering af Teradata Master Data Management-løsning
- 2008 – Teradata 13.0 udgivet med Active Data Warehousing
- 2011 – Køber Teradata Aster og kaster sig ud i Advanced Analytics Space
- 2012 – Teradata 14.0 introduceret
- 2014 – Teradata 15.0 introduceret
- 2015- Teradata køber Apps Marketing Platform Appoxee
- 2016- Terada går sammen med Big data
- 2017- Teradata erhverver San Diegos StackIQ
Hvorfor Teradata?
- Teradata tilbyder en komplet pakke af tjenester, der fokuserer på Datavarehousing
- Systemet er bygget på åben arkitektur. Så hver gang hurtigere enheder stilles til rådighed, kan de indarbejdes i den allerede opbyggede arkitektur.
- Teradata understøtter 50+ petabyte data.
- Enkeltbetjeningsvisning for et stort Teradata multi-node system ved hjælp af Service Workstation
- Kompatibel med en bred vifte af BI værktøj at hente data.
- Det kan fungere som et enkelt kontrolpunkt for DBA til at styre Database.
- Høj ydeevne, forskellige forespørgsler, analyse i databasen og sofistikeret styring af arbejdsbelastning
- Teradata giver dig mulighed for at få de samme data på flere implementeringsmuligheder
Næste i denne Teradata-tutorial lærer vi om funktionerne i Teradata.
Funktioner i Teradata SQL
Teradata tilbyder følgende kraftfulde funktioner:
- Lineær skalerbarhed: Tilbyder lineær skalerbarhed ved håndtering af store mængder data ved at tilføje noder for at øge systemets ydeevne.
- Ubegrænset parallelisme: Teradata er baseret på MPP (Massively Parallel Processing). Architecture). Så det er designet til at være parallelt siden begyndelsen. Den kan dele en stor opgave op i mindre opgaver og køre dem parallelt
- Mature Optimizer: Teradata Optimizer kan håndtere op til 64 joinforbindelser i en forespørgsel.
- Lav TCO: Tera-data har lave samlede ejeromkostninger. Det er nemt at konfigurere, vedligeholde og administrere.
- Indlæs og aflæs hjælpeprogrammer: Teradata leverer ind- og udlæsningsværktøjer til at flytte data ind i/fra Teradata System.
- Tilslutning: Dette MPP-system kan oprette forbindelse til kanaltilknyttede systemer som en mainframe eller netværkstilsluttede systemer.
- SQL: Teradata understøtter SQL at interagere med de data, der er gemt i tabeller. Det giver sin forlængelse.
- Robuste hjælpeprogrammer: Teradata leverer robuste værktøjer til at importere/eksportere data fra/til Teradata-systemer som FastExport, FastLoad, MultiLoad og TPT.
- Automatisk distribution: Teradata kan distribuere dataene til diskene automatisk uden manuel indgriben.
Næste i denne Teradata SQL-tutorial lærer vi om Teradata Architecture.
Teradata Architecture
Teradata-arkitektur er en massivt parallel behandling Architecture.
Tre vigtige komponenter i Teradata er:
- Parsing Engine
- BYNET
- Access Module Processorer (AMP'er)
Teradata lagring Architecture Database ArchiTecture Diagram:
Teradata lagring Architecture
Parsing Engine:
Parsing Engine analyserer forespørgslerne og forbereder udførelsesplanen. Det administrerer sessioner for brugere. Det optimerer og sender en anmodning til brugerne.
Så når klienten udfører forespørgsler for at indsætte poster, sender Parsing Engine posterne til Message Passing-laget. Message passing layer eller BYNET er en software- og hardwarekomponent. Det tilbyder netværkskapacitet. Den henter også posterne og sender rækken til mål-AMP.
Amp:
AMP står for Access Module Processor. Det gemmer poster på disse diske. AMP udfører følgende aktiviteter:
- Styrer en del af databasen
- Styrer en del af hvert bord
- Udfør alle de opgaver, der er forbundet med at generere resultatsæt, såsom sortering, aggregering og joinforbindelse
- Udfør låse- og pladsstyring
Teradata-hentning Architecture
Når klienten kører forespørgsler for at hente poster, sender parsing-motoren en anmodning til BYNET. Derefter sender BYNET genfindingsanmodningen til passende AMP'er.
AMP'er søger parallelt på deres diske og genkender de nødvendige poster og sender dem til BYNET. BYNET sender posterne til Parsing Engine, som igen vil blive sendt til klienten.
Dernæst i denne Teradata Database-øvelse lærer vi om Teradata SQL-kommandoer.
Typer af Teradata SQL-kommandoer
Teradata Database understøtter følgende grundlæggende SQL-kommandoer:
- Data Definition Language (DDL) kommandoer
- Data Control Language (DCL) kommandoer
- Data Manipulation Language (DML) kommandoer
Data Definition Language kommandoer
KOMMANDO | Description |
---|---|
SKAB | Opretter en ny database, tabel, bruger osv. |
DROP | Fjerner en ny database, tabel, bruger osv. |
ÆNDRE | Ændrer en tabel, kolonne, trigger osv. |
MODIFICERE | Ændrer en database eller brugerdefinition |
OMDØB | Ændrer navn på tabeller, visninger, makroer osv. |
Sprogkommandoer for datakontrol
KOMMANDO | Description |
---|---|
TILDEL/ TILBAGETRÆKKE | Bruges til at kontrollere privilegier for en bruger på et objekt |
TILDEL LOGON/TILBAGE LOGON | Bruges til at kontrollere logonrettigheder til en vært eller værtsgruppe |
GIVE | Bruges til at give et databaseobjekt til et andet databaseobjekt |
Teradata Database SQL Data Manipulation Language kommandoer
KOMMANDO | Description |
---|---|
SLET | Fjerner en række fra tabellen |
ECHO | Bruges til at ekko en streng eller kommando til klienten |
KONTROLPUNKT | Definerer et gendannelsespunkt i journalen, der senere kan bruges til at gendanne tabelindholdet |
SELECT | Bruges til at returnere bestemte rækkedata i en tabelform |
OPDATER | Ændrer data i en eller flere rækker i en tabel |
Anvendelser af Teradata-databasen
Følgende er de populære Teradata-applikationer:
- Kundedatahåndtering: Hjælper med at opretholde langvarige relationer med kunder.
- Master Data Management: Hjælper med at udvikle et miljø, hvor stamdata kan bruges, synkroniseres og gemmes.
- Økonomi og resultatstyring: Hjælper organisationen med at forbedre hastigheden og kvaliteten af finansiel rapportering. Det reducerer omkostningerne til finansieringsinfrastruktur og styrer virksomhedens ydeevne proaktivt.
- Supply Chain Management: Forbedre forsyningskædedriften, som hjælper til forbedret kundeservice, reducerede cyklustider og lavere varebeholdninger.
- Efterspørgselskædestyring: Hjælper med at øge kundeserviceniveauer og salg. Det hjælper også virksomheder med at forudsige efterspørgslen efter deres butiksvarer nøjagtigt.
Næste i denne Teradata for begyndere tutorial, vil vi lære om forskellen mellem Teradata og andre RDBMS.
Forskellen mellem Teradata og andre RDBMS
Parameter | TERA DATA | RDBMS |
---|---|---|
Architectures | Følger Shared Nothing Architecture. | Delte alt og tillader ressourcestrid. |
Processer | MIPS [Millioner af instruktioner/sek.] | KIPS [Tusindvis af institutioner/sek.] |
Indexes | Bedre distribution og genfinding | Tilbyder kun FASI Retrieval |
parallelitet | Understøtter ubetinget parallelisme. | Parallelisme er betinget og uforudsigelig |
Bulk belastning | Teradata tillader bulk load. | Tillader kun begrænset bulkbelastning. |
Skalerbarhed | Lineær skalerbarhed med en hældning på én | Skalerbarhed med faldende afkast |
Database buffer | En enkelt databasebuffer brugt af alle UoP'er. (En enhed af parallelisme). Et enkelt datalager, som alle UoP'er har adgang til | Query Controller sender funktioner til UoP'er, der ejer dataene |
butikker | Det gemmer TERA BYTES[Billioner af rækker] | GIGA BYTES[Millioner af rækker] |
MPP vs. SMP
MPP | SMP |
---|---|
MPP – Massively Parallel Processing. Det er computersystem, som er knyttet til mange uafhængige aritmetiske enheder eller hele mikroprocessorer, der kører parallelt. | Symmetrisk multi-behandling. I et SMP-behandlingssystem deler CPU'erne den samme hukommelse, og som et resultat kan kode, der kører i et system, påvirke den hukommelse, der bruges af et andet. |
Databaser kan udvides ved at tilføje nye CPU'er. | SMP-databaser bruger generelt én CPU til at udføre databasesøgninger. |
I et MPP-miljø forbedres ydeevnen, fordi ingen ressourcer skal deles mellem fysiske computere. | Arbejdsbyrden for et paralleljob er fordelt på tværs af processorerne i systemet. |
Ydeevnen af et massivt parallelt behandlingssystem er lineært. Det vil dog stige i forhold til antallet af noder. | SMP-databaser kan køre på flere servere. Vil dog dele en anden ressource. |
Resumé
- Teradata betydning: Teradata er en open source Databasestyringssystem til udvikling af store data warehousing applikationer.
- Teradata var en afdeling af NCR Corporation. Det blev indlemmet i 1979, men skiltes fra NCR i oktober 2007
- Teradata tilbyder en komplet pakke af tjenester, der fokuserer på Data Warehousing
- Teradata tilbyder lineær skalerbarhed, når de håndterer store mængder data ved at tilføje noder for at øge systemets ydeevne.
- Tre vigtige komponenter i Teradata er 1) Parsing Engine 2) MPP 3) Access Module Processorer (AMP'er)
- Teradata tilbyder et komplet udvalg af produktsuiter til at opfylde data warehousing og ETL behov i enhver organisation
- Teradata-applikation bruges hovedsageligt til Supply Chain Management, Master Data Management, Demand Chain Management osv.