Teradata-veiledning: Hva er Teradata SQL? Database Architecture
Hva er Teradata?
Teradata er et åpen kildekode-databasestyringssystem for utvikling av store datavarehusapplikasjoner. Dette verktøyet gir støtte for flere datavarehusoperasjoner samtidig ved å bruke konseptet parallellisme. Teradata er et massivt åpent behandlingssystem som støtter Unix/Linux/Windows serverplattformer.
Teradata-programvaren er utviklet av Teradata Corporation, som er et amerikansk IT-firma. Det er en leverandør av analysedataplattformer, applikasjoner og andre relaterte tjenester. Firmaet utvikler et produkt for å konsolidere data fra ulike kilder og gjøre dataene tilgjengelige for analyse.
Historien om Teradata
Teradata var en avdeling av NCR Corporation. Det ble innlemmet i 1979, men skilte seg fra NCR i oktober 2007. Michael Koehler ble den første administrerende direktøren i Teradata.
Milepæler for Teradata Corporation:
- 1979 - Teradata ble innlemmet
- 1984 – Utgivelse av første databasedatamaskin DBC/1012
- 1986 - Fortune magazine erklærte Teradata som 'Årets produkt'
- 1999 - Største database bygget med Teradata med 130 Terabyte
- 2002 - Teradata V2R5 versjonsutgivelse med komprimering og partisjonsprimær
- 2006 – Lansering av Teradata Master Data Management-løsning
- 2008 – Teradata 13.0 utgitt med Active Data Warehousing
- 2011 – Kjøper Teradata Aster og stuper inn i Advanced Analytics Space
- 2012 – Teradata 14.0 introdusert
- 2014 – Teradata 15.0 introdusert
- 2015- Teradata kjøper Apps Marketing Platform Appoxee
- 2016- Terada går sammen med Big data
- 2017- Teradata anskaffer San Diegos StackIQ
Hvorfor Teradata?
- Teradata tilbyr en komplett tjenestepakke som fokuserer på Datavarehus
- Systemet er bygget på åpen arkitektur. Så hver gang raskere enheter gjøres tilgjengelige, kan de integreres i den allerede bygde arkitekturen.
- Teradata støtter 50+ petabyte med data.
- Enkeltoperasjonsvisning for et stort Teradata multi-node-system som bruker Service Workstation
- Kompatibel med et bredt utvalg av BI-verktøy for å hente data.
- Det kan fungere som et enkelt kontrollpunkt for DBA å administrere Database.
- Høy ytelse, varierte søk, analyse i databasen og sofistikert håndtering av arbeidsbelastning
- Teradata lar deg få de samme dataene på flere distribusjonsalternativer
Neste i denne Teradata-opplæringen vil vi lære om funksjonene til Teradata.
Funksjoner i Teradata SQL
Teradata tilbyr følgende kraftige funksjoner:
- Lineær skalerbarhet: Tilbyr lineær skalerbarhet ved håndtering av store datavolumer ved å legge til noder for å øke ytelsen til systemet.
- Ubegrenset parallellisme: Teradata er basert på MPP (Massively Parallel Processing). Architecture). Så den er designet for å være parallell siden begynnelsen. Den kan dele opp en stor oppgave i mindre oppgaver og kjøre dem parallelt
- Mature Optimizer: Teradata Optimizer kan håndtere opptil 64 sammenføyninger i en spørring.
- Lav TCO: Tera-data har lave totale eierkostnader. Det er enkelt å sette opp, vedlikeholde og administrere.
- Laste og losse verktøy: Teradata tilbyr laste- og losseverktøy for å flytte data til/fra Teradata-systemet.
- Tilkobling: Dette MPP-systemet kan kobles til kanaltilkoblede systemer som en stormaskin eller nettverkstilkoblede systemer.
- SQL: Teradata støtter SQL å samhandle med dataene som er lagret i tabeller. Det gir sin utvidelse.
- Robuste verktøy: Teradata gir robuste verktøy for å importere/eksportere data fra/til Teradata-systemer som FastExport, FastLoad, MultiLoad og TPT.
- Automatisk distribusjon: Teradata kan distribuere dataene til diskene automatisk uten manuell inngripen.
Neste i denne Teradata SQL-opplæringen vil vi lære om Teradata Architecture.
Teradata Architecture
Teradata-arkitektur er en massivt parallell prosessering Architecture.
Tre viktige komponenter i Teradata er:
- Parsing Engine
- BYNET
- Access Module-prosessorer (AMP-er)
Teradata-lagring Architecture Database ArchiTecture Diagram:
Teradata-lagring Architecture
Parsing Engine:
Parsing Engine analyserer spørringene og forbereder utførelsesplanen. Den administrerer økter for brukere. Den optimerer og sender en forespørsel til brukerne.
Så når klienten utfører spørringer for å sette inn poster, sender Parsing Engine postene til Message Passing-laget. Message passing layer eller BYNET er en programvare- og maskinvarekomponent. Den tilbyr nettverksmulighet. Den henter også postene og sender raden til mål-AMP.
AMP:
AMP står for Access Module Processor. Den lagrer poster på disse diskene. AMP utfører følgende aktiviteter:
- Administrerer en del av databasen
- Administrerer en del av hvert bord
- Utfør alle oppgavene knyttet til å generere resultatsett som sortering, aggregering og sammenføyning
- Utfør låse- og plassadministrasjon
Henting av teradata Architecture
Når klienten kjører spørringer for å hente poster, sender Parsing-motoren en forespørsel til BYNET. Deretter sender BYNET gjenfinningsforespørselen til passende AMP-er.
AMP-er søker på diskene sine parallelt og gjenkjenner de nødvendige postene og sender dem til BYNET. BYNET sender postene til Parsing Engine, som igjen vil bli sendt til klienten.
Neste i denne Teradata Database-opplæringen vil vi lære om Teradata SQL-kommandoer.
Typer Teradata SQL-kommandoer
Teradata Database støtter følgende grunnleggende SQL-kommandoer:
- Data Definition Language (DDL) kommandoer
- Data Control Language (DCL) kommandoer
- Data Manipulation Language (DML) kommandoer
Data Definition Language-kommandoer
KOMMANDO | Description |
---|---|
SKAPE | Oppretter en ny database, tabell, bruker osv. |
DROP | Fjerner en ny database, tabell, bruker osv. |
ENDRE | Endrer en tabell, kolonne, utløser osv. |
MODIFISER | Endrer en database eller brukerdefinisjon |
RENAME | Endrer navn på tabeller, visninger, makroer osv. |
Språkkommandoer for datakontroll
KOMMANDO | Description |
---|---|
TILLEIE/TILLBAKE TILBAKE | Brukes til å kontrollere rettigheter til en bruker på et objekt |
GI PÅLOGGING/TILLBAKE PÅLOGGING | Brukes til å kontrollere påloggingsrettigheter til en vert eller vertsgruppe |
GI | Brukes til å gi et databaseobjekt til et annet databaseobjekt |
Teradata Database SQL Data Manipulation Language-kommandoer
KOMMANDO | Description |
---|---|
SLETT | Fjerner en rad fra tabellen |
ECHO | Brukes til å ekko en streng eller kommando til klienten |
KONTROLLPUNKT | Definerer et gjenopprettingspunkt i journalen som kan brukes senere for å gjenopprette tabellinnholdet |
VELG | Brukes til å returnere en spesifikk raddata i et tabellskjema |
OPPDATERING | Endrer data i én eller flere rader i en tabell |
Applikasjoner av Teradata-databasen
Følgende er de populære Teradata-applikasjonene:
- Kundedatabehandling: Bidrar til å opprettholde langvarige relasjoner med kunder.
- Master Data Management: Bidrar til å utvikle et miljø der masterdata kan brukes, synkroniseres og lagres.
- Økonomi og resultatstyring: Hjelper organisasjonen med å forbedre hastigheten og kvaliteten på finansiell rapportering. Det reduserer kostnadene for finansinfrastruktur og administrerer bedriftsytelsen proaktivt.
- Supply Chain Management: Forbedre forsyningskjedeoperasjoner som bidrar til forbedret kundeservice, reduserte syklustider og lavere varelager.
- Etterspørselskjedestyring: Bidrar til å øke kundeservicenivå og salg. Det hjelper også bedrifter med å forutsi etterspørselen etter butikkvaren deres nøyaktig.
Neste i denne Teradata for nybegynneropplæringen vil vi lære om forskjellen mellom Teradata og andre RDBMS.
Forskjellen mellom Teradata og andre RDBMS
Parameter | TERA DATA | RDBMS |
---|---|---|
Architectures | Følger Shared Nothing Architecture. | Delte alt og tillater ressursstrid. |
prosesser | MIPS [Millioner av instruksjoner/sek.] | KIPS [Tusenvis av institusjoner/sek] |
Indekser | Bedre distribusjon og gjenfinning | Tilbyr kun FASI Retrieval |
parallellitet | Støtter ubetinget parallellisme. | Parallelisme er betinget og uforutsigbar |
Bulk belastning | Teradata tillater bulk belastning. | Tillater kun begrenset bulklast. |
skalerbarhet | Lineær skalerbarhet med en helning på én | Skalerbarhet med avtagende avkastning |
Databasebuffer | En enkelt databasebuffer brukt av alle UoP-er. (En enhet av parallellisme). Et enkelt datalager som alle UoP har tilgang til | Query Controller sender funksjoner til UoP-er som eier dataene |
butikker | Den lagrer TERA BYTES[Billioner av rader] | GIGA BYTES[Millioner av rader] |
MPP vs. SMP
MPP utvidelse | SMP |
---|---|
MPP – Massively Parallell Processing. Det er datasystem som er koblet til mange uavhengige aritmetiske enheter eller hele mikroprosessorer som kjører parallelt. | Symmetrisk multi-behandling. I et SMP-behandlingssystem deler CPU-ene det samme minnet, og som et resultat kan kode som kjører i ett system påvirke minnet som brukes av et annet. |
Databaser kan utvides ved å legge til nye CPUer. | SMP-databaser bruker vanligvis én CPU for å utføre databasesøk. |
I et MPP-miljø forbedres ytelsen fordi ingen ressurser må deles mellom fysiske datamaskiner. | Arbeidsmengden for en parallell jobb er fordelt over prosessorene i systemet. |
Ytelsen til et massivt parallellbehandlingssystem er lineært. Det vil imidlertid øke proporsjonalt med antall noder. | SMP-databaser kan kjøres på flere servere. Vil imidlertid dele en annen ressurs. |
Oppsummering
- Teradata betydning: Teradata er en åpen kildekode Databasestyringssystem for utvikling av store datavarehusapplikasjoner.
- Teradata var en avdeling av NCR Corporation. Det ble innlemmet i 1979, men skilte seg fra NCR i oktober 2007
- Teradata tilbyr en komplett tjenestepakke som fokuserer på datavarehus
- Teradata tilbyr lineær skalerbarhet når du håndterer store datavolumer ved å legge til noder for å øke ytelsen til systemet.
- Tre viktige komponenter i Teradata er 1) Parsing Engine 2) MPP 3) Access Module Processors (AMPs)
- Teradata tilbyr et komplett utvalg av produktsuiter for å møte datavarehus- og ETL-behov til enhver organisasjon
- Teradata-applikasjonen brukes hovedsakelig til Supply Chain Management, Master Data Management, Demand Chain Management, etc.