Teradata-veiledning: Hva er Teradata SQL? Database Architecture

Hva er Teradata?

Teradata er et åpen kildekode-databasestyringssystem for utvikling av store datavarehusapplikasjoner. Dette verktøyet gir støtte for flere datavarehusoperasjoner samtidig ved å bruke konseptet parallellisme. Teradata er et massivt åpent behandlingssystem som støtter Unix/Linux/Windows serverplattformer.

Teradata-programvaren er utviklet av Teradata Corporation, som er et amerikansk IT-firma. Det er en leverandør av analysedataplattformer, applikasjoner og andre relaterte tjenester. Firmaet utvikler et produkt for å konsolidere data fra ulike kilder og gjøre dataene tilgjengelige for analyse.

Historien om Teradata

Teradata var en avdeling av NCR Corporation. Det ble innlemmet i 1979, men skilte seg fra NCR i oktober 2007. Michael Koehler ble den første administrerende direktøren i Teradata.

Milepæler for Teradata Corporation:

  • 1979 - Teradata ble innlemmet
  • 1984 – Utgivelse av første databasedatamaskin DBC/1012
  • 1986 - Fortune magazine erklærte Teradata som 'Årets produkt'
  • 1999 - Største database bygget med Teradata med 130 Terabyte
  • 2002 - Teradata V2R5 versjonsutgivelse med komprimering og partisjonsprimær
  • 2006 – Lansering av Teradata Master Data Management-løsning
  • 2008 – Teradata 13.0 utgitt med Active Data Warehousing
  • 2011 – Kjøper Teradata Aster og stuper inn i Advanced Analytics Space
  • 2012 – Teradata 14.0 introdusert
  • 2014 – Teradata 15.0 introdusert
  • 2015- Teradata kjøper Apps Marketing Platform Appoxee
  • 2016- Terada går sammen med Big data
  • 2017- Teradata anskaffer San Diegos StackIQ

Hvorfor Teradata?

  • Teradata tilbyr en komplett tjenestepakke som fokuserer på Datavarehus
  • Systemet er bygget på åpen arkitektur. Så hver gang raskere enheter gjøres tilgjengelige, kan de integreres i den allerede bygde arkitekturen.
  • Teradata støtter 50+ petabyte med data.
  • Enkeltoperasjonsvisning for et stort Teradata multi-node-system som bruker Service Workstation
  • Kompatibel med et bredt utvalg av BI-verktøy for å hente data.
  • Det kan fungere som et enkelt kontrollpunkt for DBA å administrere Database.
  • Høy ytelse, varierte søk, analyse i databasen og sofistikert håndtering av arbeidsbelastning
  • Teradata lar deg få de samme dataene på flere distribusjonsalternativer

Neste i denne Teradata-opplæringen vil vi lære om funksjonene til Teradata.

Funksjoner i Teradata SQL

Teradata tilbyr følgende kraftige funksjoner:

  • Lineær skalerbarhet: Tilbyr lineær skalerbarhet ved håndtering av store datavolumer ved å legge til noder for å øke ytelsen til systemet.
  • Ubegrenset parallellisme: Teradata er basert på MPP (Massively Parallel Processing). Architecture). Så den er designet for å være parallell siden begynnelsen. Den kan dele opp en stor oppgave i mindre oppgaver og kjøre dem parallelt
  • Mature Optimizer: Teradata Optimizer kan håndtere opptil 64 sammenføyninger i en spørring.
  • Lav TCO: Tera-data har lave totale eierkostnader. Det er enkelt å sette opp, vedlikeholde og administrere.
  • Laste og losse verktøy: Teradata tilbyr laste- og losseverktøy for å flytte data til/fra Teradata-systemet.
  • Tilkobling: Dette MPP-systemet kan kobles til kanaltilkoblede systemer som en stormaskin eller nettverkstilkoblede systemer.
  • SQL: Teradata støtter SQL å samhandle med dataene som er lagret i tabeller. Det gir sin utvidelse.
  • Robuste verktøy: Teradata gir robuste verktøy for å importere/eksportere data fra/til Teradata-systemer som FastExport, FastLoad, MultiLoad og TPT.
  • Automatisk distribusjon: Teradata kan distribuere dataene til diskene automatisk uten manuell inngripen.

Neste i denne Teradata SQL-opplæringen vil vi lære om Teradata Architecture.

Teradata Architecture

Teradata-arkitektur er en massivt parallell prosessering Architecture.

Tre viktige komponenter i Teradata er:

  • Parsing Engine
  • BYNET
  • Access Module-prosessorer (AMP-er)

Teradata-lagring Architecture Database ArchiTecture Diagram:

Teradata Architecture
Teradata ArchiTecture Diagram

Teradata-lagring Architecture

Parsing Engine:

Parsing Engine analyserer spørringene og forbereder utførelsesplanen. Den administrerer økter for brukere. Den optimerer og sender en forespørsel til brukerne.

Så når klienten utfører spørringer for å sette inn poster, sender Parsing Engine postene til Message Passing-laget. Message passing layer eller BYNET er en programvare- og maskinvarekomponent. Den tilbyr nettverksmulighet. Den henter også postene og sender raden til mål-AMP.

AMP:

AMP står for Access Module Processor. Den lagrer poster på disse diskene. AMP utfører følgende aktiviteter:

  • Administrerer en del av databasen
  • Administrerer en del av hvert bord
  • Utfør alle oppgavene knyttet til å generere resultatsett som sortering, aggregering og sammenføyning
  • Utfør låse- og plassadministrasjon

Henting av teradata Architecture

Når klienten kjører spørringer for å hente poster, sender Parsing-motoren en forespørsel til BYNET. Deretter sender BYNET gjenfinningsforespørselen til passende AMP-er.

AMP-er søker på diskene sine parallelt og gjenkjenner de nødvendige postene og sender dem til BYNET. BYNET sender postene til Parsing Engine, som igjen vil bli sendt til klienten.

Neste i denne Teradata Database-opplæringen vil vi lære om Teradata SQL-kommandoer.

Typer Teradata SQL-kommandoer

Teradata Database støtter følgende grunnleggende SQL-kommandoer:

  1. Data Definition Language (DDL) kommandoer
  2. Data Control Language (DCL) kommandoer
  3. Data Manipulation Language (DML) kommandoer

Data Definition Language-kommandoer

KOMMANDO Description
SKAPE Oppretter en ny database, tabell, bruker osv.
DROP Fjerner en ny database, tabell, bruker osv.
ENDRE Endrer en tabell, kolonne, utløser osv.
MODIFISER Endrer en database eller brukerdefinisjon
RENAME Endrer navn på tabeller, visninger, makroer osv.

Språkkommandoer for datakontroll

KOMMANDO Description
TILLEIE/TILLBAKE TILBAKE Brukes til å kontrollere rettigheter til en bruker på et objekt
GI PÅLOGGING/TILLBAKE PÅLOGGING Brukes til å kontrollere påloggingsrettigheter til en vert eller vertsgruppe
GI Brukes til å gi et databaseobjekt til et annet databaseobjekt

Teradata Database SQL Data Manipulation Language-kommandoer

KOMMANDO Description
SLETT Fjerner en rad fra tabellen
ECHO Brukes til å ekko en streng eller kommando til klienten
KONTROLLPUNKT Definerer et gjenopprettingspunkt i journalen som kan brukes senere for å gjenopprette tabellinnholdet
VELG Brukes til å returnere en spesifikk raddata i et tabellskjema
OPPDATERING Endrer data i én eller flere rader i en tabell

Applikasjoner av Teradata-databasen

Følgende er de populære Teradata-applikasjonene:

  • Kundedatabehandling: Bidrar til å opprettholde langvarige relasjoner med kunder.
  • Master Data Management: Bidrar til å utvikle et miljø der masterdata kan brukes, synkroniseres og lagres.
  • Økonomi og resultatstyring: Hjelper organisasjonen med å forbedre hastigheten og kvaliteten på finansiell rapportering. Det reduserer kostnadene for finansinfrastruktur og administrerer bedriftsytelsen proaktivt.
  • Supply Chain Management: Forbedre forsyningskjedeoperasjoner som bidrar til forbedret kundeservice, reduserte syklustider og lavere varelager.
  • Etterspørselskjedestyring: Bidrar til å øke kundeservicenivå og salg. Det hjelper også bedrifter med å forutsi etterspørselen etter butikkvaren deres nøyaktig.

Neste i denne Teradata for nybegynneropplæringen vil vi lære om forskjellen mellom Teradata og andre RDBMS.

Forskjellen mellom Teradata og andre RDBMS

Parameter TERA DATA RDBMS
Architectures Følger Shared Nothing Architecture. Delte alt og tillater ressursstrid.
prosesser MIPS [Millioner av instruksjoner/sek.] KIPS [Tusenvis av institusjoner/sek]
Indekser Bedre distribusjon og gjenfinning Tilbyr kun FASI Retrieval
parallellitet Støtter ubetinget parallellisme. Parallelisme er betinget og uforutsigbar
Bulk belastning Teradata tillater bulk belastning. Tillater kun begrenset bulklast.
skalerbarhet Lineær skalerbarhet med en helning på én Skalerbarhet med avtagende avkastning
Databasebuffer En enkelt databasebuffer brukt av alle UoP-er. (En enhet av parallellisme). Et enkelt datalager som alle UoP har tilgang til Query Controller sender funksjoner til UoP-er som eier dataene
butikker Den lagrer TERA BYTES[Billioner av rader] GIGA BYTES[Millioner av rader]

MPP vs. SMP

MPP utvidelse SMP
MPP – Massively Parallell Processing. Det er datasystem som er koblet til mange uavhengige aritmetiske enheter eller hele mikroprosessorer som kjører parallelt. Symmetrisk multi-behandling. I et SMP-behandlingssystem deler CPU-ene det samme minnet, og som et resultat kan kode som kjører i ett system påvirke minnet som brukes av et annet.
Databaser kan utvides ved å legge til nye CPUer. SMP-databaser bruker vanligvis én CPU for å utføre databasesøk.
I et MPP-miljø forbedres ytelsen fordi ingen ressurser må deles mellom fysiske datamaskiner. Arbeidsmengden for en parallell jobb er fordelt over prosessorene i systemet.
Ytelsen til et massivt parallellbehandlingssystem er lineært. Det vil imidlertid øke proporsjonalt med antall noder. SMP-databaser kan kjøres på flere servere. Vil imidlertid dele en annen ressurs.

Oppsummering

  • Teradata betydning: Teradata er en åpen kildekode Databasestyringssystem for utvikling av store datavarehusapplikasjoner.
  • Teradata var en avdeling av NCR Corporation. Det ble innlemmet i 1979, men skilte seg fra NCR i oktober 2007
  • Teradata tilbyr en komplett tjenestepakke som fokuserer på datavarehus
  • Teradata tilbyr lineær skalerbarhet når du håndterer store datavolumer ved å legge til noder for å øke ytelsen til systemet.
  • Tre viktige komponenter i Teradata er 1) Parsing Engine 2) MPP 3) Access Module Processors (AMPs)
  • Teradata tilbyr et komplett utvalg av produktsuiter for å møte datavarehus- og ETL-behov til enhver organisasjon
  • Teradata-applikasjonen brukes hovedsakelig til Supply Chain Management, Master Data Management, Demand Chain Management, etc.