Teradata õpetus: mis on Teradata SQL? Andmebaas Architektuur

Mis on Teradata?

Teradata on avatud lähtekoodiga andmebaasihaldussüsteem suuremahuliste andmehoidlate rakenduste arendamiseks. See tööriist toetab paralleelsuse kontseptsiooni kasutades korraga mitut andmelao toimingut. Teradata on tohutult avatud töötlemissüsteem, mis toetab Unix/Linux/Windows serveriplatvormid.

Teradata tarkvara on välja töötanud Teradata Corporation, mis on Ameerika IT-ettevõte. See on analüütiliste andmeplatvormide, rakenduste ja muude seotud teenuste müüja. Ettevõte töötab välja toote, et koondada erinevatest allikatest pärit andmed ja teha andmed analüüsimiseks kättesaadavaks.

Teradata ajalugu

Teradata oli NCR Corporationi üksus. See asutati 1979. aastal, kuid läks NCR-ist lahku 2007. aasta oktoobris. Michael Koehlerist sai Teradata esimene tegevjuht.

Teradata Corporationi verstapostid:

  • 1979 – Teradata asutati
  • 1984 – esimese andmebaasiarvuti DBC/1012 väljalaskmine
  • 1986 – ajakiri Fortune kuulutas Teradata aasta tooteks
  • 1999 – suurim Teradata abil loodud andmebaas 130 terabaidiga
  • 2002 – Teradata V2R5 versiooni väljalase koos tihendamise ja partitsiooni primaarsega
  • 2006 – Teradata Master Data Management lahenduse turuletoomine
  • 2008 – väljastati Teradata 13.0 koos Active Data Warehousingiga
  • 2011 – omandab Teradata Asteri ja sukeldub Advanced Analytics ruumi
  • 2012 – tutvustati Teradata 14.0
  • 2014 – tutvustati Teradata 15.0
  • 2015 – Teradata ostab Apps Marketing Platform Appoxee
  • 2016 – Terada ühendab käed suurandmetega
  • 2017 – Teradata omandab San Diegos StackIQ

Miks Teradata?

  • Teradata pakub täielikku teenuste komplekti, mis keskendub Andmete ladustamine
  • Süsteem on üles ehitatud avatud arhitektuurile. Nii et kui kiiremad seadmed kättesaadavaks tehakse, saab selle lisada juba ehitatud arhitektuuri.
  • Teradata toetab 50+ petabaiti andmeid.
  • Ühe toimingu vaade suurele Teradata mitme sõlmega süsteemile, mis kasutab Service Workstationit
  • Ühildub laia valikuga BI tööriist andmete toomiseks.
  • See võib toimida ühe kontrollpunktina, et DBA haldaks andmebaas.
  • Suur jõudlus, mitmekesised päringud, andmebaasisisene analüüs ja keerukas töökoormuse haldamine
  • Teradata võimaldab teil saada samu andmeid mitme juurutamisvaliku kohta

Järgmisena selles Teradata õpetuses õpime tundma Teradata funktsioone.

Teradata SQL-i omadused

Teradata pakub järgmisi võimsaid funktsioone:

  • Lineaarne skaleeritavus: Pakub lineaarset skaleeritavust suurte andmemahtude töötlemisel, lisades süsteemi jõudluse suurendamiseks sõlme.
  • Piiramatu paralleelsus: Teradata põhineb MPP-l (massively Parallel Processing Architektuur). Seega on see algusest peale loodud paralleelseks. See võib jagada suure ülesande väiksemateks ülesanneteks ja käivitada neid paralleelselt
  • Mature Optimizer: Teradata Optimizer saab päringus käsitleda kuni 64 liitumist.
  • Madal TCO: Tera andmetel on madal kogu omamiskulu. Seda on lihtne seadistada, hooldada ja hallata.
  • Laadi ja maha utiliidid: Teradata pakub laadimis- ja mahalaadimisutiliite andmete teisaldamiseks Teradata süsteemi/süsteemist.
  • Ühenduvus: Seda MPP-süsteemi saab ühendada kanaliga ühendatud süsteemidega, nagu suurarvuti või võrguühendusega süsteemid.
  • SQL: Teradata toetab SQL tabelitesse salvestatud andmetega suhtlemiseks. See pakub selle laiendust.
  • Tugevad utiliidid: Teradata pakub tugevaid utiliite andmete importimiseks/eksportimiseks Teradata süsteemidest, nagu FastExport, FastLoad, MultiLoad ja TPT.
  • Automaatne levitamine: Teradata saab andmeid ketastele automaatselt jaotada ilma käsitsi sekkumiseta.

Järgmisena selles Teradata SQL-i õpetuses tutvume Teradataga Architektuur.

Teradata Architektuur

Teradata arhitektuur on massiliselt paralleelne töötlemine Architektuur.

Teradata kolm olulist komponenti on:

  • Mootori parsimine
  • BÜNET
  • Juurdepääsumooduli protsessorid (AMP)

Teradata salvestusruum Architecture andmebaas Architektuuri skeem:

Teradata Architektuur
Teradata Architektuuri diagramm

Teradata salvestusruum Architektuur

Mootori parsimine:

Parsimismootor parsib päringuid ja koostab täitmisplaani. See haldab kasutajate seansse. See optimeerib ja saadab kasutajatele päringu.

Seega, kui klient täidab päringuid kirjete sisestamiseks, saadab parsimismootor kirjed sõnumi edastamise kihti. Sõnumi edastamise kiht ehk BYNET on tarkvara- ja riistvarakomponent. See pakub võrguvõimalusi. Samuti hangib see kirjed ja saadab rea siht-AMP-le.

AMP:

AMP tähistab Access Module Processorit. See salvestab nendele ketastele kirjeid. AMP viib läbi järgmisi tegevusi:

  • Haldab osa andmebaasist
  • Haldab iga tabeli osa
  • Tehke kõik tulemuste komplekti genereerimisega seotud toimingud, nagu sortimine, koondamine ja ühendamine
  • Tehke luku- ja ruumihaldus

Teraandmete otsimine Architektuur

Kui klient käitab kirjete toomiseks päringuid, saadab parsimismootor päringu BYNETile. Seejärel saadab BYNET otsingupäringu sobivatele AMP-dele.

AMP-d otsivad paralleelselt oma kettaid ja tuvastavad vajalikud kirjed ning saadavad need BYNETi. BYNET saadab kirjed Parsing Engine'ile, mis omakorda saadetakse kliendile.

Järgmisena selles Teradata Database õpetuses õpime tundma Teradata SQL-i käske.

Teradata SQL-käskude tüübid

Teradata andmebaas toetab järgmisi põhilisi SQL-käske:

  1. Data Definition Language (DDL) käsud
  2. Data Control Language (DCL) käsud
  3. Data Manipulation Language (DML) käsud

Andmete määratlemise keele käsud

COMMAND Kirjeldus
LUUA Loob uue andmebaasi, tabeli, kasutaja jne.
DROP Eemaldab uue andmebaasi, tabeli, kasutaja jne.
VANUS Muudab tabelit, veergu, päästikut jne.
MUUTMA Muudab andmebaasi või kasutaja määratlust
RENAME Muudab tabelite, vaadete, makrode jne nimesid.

Andmehalduse keele käsud

COMMAND Kirjeldus
ANNA/TÜHISTADA Kasutatakse objektil kasutaja õiguste kontrollimiseks
ANNA SISSELOGIMISE / TÜHISTAKE SISSElogimise Kasutatakse hosti või hostirühma sisselogimisõiguste kontrollimiseks
aNNA Kasutatakse andmebaasiobjekti andmiseks teisele andmebaasiobjektile

Teradata andmebaasi SQL-i andmete manipuleerimise keele käsud

COMMAND Kirjeldus
Kustuta Eemaldab tabelist rea
ECHO Kasutatakse stringi või käsu kordamiseks kliendile
KONTROLLIKOHT Määrab ajakirjas taastepunkti, mida saab hiljem kasutada tabeli sisu taastamiseks
SELECT Kasutatakse konkreetse rea andmete tagastamiseks tabeli kujul
UPDATE Muudab andmeid tabeli ühes või mitmes reas

Teradata andmebaasi rakendused

Järgmised on populaarsed Teradata rakendused:

  • Kliendiandmete haldamine: Aitab hoida klientidega pikaajalisi suhteid.
  • Põhiandmete haldamine: Aitab arendada keskkonda, kus saab põhiandmeid kasutada, sünkroonida ja salvestada.
  • Finants- ja tulemusjuhtimine: Aitab organisatsioonil parandada finantsaruandluse kiirust ja kvaliteeti. See vähendab finantsinfrastruktuuri kulusid ja haldab ennetavalt ettevõtte jõudlust.
  • Tarneahela juhtimine: Parandage tarneahela toiminguid, mis aitavad parandada klienditeenindust, lühendada tsükliaegu ja vähendada laoseisu.
  • Nõudlusahela juhtimine: Aitab tõsta klienditeeninduse taset ja müüki. Samuti aitab see ettevõtetel täpselt prognoosida nõudlust oma poekauba järele.

Järgmisena selles Teradata algajatele õpetuses saame teada, mis vahe on Teradata ja muu vahel RDBMS.

Erinevus Teradata ja teiste RDBMS-ide vahel

Parameeter TERA ANDMED RDBMS
Architektuurid Jälgib jagatud mittemidagi Architektuur. Jagas kõike ja võimaldab ressurssidega väitlust.
protsessid MIPS [miljoneid juhiseid sekundis] KIPS [tuhanded institutsioonid sekundis]
Indexes Parem levitamine ja kättesaamine Pakub ainult FASI allalaadimist
Paralleelsus Toetab tingimusteta paralleelsust. Paralleelsus on tingimuslik ja ettearvamatu
Masskoormus Teradata võimaldab hulgilaadimist. Lubab ainult piiratud puistekoormust.
Skaalautuvus Lineaarne skaleeritavus ühe kaldega Skaleeritavus kahaneva tuluga
Andmebaasi puhver Üks andmebaasipuhver, mida kasutavad kõik UoP-d. (Paralleelsuse liit). Üks andmesalv, millele pääsevad juurde kõik UoP-d Päringukontroller saadab funktsioonid UoP-idele, kes omavad andmeid
Kauplused See salvestab TERA BYTES[Billridade ioonid] GIGA BAITIT[Miljoneid ridu]

MPP vs SMP

MPP SMP
MPP – massiliselt paralleelne töötlemine. See on arvutisüsteem, mis on ühendatud paljude sõltumatute aritmeetikaüksuste või tervete mikroprotsessoritega, mis töötavad paralleelselt. Sümmeetriline mitmekordne töötlemine. SMP-töötlussüsteemis jagavad CPU-d sama mälu ja selle tulemusena võib ühes süsteemis töötav kood mõjutada teise kasutatavat mälu.
Andmebaase saab laiendada uute protsessorite lisamisega. SMP-andmebaasid kasutavad andmebaasiotsingu tegemiseks üldjuhul ühte CPU-d.
MPP-keskkonnas paraneb jõudlus, kuna füüsiliste arvutite vahel ei tohi ressursse jagada. Paralleeltöö töökoormus jaotatakse süsteemis olevate protsessorite vahel.
Massiivse paralleeltöötlussüsteemi jõudlus on lineaarne. See aga suureneb proportsionaalselt sõlmede arvuga. SMP andmebaasid võivad töötada mitmes serveris. Siiski jagab teist ressurssi.

kokkuvõte

  • Teradata tähendus: Teradata on avatud lähtekoodiga fail Andmebaasi haldamise süsteem suuremahuliste andmehoidlate rakenduste arendamiseks.
  • Teradata oli NCR Corporationi üksus. See asutati 1979. aastal, kuid läks NCR-ist lahku 2007. aasta oktoobris
  • Teradata pakub täielikku teenuste komplekti, mis keskendub andmehoidlale
  • Teradata pakub suurte andmemahtude töötlemisel lineaarset skaleeritavust, lisades süsteemi jõudluse suurendamiseks sõlme.
  • Teradata kolm olulist komponenti on 1) parsimismootor 2) MPP 3) juurdepääsumooduli protsessorid (AMP)
  • Teradata pakub täielikku tootekomplekti, mis vastab iga organisatsiooni andmehoidla ja ETL-i vajadustele
  • Teradata rakendust kasutatakse peamiselt tarneahela juhtimiseks, põhiandmete haldamiseks, nõudlusahela haldamiseks jne.