Teradata õpetus: mis on Teradata SQL? Andmebaas Architektuur
Mis on Teradata?
Teradata on avatud lähtekoodiga andmebaasihaldussüsteem suuremahuliste andmehoidlate rakenduste arendamiseks. See tööriist toetab paralleelsuse kontseptsiooni kasutades korraga mitut andmelao toimingut. Teradata on tohutult avatud töötlemissüsteem, mis toetab Unix/Linux/Windows serveriplatvormid.
Teradata tarkvara on välja töötanud Teradata Corporation, mis on Ameerika IT-ettevõte. See on analüütiliste andmeplatvormide, rakenduste ja muude seotud teenuste müüja. Ettevõte töötab välja toote, et koondada erinevatest allikatest pärit andmed ja teha andmed analüüsimiseks kättesaadavaks.
Teradata ajalugu
Teradata oli NCR Corporationi üksus. See asutati 1979. aastal, kuid läks NCR-ist lahku 2007. aasta oktoobris. Michael Koehlerist sai Teradata esimene tegevjuht.
Teradata Corporationi verstapostid:
- 1979 – Teradata asutati
- 1984 – esimese andmebaasiarvuti DBC/1012 väljalaskmine
- 1986 – ajakiri Fortune kuulutas Teradata aasta tooteks
- 1999 – suurim Teradata abil loodud andmebaas 130 terabaidiga
- 2002 – Teradata V2R5 versiooni väljalase koos tihendamise ja partitsiooni primaarsega
- 2006 – Teradata Master Data Management lahenduse turuletoomine
- 2008 – väljastati Teradata 13.0 koos Active Data Warehousingiga
- 2011 – omandab Teradata Asteri ja sukeldub Advanced Analytics ruumi
- 2012 – tutvustati Teradata 14.0
- 2014 – tutvustati Teradata 15.0
- 2015 – Teradata ostab Apps Marketing Platform Appoxee
- 2016 – Terada ühendab käed suurandmetega
- 2017 – Teradata omandab San Diegos StackIQ
Miks Teradata?
- Teradata pakub täielikku teenuste komplekti, mis keskendub Andmete ladustamine
- Süsteem on üles ehitatud avatud arhitektuurile. Nii et kui kiiremad seadmed kättesaadavaks tehakse, saab selle lisada juba ehitatud arhitektuuri.
- Teradata toetab 50+ petabaiti andmeid.
- Ühe toimingu vaade suurele Teradata mitme sõlmega süsteemile, mis kasutab Service Workstationit
- Ühildub laia valikuga BI tööriist andmete toomiseks.
- See võib toimida ühe kontrollpunktina, et DBA haldaks andmebaas.
- Suur jõudlus, mitmekesised päringud, andmebaasisisene analüüs ja keerukas töökoormuse haldamine
- Teradata võimaldab teil saada samu andmeid mitme juurutamisvaliku kohta
Järgmisena selles Teradata õpetuses õpime tundma Teradata funktsioone.
Teradata SQL-i omadused
Teradata pakub järgmisi võimsaid funktsioone:
- Lineaarne skaleeritavus: Pakub lineaarset skaleeritavust suurte andmemahtude töötlemisel, lisades süsteemi jõudluse suurendamiseks sõlme.
- Piiramatu paralleelsus: Teradata põhineb MPP-l (massively Parallel Processing Architektuur). Seega on see algusest peale loodud paralleelseks. See võib jagada suure ülesande väiksemateks ülesanneteks ja käivitada neid paralleelselt
- Mature Optimizer: Teradata Optimizer saab päringus käsitleda kuni 64 liitumist.
- Madal TCO: Tera andmetel on madal kogu omamiskulu. Seda on lihtne seadistada, hooldada ja hallata.
- Laadi ja maha utiliidid: Teradata pakub laadimis- ja mahalaadimisutiliite andmete teisaldamiseks Teradata süsteemi/süsteemist.
- Ühenduvus: Seda MPP-süsteemi saab ühendada kanaliga ühendatud süsteemidega, nagu suurarvuti või võrguühendusega süsteemid.
- SQL: Teradata toetab SQL tabelitesse salvestatud andmetega suhtlemiseks. See pakub selle laiendust.
- Tugevad utiliidid: Teradata pakub tugevaid utiliite andmete importimiseks/eksportimiseks Teradata süsteemidest, nagu FastExport, FastLoad, MultiLoad ja TPT.
- Automaatne levitamine: Teradata saab andmeid ketastele automaatselt jaotada ilma käsitsi sekkumiseta.
Järgmisena selles Teradata SQL-i õpetuses tutvume Teradataga Architektuur.
Teradata Architektuur
Teradata arhitektuur on massiliselt paralleelne töötlemine Architektuur.
Teradata kolm olulist komponenti on:
- Mootori parsimine
- BÜNET
- Juurdepääsumooduli protsessorid (AMP)
Teradata salvestusruum Architecture andmebaas Architektuuri skeem:
Teradata salvestusruum Architektuur
Mootori parsimine:
Parsimismootor parsib päringuid ja koostab täitmisplaani. See haldab kasutajate seansse. See optimeerib ja saadab kasutajatele päringu.
Seega, kui klient täidab päringuid kirjete sisestamiseks, saadab parsimismootor kirjed sõnumi edastamise kihti. Sõnumi edastamise kiht ehk BYNET on tarkvara- ja riistvarakomponent. See pakub võrguvõimalusi. Samuti hangib see kirjed ja saadab rea siht-AMP-le.
AMP:
AMP tähistab Access Module Processorit. See salvestab nendele ketastele kirjeid. AMP viib läbi järgmisi tegevusi:
- Haldab osa andmebaasist
- Haldab iga tabeli osa
- Tehke kõik tulemuste komplekti genereerimisega seotud toimingud, nagu sortimine, koondamine ja ühendamine
- Tehke luku- ja ruumihaldus
Teraandmete otsimine Architektuur
Kui klient käitab kirjete toomiseks päringuid, saadab parsimismootor päringu BYNETile. Seejärel saadab BYNET otsingupäringu sobivatele AMP-dele.
AMP-d otsivad paralleelselt oma kettaid ja tuvastavad vajalikud kirjed ning saadavad need BYNETi. BYNET saadab kirjed Parsing Engine'ile, mis omakorda saadetakse kliendile.
Järgmisena selles Teradata Database õpetuses õpime tundma Teradata SQL-i käske.
Teradata SQL-käskude tüübid
Teradata andmebaas toetab järgmisi põhilisi SQL-käske:
- Data Definition Language (DDL) käsud
- Data Control Language (DCL) käsud
- Data Manipulation Language (DML) käsud
Andmete määratlemise keele käsud
COMMAND | Kirjeldus |
---|---|
LUUA | Loob uue andmebaasi, tabeli, kasutaja jne. |
DROP | Eemaldab uue andmebaasi, tabeli, kasutaja jne. |
VANUS | Muudab tabelit, veergu, päästikut jne. |
MUUTMA | Muudab andmebaasi või kasutaja määratlust |
RENAME | Muudab tabelite, vaadete, makrode jne nimesid. |
Andmehalduse keele käsud
COMMAND | Kirjeldus |
---|---|
ANNA/TÜHISTADA | Kasutatakse objektil kasutaja õiguste kontrollimiseks |
ANNA SISSELOGIMISE / TÜHISTAKE SISSElogimise | Kasutatakse hosti või hostirühma sisselogimisõiguste kontrollimiseks |
aNNA | Kasutatakse andmebaasiobjekti andmiseks teisele andmebaasiobjektile |
Teradata andmebaasi SQL-i andmete manipuleerimise keele käsud
COMMAND | Kirjeldus |
---|---|
Kustuta | Eemaldab tabelist rea |
ECHO | Kasutatakse stringi või käsu kordamiseks kliendile |
KONTROLLIKOHT | Määrab ajakirjas taastepunkti, mida saab hiljem kasutada tabeli sisu taastamiseks |
SELECT | Kasutatakse konkreetse rea andmete tagastamiseks tabeli kujul |
UPDATE | Muudab andmeid tabeli ühes või mitmes reas |
Teradata andmebaasi rakendused
Järgmised on populaarsed Teradata rakendused:
- Kliendiandmete haldamine: Aitab hoida klientidega pikaajalisi suhteid.
- Põhiandmete haldamine: Aitab arendada keskkonda, kus saab põhiandmeid kasutada, sünkroonida ja salvestada.
- Finants- ja tulemusjuhtimine: Aitab organisatsioonil parandada finantsaruandluse kiirust ja kvaliteeti. See vähendab finantsinfrastruktuuri kulusid ja haldab ennetavalt ettevõtte jõudlust.
- Tarneahela juhtimine: Parandage tarneahela toiminguid, mis aitavad parandada klienditeenindust, lühendada tsükliaegu ja vähendada laoseisu.
- Nõudlusahela juhtimine: Aitab tõsta klienditeeninduse taset ja müüki. Samuti aitab see ettevõtetel täpselt prognoosida nõudlust oma poekauba järele.
Järgmisena selles Teradata algajatele õpetuses saame teada, mis vahe on Teradata ja muu vahel RDBMS.
Erinevus Teradata ja teiste RDBMS-ide vahel
Parameeter | TERA ANDMED | RDBMS |
---|---|---|
Architektuurid | Jälgib jagatud mittemidagi Architektuur. | Jagas kõike ja võimaldab ressurssidega väitlust. |
protsessid | MIPS [miljoneid juhiseid sekundis] | KIPS [tuhanded institutsioonid sekundis] |
Indexes | Parem levitamine ja kättesaamine | Pakub ainult FASI allalaadimist |
Paralleelsus | Toetab tingimusteta paralleelsust. | Paralleelsus on tingimuslik ja ettearvamatu |
Masskoormus | Teradata võimaldab hulgilaadimist. | Lubab ainult piiratud puistekoormust. |
Skaalautuvus | Lineaarne skaleeritavus ühe kaldega | Skaleeritavus kahaneva tuluga |
Andmebaasi puhver | Üks andmebaasipuhver, mida kasutavad kõik UoP-d. (Paralleelsuse liit). Üks andmesalv, millele pääsevad juurde kõik UoP-d | Päringukontroller saadab funktsioonid UoP-idele, kes omavad andmeid |
Kauplused | See salvestab TERA BYTES[Billridade ioonid] | GIGA BAITIT[Miljoneid ridu] |
MPP vs SMP
MPP | SMP |
---|---|
MPP – massiliselt paralleelne töötlemine. See on arvutisüsteem, mis on ühendatud paljude sõltumatute aritmeetikaüksuste või tervete mikroprotsessoritega, mis töötavad paralleelselt. | Sümmeetriline mitmekordne töötlemine. SMP-töötlussüsteemis jagavad CPU-d sama mälu ja selle tulemusena võib ühes süsteemis töötav kood mõjutada teise kasutatavat mälu. |
Andmebaase saab laiendada uute protsessorite lisamisega. | SMP-andmebaasid kasutavad andmebaasiotsingu tegemiseks üldjuhul ühte CPU-d. |
MPP-keskkonnas paraneb jõudlus, kuna füüsiliste arvutite vahel ei tohi ressursse jagada. | Paralleeltöö töökoormus jaotatakse süsteemis olevate protsessorite vahel. |
Massiivse paralleeltöötlussüsteemi jõudlus on lineaarne. See aga suureneb proportsionaalselt sõlmede arvuga. | SMP andmebaasid võivad töötada mitmes serveris. Siiski jagab teist ressurssi. |
kokkuvõte
- Teradata tähendus: Teradata on avatud lähtekoodiga fail Andmebaasi haldamise süsteem suuremahuliste andmehoidlate rakenduste arendamiseks.
- Teradata oli NCR Corporationi üksus. See asutati 1979. aastal, kuid läks NCR-ist lahku 2007. aasta oktoobris
- Teradata pakub täielikku teenuste komplekti, mis keskendub andmehoidlale
- Teradata pakub suurte andmemahtude töötlemisel lineaarset skaleeritavust, lisades süsteemi jõudluse suurendamiseks sõlme.
- Teradata kolm olulist komponenti on 1) parsimismootor 2) MPP 3) juurdepääsumooduli protsessorid (AMP)
- Teradata pakub täielikku tootekomplekti, mis vastab iga organisatsiooni andmehoidla ja ETL-i vajadustele
- Teradata rakendust kasutatakse peamiselt tarneahela juhtimiseks, põhiandmete haldamiseks, nõudlusahela haldamiseks jne.