Teradata Vodič: Što je Teradata SQL? Baza podataka Architektura

Što je Teradata?

Teradata je sustav upravljanja bazom podataka otvorenog koda za razvoj velikih aplikacija za skladištenje podataka. Ovaj alat pruža podršku za višestruke operacije skladišta podataka istovremeno koristeći koncept paralelizma. Teradata je masivno otvoreni sustav obrade koji podržava Unix/Linux/Windows poslužiteljske platforme.

Softver Teradata razvila je Teradata Corporation, američka IT tvrtka. Dobavljač je analitičkih podatkovnih platformi, aplikacija i drugih povezanih usluga. Tvrtka razvija proizvod za konsolidaciju podataka iz različitih izvora i dostupnost podataka za analizu.

Povijest Teradate

Teradata je bila odjel NCR Corporation. Osnovan je 1979., ali se odvojio od NCR-a u listopadu 2007. Michael Koehler postao je prvi izvršni direktor Teradate.

Prekretnice Teradata Corporationa:

  • 1979 – Teradata je osnovana
  • 1984. – Puštanje u promet prvog računala baze podataka DBC/1012
  • 1986. – Časopis Fortune proglasio je Teradatu 'proizvodom godine'
  • 1999. – Najveća baza podataka izgrađena pomoću Teradata sa 130 terabajta
  • 2002. – izdanje verzije Teradata V2R5 s kompresijom i primarnom particijom
  • 2006. – Lansiranje rješenja Teradata Master Data Management
  • 2008. – Teradata 13.0 izdana s Active Data Warehousingom
  • 2011. – Kupnja Teradata Aster i uranja u prostor napredne analitike
  • 2012. – Predstavljen Teradata 14.0
  • 2014. – Predstavljen Teradata 15.0
  • 2015. - Teradata kupuje Apps Marketing Platform Appoxee
  • 2016- Terada se udružila s Big data
  • 2017. - Teradata preuzima StackIQ iz San Diega

Zašto Teradata?

  • Teradata nudi kompletan paket usluga koji se fokusira na Skladištenje podataka
  • Sustav je izgrađen na otvorenoj arhitekturi. Dakle, kad god se brži uređaji stave na raspolaganje, oni se mogu ugraditi u već izgrađenu arhitekturu.
  • Teradata podržava 50+ petabajta podataka.
  • Prikaz jedne operacije za veliki Teradata sustav s više čvorova koji koristi Service Workstation
  • Kompatibilan sa širokim spektrom BI alat dohvatiti podatke.
  • Može djelovati kao jedinstvena točka kontrole kojom DBA upravlja Baza podataka.
  • Visoke performanse, raznoliki upiti, analitika unutar baze podataka i sofisticirano upravljanje radnim opterećenjem
  • Teradata vam omogućuje da dobijete iste podatke o više opcija implementacije

Zatim ćemo u ovom Teradata vodiču naučiti o značajkama Teradate.

Značajke Teradata SQL

Teradata nudi sljedeće moćne značajke:

  • Linearna skalabilnost: Nudi linearnu skalabilnost kada se radi s velikim količinama podataka dodavanjem čvorova za povećanje performansi sustava.
  • Neograničeni paralelizam: Teradata se temelji na MPP (Massively Parallel Processing). Architekstura). Dakle, osmišljeno je da bude paralelno od početka. Može podijeliti veliki zadatak na manje i izvoditi ih paralelno
  • Razvijeni alat za optimizaciju: Teradata Optimizer može obraditi do 64 spajanja u upitu.
  • Niski TCO: Tera data ima niske ukupne troškove vlasništva. Jednostavan je za postavljanje, održavanje i administraciju.
  • Pomoćni programi za učitavanje i istovar: Teradata pruža pomoćne programe za učitavanje i istovar za premještanje podataka u/iz Teradata sustava.
  • Povezivanje: Ovaj MPP sustav može se spojiti na sustave priključene na kanale poput glavnog računala ili sustava priključenih na mrežu.
  • SQL: Teradata podržava SQL za interakciju s podacima pohranjenim u tablicama. Osigurava njegovo proširenje.
  • Robusni uslužni programi: Teradata pruža robusne alate za uvoz/izvoz podataka iz/u Teradata sustave kao što su FastExport, FastLoad, MultiLoad i TPT.
  • Automatska distribucija: Teradata može automatski distribuirati podatke na diskove bez ručne intervencije.

Zatim ćemo u ovom vodiču za Teradata SQL učiti o Teradati Architektura.

Teradata Architektura

Teradata arhitektura je masivna paralelna obrada Architektura.

Tri važne komponente Teradata su:

  • Motor za analizu
  • BYNET
  • Procesori pristupnog modula (AMP)

Teradata Storage Architekstura baze podataka Archidijagram strukture:

Teradata Architektura
Teradata Archidijagram strukture

Teradata Storage Architektura

Motor za analizu:

Parsing Engine analizira upite i priprema plan izvršenja. Upravlja sesijama za korisnike. Optimizira i šalje zahtjev korisnicima.

Dakle, kada klijent izvršava upite za umetanje zapisa, Parsing Engine šalje zapise u sloj prosljeđivanja poruka. Message passing layer ili BYNET je softverska i hardverska komponenta. Nudi mogućnost umrežavanja. Također dohvaća zapise i šalje red na ciljni AMP.

AMP:

AMP je kratica za Access Module Processor. Na tim diskovima pohranjuje zapise. AMP provodi sljedeće aktivnosti:

  • Upravlja dijelom baze podataka
  • Upravlja dijelom svake tablice
  • Izvršite sve zadatke povezane s generiranjem skupa rezultata kao što su sortiranje, združivanje i spajanje
  • Izvršite upravljanje zaključavanjem i prostorom

Teradata Retrieval Architektura

Kada klijent pokrene upite za dohvaćanje zapisa, mehanizam za analizu šalje zahtjev BYNET-u. Zatim BYNET šalje zahtjev za dohvaćanje odgovarajućim AMP-ovima.

AMP-ovi paralelno pretražuju svoje diskove i prepoznaju potrebne zapise te ih šalju BYNET-u. BYNET šalje zapise Parsing Engineu, koji će zauzvrat biti poslan klijentu.

Zatim ćemo u ovom vodiču za Teradata bazu podataka učiti o Teradata SQL naredbama.

Vrste Teradata SQL naredbi

Teradata baza podataka podržava sljedeće osnovne SQL naredbe:

  1. Naredbe jezika za definiranje podataka (DDL).
  2. Naredbe Data Control Language (DCL).
  3. Data Manipulation Language (DML) naredbe

Naredbe jezika za definiranje podataka

COMMAND Description
STVORITI Stvara novu bazu podataka, tablicu, korisnika itd.
KAP Uklanja novu bazu podataka, tablicu, korisnika itd.
IZMIJENI Mijenja tablicu, stupac, okidač itd.
IZMJENITI Mijenja bazu podataka ili korisničku definiciju
PREIMENOVATI Mijenja nazive tablica, prikaza, makroa itd.

Naredbe jezika za kontrolu podataka

COMMAND Description
ODOBRITI/OPOZIVI Koristi se za kontrolu privilegija korisnika na objektu
ODOBRIVANJE PRIJAVE/OPOZIVANJE PRIJAVE Koristi se za kontrolu povlastica za prijavu na host ili grupu hostova
DATI Koristi se za davanje objekta baze podataka drugom objektu baze podataka

Teradata Database SQL Data Manipulation Language naredbe

COMMAND Description
DELETE Uklanja red iz tablice
ECHO Koristi se za ponavljanje niza ili naredbe klijentu
KONTROLA Definira točku oporavka u dnevniku koja se kasnije može koristiti za vraćanje sadržaja tablice
SELECT Koristi se za vraćanje podataka određenog retka u obliku tablice
UPDATE Mijenja podatke u jednom ili više redaka tablice

Primjene baze podataka Teradata

Slijede popularne Teradata aplikacije:

  • Upravljanje podacima o klijentima: Pomaže u održavanju dugotrajnih odnosa s kupcima.
  • Upravljanje glavnim podacima: Pomaže u razvoju okruženja u kojem se glavni podaci mogu koristiti, sinkronizirati i pohraniti.
  • Upravljanje financijama i učinkom: Pomaže organizaciji poboljšati brzinu i kvalitetu financijskog izvješćivanja. Smanjuje troškove financijske infrastrukture i proaktivno upravlja učinkom poduzeća.
  • Upravljanje lancem opskrbe: Poboljšajte operacije opskrbnog lanca koje pomažu poboljšanju korisničke usluge, smanjenju vremena ciklusa i smanjenju zaliha.
  • Upravljanje lancem potražnje: Pomaže u povećanju razine korisničke usluge i prodaje. Također pomaže tvrtkama da točno predvide potražnju za svojim prodajnim artiklom.

Zatim ćemo u ovom vodiču Teradata za početnike naučiti o razlici između Teradate i ostalih RDBMS.

Razlika između Teradata i drugih RDBMS

Parametar PODACI TERA RDBMS
Architekture Prati Shared Nothing Architektura. Dijeli sve i dopušta sukobe za resurse.
Procesi MIPS [Milijuni instrukcija/s] KIPS [Tisuće institucija/s]
Indeksi Bolja distribucija i dohvaćanje Nudi samo FASI Retrieval
Paralelizam Podržava bezuvjetni paralelizam. Paralelizam je uvjetovan i nepredvidiv
Rasuti teret Teradata dopušta skupno učitavanje. Dopušta samo ograničeno rasuto opterećenje.
skalabilnost Linearna skalabilnost s nagibom od jedan Skalabilnost s opadajućim prinosima
Međuspremnik baze podataka Jedan međuspremnik baze podataka koji koriste svi UoP-ovi. (Jedinstvo paralelizma). Jedna pohrana podataka kojoj pristupaju svi UoP-ovi Query Controller isporučuje funkcije UoP-ovima koji posjeduju podatke
Prodavaonice Pohranjuje TERA BYTES[Billioni redaka] GIGA BAJTOVA[Milijuni redaka]

MPP u odnosu na SMP

MPP SMP
MPP – Masivna paralelna obrada. To je računalni sustav koji je povezan s mnogo neovisnih aritmetičkih jedinica ili čitavih mikroprocesora koji rade paralelno. Simetrična višestruka obrada. U SMP sustavu obrade, CPU-ovi dijele istu memoriju i kao rezultat toga kod koji se izvodi u jednom sustavu može utjecati na memoriju koju koristi drugi.
Baze podataka se mogu proširiti dodavanjem novih CPU-a. SMP baze podataka općenito koriste jedan CPU za izvođenje pretraživanja baze podataka.
U MPP okruženju, performanse su poboljšane jer se nikakvi resursi ne smiju dijeliti među fizičkim računalima. Radno opterećenje za paralelni posao raspoređuje se na procesore u sustavu.
Performanse masivnog paralelnog obradnog sustava su linearne. Međutim, povećavat će se proporcionalno broju čvorova. SMP baze podataka mogu raditi na više poslužitelja. Međutim, podijelit ćemo još jedan resurs.

rezime

  • Teradata znači: Teradata je open-source Sustav za upravljanje bazom podataka za razvoj velikih aplikacija za skladištenje podataka.
  • Teradata je bila odjel NCR Corporation. Osnovan je 1979., ali se odvojio od NCR-a u listopadu 2007
  • Teradata nudi potpuni paket usluga koji se fokusira na skladištenje podataka
  • Teradata nudi linearnu skalabilnost kada se radi s velikim količinama podataka dodavanjem čvorova za povećanje performansi sustava.
  • Tri važne komponente Teradata su 1) Parsing Engine 2) MPP 3) Procesori pristupnog modula (AMP)
  • Teradata nudi kompletan niz proizvoda za ispunjavanje potreba svake organizacije za skladištenjem podataka i ETL-om
  • Aplikacija Teradata uglavnom se koristi za upravljanje lancem opskrbe, upravljanje glavnim podacima, upravljanje lancem potražnje itd.