Kurz Teradata: Co je Teradata SQL? Databáze Architecture

Co je Teradata?

Teradata je open-source systém pro správu databází pro vývoj rozsáhlých aplikací pro ukládání dat. Tento nástroj poskytuje podporu pro více operací datového skladu současně pomocí konceptu paralelismu. Teradata je masivně otevřený systém zpracování, který podporuje Unix/Linux/Windows serverové platformy.

Software Teradata je vyvinut společností Teradata Corporation, což je americká IT firma. Je dodavatelem analytických datových platforem, aplikací a dalších souvisejících služeb. Firma vyvíjí produkt pro konsolidaci dat z různých zdrojů a zpřístupnění dat pro analýzu.

Historie Teradata

Teradata byla divize NCR Corporation. Vznikla v roce 1979, ale v říjnu 2007 se od NCR oddělila. Michael Koehler se stal prvním generálním ředitelem Teradata.

Milníky společnosti Teradata Corporation:

  • 1979 – byla začleněna společnost Teradata
  • 1984 – Vydání prvního databázového počítače DBC/1012
  • 1986 – časopis Fortune vyhlásil Teradata jako „produkt roku“
  • 1999 – Největší databáze vytvořená pomocí Teradata se 130 terabajty
  • 2002 – Verze Teradata V2R5 s kompresí a Partition Primary
  • 2006 – Uvedení řešení Teradata Master Data Management
  • 2008 – Vydán Teradata 13.0 s Active Data Warehousing
  • 2011 – Kupuje Teradata Aster a vrhá se do Advanced Analytics Space
  • 2012 – Představení Teradata 14.0
  • 2014 – Představení Teradata 15.0
  • 2015 – Teradata kupuje Apps Marketing Platform Appoxee
  • 2016 – Terada spojí ruce s velkými daty
  • 2017 – Teradata získává San Diego's StackIQ

Proč Teradata?

  • Teradata nabízí kompletní sadu služeb, na které se zaměřuje Skladování dat
  • Systém je postaven na otevřené architektuře. Takže kdykoli jsou k dispozici rychlejší zařízení, lze je začlenit do již sestavené architektury.
  • Teradata podporuje 50+ petabajtů dat.
  • Jediný operační pohled pro velký víceuzlový systém Teradata využívající Service Workstation
  • Kompatibilní se širokou škálou BI nástroj k načtení dat.
  • Může fungovat jako jediný kontrolní bod pro DBA pro správu Databáze.
  • Vysoký výkon, různé dotazy, analýzy v databázi a sofistikovaná správa pracovní zátěže
  • Teradata vám umožňuje získat stejná data na více možnostech nasazení

Dále v tomto tutoriálu Teradata se seznámíme s funkcemi Teradata.

Vlastnosti Teradata SQL

Teradata nabízí následující výkonné funkce:

  • Lineární škálovatelnost: Nabízí lineární škálovatelnost při práci s velkými objemy dat přidáním uzlů ke zvýšení výkonu systému.
  • Neomezený paralelismus: Teradata je založena na MPP (Massively Parallel Processing). Architektura). Je tedy navržen tak, aby byl od začátku paralelní. Dokáže rozdělit velký úkol na menší úkoly a spouštět je paralelně
  • Prospělý optimalizátor: Teradata Optimizer dokáže zpracovat až 64 spojení v dotazu.
  • Nízké TCO: Tera data mají nízké celkové náklady na vlastnictví. Je snadné jej nastavit, udržovat a spravovat.
  • Nástroje pro načítání a vykládání: Teradata poskytuje nástroje pro načítání a vyjímání pro přesun dat do/z Teradata System.
  • Konektivita: Tento systém MPP se může připojit k systémům připojeným ke kanálu, jako je sálový počítač nebo k systémům připojeným k síti.
  • SQL: Teradata podporuje SQL pro interakci s daty uloženými v tabulkách. Poskytuje jeho rozšíření.
  • Robustní nástroje: Teradata poskytuje robustní nástroje pro import/export dat z/do systémů Teradata, jako jsou FastExport, FastLoad, MultiLoad a TPT.
  • Automatická distribuce: Teradata dokáže distribuovat data na disky automaticky bez ručního zásahu.

Dále v tomto tutoriálu Teradata SQL se dozvíme o Teradata Architecture.

Teradata Architecture

Architektura Teradata je masivně paralelní zpracování Architecture.

Tři důležité součásti Teradata jsou:

  • Modul analýzy
  • BYNET
  • Procesory přístupového modulu (AMP)

Úložiště Teradata Archidatabáze tecture ArchiSchéma struktury:

Teradata Architecture
Teradata Architecture Diagram

Úložiště Teradata Architecture

Modul analýzy:

Modul analýzy analyzuje dotazy a připravuje plán provádění. Spravuje relace pro uživatele. Optimalizuje a odešle požadavek uživatelům.

Když tedy klient provádí dotazy na vkládání záznamů, modul analýzy odešle záznamy do vrstvy předávání zpráv. Vrstva předávání zpráv neboli BYNET je softwarová a hardwarová součást. Nabízí síťové funkce. Také načte záznamy a odešle řádek do cílového AMP.

MPA:

AMP je zkratka pro Access Module Processor. Na tyto disky ukládá záznamy. AMP provádí následující činnosti:

  • Spravuje část databáze
  • Spravuje část každé tabulky
  • Proveďte všechny úkoly spojené s generováním sady výsledků, jako je řazení, agregace a spojení
  • Proveďte zámek a správu prostoru

Načítání Teradata Architecture

Když klient spustí dotazy k načtení záznamů, modul analýzy odešle požadavek do BYNET. Poté BYNET odešle žádost o načtení příslušným AMP.

AMP paralelně prohledávají své disky a rozpoznávají požadované záznamy a odesílají je společnosti BYNET. BYNET odešle záznamy do modulu Parsing Engine, který bude následně odeslán klientovi.

Dále v tomto tutoriálu Teradata Database se seznámíme s příkazy Teradata SQL.

Typy příkazů Teradata SQL

Databáze Teradata podporuje následující základní příkazy SQL:

  1. Příkazy jazyka DDL (Data Definition Language).
  2. Příkazy jazyka řízení dat (DCL).
  3. Příkazy jazyka DML (Data Manipulation Language).

Příkazy jazyka definice dat

COMMAND Description
CREATE Vytvoří novou databázi, tabulku, uživatele atd.
DROP Odebere novou databázi, tabulku, uživatele atd.
ALTER Změní tabulku, sloupec, spouštěč atd.
MODIFIKOVAT Změní databázi nebo definici uživatele
PŘEJMENOVAT Změní názvy tabulek, pohledů, maker atd.

Příkazy jazyka Data Control Language

COMMAND Description
UDĚLIT/ODVOLAT Používá se k řízení oprávnění uživatele k objektu
UDĚLIT PŘIHLÁŠENÍ/ODVOLAT PŘIHLÁŠENÍ Používá se k řízení přihlašovacích oprávnění k hostiteli nebo skupině hostitelů
DÁT Používá se k přidělení databázového objektu jinému databázovému objektu

Příkazy jazyka SQL Data Manipulation Language databáze Teradata

COMMAND Description
DELETE Odebere řádek z tabulky
ECHO Používá se k odeslání řetězce nebo příkazu klientovi
KONTROLNÍ BOD Definuje bod obnovy v žurnálu, který lze později použít k obnovení obsahu tabulky
SELECT Používá se k vrácení dat konkrétního řádku ve formuláři tabulky
UPDATE Upravuje data v jednom nebo více řádcích tabulky

Aplikace databáze Teradata

Níže jsou uvedeny oblíbené aplikace Teradata:

  • Správa zákaznických dat: Pomáhá udržovat dlouhodobé vztahy se zákazníky.
  • Správa kmenových dat: Pomáhá vyvinout prostředí, kde lze používat, synchronizovat a ukládat kmenová data.
  • Řízení financí a výkonu: Pomáhá organizaci zlepšit rychlost a kvalitu účetního výkaznictví. Snižuje náklady na finanční infrastrukturu a proaktivně řídí výkon podniku.
  • Řízení dodavatelského řetězce: Zlepšete operace dodavatelského řetězce, které pomáhají zlepšit služby zákazníkům, zkrátit doby cyklů a snížit zásoby.
  • Řízení poptávkového řetězce: Pomáhá zvyšovat úroveň zákaznických služeb a prodeje. Pomáhá také společnostem přesně předvídat poptávku po jejich položce z obchodu.

Dále v tomto tutoriálu Teradata pro začátečníky se seznámíme s rozdílem mezi Teradata a ostatními RDBMS.

Rozdíl mezi Teradata a jinými RDBMS

Parametr DATA TERA RDBMS
Architectures Sleduje sdílené nic Architecture. Sdílel vše a umožňuje soupeření o zdroje.
Procesy MIPS [miliony instrukcí/s] KIPS [Tisíce institucí/s]
Indexy Lepší distribuce a vyhledávání Nabízí pouze FASI Retrieval
Rovnoběžnost Podporuje nepodmíněný paralelismus. Paralelismus je podmíněný a nepředvídatelný
Hromadné zatížení Teradata umožňuje hromadné načítání. Umožňuje pouze omezené hromadné zatížení.
Škálovatelnost Lineární škálovatelnost se sklonem jedna Škálovatelnost s klesajícími výnosy
Vyrovnávací paměť databáze Jediný databázový buffer používaný všemi UoP. (Jednota paralelismu). Jediné úložiště dat, ke kterému mají přístup všechny UoP Query Controller dodává funkce UoP, které vlastní data
Obchody Ukládá TERA BYTES[Billionty řádků] GIGA BYTES [miliony řádků]

MPP vs. SMP

MPP SMP
MPP – Masivně paralelní zpracování. Je to počítačový systém, který je připojen k mnoha nezávislým aritmetickým jednotkám nebo celým mikroprocesorům, které běží paralelně. Symetrické vícenásobné zpracování. V systému zpracování SMP sdílí CPU stejnou paměť a v důsledku toho může kód spuštěný v jednom systému ovlivnit paměť používanou jiným.
Databáze lze rozšířit přidáním nových CPU. Databáze SMP obecně používají jeden procesor k provádění prohledávání databáze.
V prostředí MPP je výkon vylepšen, protože fyzické počítače nesmí sdílet žádné prostředky. Pracovní zátěž pro paralelní úlohu je distribuována mezi procesory v systému.
Výkon systému Massive paralelního zpracování je lineární. Bude se však zvyšovat úměrně s počtem uzlů. SMP databáze mohou běžet na více serverech. Bude však sdílet jiný zdroj.

Shrnutí

  • Význam Teradata: Teradata je open-source Systém pro správu databází pro vývoj rozsáhlých aplikací pro ukládání dat.
  • Teradata byla divize NCR Corporation. Byla začleněna v roce 1979, ale oddělila se od NCR v říjnu 2007
  • Teradata nabízí kompletní sadu služeb, která se zaměřuje na datové sklady
  • Teradata nabízí lineární škálovatelnost při práci s velkými objemy dat přidáním uzlů ke zvýšení výkonu systému.
  • Tři důležité součásti Teradata jsou 1) Parsing Engine 2) MPP 3) Procesory Access Module Processors (AMP)
  • Teradata nabízí kompletní řadu produktů, které splňují požadavky na datové sklady a ETL jakékoli organizace
  • Aplikace Teradata se používá hlavně pro Supply Chain Management, Master Data Management, Demand Chain Management atd.