Samouczek Teradata: Co to jest Teradata SQL? Baza danych Architektura

Co to jest Teradata?

Teradane jest systemem zarządzania bazą danych typu open source do tworzenia aplikacji do magazynowania danych na dużą skalę. To narzędzie zapewnia obsługę wielu operacji magazynowania danych jednocześnie, wykorzystując koncepcję paralelizmu. Teradata jest masowo otwartym systemem przetwarzania, który obsługuje systemy Unix/Linux/Windows platformy serwerowe.

Oprogramowanie Teradata zostało opracowane przez Teradata Corporation, amerykańską firmę informatyczną. Jest dostawcą platform danych analitycznych, aplikacji i innych powiązanych usług. Firma rozwija produkt pozwalający konsolidować dane z różnych źródeł i udostępniać je do analizy.

Historia Teradaty

Teradata była oddziałem NCR Corporation. Została założona w 1979 r., ale oddzieliła się od NCR w październiku 2007 r. Michael Koehler został pierwszym dyrektorem generalnym Teradata.

Kamienie milowe Teradata Corporation:

  • 1979 – zarejestrowano firmę Teradata
  • 1984 – Wypuszczenie pierwszego komputera bazodanowego DBC/1012
  • 1986 – Magazyn Fortune uznał Teradata za „Produkt Roku”
  • 1999 – Największa baza danych zbudowana przy użyciu Teradaty o wielkości 130 terabajtów
  • 2002 – wydanie wersji Teradata V2R5 z kompresją i partycją podstawową
  • 2006 – Wprowadzenie rozwiązania Teradata Master Data Management
  • 2008 – wypuszczenie Teradata 13.0 z Active Data Warehousing
  • 2011 – nabywa Teradata Aster i zagłębia się w przestrzeń Advanced Analytics
  • 2012 – wprowadzenie Teradata 14.0
  • 2014 – wprowadzenie Teradata 15.0
  • 2015 — Teradata kupuje platformę marketingową aplikacji Appoxee
  • 2016- Terada łączy siły z Big Data
  • 2017 — Teradata przejmuje StackIQ w San Diego

Dlaczego Teradata?

  • Teradata oferuje pełny pakiet usług, który koncentruje się na Magazyn danych
  • System jest zbudowany na otwartej architekturze. Więc kiedykolwiek jakieś szybsze urządzenia są dostępne, można je włączyć do już zbudowanej architektury.
  • Teradata obsługuje ponad 50 petabajtów danych.
  • Pojedynczy widok operacyjny dla dużego systemu wielowęzłowego Teradata przy użyciu Service Workstation
  • Kompatybilny z szeroką gamą Narzędzie BI do pobrania danych.
  • Może działać jako pojedynczy punkt kontroli dla administratora danych w celu zarządzania Baza danych.
  • Wysoka wydajność, różnorodne zapytania, analityka w bazie danych i zaawansowane zarządzanie obciążeniem
  • Teradata umożliwia uzyskanie tych samych danych przy wielu opcjach wdrożenia

W dalszej części tego samouczka Teradata dowiemy się o funkcjach Teradata.

Funkcje Teradata SQL

Teradata oferuje następujące zaawansowane funkcje:

  • Skalowalność liniowa: Oferuje skalowalność liniową w przypadku dużych ilości danych poprzez dodanie węzłów w celu zwiększenia wydajności systemu.
  • Nieograniczona równoległość: Teradata opiera się na MPP (Massively Parallel Processing Architektura). Dlatego od początku zaprojektowano go równolegle. Potrafi podzielić duże zadanie na mniejsze zadania i wykonywać je równolegle
  • Dojrzały optymalizator: Teradata Optimizer może obsłużyć do 64 złączeń w zapytaniu.
  • Niski całkowity koszt posiadania: Tera Data charakteryzuje się niskim całkowitym kosztem posiadania. Jest łatwy w konfiguracji, utrzymaniu i administrowaniu.
  • Załaduj i rozładuj narzędzia: Teradata zapewnia narzędzia do ładowania i rozładowywania umożliwiające przenoszenie danych do/z systemu Teradata.
  • Łączność: Ten system MPP można podłączyć do systemów podłączonych do kanału, takich jak komputery typu mainframe lub systemy podłączone do sieci.
  • SQL: Obsługuje Teradata SQL do interakcji z danymi przechowywanymi w tabelach. Zapewnia jego rozszerzenie.
  • Solidne narzędzia: Teradata zapewnia niezawodne narzędzia do importowania/eksportowania danych z/do systemów Teradata, takich jak FastExport, FastLoad, MultiLoad i TPT.
  • Automatyczna dystrybucja: Teradane może automatycznie dystrybuować dane na dyski, bez konieczności ręcznej interwencji.

W dalszej części tego samouczka Teradata SQL dowiemy się o Teradata Architektura.

Teradane Architektura

Architektura Teradata to masowo równoległa architektura przetwarzania Architektura.

Trzy ważne komponenty Teradata to:

  • Silnik analizujący
  • BYNET
  • Procesory modułów dostępowych (AMP)

Pamięć Teradanych ArchiBaza danych technologii Archischemat budowy:

Teradane Architektura
Teradane ArchiSchemat tecture

Pamięć Teradanych Architektura

Silnik analizujący:

Parsing Engine analizuje zapytania i przygotowuje plan wykonania. Zarządza sesjami dla użytkowników. Optymalizuje i wysyła żądanie do użytkowników.

Tak więc, gdy klient wykonuje zapytania o wstawienie rekordów, silnik analizujący wysyła rekordy do warstwy przekazywania komunikatów. Warstwa przekazująca komunikaty, czyli BYNET, to komponent oprogramowania i sprzętu. Oferuje możliwości pracy w sieci. Pobiera również rekordy i wysyła wiersz do docelowego AMP.

AMP:

AMP oznacza Access Module Processor. Przechowuje rekordy na tych dyskach. AMP wykonuje następujące czynności:

  • Zarządza częścią bazy danych
  • Zarządza częścią każdej tabeli
  • Wykonuj wszystkie zadania związane z generowaniem zestawu wyników, takie jak sortowanie, agregacja i łączenie
  • Zarządzaj blokadami i przestrzenią

Odzyskiwanie Teradanych Architektura

Gdy klient uruchamia zapytania w celu pobrania rekordów, aparat analizujący wysyła żądanie do BYNET. Następnie BYNET wysyła żądanie pobrania do odpowiednich AMP.

AMP przeszukują swoje dyski równolegle, rozpoznają wymagane rekordy i wysyłają je do BYNET. BYNET wysyła rekordy do silnika analizującego, który z kolei zostanie wysłany do klienta.

W dalszej części tego samouczka dotyczącego bazy danych Teradata dowiemy się o poleceniach Teradata SQL.

Rodzaje poleceń Teradata SQL

Baza danych Teradata obsługuje następujące podstawowe polecenia SQL:

  1. Polecenia języka definicji danych (DDL).
  2. Polecenia języka kontroli danych (DCL).
  3. Polecenia języka manipulacji danymi (DML).

Polecenia języka definicji danych

COMMAND Opisy Konstrukcyjne
TWORZENIE Tworzy nową bazę danych, tabelę, użytkownika itp.
DROP Usuwa nową bazę danych, tabelę, użytkownika itp.
ZMIANA Zmienia tabelę, kolumnę, wyzwalacz itp.
MODYFIKOWAĆ Zmienia bazę danych lub definicję użytkownika
PRZEMIANOWAĆ Zmienia nazwy tabel, widoków, makr itp.

Polecenia języka kontroli danych

COMMAND Opisy Konstrukcyjne
PRZYZNAJ/ODWOŁAJ Służy do kontrolowania uprawnień użytkownika do obiektu
PRZYZNAJ LOGOWANIE/ODWOŁAJ LOGOWANIE Służy do kontrolowania uprawnień logowania do hosta lub grupy hostów
DAĆ Służy do przekazywania obiektu bazy danych innemu obiektowi bazy danych

Polecenia języka manipulacji danymi Teradata Database SQL

COMMAND Opisy Konstrukcyjne
DELETE Usuwa wiersz z tabeli
ECHO Służy do wysyłania echa ciągu lub polecenia do klienta
PUNKT KONTROLNY Definiuje punkt odzyskiwania w dzienniku, który można później wykorzystać do przywrócenia zawartości tabeli
SELECT Służy do zwracania określonych danych wiersza w formie tabeli
Aktualizacja Modyfikuje dane w jednym lub większej liczbie wierszy tabeli

Zastosowania bazy danych Teradata

Poniżej przedstawiono popularne aplikacje Teradata:

  • Zarządzanie danymi klientów: Pomaga utrzymać długotrwałe relacje z klientami.
  • Zarządzanie danymi podstawowymi: Pomaga w stworzeniu środowiska, w którym dane podstawowe mogą być wykorzystywane, synchronizowane i przechowywane.
  • Zarządzanie finansami i wynikami: Pomaga organizacji poprawić szybkość i jakość raportowania finansowego. Zmniejsza koszty infrastruktury finansowej i aktywnie zarządza wydajnością przedsiębiorstwa.
  • Zarządzanie łańcuchem dostaw: Usprawnij działanie łańcucha dostaw, co przełoży się na lepszą obsługę klienta, skrócenie czasu cykli i obniżenie zapasów.
  • Zarządzanie łańcuchem popytu: Pomaga zwiększyć poziom obsługi klienta i sprzedaży. Pomaga także firmom dokładnie przewidzieć popyt na produkty w ich sklepie.

W dalszej części tego samouczka Teradata dla początkujących dowiemy się o różnicy między Teradata a innymi programami RDBMS.

Różnica między Teradata a innymi RDBMS

Parametr DANE TERA RDBMS
Archistruktury Obserwuje Shared Nothing Architektura. Udostępnij wszystko i umożliwia rywalizację o zasoby.
Procesy MIPS [miliony instrukcji/s] KIPS [tysiące instytucji/s]
Indeksy Lepsza dystrybucja i odzyskiwanie Oferuje tylko pobieranie FASI
Równoległość Obsługuje bezwarunkową równoległość. Równoległość jest warunkowa i nieprzewidywalna
Obciążenie zbiorcze Teradata umożliwia ładowanie masowe. Umożliwia tylko ograniczone obciążenie masowe.
Skalowalność Skalowalność liniowa o nachyleniu jeden Skalowalność przy malejących zyskach
Bufor bazy danych Pojedynczy bufor bazy danych używany przez wszystkie UoP. (Jednostka paralelizmu). Pojedynczy magazyn danych dostępny dla wszystkich UoP. Query Controller dostarcza funkcje do UoP, które są właścicielami danych
Sklepy Przechowuje TERA BYTES [Billjony rzędów] GIGA BYTES [Miliony wierszy]

MPP kontra SMP

MPP SMP
MPP – masowe przetwarzanie równoległe. Jest to system komputerowy, który jest podłączony do wielu niezależnych jednostek arytmetycznych lub całych mikroprocesorów, które działają równolegle. Symetryczne przetwarzanie wieloprocesowe. W systemie przetwarzającym SMP procesory korzystają z tej samej pamięci, w wyniku czego kod działający w jednym systemie może wpływać na pamięć używaną przez inny.
Bazy danych można rozbudowywać poprzez dodanie nowych procesorów. Bazy danych SMP zazwyczaj korzystają z jednego procesora do wykonywania przeszukiwań baz danych.
W środowisku MPP wydajność jest lepsza, ponieważ żadne zasoby nie muszą być współdzielone pomiędzy komputerami fizycznymi. Obciążenie zadania równoległego jest rozkładane na procesory w systemie.
Wydajność ogromnego systemu przetwarzania równoległego jest liniowa. Będzie jednak wzrastać proporcjonalnie do liczby węzłów. Bazy danych SMP mogą działać na wielu serwerach. Jednak udostępni inny zasób.

Podsumowanie

  • Znaczenie Teradata: Teradata jest oprogramowaniem typu open source System zarządzania bazą danych do tworzenia wielkoskalowych aplikacji do przechowywania danych.
  • Teradata była oddziałem NCR Corporation. Została utworzona w 1979 r., ale oddzieliła się od NCR w październiku 2007 r
  • Teradata oferuje pełny pakiet usług skupiających się na hurtowni danych
  • Teradata oferuje skalowalność liniową w przypadku dużych ilości danych poprzez dodanie węzłów w celu zwiększenia wydajności systemu.
  • Trzy ważne komponenty Teradata to 1) silnik parsujący 2) MPP 3) procesory modułów dostępowych (AMP)
  • Teradata oferuje pełną gamę produktów spełniających potrzeby każdej organizacji w zakresie hurtowni danych i ETL
  • Aplikacja Teradata używana głównie do zarządzania łańcuchem dostaw, zarządzania danymi podstawowymi, zarządzania łańcuchem popytu itp.