Samouczek Teradata: Co to jest Teradata SQL? Baza danych Architektura
Co to jest Teradata?
Teradane jest systemem zarządzania bazą danych typu open source do tworzenia aplikacji do magazynowania danych na dużą skalę. To narzędzie zapewnia obsługę wielu operacji magazynowania danych jednocześnie, wykorzystując koncepcję paralelizmu. Teradata jest masowo otwartym systemem przetwarzania, który obsługuje systemy Unix/Linux/Windows platformy serwerowe.
Oprogramowanie Teradata zostało opracowane przez Teradata Corporation, amerykańską firmę informatyczną. Jest dostawcą platform danych analitycznych, aplikacji i innych powiązanych usług. Firma rozwija produkt pozwalający konsolidować dane z różnych źródeł i udostępniać je do analizy.
Historia Teradaty
Teradata była oddziałem NCR Corporation. Została założona w 1979 r., ale oddzieliła się od NCR w październiku 2007 r. Michael Koehler został pierwszym dyrektorem generalnym Teradata.
Kamienie milowe Teradata Corporation:
- 1979 – zarejestrowano firmę Teradata
- 1984 – Wypuszczenie pierwszego komputera bazodanowego DBC/1012
- 1986 – Magazyn Fortune uznał Teradata za „Produkt Roku”
- 1999 – Największa baza danych zbudowana przy użyciu Teradaty o wielkości 130 terabajtów
- 2002 – wydanie wersji Teradata V2R5 z kompresją i partycją podstawową
- 2006 – Wprowadzenie rozwiązania Teradata Master Data Management
- 2008 – wypuszczenie Teradata 13.0 z Active Data Warehousing
- 2011 – nabywa Teradata Aster i zagłębia się w przestrzeń Advanced Analytics
- 2012 – wprowadzenie Teradata 14.0
- 2014 – wprowadzenie Teradata 15.0
- 2015 — Teradata kupuje platformę marketingową aplikacji Appoxee
- 2016- Terada łączy siły z Big Data
- 2017 — Teradata przejmuje StackIQ w San Diego
Dlaczego Teradata?
- Teradata oferuje pełny pakiet usług, który koncentruje się na Magazyn danych
- System jest zbudowany na otwartej architekturze. Więc kiedykolwiek jakieś szybsze urządzenia są dostępne, można je włączyć do już zbudowanej architektury.
- Teradata obsługuje ponad 50 petabajtów danych.
- Pojedynczy widok operacyjny dla dużego systemu wielowęzłowego Teradata przy użyciu Service Workstation
- Kompatybilny z szeroką gamą Narzędzie BI do pobrania danych.
- Może działać jako pojedynczy punkt kontroli dla administratora danych w celu zarządzania Baza danych.
- Wysoka wydajność, różnorodne zapytania, analityka w bazie danych i zaawansowane zarządzanie obciążeniem
- Teradata umożliwia uzyskanie tych samych danych przy wielu opcjach wdrożenia
W dalszej części tego samouczka Teradata dowiemy się o funkcjach Teradata.
Funkcje Teradata SQL
Teradata oferuje następujące zaawansowane funkcje:
- Skalowalność liniowa: Oferuje skalowalność liniową w przypadku dużych ilości danych poprzez dodanie węzłów w celu zwiększenia wydajności systemu.
- Nieograniczona równoległość: Teradata opiera się na MPP (Massively Parallel Processing Architektura). Dlatego od początku zaprojektowano go równolegle. Potrafi podzielić duże zadanie na mniejsze zadania i wykonywać je równolegle
- Dojrzały optymalizator: Teradata Optimizer może obsłużyć do 64 złączeń w zapytaniu.
- Niski całkowity koszt posiadania: Tera Data charakteryzuje się niskim całkowitym kosztem posiadania. Jest łatwy w konfiguracji, utrzymaniu i administrowaniu.
- Załaduj i rozładuj narzędzia: Teradata zapewnia narzędzia do ładowania i rozładowywania umożliwiające przenoszenie danych do/z systemu Teradata.
- Łączność: Ten system MPP można podłączyć do systemów podłączonych do kanału, takich jak komputery typu mainframe lub systemy podłączone do sieci.
- SQL: Obsługuje Teradata SQL do interakcji z danymi przechowywanymi w tabelach. Zapewnia jego rozszerzenie.
- Solidne narzędzia: Teradata zapewnia niezawodne narzędzia do importowania/eksportowania danych z/do systemów Teradata, takich jak FastExport, FastLoad, MultiLoad i TPT.
- Automatyczna dystrybucja: Teradane może automatycznie dystrybuować dane na dyski, bez konieczności ręcznej interwencji.
W dalszej części tego samouczka Teradata SQL dowiemy się o Teradata Architektura.
Teradane Architektura
Architektura Teradata to masowo równoległa architektura przetwarzania Architektura.
Trzy ważne komponenty Teradata to:
- Silnik analizujący
- BYNET
- Procesory modułów dostępowych (AMP)
Pamięć Teradanych ArchiBaza danych technologii Archischemat budowy:
Pamięć Teradanych Architektura
Silnik analizujący:
Parsing Engine analizuje zapytania i przygotowuje plan wykonania. Zarządza sesjami dla użytkowników. Optymalizuje i wysyła żądanie do użytkowników.
Tak więc, gdy klient wykonuje zapytania o wstawienie rekordów, silnik analizujący wysyła rekordy do warstwy przekazywania komunikatów. Warstwa przekazująca komunikaty, czyli BYNET, to komponent oprogramowania i sprzętu. Oferuje możliwości pracy w sieci. Pobiera również rekordy i wysyła wiersz do docelowego AMP.
AMP:
AMP oznacza Access Module Processor. Przechowuje rekordy na tych dyskach. AMP wykonuje następujące czynności:
- Zarządza częścią bazy danych
- Zarządza częścią każdej tabeli
- Wykonuj wszystkie zadania związane z generowaniem zestawu wyników, takie jak sortowanie, agregacja i łączenie
- Zarządzaj blokadami i przestrzenią
Odzyskiwanie Teradanych Architektura
Gdy klient uruchamia zapytania w celu pobrania rekordów, aparat analizujący wysyła żądanie do BYNET. Następnie BYNET wysyła żądanie pobrania do odpowiednich AMP.
AMP przeszukują swoje dyski równolegle, rozpoznają wymagane rekordy i wysyłają je do BYNET. BYNET wysyła rekordy do silnika analizującego, który z kolei zostanie wysłany do klienta.
W dalszej części tego samouczka dotyczącego bazy danych Teradata dowiemy się o poleceniach Teradata SQL.
Rodzaje poleceń Teradata SQL
Baza danych Teradata obsługuje następujące podstawowe polecenia SQL:
- Polecenia języka definicji danych (DDL).
- Polecenia języka kontroli danych (DCL).
- Polecenia języka manipulacji danymi (DML).
Polecenia języka definicji danych
COMMAND | Opisy Konstrukcyjne |
---|---|
TWORZENIE | Tworzy nową bazę danych, tabelę, użytkownika itp. |
DROP | Usuwa nową bazę danych, tabelę, użytkownika itp. |
ZMIANA | Zmienia tabelę, kolumnę, wyzwalacz itp. |
MODYFIKOWAĆ | Zmienia bazę danych lub definicję użytkownika |
PRZEMIANOWAĆ | Zmienia nazwy tabel, widoków, makr itp. |
Polecenia języka kontroli danych
COMMAND | Opisy Konstrukcyjne |
---|---|
PRZYZNAJ/ODWOŁAJ | Służy do kontrolowania uprawnień użytkownika do obiektu |
PRZYZNAJ LOGOWANIE/ODWOŁAJ LOGOWANIE | Służy do kontrolowania uprawnień logowania do hosta lub grupy hostów |
DAĆ | Służy do przekazywania obiektu bazy danych innemu obiektowi bazy danych |
Polecenia języka manipulacji danymi Teradata Database SQL
COMMAND | Opisy Konstrukcyjne |
---|---|
DELETE | Usuwa wiersz z tabeli |
ECHO | Służy do wysyłania echa ciągu lub polecenia do klienta |
PUNKT KONTROLNY | Definiuje punkt odzyskiwania w dzienniku, który można później wykorzystać do przywrócenia zawartości tabeli |
SELECT | Służy do zwracania określonych danych wiersza w formie tabeli |
Aktualizacja | Modyfikuje dane w jednym lub większej liczbie wierszy tabeli |
Zastosowania bazy danych Teradata
Poniżej przedstawiono popularne aplikacje Teradata:
- Zarządzanie danymi klientów: Pomaga utrzymać długotrwałe relacje z klientami.
- Zarządzanie danymi podstawowymi: Pomaga w stworzeniu środowiska, w którym dane podstawowe mogą być wykorzystywane, synchronizowane i przechowywane.
- Zarządzanie finansami i wynikami: Pomaga organizacji poprawić szybkość i jakość raportowania finansowego. Zmniejsza koszty infrastruktury finansowej i aktywnie zarządza wydajnością przedsiębiorstwa.
- Zarządzanie łańcuchem dostaw: Usprawnij działanie łańcucha dostaw, co przełoży się na lepszą obsługę klienta, skrócenie czasu cykli i obniżenie zapasów.
- Zarządzanie łańcuchem popytu: Pomaga zwiększyć poziom obsługi klienta i sprzedaży. Pomaga także firmom dokładnie przewidzieć popyt na produkty w ich sklepie.
W dalszej części tego samouczka Teradata dla początkujących dowiemy się o różnicy między Teradata a innymi programami RDBMS.
Różnica między Teradata a innymi RDBMS
Parametr | DANE TERA | RDBMS |
---|---|---|
Archistruktury | Obserwuje Shared Nothing Architektura. | Udostępnij wszystko i umożliwia rywalizację o zasoby. |
Procesy | MIPS [miliony instrukcji/s] | KIPS [tysiące instytucji/s] |
Indeksy | Lepsza dystrybucja i odzyskiwanie | Oferuje tylko pobieranie FASI |
Równoległość | Obsługuje bezwarunkową równoległość. | Równoległość jest warunkowa i nieprzewidywalna |
Obciążenie zbiorcze | Teradata umożliwia ładowanie masowe. | Umożliwia tylko ograniczone obciążenie masowe. |
Skalowalność | Skalowalność liniowa o nachyleniu jeden | Skalowalność przy malejących zyskach |
Bufor bazy danych | Pojedynczy bufor bazy danych używany przez wszystkie UoP. (Jednostka paralelizmu). Pojedynczy magazyn danych dostępny dla wszystkich UoP. | Query Controller dostarcza funkcje do UoP, które są właścicielami danych |
Sklepy | Przechowuje TERA BYTES [Billjony rzędów] | GIGA BYTES [Miliony wierszy] |
MPP kontra SMP
MPP | SMP |
---|---|
MPP – masowe przetwarzanie równoległe. Jest to system komputerowy, który jest podłączony do wielu niezależnych jednostek arytmetycznych lub całych mikroprocesorów, które działają równolegle. | Symetryczne przetwarzanie wieloprocesowe. W systemie przetwarzającym SMP procesory korzystają z tej samej pamięci, w wyniku czego kod działający w jednym systemie może wpływać na pamięć używaną przez inny. |
Bazy danych można rozbudowywać poprzez dodanie nowych procesorów. | Bazy danych SMP zazwyczaj korzystają z jednego procesora do wykonywania przeszukiwań baz danych. |
W środowisku MPP wydajność jest lepsza, ponieważ żadne zasoby nie muszą być współdzielone pomiędzy komputerami fizycznymi. | Obciążenie zadania równoległego jest rozkładane na procesory w systemie. |
Wydajność ogromnego systemu przetwarzania równoległego jest liniowa. Będzie jednak wzrastać proporcjonalnie do liczby węzłów. | Bazy danych SMP mogą działać na wielu serwerach. Jednak udostępni inny zasób. |
Podsumowanie
- Znaczenie Teradata: Teradata jest oprogramowaniem typu open source System zarządzania bazą danych do tworzenia wielkoskalowych aplikacji do przechowywania danych.
- Teradata była oddziałem NCR Corporation. Została utworzona w 1979 r., ale oddzieliła się od NCR w październiku 2007 r
- Teradata oferuje pełny pakiet usług skupiających się na hurtowni danych
- Teradata oferuje skalowalność liniową w przypadku dużych ilości danych poprzez dodanie węzłów w celu zwiększenia wydajności systemu.
- Trzy ważne komponenty Teradata to 1) silnik parsujący 2) MPP 3) procesory modułów dostępowych (AMP)
- Teradata oferuje pełną gamę produktów spełniających potrzeby każdej organizacji w zakresie hurtowni danych i ETL
- Aplikacja Teradata używana głównie do zarządzania łańcuchem dostaw, zarządzania danymi podstawowymi, zarządzania łańcuchem popytu itp.