Підручник Teradata: що таке Teradata SQL? База даних Archiтектура

Що таке Teradata?

Терадата це система керування базами даних із відкритим вихідним кодом для розробки великомасштабних додатків для зберігання даних. Цей інструмент забезпечує підтримку кількох операцій сховища даних одночасно, використовуючи концепцію паралелізму. Teradata — це широко відкрита система обробки, яка підтримує Unix/Linux/Windows серверні платформи.

Програмне забезпечення Teradata розроблено американською ІТ-компанією Teradata Corporation. Це постачальник платформ аналітичних даних, програм та інших пов’язаних послуг. Фірма розробляє продукт для консолідації даних із різних джерел і надання даних для аналізу.

Історія Teradata

Teradata була підрозділом NCR Corporation. Вона була зареєстрована в 1979 році, але відійшла від NCR у жовтні 2007 року. Майкл Келер став першим генеральним директором Teradata.

Віхи корпорації Teradata:

  • 1979 – Teradata була зареєстрована
  • 1984 – Випуск першого комп’ютера з базою даних DBC/1012
  • 1986 – журнал Fortune оголосив Teradata «продуктом року»
  • 1999 – Найбільша база даних, створена з використанням Teradata з 130 терабайтами
  • 2002 – випуск версії Teradata V2R5 зі стисненням і основним розділом
  • 2006 – Запуск рішення Teradata Master Data Management
  • 2008 – Teradata 13.0 випущено з Active Data Warehousing
  • 2011 – придбання Teradata Aster і занурюється в простір Advanced Analytics
  • 2012 – представлено Teradata 14.0
  • 2014 – представлено Teradata 15.0
  • 2015 — Teradata купує Apps Marketing Platform Appoxee
  • 2016 – Terada об’єднує великі дані
  • 2017 — Teradata придбала StackIQ у Сан-Дієго

Чому Teradata?

  • Teradata пропонує повний набір послуг, які зосереджуються на Склад даних
  • Система побудована на відкритій архітектурі. Тож щоразу, коли доступні будь-які швидші пристрої, їх можна включити до вже створеної архітектури.
  • Teradata підтримує 50+ петабайт даних.
  • Перегляд однієї операції для великої багатовузлової системи Teradata з використанням Service Workstation
  • Сумісний із широким спектром Інструмент BI щоб отримати дані.
  • Він може діяти як єдина точка контролю для управління БД Database.
  • Висока продуктивність, різноманітні запити, аналітика в базі даних і складне керування робочим навантаженням
  • Teradata дозволяє отримувати однакові дані про різні варіанти розгортання

Далі в цьому підручнику Teradata ми дізнаємося про функції Teradata.

Особливості Teradata SQL

Teradata пропонує такі потужні функції:

  • Лінійна масштабованість: Пропонує лінійну масштабованість при роботі з великими обсягами даних шляхом додавання вузлів для підвищення продуктивності системи.
  • Необмежений паралелізм: Teradata базується на MPP (Massively Parallel Processing). Archiтектура). Отже, він розроблений, щоб бути паралельним із самого початку. Він може розділити велике завдання на менші та виконувати їх паралельно
  • Зрілий оптимізатор: Teradata Optimizer може обробляти до 64 об’єднань у запиті.
  • Низька TCO: Tera data має низьку загальну вартість володіння. Його легко налаштувати, підтримувати та адмініструвати.
  • Утиліти завантаження та вивантаження: Teradata надає утиліти завантаження та вивантаження для переміщення даних у/з системи Teradata.
  • Зв'язок: Ця система MPP може підключатися до систем, підключених до каналу, таких як мейнфрейм або системи, підключені до мережі.
  • SQL: Підтримка Teradata SQL взаємодіяти з даними, що зберігаються в таблицях. Це забезпечує його розширення.
  • Надійні утиліти: Teradata надає надійні утиліти для імпорту/експорту даних із/до систем Teradata, таких як FastExport, FastLoad, MultiLoad і TPT.
  • Автоматичний розподіл: Терадата може розподіляти дані на диски автоматично без ручного втручання.

Далі в цьому посібнику з Teradata SQL ми дізнаємося про Teradata Archiтектура.

Терадата Archiтектура

Архітектура Teradata — це масивна паралельна обробка Archiтектура.

Три важливі компоненти Teradata:

  • Механізм аналізу
  • БАЙНЕТ
  • Процесори модуля доступу (AMP)

Сховище Teradata ArchiБаза даних tecture Archiдіаграма текстури:

Терадата Archiтектура
Терадата Archiдіаграма текстури

Сховище Teradata Archiтектура

Механізм аналізу:

Механізм аналізу аналізує запити та готує план виконання. Він керує сеансами для користувачів. Він оптимізує та надсилає запит користувачам.

Отже, коли клієнт виконує запити на вставку записів, Parsing Engine надсилає записи на рівень передачі повідомлень. Рівень передачі повідомлень або BYNET — це програмно-апаратний компонент. Він пропонує мережеві можливості. Він також отримує записи та надсилає рядок до цільової AMP.

AMP:

AMP означає процесор модуля доступу. Він зберігає записи на цих дисках. AMP проводить такі заходи:

  • Керує частиною бази даних
  • Керує частиною кожного столу
  • Виконуйте всі завдання, пов’язані зі створенням набору результатів, наприклад сортування, агрегування та об’єднання
  • Виконуйте блокування та управління простором

Teradata Retrieval Archiтектура

Коли клієнт запускає запити для отримання записів, система аналізу надсилає запит до BYNET. Потім БАЙНЕТ надсилає запит на отримання відповідним AMP.

АМП паралельно шукають свої диски, розпізнають потрібні записи та відправляють їх у БАЙНЕТ. БАЙНЕТ надсилає записи до Parsing Engine, який, у свою чергу, надсилається клієнту.

Далі в цьому посібнику з бази даних Teradata ми дізнаємося про команди Teradata SQL.

Типи команд Teradata SQL

База даних Teradata підтримує такі основні команди SQL:

  1. Команди мови визначення даних (DDL).
  2. Команди мови керування даними (DCL).
  3. Команди мови обробки даних (DML).

Команди мови визначення даних

КОМАНДА Опис
CREATE Створює нову базу даних, таблицю, користувача тощо.
DROP Видаляє нову базу даних, таблицю, користувача тощо.
АЛЬТЕР Змінює таблицю, стовпець, тригер тощо.
ЗМІНИТИ Змінює базу даних або визначення користувача
ОЗНАЧИТИ Змінює назву таблиць, представлень, макросів тощо.

Команди мови керування даними

КОМАНДА Опис
НАДАТИ/СКАСУВАТИ Використовується для керування привілеями користувача щодо об’єкта
ДОЗВОЛИТИ ВХІД/СКАСУВАТИ ВХІД Використовується для керування привілеями входу на хост або групу хостів
ДАЙ Використовується для надання об’єкта бази даних іншому об’єкту бази даних

Команди мови обробки даних SQL бази даних Teradata

КОМАНДА Опис
DELETE Видаляє рядок із таблиці
ECHO Використовується для повторення рядка або команди клієнту
КОНТРОЛЬНА ТОЧКА Визначає точку відновлення в журналі, яку можна використовувати пізніше для відновлення вмісту таблиці
ВИБІР Використовується для повернення даних певного рядка у формі таблиці
ОНОВЛЕННЯ Змінює дані в одному або кількох рядках таблиці

Програми бази даних Teradata

Нижче наведено популярні програми Teradata:

  • Керування даними клієнтів: Допомагає підтримувати довгострокові відносини з клієнтами.
  • Управління основними даними: Допомагає розробити середовище, де основні дані можна використовувати, синхронізувати та зберігати.
  • Управління фінансами та продуктивністю: Допомагає організації покращити швидкість і якість фінансової звітності. Це зменшує витрати на фінансову інфраструктуру та завчасно керує продуктивністю підприємства.
  • Управління ланцюгами поставок: Покращте роботу ланцюга постачання, що допоможе покращити обслуговування клієнтів, скоротити тривалість циклу та зменшити запаси.
  • Управління ланцюгом попиту: Допомагає підвищити рівень обслуговування клієнтів і продажі. Це також допомагає компаніям точно спрогнозувати попит на їхній магазинний товар.

Далі в цьому підручнику Teradata для початківців ми дізнаємося про різницю між Teradata та іншими СУБД.

Різниця між Teradata та іншими RDBMS

Параметр ДАНІ TERA СУБД
Archiтектури Слідкує за Shared Nothing Archiтектура. Спільний доступ до всього та дозволяє боротися за ресурси.
процеси MIPS [Мільйони інструкцій/с] KIPS [Тисячі закладів/сек]
Індекси Кращий розподіл і пошук Пропонує лише FASI Retrieval
Паралелізм Підтримує безумовний паралелізм. Паралелізм умовний і непередбачуваний
Масове навантаження Teradata дозволяє масове завантаження. Дозволяє лише обмежене масове завантаження.
масштабованість Лінійна масштабованість з нахилом одиниці Масштабованість із зменшенням прибутку
Буфер бази даних Єдиний буфер бази даних, який використовується всіма UoP. (Єдність паралелізму). Єдине сховище даних, до якого мають доступ усі UoP Контролер запитів передає функції UoP, які володіють даними
Магазини Він зберігає TERA BYTES[Billіони рядків] ГІГА БАЙТІВ [Мільйони рядків]

MPP проти SMP

MPP SMP
MPP – масивна паралельна обробка. Це комп’ютерна система, яка приєднана до багатьох незалежних арифметичних блоків або цілих мікропроцесорів, які працюють паралельно. Симетрична багатопроцесорна обробка. У системі обробки SMP центральний процесор спільно використовує ту саму пам’ять, і в результаті код, що виконується в одній системі, може впливати на пам’ять, яку використовує інша.
Бази даних можна розширювати, додаючи нові ЦП. Бази даних SMP зазвичай використовують один ЦП для виконання пошуку в базі даних.
У середовищі MPP продуктивність покращується, оскільки фізичні комп’ютери не повинні спільно використовувати ресурси. Навантаження для паралельного завдання розподіляється між процесорами в системі.
Продуктивність масивної системи паралельної обробки є лінійною. Однак вона буде збільшуватися пропорційно кількості вузлів. Бази даних SMP можуть працювати на кількох серверах. Однак поділюся іншим ресурсом.

Підсумки

  • Значення Teradata: Teradata є відкритим кодом Система управління базами даних для розробки великомасштабних додатків сховищ даних.
  • Teradata була підрозділом NCR Corporation. Він був зареєстрований у 1979 році, але відокремився від NCR у жовтні 2007 року
  • Teradata пропонує повний набір послуг, зосереджених на сховищах даних
  • Teradata пропонує лінійну масштабованість при роботі з великими обсягами даних шляхом додавання вузлів для підвищення продуктивності системи.
  • Три важливі компоненти Teradata: 1) Механізм аналізу 2) MPP 3) Процесори модулів доступу (AMP)
  • Teradata пропонує повний набір продуктів для задоволення потреб будь-якої організації в сховищах даних і ETL
  • Програма Teradata в основному використовується для керування ланцюгом поставок, керування основними даними, керування ланцюгом попиту тощо.