Учебное пособие по Teradata: что такое Teradata SQL? База данных Archiтекстура

Что такое Терадата?

Teradata — это система управления базами данных с открытым исходным кодом для разработки крупномасштабных приложений хранения данных. Этот инструмент обеспечивает поддержку нескольких операций хранилища данных одновременно, используя концепцию параллелизма. Teradata — это система обработки с широкими возможностями, которая поддерживает Unix/Linux/Windows серверные платформы.

Программное обеспечение Teradata разработано Teradata Corporation, американской ИТ-компанией. Это поставщик платформ аналитических данных, приложений и других сопутствующих услуг. Фирма разрабатывает продукт для консолидации данных из различных источников и предоставления данных для анализа.

История Терадаты

Терадата была подразделением корпорации NCR. Она была основана в 1979 году, но отделилась от NCR в октябре 2007 года. Первым генеральным директором Teradata стал Майкл Келер.

Вехи развития корпорации Teradata:

  • 1979 – зарегистрирована компания Teradata.
  • 1984 – Выпуск первого компьютера базы данных DBC/1012.
  • 1986 - журнал Fortune объявил Teradata «Продуктом года».
  • 1999 – Крупнейшая база данных, созданная с использованием Teradata, объемом 130 терабайт.
  • 2002 — выпуск версии Teradata V2R5 со сжатием и первичным разделением.
  • 2006 – Запуск решения Teradata Master Data Management.
  • 2008 – выпущен Teradata 13.0 с активным хранилищем данных.
  • 2011 г. – приобретает Teradata Aster и погружается в сферу расширенной аналитики.
  • 2012 – Представлена ​​Teradata 14.0.
  • 2014 – Представлена ​​Teradata 15.0.
  • 2015 – Teradata покупает платформу для маркетинга приложений Appoxee.
  • 2016 – Terada объединяет усилия с большими данными.
  • 2017 – Teradata приобретает StackIQ в Сан-Диего.

Почему Терадата?

  • Teradata предлагает полный набор услуг, ориентированный на Хранилище данных
  • Система построена на открытой архитектуре. Поэтому всякий раз, когда становятся доступными более быстрые устройства, их можно включить в уже построенную архитектуру.
  • Teradata поддерживает более 50 петабайт данных.
  • Представление одной операции для большой многоузловой системы Teradata с использованием Service Workstation
  • Совместим с широким спектром Инструмент бизнес-аналитики для получения данных.
  • Он может выступать в качестве единой точки контроля для администратора базы данных. База данных.
  • Высокая производительность, разнообразные запросы, аналитика в базе данных и сложное управление рабочей нагрузкой.
  • Teradata позволяет получать одни и те же данные при нескольких вариантах развертывания.

Далее в этом руководстве по Teradata мы узнаем о функциях Teradata.

Возможности Teradata SQL

Teradata предлагает следующие мощные функции:

  • Линейная масштабируемость: Предлагает линейную масштабируемость при работе с большими объемами данных за счет добавления узлов для повышения производительности системы.
  • Неограниченный параллелизм: Teradata основана на MPP (массово-параллельная обработка). Archiтектура). Таким образом, он с самого начала спроектирован так, чтобы быть параллельным. Он может разделить большую задачу на более мелкие и выполнять их параллельно.
  • Зрелый оптимизатор: Teradata Optimizer может обрабатывать до 64 объединений в запросе.
  • Низкая совокупная стоимость владения: Данные Tera имеют низкую совокупную стоимость владения. Его легко настраивать, поддерживать и администрировать.
  • Утилиты загрузки и выгрузки: Teradata предоставляет утилиты загрузки и выгрузки для перемещения данных в/из системы Teradata.
  • Связь: Эта система MPP может подключаться к системам, подключенным к каналу, таким как мейнфрейм или системы, подключенные к сети.
  • SQL: Teradata поддерживает SQL взаимодействовать с данными, хранящимися в таблицах. Он обеспечивает его расширение.
  • Надежные утилиты: Teradata предоставляет надежные утилиты для импорта/экспорта данных из/в системы Teradata, такие как FastExport, FastLoad, MultiLoad и TPT.
  • Автоматическое распространение: Teradata может распределять данные на диски автоматически, без ручного вмешательства.

Далее в этом руководстве по Teradata SQL мы узнаем о Teradata. Archiтектура.

Teradata Archiтекстура

Архитектура Teradata — это массивно-параллельная обработка Archiтектура.

Три важных компонента Teradata:

  • Механизм синтаксического анализа
  • БАЙНЕТ
  • Процессоры модулей доступа (AMP)

Хранение данных Терадаты ArchiБаза данных тектуры ArchiДиаграмма текстуры:

Teradata Archiтекстура
Teradata ArchiДиаграмма тектуры

Хранение данных Терадаты Archiтекстура

Механизм разбора:

Parsing Engine анализирует запросы и подготавливает план выполнения. Он управляет сеансами для пользователей. Он оптимизирует и отправляет запрос пользователям.

Таким образом, когда клиент выполняет запросы на вставку записей, механизм синтаксического анализа отправляет записи на уровень передачи сообщений. Уровень передачи сообщений или BYNET — это программный и аппаратный компонент. Он предлагает сетевые возможности. Он также извлекает записи и отправляет строку в целевой AMP.

AMP:

AMP означает Access Module Processor. Он хранит записи на этих дисках. AMP выполняет следующие действия:

  • Управляет частью базы данных
  • Управляет частью каждой таблицы
  • Выполните все задачи, связанные с генерацией набора результатов, такие как сортировка, агрегирование и объединение.
  • Выполнение блокировки и управления пространством

Получение тераданных Archiтекстура

Когда клиент выполняет запросы для получения записей, механизм синтаксического анализа отправляет запрос в BYNET. Затем BYNET отправляет запрос на получение соответствующим AMP.

AMP параллельно просматривают свои диски, распознают необходимые записи и отправляют их в BYNET. BYNET отправляет записи в механизм синтаксического анализа, который, в свою очередь, будет отправлен клиенту.

Далее в этом руководстве по базе данных Teradata мы узнаем о командах Teradata SQL.

Типы команд Teradata SQL

База данных Teradata поддерживает следующие основные команды SQL:

  1. Команды языка определения данных (DDL)
  2. Команды языка управления данными (DCL)
  3. Команды языка манипулирования данными (DML)

Команды языка определения данных

КОМАНДА Описание
СОЗДАТЬ Создает новую базу данных, таблицу, пользователя и т. д.
DROP Удаляет новую базу данных, таблицу, пользователя и т. д.
ALTER Изменяет таблицу, столбец, триггер и т. д.
ИЗМЕНИТЬ Изменяет базу данных или определение пользователя.
ПЕРЕИМЕНОВАТЬ Изменяет названия таблиц, представлений, макросов и т. д.

Команды языка управления данными

КОМАНДА Описание
ПРЕДОСТАВЛЕНИЕ/ОТЗЫВ Используется для управления правами пользователя на объекте.
РАЗРЕШИТЬ ВХОД/ОТМЕНИТЬ ВХОД Используется для управления правами входа на хост или группу хостов.
ДАЙТЕ Используется для передачи объекта базы данных другому объекту базы данных.

Команды языка манипулирования данными SQL базы данных Teradata

КОМАНДА Описание
УДАЛИТЬ Удаляет строку из таблицы
ЭХО Используется для отображения строки или команды клиенту.
ПРОПУСКНОЙ ПУНКТ Определяет точку восстановления в журнале, которую можно использовать позже для восстановления содержимого таблицы.
ВЫБОР Используется для возврата данных определенной строки в виде таблицы.
ОБНОВЛЕНИЕ ПО Изменяет данные в одной или нескольких строках таблицы.

Приложения базы данных Teradata

Ниже приведены популярные приложения Teradata:

  • Управление данными клиентов: Помогает поддерживать долгосрочные отношения с клиентами.
  • Управление основными данными: Помогает разработать среду, в которой можно использовать, синхронизировать и хранить основные данные.
  • Управление финансами и эффективностью: Помогает организации улучшить скорость и качество финансовой отчетности. Это снижает затраты на финансовую инфраструктуру и позволяет активно управлять производительностью предприятия.
  • Система управления цепями поставок: Улучшите операции цепочки поставок, что поможет улучшить обслуживание клиентов, сократить время цикла и снизить запасы.
  • Управление цепочкой спроса: Помогает повысить уровень обслуживания клиентов и продажи. Это также помогает компаниям точно прогнозировать спрос на товар в их магазине.

Далее в этом уроке Teradata для начинающих мы узнаем о разнице между Teradata и другими RDBMS.

Разница между Teradata и другими СУБД

Параметр ТЕРА ДАННЫЕ RDBMS
Archiтекстуры Подписывается на «Ничего не поделилось» Archiтектура. Shared Everything и позволяет конкурировать за ресурсы.
Процессы MIPS [миллионов инструкций/сек] KIPS [Тысячи учреждений/сек]
Индексы Лучшее распространение и поиск Предлагает только поиск FASI
параллелизм Поддерживает безусловный параллелизм. Параллелизм условен и непредсказуем
Основная нагрузка Teradata позволяет осуществлять массовую загрузку. Допускает только ограниченную объемную загрузку.
Масштабируемость Линейная масштабируемость с наклоном, равным единице Масштабируемость с уменьшающейся отдачей
Буфер базы данных Единый буфер базы данных, используемый всеми UoP. (Единица параллелизма). Единое хранилище данных, к которому имеют доступ все UoP. Контроллер запросов отправляет функции UoP, владеющим данными.
Магазины Он хранит TERA BYTES[Billионы рядов] ГИГА БАЙТЫ[Миллионы строк]

MPP против SMP

MPP SMP
MPP – Массивная параллельная обработка. Это компьютерная система, которая связана со многими независимыми арифметическими блоками или целыми микропроцессорами, работающими параллельно. Симметричная мультиобработка. В системе обработки SMP процессоры используют одну и ту же память, и в результате код, выполняемый в одной системе, может влиять на память, используемую другой.
Базы данных можно расширять за счет добавления новых процессоров. Базы данных SMP обычно используют один процессор для выполнения поиска в базе данных.
В среде MPP производительность повышается, поскольку физические компьютеры не должны совместно использовать ресурсы. Рабочая нагрузка параллельного задания распределяется между процессорами системы.
Производительность системы массовой параллельной обработки линейна. Однако оно будет увеличиваться пропорционально количеству узлов. Базы данных SMP могут работать на нескольких серверах. Однако поделюсь другим ресурсом.

Итого

  • Значение Teradata: Teradata — это платформа с открытым исходным кодом. Система управления базами данных для разработки крупномасштабных приложений для хранения данных.
  • Терадата была подразделением корпорации NCR. Он был зарегистрирован в 1979 году, но отделился от NCR в октябре 2007 года.
  • Teradata предлагает полный набор услуг, ориентированных на хранение данных.
  • Teradata предлагает линейную масштабируемость при работе с большими объемами данных за счет добавления узлов для повышения производительности системы.
  • Три важных компонента Teradata: 1) Механизм синтаксического анализа 2) MPP 3) Процессоры модулей доступа (AMP).
  • Teradata предлагает полный набор продуктов для удовлетворения потребностей любой организации в хранении данных и ETL.
  • Приложение Teradata в основном используется для управления цепочками поставок, управления основными данными, управления цепочками спроса и т. д.