50 лучших вопросов и ответов на интервью Teradata (2025 г.)

Вот вопросы и ответы на собеседовании Teradata для как новичков, так и опытных кандидатов, желающих получить работу своей мечты.

 

Вопросы и ответы на собеседовании Teradata для первокурсников

1) Как вы определяете Teradata? Приведите некоторые его основные характеристики.

Teradata — это, по сути, RDMS, которая используется для управления Datamart, Datawarehouse, OLAP, OLTP, а также устройствами DSS компании. Некоторые основные характеристики Teradata приведены ниже.

  • Способен работать как на одиночных, так и на нескольких узлах.
  • В систему встроен параллелизм.
  • Очень совместим со стандартами ANSI.
  • Имеет тенденцию действовать так же, как сервер.
  • Это открытая система, которая в основном работает для UNIX MR-RAS, Suse Linux ETC, WIN2K и т. д.

👉 Скачать бесплатно PDF-файл: Вопросы и ответы для интервью Teradata


2) Каковы новые возможности Teradata?

Некоторые из недавно разработанных функций Teradata:

  • Автоматизированная временная аналитика
  • Расширение возможностей сжатия, позволяющее гибко сжимать данные примерно в 20 раз больше, чем в предыдущей версии.
  • Инновации, связанные с клиентом, такие как точка зрения тетраданных.

3) Выделите несколько важных компонентов Teradata.

Некоторые из важных компонентов Teradata: –

  • Байнет
  • Процессор модуля доступа (AMP)
  • Механизм синтаксического анализа (PE)
  • Виртуальный диск (vDisk)
  • Виртуальная система хранения (VSS)
Терадата вопросы интервью
Терадата вопросы интервью

4) Упомяните процедуру, с помощью которой мы можем запускать задания Teradata в среде UNIX.

Все, что вам нужно сделать, это выполнить выполнение в UNIX, как указано ниже.

$Sh > BTEQ < [Script Path] > [Logfile Path]

or

$Sh > BTEQ < [Script Path] TEE [Logfile Path]


5) Как в Teradata генерировать последовательность?

В Teradata мы генерируем последовательность, используя столбец идентификаторов.


6) Как во время отображения последовательность генерируется Teradata?

Все, что вам нужно сделать, это использовать CSUM.


7) На стол возлагается определенная нагрузка и то каждый час. Утром трафик относительно низкий, а ночью очень высокий. В этой ситуации какая утилита является наиболее подходящей и как эту утилиту следует загружать?

Наиболее вероятной утилитой здесь является Tpump. Используя уменьшение или увеличение размера пакета, можно легко обрабатывать трафик.


8) Если сценарий быстрой загрузки завершается сбоем и вам доступны только таблицы ошибок, как вы перезапустите?

В этом случае есть два основных способа перезапуска.

  • Запуск старого файла. Убедитесь, что вы не удалили полностью таблицы ошибок. Вместо этого попробуйте исправить ошибки, присутствующие в сценарии или файле, а затем выполните его еще раз.
  • Запуск нового файла. В этом процессе сценарий выполняется просто с использованием операторов завершения загрузки и начала. Это поможет снять блокировку, установленную на целевой таблице, а также может удалить данную запись из таблицы быстрого журнала. Как только это будет сделано, вы сможете снова запустить весь скрипт.

9) Упомяните несколько инструментов ETL, входящих в состав Teradata.

Некоторые из Инструменты ETL в Teradata обычно используются DataStage, Informatica, SSIS и т. д.


10) Выделите несколько преимуществ инструментов ETL перед TD.

Некоторые из преимуществ инструментов ETL перед TD:

  • Можно управлять несколькими разнородными пунктами назначения, а также источниками.
  • Процесс отладки значительно упрощается с помощью инструментов ETL благодаря полноценной поддержке графического интерфейса.
  • Компоненты инструментов ETL можно легко использовать повторно, и в результате, если происходит обновление основного сервера, то все соответствующие приложения, подключенные к серверу, обновляются автоматически.
  • Деповорот и поворот можно легко выполнить с помощью инструментов ETL.

11) Что означает кэширование в Teradata?

Кэширование рассматривается как дополнительное преимущество использования Teradata поскольку он в основном работает с источником, который остается в том же порядке, т.е. не меняется часто. Иногда кэш обычно используется совместно несколькими приложениями.


12) Как мы можем проверить версию Teradata, которую мы используем в данный момент?

Просто дай команду .SHOW VERSION.


13) Приведите обоснованную причину, почему Multi-load поддерживает NUSI вместо USI.

Строка индексной подтаблицы находится в том же Amp, что и строка данных в NUSI. Таким образом, каждый усилитель работает отдельно и параллельно.


14) Как перезапускается клиентская система MLOAD после выполнения?

Сценарий необходимо отправить вручную, чтобы он мог легко загрузить данные из последней контрольной точки.


15) Как перезапускается сервер MLOAD Teradata после выполнения?

Процесс в основном выполняется с последней известной контрольной точки, и как только данные будут обработаны после выполнения сценария MLOAD, сервер перезапускается.


16) Что подразумевается под узлом?

Узел в основном называется набором компонентов аппаратного и программного обеспечения. Обычно сервер называют узлом.


17) Допустим, есть файл, состоящий из 100 записей, из которых нам нужно пропустить первую и последние 20 записей. Что будет с фрагментом кода?

Для выполнения этой задачи нам нужно использовать утилиту BTEQ. В скрипте будет использоваться Skip 20, а также Repeat 60.


18) Объясните PDE.

PDE по сути означает параллельное расширение данных. По сути, PDE представляет собой интерфейсный уровень программного обеспечения, расположенный над операционной системой, и дает базе данных возможность работать в параллельной среде.


19) Что такое ТПД?

TPD по сути означает «Надежная параллельная база данных» и в основном работает под управлением PDE. Teradata — это база данных, которая в основном работает под управлением PDE. По этой причине Teradata обычно называют базой данных Trusted Parallel или Pure Parallel.


20) Что подразумевается под драйвером канала?

Драйвер канала — это программное обеспечение, которое действует как средство связи между PE и всеми приложениями, работающими на каналах, подключенных к клиентам.


Вопросы и ответы на собеседовании Teradata для опытных

21) Что подразумевается под шлюзом Teradata?

Как и драйвер канала, Teradata Gateway действует как средство связи между механизмом синтаксического анализа и приложениями, подключенными к сетевым клиентам. Каждому узлу назначается только один шлюз.


22) Что подразумевается под виртуальным диском?

Виртуальный диск — это, по сути, совокупность целого массива цилиндров, которые являются физическими дисками. Иногда его называют дисковым массивом.


23) Объясните значение слова Amp?

Amp по сути означает «Процессор модуля доступа» и представляет собой процессор, работающий виртуально и в основном используемый для управления одной частью базы данных. Эта конкретная часть базы данных не может использоваться другим усилителем. Таким образом, эту форму архитектуры обычно называют архитектурой без общего доступа.


24) Что содержит Amp и какие операции он выполняет?

Amp в основном состоит из подсистемы менеджера базы данных и способен выполнять операции, упомянутые ниже.

  • Выполнение DML
  • Выполнение DDL
  • Реализация агрегаций и объединений.
  • Снятие и наложение блокировок и т. д.

25) Что подразумевается под механизмом синтаксического анализа?

PE — это своего рода Vproc. Его основная функция — принимать SQL-запросы и доставлять ответы в SQL. Он состоит из широкого набора программных компонентов, которые используются для разбиения SQL на различные этапы и последующей отправки этих шагов в AMP.


26) Что вы подразумеваете под разбором?

Синтаксический анализ — это процесс, связанный с анализом символов строки, которые находятся либо на компьютерном, либо на естественном языке.


27) Каковы функции парсера?

Парсер: –

  • Проверяет семантические ошибки
  • Проверяет синтаксические ошибки
  • Проверяет существование объекта

28) Что подразумевается под диспетчером?

Диспетчер принимает всю коллекцию запросов и затем сохраняет их в очереди. Одна и та же очередь поддерживается на протяжении всего процесса для доставки нескольких наборов ответов.


29) Сколько сеансов MAX может обрабатывать PE в определенное время?

PE может обрабатывать в общей сложности 120 сеансов в определенный момент времени.


30) Объясните БАЙНЕТ.

BYNET в основном служит средством связи между компонентами. Он в первую очередь отвечает за отправку сообщений, а также за выполнение операций слияния и сортировки.


31) Что подразумевается под кликой?

Клика, как известно, представляет собой совокупность узлов, которые совместно используются общими дисками. Наличие Clique чрезвычайно важно, поскольку помогает избежать сбоев узлов.


32) Что происходит, когда узел выходит из строя?

Всякий раз, когда уровень производительности узла падает, все соответствующие Vprocs немедленно мигрируют на новый узел с отказавшего узла, чтобы получить обратно все данные с общих дисков.


33) Перечислите все формы БЛОКИРОВОК, доступные в Teradata.

Существует четыре типа ЗАМКОВ, подпадающих под Teradata. Это: -

  • Чтение блокировки
  • Блокировка доступа
  • Эксклюзивный замок
  • Блокировка записи

34) Каков конкретный уровень, на котором БЛОКИРОВКА может применяться в Teradata?

  • Уровень таблицы. Все строки, находящиеся внутри таблицы, обязательно будут заблокированы.
  • Блокировка уровня базы данных. Все объекты, находящиеся внутри базы данных, будут заблокированы.
  • Блокировка уровня хэша строк — будут заблокированы только те строки, которые соответствуют конкретной строке.

35) Каково количество активно участвующих AMP в первичном индексе?

Только один AMP активно участвует в первичном индексе.


36) Каково значение команды UPSERT в Teradata?

UPSERT по сути означает Update Else Insert. Эта опция доступна только в Teradata.


37) Выделите преимущества PPI (первичный индекс раздела).

PPI в основном используется для хранения данных на основе диапазона или категории. Когда дело доходит до запросов диапазона, нет необходимости использовать полное сканирование таблицы, поскольку оно сразу переходит к следующему разделу, пропуская все остальные разделы.


38) Укажите размеры SMALLINT, BYTEINT и INTEGER.

SMALLINT – 2 байта – 16 байт -> от -32768 до 32767

BYTEINT – 1 байт – 8 бит -> от -128 до 127

ЦЕЛОЕ ЧИСЛО – 4 байта – 32 бита -> от -2,147,483,648 2,147,483,647 XNUMX XNUMX до XNUMX XNUMX XNUMX XNUMX.


39) Что подразумевается под планом наименьших затрат?

План наименьших затрат обычно выполняется за меньшее время по кратчайшему пути.


40) Выделить точки различия между базой данных и пользователем в Teradata.

  • База данных в основном пассивна, тогда как пользователь активен.
  • База данных в основном хранит все объекты базы данных, тогда как пользователь может хранить любой объект, будь то макрос, таблица, представление и т. д.
  • База данных не имеет пароля, хотя пользователь должен ввести пароль.

Вопросы и ответы для интервью Teradata за 10 лет опыта

41) Выделите различия между первичным ключом и первичным индексом.

  • Первичный индекс является обязательным, тогда как первичный ключ не является обязательным.
  • Первичный индекс имеет ограничение в 64 таблицы/столбца, тогда как первичный ключ не имеет ограничений.
  • Первичный индекс допускает дубликаты и значения NULL, тогда как первичный ключ — нет.
  • Первичный индекс — это физический механизм, тогда как первичный ключ — это чисто логический механизм.

42) Объясните, как используется пространство катушки.

Пространство буфера в Teradata в основном используется для выполнения запросов. Из общего пространства, доступного в Teradata, 20% пространства в основном отводится под буферное пространство.


43) Подчеркните необходимость настройки производительности.

Настройка производительности в Teradata в основном выполняется для выявления всех узких мест и последующего их устранения.


44) Прокомментируйте, является ли узкое место ошибкой или нет.

Технически узкое место не является формой ошибки, но оно, безусловно, вызывает определенную задержку в системе.


45) Как можно выявить узкие места?

Существует четыре основных способа выявления узкого места. Это: -

  • Визуальное объяснение Teradata
  • Объяснение модификатора запроса
  • Менеджер Терадаты
  • Performance Monitor

46) Что подразумевается под планом максимальной стоимости?

В соответствии с планом наибольшей стоимости время, необходимое для выполнения процесса, больше, и он занимает самый длинный доступный путь.


47) Выделите все режимы, которые присутствуют в разделе «Уровень уверенности».

Низкий, Нет, Высокий и Присоединение — это четыре режима, которые присутствуют в разделе «Уровень уверенности».


48) Назовите пять этапов, которые входят в состав MultiLoad Utility.

Предварительный этап, этап DML, этап сбора данных, этап применения и завершающий этап.


49) Выделите ограничения утилиты TPUMP.

Ниже приведены ограничения утилиты TPUMP: –

  • Мы не можем использовать оператор SELECT.
  • Файлы данных не могут быть объединены.
  • Агрегатные и экспоненциальные операторы не поддерживаются.
  • Арифметические функции не поддерживаются.

50) Как в BTEQ задаются параметры сеансового режима?

.set транзакция сеанса BTET -> режим транзакции Teradata

.set сессионная транзакция ANSI -> режим ANSI

Эти команды будут работать только в том случае, если они введены до входа в сеанс.

Эти вопросы для собеседования также помогут вам в устной речи.