Топ-50 запитань і відповідей на інтерв’ю Teradata (2025)
Ось питання та відповіді на співбесіді Teradata для нових і досвідчених кандидатів, щоб отримати роботу своєї мрії.
Запитання та відповіді на співбесіді Teradata для першокурсників
1) Як ви визначаєте Teradata? Наведіть деякі його основні характеристики.
Teradata — це в основному RDMS, який використовується для управління Datamart, Datawarehouse, OLAP, OLTP, а також DSS Appliances компанії. Нижче наведено деякі основні характеристики Teradata.
- Може працювати на одиночних вузлах, а також на кількох вузлах.
- Паралелізм вбудований в систему.
- Дуже сумісний зі стандартами ANSI.
- Схильний діяти так само, як сервер.
- Це відкрита система, яка в основному виконується для UNIX MR-RAS, Suse Linux ETC, WIN2K тощо.
👉 Безкоштовне завантаження PDF: запитання та відповіді на інтерв’ю Teradata
2) Які нові функції Teradata?
Деякі з нещодавно розроблених функцій Teradata: –
- Автоматизована часова аналітика
- Розширення можливостей стиснення, яке дозволяє гнучко стискати дані приблизно в 20 разів більше, ніж у попередній версії.
- Інновація, пов’язана з клієнтом, як тетрадані.
3) Виділіть кілька важливих компонентів Teradata
Деякі з важливих компонентів Teradata: –
- Байнет
- Процесор модуля доступу (AMP)
- Механізм аналізу (PE)
- Віртуальний диск (vDisk)
- Віртуальна система зберігання (VSS)
4) Згадайте процедуру, за допомогою якої ми можемо запускати завдання Teradata в середовищі UNIX.
Все, що вам потрібно зробити, це виконати виконання в UNIX у такий спосіб, як зазначено нижче.
$Sh > BTEQ < [Script Path] > [Logfile Path]
or
$Sh > BTEQ < [Script Path] TEE [Logfile Path]
5) Як ми генеруємо послідовність у Teradata?
У Teradata ми генеруємо послідовність, використовуючи стовпець ідентичності
6) Як Teradata генерує послідовність протягом часу відображення?
Все, що вам потрібно зробити, це використовувати CSUM.
7) На стіл лягає певне навантаження, і так щогодини. Трафік вранці відносно низький, а вночі дуже високий. Відповідно до цієї ситуації, яка утиліта є найбільш доцільною та як цю утиліту слід завантажувати?
Найпропонованішою утилітою тут має бути Tpump. За допомогою зменшення або збільшення розміру пакета трафік можна легко обробляти.
8) Якщо Fast Load Script дає збій і вам доступні лише таблиці помилок, як ви перезапустите?
В основному є два способи перезапуску в цьому випадку.
- Запуск старого файлу – переконайтеся, що таблиці помилок не видалено повністю. Натомість спробуйте виправити помилки, наявні в сценарії або файлі, а потім виконайте знову.
- Запуск нового файлу – у цьому процесі сценарій виконується просто за допомогою операторів завершення завантаження та початку. Це допоможе зняти блокування цільової таблиці, а також може видалити даний запис із таблиці швидкого журналу. Коли це буде зроблено, ви можете знову запустити весь сценарій.
9) Згадайте кілька інструментів ETL, які входять до складу Teradata.
Деякі з цих Інструменти ETL які зазвичай використовуються в Teradata, це DataStage, Informatica, SSIS тощо.
10) Виділіть деякі переваги інструментів ETL перед TD.
Деякі переваги інструментів ETL над TD: –
- Можна керувати кількома різнорідними адресатами, а також джерелами.
- Процес налагодження значно спрощується за допомогою інструментів ETL завдяки повноцінній підтримці GUI.
- Компоненти інструментів ETL можна легко повторно використовувати, і в результаті, якщо є оновлення головного сервера, то всі відповідні програми, підключені до сервера, оновлюються автоматично.
- Зворотне обертання та обертання можна легко виконати за допомогою інструментів ETL.
11) Що означає кешування в Teradata?
Кешування вважається додатковою перевагою використання Терадата оскільки він в основному працює з джерелом, яке залишається в тому самому порядку, тобто не змінюється часто. Іноді кеш-пам’ять зазвичай використовується спільно програмами.
12) Як ми можемо перевірити версію Teradata, яку ми зараз використовуємо?
Просто дайте команду .SHOW VERSION.
13) Наведіть обґрунтовану причину, чому Multi-load підтримує NUSI замість USI.
Рядок підтаблиці індексу знаходиться на тому самому Amp так само, як і рядок даних у NUSI. Таким чином, кожен підсилювач працює окремо та паралельно.
14) Як клієнтська система MLOAD перезапускається після виконання?
Сценарій потрібно надіслати вручну, щоб він міг легко завантажити дані з контрольної точки, яка надходить останньою.
15) Як сервер MLOAD Teradata перезапускається після виконання?
Процес в основному виконується з останньої відомої контрольної точки, і як тільки дані будуть виконані після виконання сценарію MLOAD, сервер перезавантажується.
16) Що означає вузол?
Вузол в основному називається набором компонентів апаратного та програмного забезпечення. Зазвичай сервер називають вузлом.
17) Припустимо, є файл, який складається зі 100 записів, з яких нам потрібно пропустити перші та останні 20 записів. Яким буде фрагмент коду?
Щоб виконати це завдання, нам потрібно скористатися утилітою BTEQ. У сценарії буде використано Skip 20, а також Repeat 60.
18) Поясніть PDE.
PDE в основному розшифровується як Parallel Data Extension. PDE в основному є рівнем інтерфейсу програмного забезпечення, розташованого над операційною системою, і дає базі даних можливість працювати в паралельному середовищі.
19) Що таке TPD?
TPD в основному означає довірену паралельну базу даних і в основному працює під PDE. Teradata — це база даних, яка в основному працює в PDE. Це причина, чому Teradata зазвичай називають Trusted Parallel або Pure Parallel.
20) Що мається на увазі під драйвером каналу?
Драйвер каналу — це програмне забезпечення, яке діє як засіб зв’язку між PE та всіма додатками, що працюють на каналах, під’єднаних до клієнтів.
Запитання та відповіді на інтерв’ю Teradata для досвідчених
21) Що означає шлюз Teradata?
Подібно до драйвера каналу, шлюз Teradata діє як засіб зв’язку між Parse Engine і програмами, підключеними до мережевих клієнтів. На вузол призначається лише один шлюз.
22) Що означає віртуальний диск?
Віртуальний диск — це в основному компіляція цілого масиву циліндрів, які є фізичними дисками. Його іноді називають дисковим масивом.
23) Поясніть значення Amp?
Amp в основному розшифровується як Access Module Processor і є процесором, що працює віртуально та в основному використовується для керування однією частиною бази даних. Цю конкретну частину бази даних не може використовувати жоден інший Amp. Таким чином, цю форму архітектури зазвичай називають архітектурою без спільного використання.
24) Що містить Amp і які всі операції він виконує?
Amp в основному складається з підсистеми диспетчера баз даних і здатний виконувати операції, зазначені нижче.
- Виконання DML
- Виконання DDL
- Впровадження агрегацій та об’єднань.
- Зняття та накладення блокувань тощо.
25) Що мається на увазі під механізмом аналізу?
PE є свого роду Vproc. Його основна функція — приймати SQL-запити та надсилати відповіді SQL. Він складається з широкого набору програмних компонентів, які використовуються для розбиття SQL на різні кроки та надсилання цих кроків до AMP.
26) Що ви маєте на увазі під розбором?
Синтаксичний аналіз — це процес, пов’язаний з аналізом символів рядка, які є комп’ютерною або природною мовою.
27) Які функції аналізатора?
Парсер: –
- Перевіряє семантичні помилки
- Перевіряє синтаксичні помилки
- Перевіряє наявність об'єкта
28) Що мається на увазі під диспетчером?
Диспетчер приймає цілу колекцію запитів, а потім зберігає їх у черзі. Ця сама черга зберігається протягом усього процесу, щоб доставити кілька наборів відповідей.
29) Скільки сеансів MAX може обробляти PE за певний час?
PE може обробляти загалом 120 сеансів за певний момент часу.
30) Поясніть БАЙНЕТ.
БАЙНЕТ в основному служить засобом зв'язку між компонентами. Він головним чином відповідає за надсилання повідомлень, а також за виконання операцій злиття та сортування.
31) Що означає кліка?
Відомо, що Clique — це набір вузлів, які спільно використовуються між звичайними дисками. Наявність Clique надзвичайно важлива, оскільки вона допомагає уникнути збоїв вузлів.
32) Що відбувається, коли вузол виходить з ладу?
Щоразу, коли відбувається падіння рівня продуктивності вузла, усі відповідні Vprocs негайно переходять на новий вузол із вузла, що вийшов з ладу, щоб повернути всі дані зі звичайних дисків.
33) Перелічіть усі форми LOCKS, доступні в Teradata.
В основному існує чотири типи ЗАМОК, які підпадають під Teradata. Це: –
- Прочитайте Lock
- Блокування доступу
- Ексклюзивний замок
- Напишіть Lock
34) Який конкретний призначений рівень, на якому LOCK може застосовуватися в Teradata?
- Рівень таблиці – усі рядки, які є всередині таблиці, безумовно, будуть заблоковані.
- Блокування рівня бази даних – усі об’єкти, присутні в базі даних, будуть заблоковані.
- Блокування рівня хешу рядка – буде заблоковано лише ті рядки, які відповідають певному рядку.
35) У первинному індексі, яка оцінка AMPs, які активно задіяні?
Лише один AMP активно бере участь у первинному індексі.
36) Яке значення має команда UPSERT у Teradata?
UPSERT в основному означає Update Else Insert. Ця опція доступна лише в Teradata.
37) Виділіть переваги PPI (Partition Primary Index).
PPI в основному використовується для зберігання даних на основі діапазону або категорії. Коли справа доходить до запитів діапазону, немає потреби використовувати повне сканування таблиці, оскільки воно одразу переміщується до наступного розділу, таким чином пропускаючи всі інші розділи.
38) Укажіть розміри SMALLINT, BYTEINT і INTEGER.
SMALLINT – 2 байти – 16 біт -> -32768 до 32767
BYTEINT – 1 байт – 8 біт -> від -128 до 127
ЦІЛЕ ЧИСЛО – 4 байти – 32 біти -> -2,147,483,648 2,147,483,647 XNUMX XNUMX до XNUMX XNUMX XNUMX XNUMX
39) Що мається на увазі під планом з найменшими витратами?
План з найменшими витратами в основному виконується за менший час через найкоротший шлях.
40) Виділіть відмінності між базою даних і користувачем у Teradata.
- База даних в основному пасивна, тоді як користувач активний.
- База даних в основному зберігає всі об’єкти бази даних, тоді як користувач може зберігати будь-який об’єкт, будь то макрос, таблиця, подання тощо.
- База даних не має пароля, тоді як користувач повинен ввести пароль.
Запитання та відповіді на інтерв’ю Teradata за 10 років досвіду
41) Виділіть відмінності між первинним ключем і первинним індексом.
- Первинний індекс є досить обов’язковим, тоді як первинний ключ необов’язковий.
- Первинний індекс має обмеження в 64 таблиці/стовпці, тоді як первинний ключ не має обмежень.
- Первинний індекс допускає дублікати та нулі, тоді як первинний ключ ні.
- Первинний індекс — це фізичний механізм, тоді як первинний ключ — суто логічний механізм.
42) Поясніть, як використовується простір золотника.
Простір буфера в Teradata в основному використовується для виконання запитів. Із загального простору, доступного в Teradata, 20% простору в основному виділено для буферного простору.
43) Підкресліть необхідність налаштування продуктивності.
Налаштування продуктивності в Teradata в основному виконується для виявлення всіх вузьких місць, а потім їх вирішення.
44) Прокоментуйте, чи є вузьке місце помилкою чи ні.
Технічно вузьке місце не є формою помилки, але воно, безперечно, викликає певну затримку в системі.
45) Як можна визначити вузькі місця?
В основному існує чотири способи визначення вузького місця. Це: –
- Візуальне пояснення Teradata
- Поясніть модифікатор запиту
- Менеджер Teradata
- Performance Monitor
46) Що означає план із найвищими витратами?
Відповідно до плану з найвищою вартістю, час, витрачений на виконання процесу, є більшим, і він займає найдовший доступний шлях.
47) Виділіть усі режими, які присутні в розділі «Рівень надійності».
«Низький», «Ні», «Високий» і «Приєднатися» — це чотири режими, які присутні в розділі «Рівень надійності».
48) Назвіть п’ять фаз, які входять до MultiLoad Utility.
Попередня фаза, фаза DML, фаза збору даних, фаза застосування та кінцева фаза.
49) Виділіть обмеження TPUMP Utility.
Нижче наведено обмеження утиліти TPUMP: –
- Ми не можемо використовувати оператор SELECT.
- Файли даних не можна об’єднувати.
- Агрегатні та експоненціальні оператори не підтримуються.
- Арифметичні функції не підтримуються.
50) Як у BTEQ встановлюються параметри режиму сеансу?
.set сеансова транзакція BTET -> Режим транзакцій Teradata
.set транзакції сеансу ANSI -> режим ANSI
Ці команди працюватимуть лише тоді, коли вони введені перед входом у сеанс.
Ці запитання для співбесіди також допоможуть вам у життєдіяльності (усному)