50 nejlepších otázek a odpovědí na rozhovory Teradata (2025)

Zde jsou otázky a odpovědi na pohovor Teradata pro čerstvější i zkušené kandidáty, aby získali svou vysněnou práci.

 

Otázky a odpovědi k pohovoru Teradata pro začátečníky

1) Jak definujete Teradata? Uveďte některé z primárních charakteristik téhož.

Teradata je v podstatě RDMS, který se používá k řízení zařízení Datamart, Datawarehouse, OLAP, OLTP a také DSS Appliance společnosti. Některé z primárních charakteristik Teradata jsou uvedeny níže.

  • Je schopen běžet na jednotlivých uzlech i na více uzlech.
  • Paralelismus je zabudován do systému.
  • Velmi kompatibilní se standardy ANSI.
  • Má tendenci se chovat stejným způsobem jako server.
  • Jedná se o otevřený systém, který se v podstatě spouští pro UNIX MR-RAS, Suse Linux ETC, WIN2K atd.

👉 Zdarma ke stažení PDF: Otázky a odpovědi k rozhovoru Teradata


2) Jaké jsou nově vyvinuté funkce Teradata?

Některé z nově vyvinutých funkcí Teradata jsou: –

  • Automatizovaná časová analytika
  • Rozšíření možností komprese, které umožňuje flexibilní kompresi dat přibližně 20krát více dat než předchozí verze.
  • Inovace související se zákazníky, jako je hledisko tetradata.

3) Zdůrazněte několik důležitých součástí Teradata

Některé z důležitých součástí Teradata jsou: –

  • Bynet
  • Procesor přístupového modulu (AMP)
  • Modul analýzy (PE)
  • Virtuální disk (vDisk)
  • Virtuální úložný systém (VSS)
Otázky k rozhovoru Teradata
Otázky k rozhovoru Teradata

4) Uveďte postup, pomocí kterého můžeme spouštět úlohy Teradata v prostředí UNIX.

Vše, co musíte udělat, je provést spuštění v UNIXu způsobem uvedeným níže.

$Sh > BTEQ < [Script Path] > [Logfile Path]

or

$Sh > BTEQ < [Script Path] TEE [Logfile Path]


5) Jak v Teradata generujeme sekvenci?

V Teradata generujeme sekvenci pomocí sloupce identity


6) Jak během doby zobrazení Teradata generuje sekvenci?

Jediné, co musíte udělat, je použít CSUM.


7) Na stůl je uvalena určitá zátěž a to také každou hodinu. Provoz v ranních hodinách je relativně nízký a provoz v noci je velmi vysoký. Který nástroj je podle této situace nejvhodnější a jak se má tento nástroj načíst?

Nejvhodnějším nástrojem zde musí být Tpump. Použitím zmenšování nebo zvyšování velikosti paketů lze provoz snadno zvládnout.


8) Pokud selže Fast Load Script a máte k dispozici pouze tabulky chyb, jak potom restartujete?

V tomto případě existují v zásadě dva způsoby restartu.

  • Spuštění starého souboru – Ujistěte se, že tabulky chyb úplně nevypustíte. Místo toho se pokuste opravit chyby, které jsou přítomny ve skriptu nebo souboru, a poté spusťte znovu.
  • Spuštění nového souboru – V tomto procesu se skript spustí jednoduše pomocí příkazů end loading a begin. To pomůže při odstranění zámku, který byl umístěn na cílové tabulce, a může také odstranit daný záznam z tabulky rychlého protokolu. Jakmile to uděláte, můžete celý skript spustit znovu.

9) Uveďte několik nástrojů ETL, které spadají pod Teradata.

Některé ETL nástroje které se běžně používají v Teradata jsou DataStage, Informatica, SSIS atd.


10) Zdůrazněte několik výhod, které mají nástroje ETL oproti TD.

Některé z výhod, které mají nástroje ETL oproti TD, jsou: –

  • Lze provozovat více heterogenních destinací i zdrojů.
  • Proces ladění je s pomocí nástrojů ETL mnohem jednodušší díky plnohodnotné podpoře GUI.
  • Komponenty nástrojů ETL lze snadno znovu použít a v důsledku toho, pokud dojde k aktualizaci hlavního serveru, jsou automaticky aktualizovány všechny odpovídající aplikace připojené k serveru.
  • Odklopení a otočení lze snadno provést pomocí nástrojů ETL.

11) Jaký je význam ukládání do mezipaměti v Teradata?

Ukládání do mezipaměti je považováno za další výhodu používání Teradata protože primárně pracuje se zdrojem, který zůstává ve stejném pořadí, tj. nemění se často. Někdy je mezipaměť obvykle sdílena mezi aplikacemi.


12) Jak můžeme zkontrolovat verzi Teradata, kterou aktuálně používáme?

Stačí dát příkaz .SHOW VERSION.


13) Uveďte ospravedlnitelný důvod, proč Multi-load podporuje NUSI místo USI.

Řádek podtabulky indexu je náhodou na stejném Amp stejným způsobem jako řádek dat v NUSI. Každý zesilovač je tedy provozován samostatně a paralelně.


14) Jak se po spuštění restartuje klientský systém MLOAD?

Skript musí být odeslán ručně, aby mohl snadno načíst data z kontrolního bodu, který je poslední.


15) Jak se po spuštění restartuje MLOAD Teradata Server?

Proces se v zásadě provádí od posledního známého kontrolního bodu a po provedení dat po provedení skriptu MLOAD se server restartuje.


16) Co znamená uzel?

Uzel je v zásadě nazýván jako sortiment součástí hardwaru a softwaru. Server je obvykle označován jako uzel.


17) Řekněme, že existuje soubor, který se skládá ze 100 záznamů, z nichž musíme přeskočit prvních a posledních 20 záznamů. Jaký bude fragment kódu?

K provedení tohoto úkolu musíme použít BTEQ Utility. Ve skriptu bude použito přeskočení 20 a opakování 60.


18) Vysvětlete PDE.

PDE v podstatě znamená Parallel Data Extension. PDE je v podstatě rozhraním softwarové vrstvy přítomné nad operačním systémem a dává databázi šanci pracovat v paralelním prostředí.


19) Co je TPD?

TPD v podstatě znamená Trusted Parallel Database a v zásadě funguje pod PDE. Teradata je shodou okolností databáze, která primárně funguje pod PDE. To je důvod, proč je Teradata obvykle označována jako Trusted Parallel nebo Pure Parallel databáze.


20) Co znamená Channel Driver?

Ovladač kanálu je software, který funguje jako médium komunikace mezi PE a všemi aplikacemi, které běží na kanálech připojených ke klientům.


Otázky a odpovědi na pohovor Teradata pro zkušené

21) Co znamená brána Teradata?

Stejně jako kanálový ovladač funguje Teradata Gateway jako médium komunikace mezi Parse Engine a aplikacemi, které jsou připojeny k síťovým klientům. Každému uzlu je přiřazena pouze jedna brána.


22) Co znamená virtuální disk?

Virtuální disk je v podstatě kompilace celé řady válců, což jsou fyzické disky. Někdy se označuje jako diskové pole.


23) Vysvětlete význam Amp?

Amp v podstatě znamená Access Module Processor a je to procesor pracující virtuálně a v podstatě se používá pro správu jedné části databáze. Tuto konkrétní část databáze nemůže sdílet žádný jiný zesilovač. Proto je tato forma architektury běžně označována jako sdílená architektura.


24) Co Amp obsahuje a jaké jsou všechny operace, které provádí?

Amp se v podstatě skládá ze subsystému Database Manager a je schopen provádět operace uvedené níže.

  • Provádění DML
  • Provádění DDL
  • Implementace agregací a spojení.
  • Uvolnění a nasazení zámků atd.

25) Co znamená syntaktický modul?

PE je náhodou druh Vproc. Jeho primární funkcí je přijímat požadavky SQL a doručovat odpovědi SQL. Skládá se ze široké řady softwarových komponent, které se používají k rozdělení SQL do různých kroků a poté k odeslání těchto kroků do AMP.


26) Co myslíš tím parsováním?

Analýza je proces, který se zabývá analýzou symbolů řetězce, které jsou buď v počítačovém jazyce, nebo v přirozeném jazyce.


27) Jaké jsou funkce parseru?

Analyzátor: –

  • Kontroluje sémantické chyby
  • Kontroluje syntaktické chyby
  • Kontroluje existenci objektu

28) Co znamená dispečer?

Dispečer vezme celou kolekci požadavků a poté je uloží ve frontě. V průběhu celého procesu se udržuje stejná fronta, aby bylo možné dodat více sad odpovědí.


29) Kolik relací MAX je PE schopen zvládnout v určitou dobu?

PE zvládne celkem 120 relací v konkrétním okamžiku.


30) Vysvětlete BYNET.

BYNET v podstatě slouží jako prostředek komunikace mezi komponentami. Je primárně odpovědný za odesílání zpráv a také za provádění slučování a řazení.


31) Co znamená klika?

Clique je v zásadě známý jako sortiment uzlů, které jsou sdíleny mezi běžnými diskovými jednotkami. Přítomnost Clique je nesmírně důležitá, protože pomáhá předcházet selhání uzlů.


32) Co se stane, když uzel upadne?

Kdykoli dojde k poklesu úrovně výkonu uzlu, všechny odpovídající Vprocs okamžitě migrují do nového uzlu z uzlu, který selhal, aby získali všechna data zpět z běžných disků.


33) Vyjmenujte všechny formy ZÁMEK, které jsou dostupné v Teradata.

V zásadě existují čtyři typy ZÁMEK, které spadají pod Teradata. Tyto jsou: -

  • Přečtěte si Zámek
  • Zámek přístupu
  • Exkluzivní zámek
  • Napište Zámek

34) Jaká je konkrétní určená úroveň, na které může být LOCK aplikován v Teradata?

  • Úroveň tabulky – Všechny řádky, které se nacházejí uvnitř tabulky, budou jistě uzamčeny.
  • Zámek úrovně databáze – Všechny objekty, které se nacházejí v databázi, budou uzamčeny.
  • Zámek úrovně hash řádku – Uzamknou se pouze ty řádky, které odpovídají danému řádku.

35) Jaké je skóre AMP, které se aktivně účastní, v primárním indexu?

Pouze jeden AMP je aktivně zapojen do primárního indexu.


36) Jaký je význam příkazu UPSERT v Teradata?

UPSERT v podstatě znamená Update Else Insert. Tato možnost je dostupná pouze v Teradata.


37) Zdůrazněte výhody PPI (Partition Primary Index).

PPI se v zásadě používá pro účely ukládání dat na základě rozsahu nebo kategorií. Pokud jde o dotazy na rozsah, není potřeba využití úplného skenování tabulky, protože se okamžitě přesune na následující oddíl, čímž se přeskočí všechny ostatní oddíly.


38) Zadejte velikosti SMALLINT, BYTEINT a INTEGER.

SMALLINT – 2 bajty – 16 bitů -> -32768 až 32767

BYTEINT – 1 bajt – 8 bitů -> -128 až 127

INTEGER – 4 bajty – 32 bitů -> -2,147,483,648 až 2,147,483,647


39) Co znamená plán nejnižších nákladů?

Plán nejnižších nákladů se v podstatě provede za kratší dobu na nejkratší cestě.


40) Zvýrazněte body rozdílů mezi databází a uživatelem v Teradata.

  • Databáze je v zásadě pasivní, zatímco uživatel je aktivní.
  • Databáze primárně ukládá všechny objekty databáze, zatímco uživatel může ukládat jakýkoli objekt, ať už jde o makro, tabulku, pohled atd.
  • Databáze nemá heslo, zatímco uživatel musí zadat heslo.

Otázky a odpovědi na pohovor Teradata za 10 let zkušeností

41) Zvýrazněte rozdíly mezi primárním klíčem a primárním indexem.

  • Primární index je zcela povinný, zatímco primární klíč je volitelný.
  • Primární index má limit 64 tabulek/sloupců, zatímco primární klíč žádný limit nemá.
  • Primární index umožňuje duplikáty a hodnoty null, zatímco primární klíč nikoli.
  • Primární index je fyzický mechanismus, zatímco primární klíč je čistě logický mechanismus.

42) Vysvětlete, jak se využívá prostor cívky.

Spoolový prostor v Teradata se v podstatě používá pro spouštění dotazů. Z celkového prostoru, který je k dispozici v Teradata, je 20 % prostoru v podstatě přiděleno prostoru pro zařazování.


43) Zdůrazněte potřebu ladění výkonu.

Ladění výkonu v Teradata se v podstatě provádí k identifikaci všech úzkých míst a jejich následnému vyřešení.


44) Komentujte, zda je úzké místo chybou nebo ne.

Z technického hlediska není úzké místo formou chyby, ale určitě způsobuje určité zpoždění v systému.


45) Jak lze identifikovat úzká místa?

V zásadě existují čtyři způsoby, jak identifikovat úzké místo. Tyto jsou: -

  • Vizuální vysvětlení Teradata
  • Vysvětlete modifikátor požadavku
  • Správce Teradata
  • Performance Monitor

46) Co znamená plán nejvyšších nákladů?

Podle plánu nejvyšších nákladů je čas potřebný k provedení procesu delší a trvá to nejdelší dostupnou cestu.


47) Zvýrazněte všechny režimy, které jsou přítomny pod úrovní spolehlivosti.

Nízká, Ne, Vysoká a Připojit jsou čtyři režimy, které jsou k dispozici pod úrovní spolehlivosti.


48) Vyjmenujte pět fází, které spadají pod MultiLoad Utility.

Předběžná fáze, DML fáze, Fáze získávání dat, Aplikační fáze a Koncová fáze.


49) Zvýrazněte omezení nástroje TPUMP Utility.

Níže jsou uvedena omezení nástroje TPUMP: –

  • Nemůžeme použít příkaz SELECT.
  • Datové soubory nelze zřetězit.
  • Agregátní a exponenciální operátory nejsou podporovány.
  • Aritmetické funkce nelze podporovat.

50) Jak se v BTEQ nastavují parametry režimu relace?

.set session transakce BTET -> Teradata transakční režim

.set session transakce ANSI -> ANSI režim

Tyto příkazy budou fungovat pouze tehdy, když jsou zadány před přihlášením do relace.

Tyto otázky na pohovoru také pomohou ve vašem životě (ústních)