Top 50 de întrebări și răspunsuri la interviu Teradata (2025)
Iată întrebările și răspunsurile la interviu Teradata pentru candidații mai proaspeți, dar și cu experiență, pentru a obține jobul visat.
Întrebări și răspunsuri la interviu Teradata pentru cei proaspăți
1) Cum definiți Teradata? Dați câteva dintre caracteristicile primare ale acestuia.
Teradata este practic un RDMS care este folosit pentru a conduce Datamart, Datawarehouse, OLAP, OLTP, precum și dispozitivele DSS ale companiei. Unele dintre caracteristicile primare ale Teradata sunt prezentate mai jos.
- Este capabil să ruleze pe un singur nod, precum și pe mai multe noduri.
- Paralelismul este construit în sistem.
- Foarte compatibil cu standardele ANSI.
- Tinde să acționeze în același mod ca un server.
- Este un sistem deschis care se execută practic pentru UNIX MR-RAS, Suse Linux ETC, WIN2K etc.
👉 Descărcare PDF gratuită: Întrebări și răspunsuri la interviu Teradata
2) Care sunt caracteristicile nou dezvoltate ale Teradata?
Unele dintre caracteristicile nou dezvoltate ale Teradata sunt: –
- Analiză temporală automată
- Extindere a capacităților de compresie care permite comprimarea flexibilă a datelor de aproximativ 20 de ori mai multe date decât versiunea anterioară.
- Inovații asociate clienților, cum ar fi punctul de vedere tetradata.
3) Evidențiați câteva dintre componentele importante ale Teradata
Unele dintre componentele importante ale Teradata sunt: –
- Bynet
- Procesor pentru modul de acces (AMP)
- Motor de analiză (PE)
- Disc virtual (vDisk)
- Sistem de stocare virtuală (VSS)
4) Menționați procedura prin care putem rula joburi Teradata într-un mediu UNIX.
Tot ce trebuie să faceți este să efectuați execuția în UNIX în modul menționat mai jos.
$Sh > BTEQ < [Script Path] > [Logfile Path]
or
$Sh > BTEQ < [Script Path] TEE [Logfile Path]
5) În Teradata, cum generăm secvența?
În Teradata, generăm secvență utilizând coloana Identity
6) În timpul Afișării, cum este generată secvența de Teradata?
Tot ce trebuie să faci este să folosești CSUM.
7) Se impune o anumită sarcină pe masă și la fel, în fiecare oră. Traficul dimineata este relativ redus, iar cel al noptii este foarte mare. Conform acestei situații, care este cel mai recomandabil utilitar și cum ar trebui să fie încărcat acel utilitar?
Cel mai sugerabil utilitar aici trebuie să fie Tpump. Folosind dimensiunea pachetelor care descrește sau crește, traficul poate fi gestionat cu ușurință.
8) Dacă Fast Load Script eșuează și numai tabelele de eroare sunt puse la dispoziție, atunci cum veți reporni?
Există practic două moduri de a reporni în acest caz.
- Rularea vechiului fișier – Asigurați-vă că nu renunțați complet la tabelele de erori. În schimb, încercați să remediați erorile care sunt prezente în script sau fișier și apoi executați din nou.
- Rularea unui fișier nou – În acest proces, scriptul este executat pur și simplu folosind instrucțiunile de încărcare finală și început. Acest lucru va ajuta la eliminarea blocării care a fost pusă pe tabelul țintă și ar putea, de asemenea, să elimine înregistrarea dată din tabelul de jurnal rapid. Odată ce ați făcut acest lucru, sunteți liber să rulați din nou întregul script.
9) Menționați câteva dintre instrumentele ETL care fac parte din Teradata.
Unele dintre Instrumente ETL care sunt utilizate în mod obișnuit în Teradata sunt DataStage, Informatica, SSIS etc.
10) Evidențiați câteva dintre avantajele pe care le au instrumentele ETL față de TD.
Unele dintre avantajele pe care le au instrumentele ETL față de TD sunt: –
- Pot fi operate mai multe destinații eterogene, precum și surse.
- Procesul de depanare este mult mai ușor cu ajutorul instrumentelor ETL, datorită suportului complet pentru GUI.
- Componentele instrumentelor ETL pot fi reutilizate cu ușurință și, ca urmare, dacă există o actualizare a serverului principal, atunci toate aplicațiile corespunzătoare conectate la server sunt actualizate automat.
- De-pivotarea și pivotarea se pot face cu ușurință folosind instrumente ETL.
11) Care este semnificația caching-ului în Teradata?
Memorarea în cache este considerată un avantaj suplimentar al utilizării Teradata deoarece funcționează în primul rând cu sursa care rămâne în aceeași ordine, adică nu se schimbă în mod frecvent. Uneori, memoria cache este de obicei partajată între aplicații.
12) Cum putem verifica versiunea de Teradata pe care o folosim în prezent?
Doar dă comanda .SHOW VERSION.
13) Dați un motiv justificat pentru care Multi-load acceptă NUSI în loc de USI.
Rândul sub-tabel index se întâmplă să fie pe același Amp, în același mod ca și rândul de date din NUSI. Astfel, fiecare amplificator este operat separat și în mod paralel.
14) Cum este repornit MLOAD Client System după execuție?
Scriptul trebuie trimis manual, astfel încât să poată încărca cu ușurință datele de la punctul de control care vine ultimul.
15) Cum este repornit serverul MLOAD Teradata după execuție?
Procesul se desfășoară practic de la ultimul punct de control cunoscut, iar odată ce datele au fost efectuate după executarea scriptului MLOAD, serverul este repornit.
16) Ce se înțelege prin nod?
Un nod este denumit practic un sortiment de componente hardware și software. De obicei, un server este denumit nod.
17) Să presupunem că există un fișier care constă din 100 de înregistrări din care trebuie să omitem primele și ultimele 20 de înregistrări. Ce va fi fragmentul de cod?
Trebuie să folosim utilitarul BTEQ pentru a face această sarcină. Skip 20, precum și Repeat 60 vor fi folosite în script.
18) Explicați PDE.
PDE înseamnă practic Parallel Data Extension. PDE se întâmplă să fie un strat de interfață de software prezent deasupra sistemului de operare și oferă bazei de date șansa de a funcționa într-un mediu paralel.
19) Ce este TPD?
TPD înseamnă în principiu Trusted Parallel Database și funcționează în principiu sub PDE. Teradata se întâmplă să fie o bază de date care funcționează în principal sub PDE. Acesta este motivul pentru care Teradata este de obicei denumită baza de date Trusted Parallel sau Pure Parallel.
20) Ce se înțelege prin driver de canal?
Un driver de canal este un software care acționează ca un mediu de comunicare între PE și toate aplicațiile care rulează pe canalele atașate clienților.
Întrebări și răspunsuri la interviu Teradata pentru cei cu experiență
21) Ce se înțelege prin Teradata Gateway?
La fel ca driverul de canal, Teradata Gateway acționează ca un mediu de comunicare între Parse Engine și aplicațiile care sunt atașate clienților de rețea. Este alocat un singur Gateway pentru fiecare nod.
22) Ce se înțelege prin disc virtual?
Virtual Disk este practic o compilație a unei game întregi de cilindri care sunt discuri fizice. Este uneori denumit disc Array.
23) Explicați semnificația lui Amp?
Amp înseamnă, practic, Access Module Processor și se întâmplă să fie un procesor care funcționează virtual și este folosit practic pentru gestionarea unei singure părți a bazei de date. Această porțiune specială a bazei de date nu poate fi partajată de niciun alt Amp. Astfel, această formă de arhitectură este denumită în mod obișnuit arhitectură comună-nimic.
24) Ce conține Amp și care sunt toate operațiunile pe care le efectuează?
Amp constă practic dintr-un subsistem de gestionare a bazelor de date și este capabil să efectueze operațiunile menționate mai jos.
- Efectuarea DML
- Efectuarea DDL
- Implementarea agregărilor și îmbinărilor.
- Eliberarea și aplicarea încuietorilor etc.
25) Ce se înțelege prin motor de analiză?
PE se întâmplă să fie un tip Vproc. Funcția sa principală este de a prelua cereri SQL și de a furniza răspunsuri SQL. Este alcătuit dintr-o gamă largă de componente software care sunt folosite pentru a împărți SQL în diferiți pași și apoi a trimite acești pași către AMP.
26) Ce înțelegi prin parsare?
Analiza este un proces care se referă la analiza simbolurilor șirurilor care sunt fie în limbajul computerului, fie în limbajul natural.
27) Care sunt funcțiile unui parser?
Un analizator: -
- Verifică erorile semantice
- Verifică erorile sintactice
- Verifică existența obiectului
28) Ce se înțelege prin dispecer?
Dispatcher preia o întreagă colecție de solicitări și apoi le păstrează într-o coadă. Aceeași coadă este păstrată pe tot parcursul procesului pentru a furniza mai multe seturi de răspunsuri.
29) Câte sesiuni de MAX este capabil PE să gestioneze la un moment dat?
PE poate gestiona un total de 120 de sesiuni la un anumit moment de timp.
30) Explicați BYNET.
BYNET servește practic ca mijloc de comunicare între componente. Este responsabil în primul rând pentru trimiterea mesajelor și, de asemenea, responsabil pentru efectuarea operațiunilor de îmbinare, precum și de sortare.
31) Ce se înțelege prin clică?
O Clique este cunoscută ca fiind un sortiment de noduri care sunt partajate între unitățile de disc comune. Prezența Clique este extrem de importantă, deoarece ajută la evitarea defecțiunilor nodurilor.
32) Ce se întâmplă când un nod suferă o cădere?
Ori de câte ori există o scădere a nivelului de performanță al unui nod, toate Vproc-urile corespunzătoare migrează imediat la un nou nod din nodul eșuat pentru a obține toate datele înapoi de pe unitățile comune.
33) Enumerați toate formele de LUCARE care sunt disponibile în Teradata.
Practic, există patru tipuri de LACĂTURI care se încadrează în Teradata. Acestea sunt: -
- Citiți Blocare
- Blocare acces
- Blocare exclusivă
- Scrie Lock
34) Care este nivelul special desemnat la care un LOCK poate fi aplicat în Teradata?
- Nivelul tabelului – Toate rândurile care sunt prezente în interiorul unui tabel vor fi cu siguranță blocate.
- Blocare la nivel de bază de date – Toate obiectele care sunt prezente în baza de date vor fi blocate.
- Row Hash Level Lock – Numai acele rânduri care corespund unui anumit rând vor fi blocate.
35) În indicele primar, care este scorul AMP care sunt implicați activ?
Doar un singur AMP este implicat activ într-un indice primar.
36) În Teradata, care este semnificația comenzii UPSERT?
UPSERT înseamnă, practic, Update Else Insert. Această opțiune este disponibilă numai în Teradata.
37) Evidențiați avantajele PPI (Index primar de partiție).
PPI este folosit practic pentru stocarea datelor bazate pe intervale sau pe categorii. Când vine vorba de interogări Range, nu este nevoie de utilizarea scanării complete a tabelului, deoarece se mută imediat la partiția ulterioară, omitând astfel toate celelalte partiții.
38) Dați dimensiunile SMALLINT, BYTEINT și INTEGER.
SMALLINT – 2 octeți – 16 biți -> -32768 până la 32767
BYTEINT – 1 octet – 8 biți -> -128 până la 127
INTEGER – 4 octeți – 32 biți -> -2,147,483,648 până la 2,147,483,647
39) Ce se înțelege prin plan cu costuri minime?
Un plan cu costuri minime se execută practic în mai puțin timp pe calea cea mai scurtă.
40) Evidențiați punctele de diferențe dintre baza de date și utilizator în Teradata.
- O bază de date este practic pasivă, în timp ce un utilizator este activ.
- O bază de date stochează în primul rând toate obiectele bazei de date, în timp ce un utilizator poate stoca orice obiect, indiferent dacă acesta este o macrocomandă, un tabel, o vizualizare etc.
- Baza de date nu are parola în timp ce utilizatorul trebuie să introducă parola.
Întrebări și răspunsuri la interviu Teradata pentru 10 ani de experiență
41) Evidențiați diferențele dintre cheia primară și indexul primar.
- Indexul primar este destul de obligatoriu, în timp ce cheia primară este opțională.
- Indexul primar are o limită de 64 de tabele/coloane, în timp ce Cheia primară nu are nicio limită.
- Primary Index permite duplicate și nule, în timp ce cheia primară nu.
- Indexul primar este un mecanism fizic, în timp ce cheia primară este un mecanism pur logic.
42) Explicați cum este utilizat spațiul bobinei.
Spațiul spool în Teradata este utilizat în principiu pentru rularea interogărilor. Din spațiul total disponibil în Teradata, 20% din spațiu este practic alocat spațiului spool.
43) Evidențiați necesitatea Ajustării performanței.
Reglarea performanței în Teradata se face practic pentru a identifica toate blocajele și apoi a le rezolva.
44) Comentați dacă blocajul este o eroare sau nu.
Din punct de vedere tehnic, blocajul nu este o formă de eroare, dar cu siguranță provoacă o anumită întârziere în sistem.
45) Cum pot fi identificate blocajele?
Există practic patru moduri de a identifica un blocaj. Acestea sunt: -
- Teradata Visual Explain
- Explicați modificatorul cererii
- Teradata Manager
- Performance Monitor
46) Ce se înțelege prin plan cu cel mai mare cost?
Conform Planului cu cel mai mare cost, timpul necesar pentru a executa procesul este mai mare și este nevoie de cea mai lungă cale disponibilă.
47) Evidențiați toate modurile care sunt prezente sub Nivelul de încredere.
Low, No, High și Join sunt cele patru moduri care sunt prezente la nivelul de încredere.
48) Numiți cele cinci faze care intră sub MultiLoad Utility.
Faza preliminară, faza DML, faza de achiziție a datelor, faza de aplicare și faza finală.
49) Evidențiați limitările utilitarului TPUMP.
Următoarele sunt limitările utilitarului TPUMP: –
- Nu putem folosi instrucțiunea SELECT.
- Fișierele de date nu pot fi concatenate.
- Operatorii agregați și exponențiali nu sunt acceptați.
- Funcțiile aritmetice nu pot fi acceptate.
50) În BTEQ, cum sunt setați parametrii modului sesiune?
.set sesiune tranzacție BTET -> modul tranzacție Teradata
.setează tranzacția de sesiune ANSI -> modul ANSI
Aceste comenzi vor funcționa numai atunci când sunt introduse înainte de a vă conecta la sesiune.
Aceste întrebări de interviu vă vor ajuta, de asemenea, în viva (orale)