50 câu hỏi và câu trả lời phỏng vấn Teradata hàng đầu (2025)

Dưới đây là các câu hỏi và câu trả lời phỏng vấn Teradata dành cho những ứng viên mới ra trường cũng như có kinh nghiệm để có được công việc mơ ước của họ.

 

Câu hỏi và câu trả lời phỏng vấn Teradata dành cho người mới

1) Bạn định nghĩa Teradata như thế nào? Nêu một số đặc điểm cơ bản giống nhau.

Teradata về cơ bản là một RDMS được sử dụng để điều khiển Datamart, Datawarehouse, OLAP, OLTP, cũng như các Thiết bị DSS của công ty. Một số đặc điểm chính của Teradata được đưa ra dưới đây.

  • Có khả năng chạy trên các nút đơn cũng như nhiều nút.
  • Tính song song được tích hợp vào hệ thống.
  • Rất tương thích với các tiêu chuẩn của ANSI.
  • Có xu hướng hoạt động giống như một máy chủ.
  • Nó là một Hệ thống mở về cơ bản thực thi cho UNIX MR-RAS, Suse Linux ETC, WIN2K, v.v.

👉 Tải xuống bản PDF miễn phí: Câu hỏi và câu trả lời phỏng vấn Teradata


2) Các tính năng mới được phát triển của Teradata là gì?

Một số tính năng mới được phát triển của Teradata là: –

  • Phân tích thời gian tự động
  • Mở rộng về khả năng nén cho phép nén dữ liệu linh hoạt gấp khoảng 20 lần so với phiên bản trước.
  • Đổi mới liên quan đến khách hàng như quan điểm tetradata.

3) Nêu bật một số thành phần quan trọng của Teradata

Một số thành phần quan trọng của Teradata là: –

  • Bynet
  • Bộ xử lý mô-đun truy cập (AMP)
  • Công cụ phân tích cú pháp (PE)
  • Đĩa ảo (vDisk)
  • Hệ thống lưu trữ ảo (VSS)
Câu hỏi phỏng vấn Teradata
Câu hỏi phỏng vấn Teradata

4) Đề cập đến quy trình để chúng ta có thể chạy các công việc Teradata trong môi trường UNIX.

Tất cả những gì bạn phải làm là thực hiện việc thực thi trong UNIX theo cách được đề cập bên dưới.

$Sh > BTEQ < [Script Path] > [Logfile Path]

or

$Sh > BTEQ < [Script Path] TEE [Logfile Path]


5) Trong Teradata, làm cách nào để tạo chuỗi?

Trong Teradata, chúng tôi tạo chuỗi bằng cách sử dụng Cột nhận dạng


6) Trong thời gian Hiển thị, chuỗi được Teradata tạo ra như thế nào?

Tất cả những gì bạn phải làm là sử dụng CSUM.


7) Một tải trọng nhất định đang được đặt lên bàn và điều đó cũng vậy, mỗi giờ. Giao thông vào buổi sáng tương đối thấp và vào ban đêm thì rất cao. Theo tình huống này, tiện ích nào được khuyên dùng nhất và tiện ích đó được tải như thế nào?

Tiện ích được gợi ý nhiều nhất ở đây phải kể đến Tpump. Bằng cách sử dụng kích thước gói giảm hoặc tăng, lưu lượng có thể được xử lý dễ dàng.


8) Nếu Fast Load Script không thành công và chỉ có các bảng lỗi được cung cấp cho bạn, thì bạn sẽ khởi động lại như thế nào?

Về cơ bản có hai cách khởi động lại trong trường hợp này.

  • Làm cho tệp cũ chạy – Đảm bảo rằng bạn không bỏ hoàn toàn các bảng lỗi. Thay vào đó, hãy cố gắng khắc phục các lỗi có trong tập lệnh hoặc tệp rồi thực hiện lại.
  • Chạy một tệp mới - Trong quá trình này, tập lệnh được thực thi chỉ bằng cách sử dụng các câu lệnh kết thúc tải và bắt đầu. Điều này sẽ giúp loại bỏ khóa đã được đặt trên bảng mục tiêu và cũng có thể xóa bản ghi đã cho khỏi bảng nhật ký nhanh. Khi việc này hoàn tất, bạn có thể tự do chạy lại toàn bộ tập lệnh một lần nữa.

9) Đề cập đến một số công cụ ETL có trong Teradata.

Một số công cụ ETL thường được sử dụng trong Teradata là DataStage, Informatica, SSIS, v.v.


10) Nêu bật một số ưu điểm của công cụ ETL so với TD.

Một số ưu điểm mà công cụ ETL có được so với TD là: –

  • Có thể vận hành nhiều đích đến và nhiều nguồn không đồng nhất.
  • Quá trình gỡ lỗi trở nên dễ dàng hơn nhiều với sự trợ giúp của các công cụ ETL nhờ hỗ trợ GUI đầy đủ.
  • Các thành phần của công cụ ETL có thể dễ dàng được sử dụng lại và do đó, nếu có bản cập nhật cho máy chủ chính thì tất cả các ứng dụng tương ứng được kết nối với máy chủ sẽ được cập nhật tự động.
  • Việc hủy xoay và xoay vòng có thể được thực hiện dễ dàng bằng các công cụ ETL.

11) Ý nghĩa của bộ nhớ đệm trong Teradata là gì?

Bộ nhớ đệm được coi là một lợi thế bổ sung của việc sử dụng Siêu dữ liệu vì nó chủ yếu hoạt động với nguồn có cùng thứ tự, tức là không thay đổi thường xuyên. Đôi khi, Cache thường được chia sẻ giữa các ứng dụng.


12) Làm cách nào chúng tôi có thể kiểm tra phiên bản Teradata mà chúng tôi đang sử dụng?

Chỉ cần ra lệnh .SHOW VERSION.


13) Đưa ra lý do chính đáng tại sao Multi-load hỗ trợ NUSI thay vì USI.

Hàng của bảng con chỉ mục nằm trên cùng một Amp giống như hàng dữ liệu trong NUSI. Do đó, mỗi Ampe được vận hành riêng biệt và song song.


14) Hệ thống máy khách MLOAD được khởi động lại sau khi thực thi như thế nào?

Tập lệnh phải được gửi thủ công để có thể dễ dàng tải dữ liệu từ điểm kiểm tra cuối cùng.


15) Máy chủ MLOAD Teradata được khởi động lại sau khi thực thi như thế nào?

Về cơ bản, quá trình này được thực hiện từ điểm kiểm tra đã biết cuối cùng và khi dữ liệu được thực hiện sau khi thực thi tập lệnh MLOAD, máy chủ sẽ được khởi động lại.


16) Nút có nghĩa là gì?

Một nút về cơ bản được gọi là một tập hợp các thành phần phần cứng và phần mềm. Thông thường một máy chủ được gọi là một nút.


17) Giả sử có một tệp bao gồm 100 bản ghi trong đó chúng ta cần bỏ qua 20 bản ghi đầu tiên và cuối cùng. Đoạn mã sẽ là gì?

Chúng ta cần sử dụng BTEQ Utility để thực hiện nhiệm vụ này. Bỏ qua 20 cũng như Lặp lại 60 sẽ được sử dụng trong tập lệnh.


18) Giải thích PDE.

PDE về cơ bản là viết tắt của Parallel Data Extension. Về cơ bản, PDE là một lớp giao diện của phần mềm nằm phía trên hệ điều hành và cung cấp cho cơ sở dữ liệu cơ hội hoạt động trong môi trường song song.


19) TPD là gì?

TPD về cơ bản là viết tắt của Cơ sở dữ liệu song song đáng tin cậy và về cơ bản nó hoạt động dưới PDE. Teradata tình cờ là một cơ sở dữ liệu chủ yếu hoạt động dưới PDE. Đây là lý do tại sao Teradata thường được gọi là cơ sở dữ liệu song song đáng tin cậy hoặc song song thuần túy.


20) Trình điều khiển kênh có nghĩa là gì?

Trình điều khiển kênh là phần mềm hoạt động như một phương tiện liên lạc giữa PE và tất cả các ứng dụng đang chạy trên các kênh được gắn với máy khách.


Câu hỏi và câu trả lời phỏng vấn Teradata dành cho người có kinh nghiệm

21) Cổng Teradata có nghĩa là gì?

Cũng giống như trình điều khiển kênh, Teradata Gateway hoạt động như một phương tiện liên lạc giữa Parse Engine và các ứng dụng được gắn vào máy khách mạng. Chỉ có một Cổng được chỉ định cho mỗi nút.


22) Đĩa ảo nghĩa là gì?

Đĩa ảo về cơ bản là sự tổng hợp của toàn bộ mảng trụ là các đĩa vật lý. Nó đôi khi được gọi là mảng đĩa.


23) Giải thích ý nghĩa của Amp?

Amp về cơ bản là viết tắt của Access Module Processor và là một bộ xử lý hoạt động ảo và về cơ bản được sử dụng để quản lý một phần duy nhất của cơ sở dữ liệu. Phần cơ sở dữ liệu cụ thể này không thể được chia sẻ bởi bất kỳ Amp nào khác. Do đó, dạng kiến ​​trúc này thường được gọi là kiến ​​trúc không chia sẻ.


24) Amp chứa những gì và tất cả các hoạt động mà nó thực hiện là gì?

Amp về cơ bản bao gồm một Hệ thống con Trình quản lý cơ sở dữ liệu và có khả năng thực hiện các hoạt động được đề cập bên dưới.

  • Thực hiện DML
  • Thực hiện DDL
  • Thực hiện tập hợp và tham gia.
  • Giải phóng và áp dụng khóa, v.v.

25) Công cụ phân tích cú pháp nghĩa là gì?

PE tình cờ là một loại Vproc. Chức năng chính của nó là nhận các yêu cầu SQL và gửi phản hồi theo SQL. Nó bao gồm một loạt các thành phần phần mềm được sử dụng để chia SQL thành nhiều bước khác nhau và sau đó gửi các bước đó tới AMP.


26) Bạn có ý gì khi phân tích cú pháp?

Phân tích cú pháp là một quá trình liên quan đến việc phân tích các ký hiệu của chuỗi bằng ngôn ngữ máy tính hoặc ngôn ngữ tự nhiên.


27) Chức năng của Trình phân tích cú pháp là gì?

Trình phân tích cú pháp: –

  • Kiểm tra lỗi ngữ nghĩa
  • Kiểm tra lỗi cú pháp
  • Kiểm tra sự tồn tại của đối tượng

28) Người điều phối nghĩa là gì?

Bộ điều phối nhận toàn bộ bộ sưu tập các yêu cầu và sau đó lưu chúng vào hàng đợi. Hàng đợi tương tự đang được giữ trong suốt quá trình để cung cấp nhiều bộ phản hồi.


29) PE có khả năng xử lý bao nhiêu phiên MAX tại một thời điểm cụ thể?

PE có thể xử lý tổng cộng 120 phiên tại một thời điểm cụ thể.


30) Giải thích BYNET.

BYNET về cơ bản đóng vai trò là phương tiện liên lạc giữa các thành phần. Nó chịu trách nhiệm chính trong việc gửi tin nhắn và cũng chịu trách nhiệm thực hiện các hoạt động hợp nhất cũng như sắp xếp.


31) Nhóm có nghĩa là gì?

Một Clique về cơ bản được biết đến là một tập hợp các nút được chia sẻ giữa các ổ đĩa thông thường. Sự hiện diện của Clique là vô cùng quan trọng vì nó giúp tránh lỗi nút.


32) Điều gì xảy ra khi một nút bị sập?

Bất cứ khi nào có sự sụt giảm về mức hiệu suất của một nút, tất cả các Vproc tương ứng sẽ ngay lập tức di chuyển sang một nút mới từ nút bị lỗi để lấy lại tất cả dữ liệu từ các ổ đĩa chung.


33) Liệt kê tất cả các dạng LOCKS có sẵn trong Teradata.

Về cơ bản có bốn loại KHÓA thuộc Teradata. Đó là: -

  • Khóa đọc
  • Khóa truy cập
  • Khóa độc quyền
  • Khóa viết

34) Mức độ được chỉ định cụ thể mà LOCK có thể được áp dụng trong Teradata là gì?

  • Cấp độ bảng – Tất cả các hàng có trong bảng chắc chắn sẽ bị khóa.
  • Khóa cấp cơ sở dữ liệu – Tất cả các đối tượng có trong cơ sở dữ liệu sẽ bị khóa.
  • Khóa cấp độ băm hàng – Chỉ những hàng tương ứng với hàng cụ thể sẽ bị khóa.

35) Trong Chỉ số chính, điểm số của AMP tích cực tham gia là bao nhiêu?

Chỉ có một AMP tích cực tham gia vào Chỉ mục chính.


36) Trong Teradata, ý nghĩa của lệnh UPSERT là gì?

UPSERT về cơ bản là viết tắt của Update Else Insert. Tùy chọn này chỉ có sẵn trong Teradata.


37) Nêu bật những ưu điểm của PPI (Chỉ số chính phân vùng).

PPI về cơ bản được sử dụng cho mục đích lưu trữ dữ liệu dựa trên Phạm vi hoặc Danh mục. Khi nói đến truy vấn Phạm vi, không cần sử dụng Quét toàn bộ bảng vì nó ngay lập tức di chuyển đến phân vùng tiếp theo, do đó bỏ qua tất cả các phân vùng khác.


38) Cho biết kích thước của SMALLINT, BYTEINT và INTEGER.

NHỎ – 2 byte – 16 lần cắn -> -32768 đến 32767

BYTEINT – 1 Byte – 8 Bit -> -128 đến 127

INTEGER – 4 Byte – 32 Bit -> -2,147,483,648 đến 2,147,483,647


39) Kế hoạch chi phí thấp nhất có nghĩa là gì?

Kế hoạch chi phí thấp nhất về cơ bản sẽ thực hiện trong thời gian ngắn hơn trên con đường ngắn nhất.


40) Nêu bật những điểm khác biệt giữa cơ sở dữ liệu và người dùng trong Teradata.

  • Cơ sở dữ liệu về cơ bản là thụ động, trong khi người dùng đang hoạt động.
  • Cơ sở dữ liệu chủ yếu lưu trữ tất cả các đối tượng của cơ sở dữ liệu, trong khi người dùng có thể lưu trữ bất kỳ đối tượng nào cho dù đó là macro, bảng, dạng xem, v.v.
  • Cơ sở dữ liệu không có mật khẩu trong khi người dùng phải nhập mật khẩu.

Câu hỏi và câu trả lời phỏng vấn Teradata trong 10 năm kinh nghiệm

41) Nêu bật sự khác biệt giữa Khóa chính và Chỉ mục chính.

  • Chỉ mục chính là khá bắt buộc, trong khi Khóa chính là tùy chọn.
  • Chỉ mục chính có giới hạn là 64 bảng/cột, trong khi Khóa chính không có bất kỳ giới hạn nào.
  • Chỉ mục chính cho phép trùng lặp và null, trong khi Khóa chính thì không.
  • Chỉ mục chính là một cơ chế vật lý, trong khi Khóa chính là cơ chế logic thuần túy.

42) Giải thích cách sử dụng không gian ống chỉ.

Không gian bộ đệm trong Teradata về cơ bản được sử dụng để chạy truy vấn. Trong tổng dung lượng có sẵn trong Teradata, 20% dung lượng về cơ bản được phân bổ cho không gian bộ đệm.


43) Nêu bật nhu cầu Điều chỉnh Hiệu suất.

Việc điều chỉnh hiệu suất trong Teradata về cơ bản được thực hiện để xác định tất cả các điểm nghẽn và sau đó giải quyết chúng.


44) Nhận xét xem nút cổ chai có phải là lỗi hay không.

Về mặt kỹ thuật, thắt cổ chai không phải là một dạng lỗi, nhưng nó chắc chắn gây ra độ trễ nhất định trong hệ thống.


45) Làm thế nào có thể xác định được nút thắt cổ chai?

Về cơ bản có bốn cách để xác định nút cổ chai. Đó là: -

  • Giải thích trực quan Teradata
  • Giải thích Công cụ sửa đổi yêu cầu
  • Trình quản lý siêu dữ liệu
  • Performance Monitor

46) Kế hoạch chi phí cao nhất có nghĩa là gì?

Theo Kế hoạch chi phí cao nhất, thời gian thực hiện quy trình sẽ nhiều hơn và phải mất đường đi dài nhất hiện có.


47) Đánh dấu tất cả các chế độ có trong Mức độ tin cậy.

Thấp, Không, Cao và Tham gia là bốn chế độ có trong Mức độ tin cậy.


48) Đặt tên cho năm giai đoạn trong Tiện ích MultiLoad.

Giai đoạn sơ bộ, Giai đoạn DML, Giai đoạn thu thập dữ liệu, Giai đoạn ứng dụng và Giai đoạn kết thúc.


49) Nêu bật những hạn chế của TPUMP Utility.

Sau đây là những hạn chế của tiện ích TPUMP: –

  • Chúng tôi không thể sử dụng câu lệnh SELECT.
  • Tệp dữ liệu không thể được nối.
  • Các toán tử tổng hợp và hàm mũ không được hỗ trợ.
  • Chức năng số học không thể được hỗ trợ.

50) Trong BTEQ, các tham số chế độ phiên được đặt như thế nào?

.set giao dịch phiên BTET -> Chế độ giao dịch Teradata

Giao dịch phiên .set ANSI -> Chế độ ANSI

Các lệnh này sẽ chỉ hoạt động khi chúng được nhập trước khi đăng nhập vào phiên.

Những câu hỏi phỏng vấn này cũng sẽ giúp ích cho bài thi viva(orals) của bạn