คำถามและคำตอบสัมภาษณ์ Teradata 50 อันดับแรก (2025)

ต่อไปนี้เป็นคำถามและคำตอบในการสัมภาษณ์ของ Teradata สำหรับผู้สมัครหน้าใหม่และผู้มีประสบการณ์เพื่อให้ได้งานในฝัน

 

คำถามและคำตอบสัมภาษณ์ Teradata สำหรับนักศึกษาใหม่

1) คุณให้คำนิยาม Teradata อย่างไร? ให้คุณสมบัติเบื้องต้นบางประการที่เหมือนกัน

Teradata โดยพื้นฐานแล้วคือ RDMS ซึ่งใช้ในการขับเคลื่อน Datamart, Datawarehouse, OLAP, OLTP รวมถึง DSS Appliances ของบริษัท คุณสมบัติหลักบางประการของ Teradata มีดังต่อไปนี้

  • สามารถทำงานบนโหนดเดียวและหลายโหนดได้
  • ความเท่าเทียมถูกสร้างขึ้นในระบบ
  • เข้ากันได้ดีมากกับมาตรฐาน ANSI
  • มีแนวโน้มที่จะดำเนินการในลักษณะเดียวกับเซิร์ฟเวอร์
  • เป็นระบบเปิดที่ดำเนินการโดยทั่วไปสำหรับ UNIX MR-RAS, Suse Linux ETC, WIN2K ฯลฯ

👉 ดาวน์โหลด PDF ฟรี: คำถามและคำตอบสัมภาษณ์ Teradata


2) คุณสมบัติที่พัฒนาขึ้นใหม่ของ Teradata คืออะไร?

คุณสมบัติที่พัฒนาขึ้นใหม่ของ Teradata ได้แก่: –

  • การวิเคราะห์ชั่วคราวแบบอัตโนมัติ
  • ส่วนขยายความสามารถในการบีบอัดซึ่งช่วยให้การบีบอัดข้อมูลมีความยืดหยุ่นมากกว่าเวอร์ชันก่อนหน้าประมาณ 20 เท่า
  • นวัตกรรมที่เกี่ยวข้องกับลูกค้าเช่นมุมมอง tetradata

3) เน้นองค์ประกอบที่สำคัญบางประการของ Teradata

องค์ประกอบที่สำคัญบางประการของ Teradata ได้แก่: –

  • ไบเน็ต
  • โปรเซสเซอร์โมดูลการเข้าถึง (AMP)
  • การแยกวิเคราะห์เครื่องยนต์ (PE)
  • ดิสก์เสมือน (vDisk)
  • ระบบจัดเก็บข้อมูลเสมือน (VSS)
คำถามสัมภาษณ์ Teradata
คำถามสัมภาษณ์ Teradata

4) พูดถึงขั้นตอนที่เราสามารถรันงาน Teradata ในสภาพแวดล้อม UNIX

สิ่งที่คุณต้องทำคือดำเนินการใน UNIX ในลักษณะที่กล่าวไว้ด้านล่าง

$Sh > BTEQ < [Script Path] > [Logfile Path]

or

$Sh > BTEQ < [Script Path] TEE [Logfile Path]


5) ใน Teradata เราจะสร้างลำดับได้อย่างไร

ใน Teradata เราสร้างลำดับโดยใช้คอลัมน์ข้อมูลประจำตัว


6) ในช่วงเวลาที่แสดง Teradata จะสร้างลำดับได้อย่างไร

สิ่งที่คุณต้องทำคือใช้ CSUM


7) มีการวางภาระบางอย่างบนโต๊ะและทุกๆ ชั่วโมงด้วย การจราจรในตอนเช้าค่อนข้างน้อย และการจราจรตอนกลางคืนก็สูงมาก ตามสถานการณ์นี้ ยูทิลิตี้ใดที่เหมาะสมที่สุดและควรโหลดยูทิลิตี้นั้นอย่างไร

ยูทิลิตี้ที่แนะนำมากที่สุดในที่นี้ต้องเป็น Tpump ด้วยการใช้ขนาดแพ็กเก็ตที่ลดลงหรือเพิ่มขึ้น จึงสามารถจัดการการรับส่งข้อมูลได้อย่างง่ายดาย


8) หาก Fast Load Script ล้มเหลวและมีเฉพาะตารางข้อผิดพลาดเท่านั้น คุณจะรีสตาร์ทอย่างไร

โดยพื้นฐานแล้วมีสองวิธีในการรีสตาร์ทในกรณีนี้

  • การทำให้ไฟล์เก่าทำงาน – ตรวจสอบให้แน่ใจว่าคุณไม่ได้ทิ้งตารางข้อผิดพลาดไปจนหมด ให้ลองแก้ไขข้อผิดพลาดที่มีอยู่ในสคริปต์หรือไฟล์แล้วดำเนินการอีกครั้ง
  • การเรียกใช้ไฟล์ใหม่ – ในกระบวนการนี้ สคริปต์จะดำเนินการโดยใช้คำสั่งการโหลดและการเริ่มต้น ซึ่งจะช่วยในการลบการล็อคที่วางไว้บนโต๊ะเป้าหมาย และอาจลบบันทึกที่กำหนดออกจากตารางบันทึกด่วนด้วย เมื่อเสร็จแล้ว คุณมีอิสระที่จะเรียกใช้สคริปต์ทั้งหมดได้อีกครั้ง

9) พูดถึงเครื่องมือ ETL บางส่วนที่อยู่ภายใต้ Teradata

บางส่วนของ เครื่องมือ ETL ซึ่งที่นิยมใช้ใน Teradata ได้แก่ DataStage, Informatica, SSIS เป็นต้น


10) เน้นข้อดีบางประการที่เครื่องมือ ETL มีเหนือ TD

ข้อดีบางประการที่เครื่องมือ ETL มีเหนือ TD คือ: -

  • สามารถดำเนินการจุดหมายปลายทางและแหล่งที่มาที่แตกต่างกันได้หลายแห่ง
  • กระบวนการดีบักจะง่ายขึ้นมากด้วยความช่วยเหลือของเครื่องมือ ETL เนื่องจากรองรับ GUI เต็มรูปแบบ
  • ส่วนประกอบของเครื่องมือ ETL สามารถนำมาใช้ซ้ำได้อย่างง่ายดาย และด้วยเหตุนี้ หากมีการอัปเดตไปยังเซิร์ฟเวอร์หลัก แอปพลิเคชันที่เกี่ยวข้องทั้งหมดที่เชื่อมต่อกับเซิร์ฟเวอร์จะได้รับการอัปเดตโดยอัตโนมัติ
  • การถอนการหมุนและการหมุนสามารถทำได้อย่างง่ายดายโดยใช้เครื่องมือ ETL

11) การแคชใน Teradata มีความหมายว่าอย่างไร?

การแคชถือเป็นข้อได้เปรียบเพิ่มเติมของการใช้งาน Teradata เนื่องจากทำงานโดยหลักกับแหล่งข้อมูลที่อยู่ในลำดับเดียวกัน กล่าวคือ ไม่เปลี่ยนแปลงบ่อยครั้ง บางครั้งแคชมักจะถูกแชร์ระหว่างแอปพลิเคชัน


12) เราจะตรวจสอบเวอร์ชันของ Teradata ที่เราใช้อยู่ได้อย่างไร?

เพียงแค่ให้คำสั่ง .SHOW VERSION.


13) ให้เหตุผลที่สมเหตุสมผลว่าทำไม Multi-load รองรับ NUSI แทนที่จะเป็น USI

แถวย่อยของตารางดัชนีจะอยู่บนแอมแปร์เดียวกันในลักษณะเดียวกับแถวข้อมูลใน NUSI ดังนั้น แอมแปร์แต่ละตัวจะทำงานแยกกันและในลักษณะขนานกัน


14) MLOAD Client System จะรีสตาร์ทหลังจากดำเนินการอย่างไร?

ต้องส่งสคริปต์ด้วยตนเองเพื่อให้สามารถโหลดข้อมูลจากจุดตรวจสอบที่มาสุดท้ายได้อย่างง่ายดาย


15) MLOAD Teradata Server จะรีสตาร์ทหลังจากดำเนินการอย่างไร

โดยพื้นฐานแล้วกระบวนการจะดำเนินการจากจุดตรวจสอบที่ทราบล่าสุด และเมื่อข้อมูลได้รับการดำเนินการหลังจากการเรียกใช้สคริปต์ MLOAD แล้ว เซิร์ฟเวอร์จะรีสตาร์ท


16) โหนดหมายถึงอะไร?

โดยทั่วไปโหนดจะเรียกว่าเป็นการแบ่งประเภทของส่วนประกอบของฮาร์ดแวร์และซอฟต์แวร์ โดยปกติแล้วเซิร์ฟเวอร์จะเรียกว่าโหนด


17) สมมติว่ามีไฟล์ที่ประกอบด้วย 100 เรคคอร์ด ซึ่งเราต้องข้าม 20 เรคคอร์ดแรกและ XNUMX เรคคอร์ดสุดท้าย ข้อมูลโค้ดจะเป็นอย่างไร

เราจำเป็นต้องใช้ BTEQ Utility เพื่อที่จะทำงานนี้ ข้าม 20 เช่นเดียวกับทำซ้ำ 60 จะถูกใช้ในสคริปต์


18) อธิบาย PDE

PDE ย่อมาจาก Parallel Data Extension โดยพื้นฐานแล้ว PDE เป็นชั้นอินเทอร์เฟซของซอฟต์แวร์ที่อยู่เหนือระบบปฏิบัติการ และให้ฐานข้อมูลสามารถทำงานในสภาพแวดล้อมแบบคู่ขนานได้


19) TPD คืออะไร?

TPD ย่อมาจาก Trusted Parallel Database และทำงานภายใต้ PDE โดยพื้นฐานแล้ว Teradata เป็นฐานข้อมูลที่ทำงานภายใต้ PDE เป็นหลัก นี่คือเหตุผลที่ Teradata มักถูกเรียกว่า Trusted Parallel หรือ Pure Parallel database


20) Channel Driver หมายถึงอะไร?

โปรแกรมควบคุมช่องสัญญาณคือซอฟต์แวร์ที่ทำหน้าที่เป็นสื่อกลางในการสื่อสารระหว่าง PE และแอปพลิเคชันทั้งหมดที่ทำงานบนช่องสัญญาณที่แนบกับไคลเอนต์


คำถามและคำตอบสัมภาษณ์ Teradata สำหรับผู้มีประสบการณ์

21) Teradata Gateway หมายถึงอะไร

เช่นเดียวกับไดรเวอร์ช่องทาง Teradata Gateway ทำหน้าที่เป็นสื่อกลางในการสื่อสารระหว่าง Parse Engine และแอปพลิเคชันที่เชื่อมต่อกับไคลเอ็นต์เครือข่าย มีการกำหนดเกตเวย์เดียวเท่านั้นต่อโหนด


22) Virtual Disk หมายถึงอะไร?

Virtual Disk นั้นเป็นการรวบรวมอาร์เรย์ทั้งหมดของกระบอกสูบซึ่งเป็นฟิสิคัลดิสก์ บางครั้งเรียกว่าดิสก์อาร์เรย์


23)อธิบายความหมายของแอมป์?

Amp ย่อมาจาก Access Module Processor ซึ่งเป็นโปรเซสเซอร์ที่ทำงานเสมือนจริงและโดยทั่วไปใช้สำหรับจัดการฐานข้อมูลเพียงส่วนเดียว ฐานข้อมูลส่วนนี้ไม่สามารถแชร์กับ Amp ตัวอื่นได้ ดังนั้นสถาปัตยกรรมรูปแบบนี้จึงมักเรียกกันว่าสถาปัตยกรรมแบบไม่มีอะไรแชร์


24) Amp ประกอบด้วยอะไรบ้าง และมีการทำงานอะไรบ้าง

โดยพื้นฐานแล้ว Amp ประกอบด้วยระบบย่อยตัวจัดการฐานข้อมูลและสามารถดำเนินการต่างๆ ที่ระบุไว้ด้านล่างนี้ได้

  • การแสดง DML
  • กำลังแสดง DDL
  • การใช้การรวมและการรวม
  • การปลดและการใช้ล็อค ฯลฯ

25) Parsing Engine หมายถึงอะไร?

PE เป็น Vproc ที่ใจดี หน้าที่หลักคือรับคำขอ SQL และส่งคำตอบมา SQL- ประกอบด้วยส่วนประกอบซอฟต์แวร์มากมายที่ใช้ในการแยก SQL ออกเป็นขั้นตอนต่างๆ แล้วส่งขั้นตอนเหล่านั้นไปยัง AMP


26) การแยกวิเคราะห์หมายถึงอะไร?

การแยกวิเคราะห์เป็นกระบวนการที่เกี่ยวข้องกับการวิเคราะห์สัญลักษณ์ของสตริงที่เป็นภาษาคอมพิวเตอร์หรือภาษาธรรมชาติ


27) Parser มีหน้าที่อะไร?

นักแยกวิเคราะห์: –

  • ตรวจสอบข้อผิดพลาดทางความหมาย
  • ตรวจสอบข้อผิดพลาดทางวากยสัมพันธ์
  • ตรวจสอบการมีอยู่ของวัตถุ

28) ผู้มอบหมายงานหมายถึงอะไร?

Dispatcher รับชุดคำขอทั้งหมดแล้วเก็บไว้ในคิว คิวเดียวกันจะถูกเก็บไว้ตลอดกระบวนการเพื่อส่งมอบการตอบกลับหลายชุด


29) PE สามารถจัดการ MAX ได้กี่เซสชันในช่วงเวลาหนึ่งๆ

PE สามารถรองรับเซสชันได้ทั้งหมด 120 เซสชันในช่วงเวลาหนึ่งๆ


30) อธิบาย BYNET

BYNET ทำหน้าที่เป็นสื่อกลางในการสื่อสารระหว่างส่วนประกอบต่างๆ โดยหลักแล้ว BYNET มีหน้าที่ในการส่งข้อความ และยังรับผิดชอบในการรวมและเรียงลำดับข้อมูลอีกด้วย


31) Clique หมายถึงอะไร?

โดยทั่วไปแล้ว Clique เป็นที่รู้กันว่าเป็นกลุ่มของโหนดที่ใช้ร่วมกันระหว่างดิสก์ไดรฟ์ทั่วไป การแสดงตนของ Clique มีความสำคัญอย่างมากเนื่องจากช่วยหลีกเลี่ยงความล้มเหลวของโหนด


32) จะเกิดอะไรขึ้นเมื่อโหนดประสบความล้มเหลว?

เมื่อใดก็ตามที่ระดับประสิทธิภาพของโหนดลดลง Vproc ที่เกี่ยวข้องทั้งหมดจะย้ายจากโหนดที่ล้มเหลวไปยังโหนดใหม่ทันที เพื่อรับข้อมูลทั้งหมดกลับจากไดรฟ์ทั่วไป


33) แสดงรายการ LOCKS ทุกรูปแบบที่มีอยู่ใน Teradata

โดยทั่วไปมี LOCKS สี่ประเภทที่อยู่ภายใต้ Teradata เหล่านี้คือ: –

  • อ่านล็อค
  • ล็อคการเข้าถึง
  • ล็อคพิเศษ
  • เขียนล็อค

34) ระดับที่กำหนดไว้โดยเฉพาะซึ่ง LOCK มีแนวโน้มที่จะนำไปใช้ใน Teradata คืออะไร?

  • ระดับตาราง – แถวทั้งหมดที่อยู่ในตารางจะถูกล็อคอย่างแน่นอน
  • ล็อคระดับฐานข้อมูล - วัตถุทั้งหมดที่มีอยู่ในฐานข้อมูลจะถูกล็อค
  • ล็อคระดับแฮชแถว - เฉพาะแถวเหล่านั้นเท่านั้นที่จะถูกล็อคซึ่งสอดคล้องกับแถวใดแถวหนึ่ง

35) ในดัชนีหลัก AMP ที่เกี่ยวข้องอย่างแข็งขันมีคะแนนเท่าใด

มี AMP เพียงตัวเดียวเท่านั้นที่มีส่วนร่วมในดัชนีหลัก


36) ใน Teradata คำสั่ง UPSERT มีความสำคัญอย่างไร

UPSERT โดยพื้นฐานแล้วย่อมาจาก Update Else Insert ตัวเลือกนี้มีเฉพาะใน Teradata เท่านั้น


37) เน้นข้อดีของ PPI (Partition Primary Index)

โดยทั่วไป PPI ใช้เพื่อวัตถุประสงค์ในการจัดเก็บข้อมูลตามช่วงหรือตามหมวดหมู่ เมื่อพูดถึงการสืบค้นแบบ Range ไม่จำเป็นต้องใช้การสแกนตารางแบบเต็ม เนื่องจากจะย้ายไปยังพาร์ติชันที่ตามมาทันที ดังนั้นจึงข้ามพาร์ติชันอื่นๆ ทั้งหมด


38) ระบุขนาดของ SMALLINT, BYTEINT และ INTEGER

SMALLINT - 2 ไบต์ - 16 ไบต์ -> -32768 ถึง 32767

BYTEINT – 1 ไบต์ – 8 บิต -> -128 ถึง 127

จำนวนเต็ม – 4 ไบต์ – 32 บิต -> -2,147,483,648 ถึง 2,147,483,647


39) แผนต้นทุนน้อยที่สุดหมายถึงอะไร?

โดยพื้นฐานแล้วแผนต้นทุนน้อยที่สุดจะดำเนินการโดยใช้เวลาน้อยลงในเส้นทางที่สั้นที่สุด


40) เน้นจุดความแตกต่างระหว่างฐานข้อมูลและผู้ใช้ใน Teradata

  • โดยพื้นฐานแล้วฐานข้อมูลเป็นแบบพาสซีฟ ในขณะที่ผู้ใช้ใช้งานอยู่
  • ฐานข้อมูลจะจัดเก็บวัตถุทั้งหมดในฐานข้อมูลเป็นหลัก ในขณะที่ผู้ใช้สามารถจัดเก็บวัตถุใด ๆ ก็ได้ ไม่ว่าจะเป็นแมโคร ตาราง มุมมอง ฯลฯ
  • ฐานข้อมูลไม่มีรหัสผ่านในขณะที่ผู้ใช้ต้องป้อนรหัสผ่าน

คำถามและคำตอบสัมภาษณ์ Teradata เป็นเวลา 10 ปี

41) เน้นความแตกต่างระหว่างคีย์หลักและดัชนีหลัก

  • ดัชนีหลักค่อนข้างจำเป็น ในขณะที่คีย์หลักเป็นทางเลือก
  • ดัชนีหลักมีขีดจำกัดอยู่ที่ 64 ตาราง/คอลัมน์ ในขณะที่คีย์หลักไม่มีขีดจำกัดใดๆ
  • ดัชนีหลักอนุญาตให้มีรายการซ้ำและเป็นโมฆะ ในขณะที่คีย์หลักไม่อนุญาต
  • ดัชนีหลักเป็นกลไกทางกายภาพ ในขณะที่คีย์หลักเป็นกลไกเชิงตรรกะล้วนๆ

42) อธิบายวิธีการใช้พื้นที่สปูล

โดยทั่วไปพื้นที่สปูลใน Teradata นั้นใช้สำหรับเรียกใช้คำสั่ง จากพื้นที่ทั้งหมดที่มีอยู่ใน Teradata โดยพื้นฐานแล้ว 20% ของพื้นที่จะถูกจัดสรรให้กับพื้นที่สปูล


43) เน้นย้ำถึงความจำเป็นในการปรับแต่งประสิทธิภาพ

โดยพื้นฐานแล้วการปรับแต่งประสิทธิภาพใน Teradata จะทำเพื่อระบุปัญหาคอขวดทั้งหมดแล้วแก้ไข


44) แสดงความคิดเห็นว่าคอขวดเป็นข้อผิดพลาดหรือไม่

ในทางเทคนิคแล้ว คอขวดไม่ใช่รูปแบบของข้อผิดพลาด แต่ทำให้เกิดความล่าช้าในระบบอย่างแน่นอน


45) สามารถระบุปัญหาคอขวดได้อย่างไร?

โดยทั่วไปมีสี่วิธีในการระบุปัญหาคอขวด เหล่านี้คือ: –

  • Teradata อธิบายภาพ
  • อธิบายตัวแก้ไขคำขอ
  • ผู้จัดการเทราดาต้า
  • การตรวจสอบประสิทธิภาพ

46) แผนต้นทุนสูงสุดหมายถึงอะไร?

ตามแผนต้นทุนสูงสุด เวลาที่ใช้ในการดำเนินการกระบวนการจะนานกว่า และใช้เส้นทางที่ยาวที่สุดที่มีอยู่


47) เน้นโหมดทั้งหมดที่มีอยู่ภายใต้ระดับความมั่นใจ

ต่ำ, ไม่, สูง และเข้าร่วมเป็นสี่โหมดที่อยู่ภายใต้ระดับความมั่นใจ


48) ตั้งชื่อห้าเฟสที่อยู่ภายใต้ MultiLoad Utility

ระยะเบื้องต้น ระยะ DML ระยะการรับข้อมูล ระยะการสมัคร และระยะสิ้นสุด


49) เน้นข้อจำกัดของยูทิลิตี้ TPUMP

ต่อไปนี้เป็นข้อจำกัดของยูทิลิตี้ TPUMP: –

  • เราไม่สามารถใช้คำสั่ง SELECT ได้
  • ไม่สามารถต่อไฟล์ข้อมูลเข้าด้วยกันได้
  • ไม่สนับสนุนตัวดำเนินการรวมและเลขชี้กำลัง
  • ไม่รองรับฟังก์ชันทางคณิตศาสตร์

50) ใน BTEQ พารามิเตอร์โหมดเซสชันถูกตั้งค่าอย่างไร

.set ธุรกรรมเซสชัน BTET -> โหมดธุรกรรม Teradata

.set ธุรกรรมเซสชัน ANSI -> โหมด ANSI

คำสั่งเหล่านี้จะใช้งานได้เมื่อมีการป้อนก่อนเข้าสู่ระบบเซสชันเท่านั้น

คำถามสัมภาษณ์เหล่านี้จะช่วยในวีว่าของคุณ (วาจา)