บทช่วยสอน Teradata: Teradata SQL คืออะไร ฐานข้อมูล Archiเทคเจอร์

เทราดาต้าคืออะไร?

Teradata เป็นระบบจัดการฐานข้อมูลโอเพ่นซอร์สสำหรับการพัฒนาแอปพลิเคชันคลังข้อมูลขนาดใหญ่ เครื่องมือนี้รองรับการดำเนินการคลังข้อมูลหลายรายการพร้อมกันโดยใช้แนวคิดการทำงานแบบคู่ขนาน Teradata เป็นระบบประมวลผลแบบเปิดจำนวนมากที่รองรับ Unix/Linux/Windows แพลตฟอร์มเซิร์ฟเวอร์

ซอฟต์แวร์ Teradata ได้รับการพัฒนาโดย Teradata Corporation ซึ่งเป็นบริษัทไอทีของอเมริกา เป็นผู้จัดจำหน่ายแพลตฟอร์มข้อมูลการวิเคราะห์ แอปพลิเคชัน และบริการอื่นๆ ที่เกี่ยวข้อง บริษัทพัฒนาผลิตภัณฑ์เพื่อรวบรวมข้อมูลจากแหล่งต่างๆ และทำให้ข้อมูลพร้อมสำหรับการวิเคราะห์

ประวัติความเป็นมาของเทราดาต้า

Teradata เป็นแผนกหนึ่งของ NCR Corporation ก่อตั้งขึ้นเมื่อปี พ.ศ. 1979 แต่แยกตัวออกจาก NCR ในเดือนตุลาคม พ.ศ. 2007 Michael Koehler กลายเป็น CEO คนแรกของ Teradata

เหตุการณ์สำคัญของบริษัท Teradata Corporation:

  • พ.ศ. 1979 (ค.ศ. XNUMX) – ก่อตั้ง Teradata
  • พ.ศ. 1984 (ค.ศ. 1012) – เปิดตัวคอมพิวเตอร์ฐานข้อมูลเครื่องแรก DBC/XNUMX
  • พ.ศ. 1986 – นิตยสาร Fortune ได้ประกาศให้ Teradata เป็น 'ผลิตภัณฑ์แห่งปี'
  • พ.ศ. 1999 – ฐานข้อมูลที่ใหญ่ที่สุดที่สร้างโดยใช้ Teradata ขนาด 130 เทราไบต์
  • 2002 – เปิดตัวเวอร์ชัน Teradata V2R5 พร้อมการบีบอัดและพาร์ติชันหลัก
  • พ.ศ. 2006 – เปิดตัวโซลูชันการจัดการข้อมูล Teradata Master
  • 2008 – Teradata 13.0 เปิดตัวพร้อมกับ Active Data Warehousing
  • พ.ศ. 2011 – เข้าซื้อกิจการ Teradata Aster และกระโจนเข้าสู่ Advanced Analytics Space
  • 2012 – เปิดตัว Teradata 14.0
  • 2014 – เปิดตัว Teradata 15.0
  • 2015- Teradata ซื้อแพลตฟอร์มการตลาดของแอป Appoxee
  • 2016- Terada จับมือกับ Big Data
  • 2017- Teradata เข้าซื้อกิจการ StackIQ ของซานดิเอโก

ทำไมต้องเทราดาต้า?

  • Teradata นำเสนอบริการแบบครบวงจรที่เน้นไปที่ คลังข้อมูล
  • ระบบนี้สร้างขึ้นบนสถาปัตยกรรมแบบเปิด ดังนั้นเมื่อใดก็ตามที่มีอุปกรณ์ที่เร็วกว่านี้ออกมา ก็สามารถนำอุปกรณ์ดังกล่าวมารวมเข้ากับสถาปัตยกรรมที่สร้างไว้แล้วได้
  • Teradata รองรับข้อมูลมากกว่า 50 เพตะไบต์
  • มุมมองการทำงานเดี่ยวสำหรับระบบ Teradata หลายโหนดขนาดใหญ่โดยใช้ Service Workstation
  • เข้ากันได้กับหลากหลายของ เครื่องมือ BI เพื่อดึงข้อมูล
  • สามารถทำหน้าที่เป็นจุดควบคุมเดียวสำหรับ DBA ในการจัดการ ฐานข้อมูล.
  • ประสิทธิภาพสูง การสืบค้นที่หลากหลาย การวิเคราะห์ในฐานข้อมูล และการจัดการภาระงานที่ซับซ้อน
  • Teradata ช่วยให้คุณได้รับข้อมูลเดียวกันจากตัวเลือกการใช้งานหลายตัวเลือก

ต่อไปในบทช่วยสอน Teradata นี้ เราจะเรียนรู้เกี่ยวกับคุณสมบัติของ Teradata

คุณสมบัติของ Teradata SQL

Teradata นำเสนอคุณสมบัติอันทรงพลังดังต่อไปนี้:

  • ความสามารถในการปรับขนาดเชิงเส้น: นำเสนอความสามารถในการปรับขนาดเชิงเส้นเมื่อต้องรับมือกับข้อมูลปริมาณมากโดยการเพิ่มโหนดเพื่อเพิ่มประสิทธิภาพของระบบ
  • ความเท่าเทียมไม่จำกัด: Teradata ขึ้นอยู่กับ MPP (การประมวลผลแบบขนานขนาดใหญ่ Archiเทคเจอร์) จึงถูกออกแบบให้ขนานกันตั้งแต่ต้น สามารถแบ่งงานใหญ่ออกเป็นงานย่อยๆ และทำงานควบคู่กันไปได้
  • เครื่องมือเพิ่มประสิทธิภาพสำหรับผู้ใหญ่: Teradata Optimizer สามารถรองรับการรวมได้สูงสุด 64 รายการในแบบสอบถาม
  • ต้นทุนการเป็นเจ้าของต่ำ: ข้อมูล Tera มีต้นทุนการเป็นเจ้าของโดยรวมต่ำ ง่ายต่อการติดตั้ง บำรุงรักษา และบริหารจัดการ
  • โหลดและยกเลิกการโหลดยูทิลิตี้: Teradata มียูทิลิตี้โหลดและยกเลิกการโหลดเพื่อย้ายข้อมูลเข้า/ออกจากระบบ Teradata
  • การเชื่อมต่อ: ระบบ MPP นี้สามารถเชื่อมต่อกับระบบที่ต่อกับช่องสัญญาณ เช่น เมนเฟรมหรือระบบที่ต่อกับเครือข่าย
  • เอสคิวแอล: รองรับ Teradata SQL เพื่อโต้ตอบกับข้อมูลที่เก็บไว้ในตาราง มันมีส่วนขยาย
  • ยูทิลิตี้ที่แข็งแกร่ง: Teradata มอบยูทิลิตี้ที่มีประสิทธิภาพในการนำเข้า/ส่งออกข้อมูลจาก/ไปยังระบบ Teradata เช่น FastExport, FastLoad, MultiLoad และ TPT
  • การกระจายอัตโนมัติ: Teradata สามารถกระจายข้อมูลไปยังดิสก์โดยอัตโนมัติโดยไม่ต้องมีการแทรกแซงด้วยตนเอง

ต่อไปในบทช่วยสอน Teradata SQL เราจะเรียนรู้เกี่ยวกับ Teradata Archiเทคเจอร์

Teradata Archiเทคเจอร์

สถาปัตยกรรม Teradata คือการประมวลผลแบบขนานจำนวนมาก Archiเทคเจอร์

องค์ประกอบที่สำคัญสามประการของ Teradata คือ:

  • การแยกวิเคราะห์เครื่องยนต์
  • ไบเน็ต
  • โปรเซสเซอร์โมดูลการเข้าถึง (AMP)

ที่เก็บข้อมูลเทราดาต้า Archiฐานข้อมูลเทคเจอร์ Archiแผนภาพเทคเจอร์:

Teradata Archiเทคเจอร์
Teradata Archiแผนภาพเทคเจอร์

ที่เก็บข้อมูลเทราดาต้า Archiเทคเจอร์

การแยกวิเคราะห์เครื่องยนต์:

เครื่องมือวิเคราะห์จะวิเคราะห์แบบสอบถามและเตรียมแผนการดำเนินการ จัดการเซสชันสำหรับผู้ใช้ เพิ่มประสิทธิภาพและส่งคำขอไปยังผู้ใช้

ดังนั้น เมื่อไคลเอนต์ดำเนินการค้นหาเพื่อแทรกบันทึก Parsing Engine จะส่งบันทึกไปยังเลเยอร์ Message Passing เลเยอร์การส่งข้อความหรือ BYNET เป็นส่วนประกอบซอฟต์แวร์และฮาร์ดแวร์ มันมีความสามารถด้านเครือข่าย นอกจากนี้ยังดึงข้อมูลระเบียนและส่งแถวไปยัง AMP เป้าหมายด้วย

แอมป์:

AMP ย่อมาจาก Access Module Processor ซึ่งทำหน้าที่จัดเก็บข้อมูลบนดิสก์เหล่านี้ AMP ดำเนินกิจกรรมดังต่อไปนี้:

  • จัดการส่วนหนึ่งของฐานข้อมูล
  • จัดการส่วนหนึ่งของแต่ละตาราง
  • ดำเนินงานทั้งหมดที่เกี่ยวข้องกับการสร้างชุดผลลัพธ์ เช่น การเรียงลำดับ การรวมกลุ่ม และการรวม
  • ดำเนินการล็อคและการจัดการพื้นที่

การดึงข้อมูล Teradata Archiเทคเจอร์

เมื่อไคลเอนต์เรียกใช้แบบสอบถามเพื่อดึงข้อมูลระเบียน โปรแกรมแยกวิเคราะห์จะส่งคำขอไปยัง BYNET จากนั้น BYNET จะส่งคำขอเรียกข้อมูลไปยัง AMP ที่เหมาะสม

AMP จะค้นหาดิสก์ในแบบคู่ขนานและจดจำบันทึกที่จำเป็นและส่งไปยัง BYNET BYNET ส่งบันทึกไปยัง Parsing Engine ซึ่งจะส่งไปยังไคลเอนต์

ต่อไปในบทช่วยสอนฐานข้อมูล Teradata นี้ เราจะเรียนรู้เกี่ยวกับคำสั่ง Teradata SQL

ประเภทของคำสั่ง Teradata SQL

ฐานข้อมูล Teradata รองรับคำสั่ง SQL พื้นฐานต่อไปนี้:

  1. คำสั่ง Data Definition Language (DDL)
  2. คำสั่งภาษาควบคุมข้อมูล (DCL)
  3. คำสั่งภาษาการจัดการข้อมูล (DML)

คำสั่งภาษาคำจำกัดความข้อมูล

คำสั่ง Descriptไอออน
สร้าง สร้างฐานข้อมูล ตาราง ผู้ใช้ ฯลฯ ใหม่
DROP ลบฐานข้อมูล ตาราง ผู้ใช้ ฯลฯ ใหม่
แก้ไข เปลี่ยนตาราง คอลัมน์ ทริกเกอร์ ฯลฯ
แก้ไข เปลี่ยนฐานข้อมูลหรือคำจำกัดความของผู้ใช้
เปลี่ยนชื่อ เปลี่ยนชื่อตาราง มุมมอง มาโคร ฯลฯ

คำสั่งภาษาควบคุมข้อมูล

คำสั่ง Descriptไอออน
ให้สิทธิ์/เพิกถอน ใช้เพื่อควบคุมสิทธิ์ของผู้ใช้บนออบเจ็กต์
ให้สิทธิ์เข้าสู่ระบบ/เพิกถอนการเข้าสู่ระบบ ใช้เพื่อควบคุมสิทธิ์การเข้าสู่ระบบให้กับโฮสต์หรือกลุ่มโฮสต์
ให้ ใช้เพื่อมอบวัตถุฐานข้อมูลให้กับวัตถุฐานข้อมูลอื่น

คำสั่งภาษาการจัดการข้อมูล SQL ของฐานข้อมูล Teradata

คำสั่ง Descriptไอออน
ลบ ลบแถวออกจากตาราง
ECHO ใช้เพื่อสะท้อนสตริงหรือคำสั่งไปยังไคลเอนต์
ด่าน กำหนดจุดการกู้คืนในวารสารที่สามารถใช้ในภายหลังเพื่อกู้คืนเนื้อหาตาราง
SELECT ใช้เพื่อส่งคืนข้อมูลแถวที่ระบุในรูปแบบตาราง
อัพเดท แก้ไขข้อมูลในหนึ่งแถวขึ้นไปของตาราง

การประยุกต์ใช้ฐานข้อมูล Teradata

ต่อไปนี้เป็นแอปพลิเคชัน Teradata ยอดนิยม:

  • การจัดการข้อมูลลูกค้า: ช่วยรักษาความสัมพันธ์อันยาวนานกับลูกค้า
  • การจัดการข้อมูลหลัก: ช่วยพัฒนาสภาพแวดล้อมที่สามารถใช้ ซิงโครไนซ์ และเก็บข้อมูลหลักได้
  • การเงินและการจัดการผลการปฏิบัติงาน: ช่วยให้องค์กรปรับปรุงความเร็วและคุณภาพของการรายงานทางการเงิน ช่วยลดต้นทุนโครงสร้างพื้นฐานทางการเงิน และจัดการประสิทธิภาพองค์กรในเชิงรุก
  • การจัดการห่วงโซ่อุปทาน: ปรับปรุงการดำเนินการห่วงโซ่อุปทานซึ่งจะช่วยปรับปรุงการบริการลูกค้า ลดเวลาในรอบการทำงาน และลดสินค้าคงคลัง
  • การจัดการห่วงโซ่อุปสงค์: ช่วยเพิ่มระดับการบริการลูกค้าและการขาย นอกจากนี้ยังช่วยให้บริษัทต่างๆ คาดการณ์ความต้องการสินค้าในร้านของตนได้อย่างแม่นยำ

ต่อไปในบทช่วยสอน Teradata สำหรับผู้เริ่มต้น เราจะเรียนรู้เกี่ยวกับความแตกต่างระหว่าง Teradata กับโปรแกรมอื่นๆ อาร์ดีบีเอ็มเอส.

ความแตกต่างระหว่าง Teradata และ RDBMS อื่น ๆ

พารามิเตอร์ ข้อมูลเทรา อาร์ดีบีเอ็มเอส
Archiเทคเจอร์ ติดตามไม่มีอะไรแชร์เลย Archiเทคเจอร์ แบ่งปันทุกอย่างและอนุญาตให้มีการโต้แย้งทรัพยากร
กระบวนการ MIPS [ล้านคำสั่ง/วินาที] KIPS [หลายพันสถาบัน/วินาที]
ดัชนี การกระจายและการสืบค้นที่ดีขึ้น เสนอการเรียกค้น FASI เท่านั้น
ความเท่าเทียม รองรับความเท่าเทียมที่ไม่มีเงื่อนไข ความเท่าเทียมนั้นมีเงื่อนไขและคาดเดาไม่ได้
โหลดจำนวนมาก Teradata ช่วยให้สามารถโหลดจำนวนมากได้ อนุญาตให้มีการโหลดจำนวนมากอย่างจำกัดเท่านั้น
scalability ความสามารถในการขยายเชิงเส้นโดยมีความชันเท่ากับ 1 ความสามารถในการปรับขนาดพร้อมกับผลตอบแทนที่ลดลง
บัฟเฟอร์ฐานข้อมูล บัฟเฟอร์ฐานข้อมูลเดียวที่ใช้โดย UoP ทั้งหมด (การรวมกันของการทำงานแบบคู่ขนาน) ที่เก็บข้อมูลเดียวที่เข้าถึงได้โดย UoP ทั้งหมด Query Controller จัดส่งฟังก์ชันไปยัง UoP ที่เป็นเจ้าของข้อมูล
ร้านค้า มันเก็บ TERA BYTES[Billไอออนของแถว] GIGA BYTES[ล้านแถว]

MPP กับ SMP

เอ็มพีพี SMP
MPP – การประมวลผลแบบขนานจำนวนมาก เป็นระบบคอมพิวเตอร์ที่เชื่อมต่อกับหน่วยเลขคณิตอิสระหรือไมโครโปรเซสเซอร์ทั้งหมดที่ทำงานแบบขนาน การประมวลผลหลายแบบสมมาตร ในระบบประมวลผล SMP CPU จะใช้หน่วยความจำเดียวกันร่วมกัน และผลที่ได้คือโค้ดที่ทำงานในระบบหนึ่งอาจส่งผลต่อหน่วยความจำที่ใช้โดยอีกระบบหนึ่ง
ฐานข้อมูลสามารถขยายได้โดยการเพิ่ม CPU ใหม่ โดยทั่วไปฐานข้อมูล SMP จะใช้ CPU หนึ่งตัวในการค้นหาฐานข้อมูล
ในสภาพแวดล้อม MPP ประสิทธิภาพได้รับการปรับปรุงเนื่องจากต้องใช้ทรัพยากรร่วมกันระหว่างคอมพิวเตอร์ที่มีอยู่จริง เวิร์กโหลดสำหรับงานแบบขนานจะถูกกระจายไปตามตัวประมวลผลในระบบ
ประสิทธิภาพของระบบประมวลผลแบบขนานขนาดใหญ่นั้นเป็นเส้นตรง แต่จะเพิ่มขึ้นตามสัดส่วนจำนวนโหนด ฐานข้อมูล SMP สามารถทำงานบนเซิร์ฟเวอร์หลายเครื่องได้ แต่จะแบ่งปันทรัพยากรอื่น

สรุป

  • Teradata ความหมาย: Teradata เป็นโอเพ่นซอร์ส ระบบจัดการฐานข้อมูล สำหรับการพัฒนาแอปพลิเคชันคลังข้อมูลขนาดใหญ่
  • Teradata เป็นแผนกหนึ่งของ NCR Corporation ก่อตั้งเมื่อปี พ.ศ. 1979 แต่แยกตัวออกจาก NCR ในเดือนตุลาคม พ.ศ. 2007
  • Teradata นำเสนอบริการเต็มรูปแบบซึ่งเน้นไปที่ Data Warehousing
  • Teradata นำเสนอความสามารถในการปรับขนาดเชิงเส้นเมื่อต้องรับมือกับข้อมูลปริมาณมากโดยการเพิ่มโหนดเพื่อเพิ่มประสิทธิภาพของระบบ
  • องค์ประกอบที่สำคัญสามประการของ Teradata คือ 1) Parsing Engine 2) MPP 3) ตัวประมวลผลโมดูลการเข้าถึง (AMP)
  • Teradata นำเสนอชุดผลิตภัณฑ์ครบวงจรเพื่อตอบสนองความต้องการด้านคลังข้อมูลและ ETL ขององค์กรต่างๆ
  • แอปพลิเคชัน Teradata ส่วนใหญ่ใช้สำหรับการจัดการห่วงโซ่อุปทาน การจัดการข้อมูลหลัก การจัดการห่วงโซ่อุปสงค์ ฯลฯ