Star Schema ในการสร้างแบบจำลอง Data Warehouse คืออะไร

สตาร์สคีมาคืออะไร?

สคีมาของดาว ในคลังข้อมูลคือสคีมาซึ่งศูนย์กลางของดวงดาวสามารถมีตารางข้อเท็จจริงหนึ่งตารางและตารางมิติที่เกี่ยวข้องจำนวนหนึ่งได้ เป็นที่รู้จักกันในนามสคีมาดาวเนื่องจากมีโครงสร้างคล้ายดาวฤกษ์ โมเดลข้อมูล Star Schema เป็นประเภทที่ง่ายที่สุดของ Data Warehouse schema มีชื่อเรียกอีกอย่างว่า Star Join Schema และได้รับการปรับให้เหมาะสมสำหรับการสืบค้นชุดข้อมูลขนาดใหญ่

สคีมาหลายมิติคืออะไร?

สคีมาหลายมิติ ได้รับการออกแบบมาโดยเฉพาะเพื่อสร้างแบบจำลองระบบคลังข้อมูล สคีมาได้รับการออกแบบมาเพื่อตอบสนองความต้องการเฉพาะของฐานข้อมูลขนาดใหญ่มากที่ออกแบบมาเพื่อวัตถุประสงค์ในการวิเคราะห์ (สพป).

ประเภทของสคีมาคลังข้อมูล:

ต่อไปนี้เป็นประเภทหลักของรูปแบบหลายมิติ 3 ประเภท ซึ่งแต่ละประเภทมีข้อดีเฉพาะตัว

ตัวอย่างการสร้างแบบจำลองข้อมูล Star Schema

ในตัวอย่าง Star Schema ต่อไปนี้ ตารางข้อเท็จจริงจะอยู่ตรงกลางซึ่งประกอบด้วยคีย์ไปยังตารางมิติทุกอัน เช่น Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID และแอตทริบิวต์อื่นๆ เช่น Units sold และ Revenue

การสร้างแบบจำลองข้อมูลสคีมาดาว
ตัวอย่างแผนภาพสตาร์สคีมา

ตารางข้อเท็จจริง

ตารางข้อเท็จจริงในสคีมาแบบดาวประกอบด้วยข้อเท็จจริงและเชื่อมต่อกับมิติ ตารางข้อเท็จจริงมีคอลัมน์สองประเภท:

  • คอลัมน์ที่มีข้อเท็จจริง
  • ตารางมิติคีย์ต่างประเทศ

โดยทั่วไป คีย์หลักของตารางข้อเท็จจริงคือคีย์ผสมที่ประกอบด้วยคีย์ต่างประเทศทั้งหมดที่ประกอบเป็นตาราง

ตารางข้อเท็จจริงสามารถมีข้อเท็จจริงระดับรายละเอียดหรือข้อเท็จจริงแบบรวมได้ ตารางข้อเท็จจริงที่มีข้อเท็จจริงแบบรวมมักเรียกว่าตารางสรุป ตารางข้อเท็จจริงมักจะมีข้อเท็จจริงที่รวบรวมมาในระดับหนึ่งแล้ว

ตารางมิติ

มิติคือสถาปัตยกรรมที่จัดหมวดหมู่ข้อมูลในลำดับชั้น มิติที่ไม่มีลำดับชั้นและระดับเรียกว่ามิติแบบแบนหรือรายการ คีย์หลักของตารางมิติแต่ละตารางเป็นส่วนหนึ่งของคีย์หลักแบบผสมของตารางข้อเท็จจริง แอตทริบิวต์มิติคือแอตทริบิวต์เชิงบรรยายที่เป็นข้อความซึ่งช่วยอธิบายค่ามิติ ตารางข้อเท็จจริงมักจะมีขนาดใหญ่กว่าตารางมิติ

ลักษณะของสคีมาดาว

  • ทุกมิติในสคีมาแบบดาวจะแสดงด้วยตารางมิติเดียวเท่านั้น
  • ตารางมิติควรมีชุดของแอตทริบิวต์
  • ตารางมิติถูกรวมเข้ากับตารางข้อเท็จจริงโดยใช้คีย์นอก
  • ตารางมิติไม่ได้เชื่อมต่อถึงกัน
  • ตารางข้อเท็จจริงจะมีคีย์และหน่วยวัด
  • สคีมา Star นั้นเข้าใจง่ายและให้การใช้งานดิสก์ที่เหมาะสมที่สุด
  • ตารางมิติไม่ได้ถูกทำให้เป็นมาตรฐาน ตัวอย่างเช่น ในรูปด้านบน Country_ID ไม่มีตารางการค้นหาประเทศเหมือนกับการออกแบบ OLTP
  • BI Tools รองรับสคีมาอย่างกว้างขวาง

ข้อดีของสตาร์สคีมา

  • สคีมาแบบดาวมีตรรกะการรวมที่ตรงไปตรงมามากกว่าเมื่อเปรียบเทียบกับสคีมาอื่นๆ สำหรับการดึงข้อมูลจากสคีมาธุรกรรมที่มีการปรับมาตรฐานสูง
  • ตรงกันข้ามกับสกีมาธุรกรรมที่เป็นมาตรฐานสูง สคีมาแบบดาวช่วยลดความซับซ้อนของตรรกะการรายงานทางธุรกิจทั่วไป เช่น การรายงานและช่วงต่อระยะเวลา
  • สตาร์สคีมาถูกใช้อย่างกว้างขวางโดยระบบ OLAP เพื่อออกแบบคิวบ์อย่างมีประสิทธิภาพ สตาร์สกีมาสามารถใช้เป็นแหล่งข้อมูลได้โดยไม่ต้องออกแบบโครงสร้างคิวบ์ในระบบ OLAP หลักๆ ส่วนใหญ่
  • ด้วยการเปิดใช้งานแผนประสิทธิภาพเฉพาะที่สามารถนำไปใช้กับแบบสอบถาม ซอฟต์แวร์ตัวประมวลผลแบบสอบถามใน Star Schema สามารถเสนอแผนการดำเนินการที่ดีกว่าได้

ข้อเสียของสตาร์สคีมา

  • เนื่องจากสคีมาถูกทำให้เป็นมาตรฐานอย่างมาก ความสมบูรณ์ของข้อมูลจึงไม่ถูกบังคับใช้อย่างดี
  • ไม่ยืดหยุ่นในแง่ของความต้องการด้านการวิเคราะห์
  • สคีมาแบบดาวไม่ได้เสริมสร้างความสัมพันธ์แบบกลุ่มต่อกลุ่มภายในองค์กรธุรกิจ