Snowflake Schema ในโมเดลคลังข้อมูล

สคีมาเกล็ดหิมะคืออะไร?

สคีมาเกล็ดหิมะ ในคลังข้อมูลคือการจัดเรียงตรรกะของตารางในฐานข้อมูลหลายมิติเช่นนั้น แผนภาพเอ้อ มีลักษณะคล้ายเกล็ดหิมะ Snowflake Schema เป็นส่วนขยายของ Star Schema และเพิ่มมิติเพิ่มเติม ตารางมิติข้อมูลได้รับการทำให้เป็นมาตรฐานซึ่งจะแบ่งข้อมูลออกเป็นตารางเพิ่มเติม

ตัวอย่างสคีมาเกล็ดหิมะ

ในตัวอย่าง Snowflake Schema ต่อไปนี้ ประเทศจะได้รับการทำให้เป็นมาตรฐานเพิ่มเติมในตารางส่วนบุคคล

สคีมาเกล็ดหิมะ
ตัวอย่างของสคีมาเกล็ดหิมะ

ลักษณะของสคีมาเกล็ดหิมะ

  • ประโยชน์หลักของสคีมาเกล็ดหิมะคือใช้พื้นที่ดิสก์น้อยลง
  • เพิ่มมิติที่ง่ายต่อการใช้งานลงใน Schema
  • เนื่องจากประสิทธิภาพการสืบค้นหลายตารางลดลง
  • ความท้าทายหลักที่คุณจะต้องเผชิญขณะใช้ Snowflake Schema คือคุณต้องดำเนินการบำรุงรักษามากขึ้นเนื่องจากมีตารางการค้นหาที่มากขึ้น

ข้อได้เปรียบของสคีมาเกล็ดหิมะ

  • ข้อได้เปรียบหลักของสคีมา Snowflake คือความสามารถในการลดความต้องการพื้นที่จัดเก็บดิสก์และรวมตารางการค้นหาที่มีขนาดเล็กลง ซึ่งช่วยปรับปรุงประสิทธิภาพการสืบค้น
  • ให้ความสามารถในการปรับขนาดที่มากขึ้นในความสัมพันธ์ระหว่างส่วนประกอบและระดับมิติ
  • ไม่มีความซ้ำซ้อน ดังนั้นจึงง่ายต่อการบำรุงรักษา

ข้อเสียของ Snowflake Schema

  • ข้อเสียที่สำคัญของสคีมาเกล็ดหิมะคือต้องมีการบำรุงรักษาเพิ่มขึ้น
  • คำถามที่ซับซ้อนเป็นเรื่องที่ท้าทายต่อการเข้าใจ
  • จำนวนตารางที่มากขึ้นหมายถึงการรวมที่มากขึ้น ดังนั้นเวลาในการดำเนินการคิวรีจึงนานขึ้น

กาแล็กซีสคีมาคืออะไร?

A สคีมาของกาแล็กซี ประกอบด้วยตารางข้อเท็จจริงสองตารางที่แบ่งปันตารางมิติระหว่างกัน เรียกอีกอย่างว่า Fact Constellation Schema โดยที่ Schema นี้ถูกมองว่าเป็นกลุ่มดาว ดังนั้นจึงเรียกว่า Galaxy Schema

สคีมาของกาแล็กซี
ตัวอย่างของ Galaxy Schema

ดังที่คุณเห็นในตัวอย่างข้างต้น มีตารางข้อเท็จจริงสองตาราง

  1. Revเข้าแล้ว
  2. สินค้า

ในมิติของการแบ่งปันรูปแบบ Galaxy เรียกว่ามิติที่สอดคล้องกัน

ลักษณะของ Galaxy Schema

  • มิติในสคีมานี้จะถูกแยกออกเป็นมิติที่แยกจากกันตามลำดับชั้นต่างๆ
  • ตัวอย่างเช่น หากภูมิศาสตร์มีลำดับชั้นสี่ระดับ เช่น ภูมิภาค ประเทศ รัฐ และเมือง สคีมา Galaxy ควรมีสี่มิติ
  • ยิ่งไปกว่านั้น คุณสามารถสร้างสคีมาประเภทนี้ได้โดยการแบ่งสคีมาหนึ่งดาวออกเป็นสคีมาแบบดาวเพิ่มเติม
  • มิติข้อมูลมีขนาดใหญ่ในสคีมานี้ซึ่งจำเป็นในการสร้างตามระดับของลำดับชั้น
  • สคีมานี้มีประโยชน์สำหรับการรวมตารางข้อเท็จจริงเพื่อความเข้าใจที่ดีขึ้น

สตาร์คืออะไร Cluster สคีมา?

โครงร่าง Snowflake ประกอบด้วยลำดับชั้นที่ขยายออกอย่างสมบูรณ์ อย่างไรก็ตาม การทำเช่นนี้อาจเพิ่มความซับซ้อนให้กับโครงร่างและต้องมีการเชื่อมโยงเพิ่มเติม ในทางกลับกัน สคีมาดาว มีลำดับชั้นที่ยุบตัวลงอย่างสมบูรณ์ ซึ่งอาจนำไปสู่ความซ้ำซ้อน ดังนั้น วิธีแก้ปัญหาที่ดีที่สุดอาจเป็นการสร้างสมดุลระหว่างโครงร่างทั้งสองนี้ ซึ่งก็คือ Star Cluster การออกแบบสคีมา

ดาว Cluster schema
ตัวอย่างของสตาร์ Cluster schema

มิติที่ทับซ้อนกันสามารถพบได้ในรูปของฟอร์กในลำดับชั้น ฟอร์กเกิดขึ้นเมื่อเอนทิตีทำหน้าที่เป็นผู้ปกครองในลำดับชั้นมิติที่แตกต่างกันสองมิติ จากนั้นเอนทิตีฟอร์กจะถูกระบุว่าเป็นการจำแนกประเภทที่มีความสัมพันธ์แบบหนึ่งต่อหลาย