Star Schema กับ Snowflake Schema - ความแตกต่างระหว่างพวกเขา
ความแตกต่างที่สำคัญระหว่าง Star Schema และ Snowflake Schema
- สคีมาแบบดาวเป็นสคีมาคลังข้อมูลประเภทที่ง่ายที่สุด เป็นที่รู้จักกันในนามสคีมาดาวเนื่องจากมีโครงสร้างคล้ายดาวฤกษ์
- เมื่อเปรียบเทียบ Snowflake กับ Star Schema แล้ว Snowflake Schema เป็นส่วนเสริมของ Star Schema และเพิ่มมิติเพิ่มเติม มันถูกเรียกว่าเกล็ดหิมะเพราะแผนภาพของมันคล้ายกับเกล็ดหิมะ
- ในสกีมาแบบดาว การรวมเพียงครั้งเดียวเท่านั้นที่จะกำหนดความสัมพันธ์ระหว่างตารางแฟคท์และตารางไดเมนชันใดๆ
- สคีมาแบบดาวประกอบด้วยตารางข้อเท็จจริงที่ล้อมรอบด้วยตารางมิติ
- สคีมาเกล็ดหิมะล้อมรอบด้วยตารางมิติซึ่งในทางกลับกันจะล้อมรอบด้วยตารางมิติ
- สคีมาเกล็ดหิมะจำเป็นต้องมีการรวมจำนวนมากเพื่อดึงข้อมูล
- เมื่อเปรียบเทียบรูปแบบ Star กับรูปแบบ Snowflake จะเห็นว่ารูปแบบ Start มีการออกแบบ DB ที่เรียบง่าย ในขณะที่รูปแบบ Snowflake มีการออกแบบ DB ที่ซับซ้อนมาก
สตาร์สคีมาคืออะไร?
สคีมาของดาว ในคลังข้อมูล ซึ่งตรงกลางดาวสามารถมีตารางข้อเท็จจริงได้หนึ่งตารางและตารางมิติที่เกี่ยวข้องหลายตาราง เป็นที่รู้จักกันในนามสคีมาดาวเนื่องจากมีโครงสร้างคล้ายดาวฤกษ์ โมเดลข้อมูล Star Schema เป็นประเภทที่ง่ายที่สุดของ Data Warehouse schema มีชื่อเรียกอีกอย่างว่า Star Join Schema และได้รับการปรับให้เหมาะสมสำหรับการสืบค้นชุดข้อมูลขนาดใหญ่
ในตัวอย่าง Star Schema ต่อไปนี้ ตารางข้อเท็จจริงจะอยู่ตรงกลางซึ่งประกอบด้วยคีย์ไปยังตารางมิติทุกอัน เช่น Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID และแอตทริบิวต์อื่นๆ เช่น Units sold และ Revenue
สคีมาเกล็ดหิมะคืออะไร?
สคีมาเกล็ดหิมะ ในคลังข้อมูลคือการจัดเรียงตรรกะของตารางในฐานข้อมูลหลายมิติเช่นนั้น แผนภาพเอ้อ มีลักษณะคล้ายเกล็ดหิมะ Snowflake Schema เป็นส่วนขยายของ Star Schema และเพิ่มมิติเพิ่มเติม ตารางมิติข้อมูลได้รับการทำให้เป็นมาตรฐานซึ่งจะแบ่งข้อมูลออกเป็นตารางเพิ่มเติม
ในตัวอย่าง Snowflake Schema ต่อไปนี้ ประเทศจะได้รับการทำให้เป็นมาตรฐานเพิ่มเติมในตารางส่วนบุคคล
ความแตกต่างระหว่าง Star Schema และ Snowflake Schema
ต่อไปนี้เป็นความแตกต่างที่สำคัญระหว่างรูปแบบ Snowflake กับรูปแบบ Star:
สคีมาของดาว | สคีมาเกล็ดหิมะ |
---|---|
ลำดับชั้นของมิติจะถูกเก็บไว้ในตารางมิติ | ลำดับชั้นจะถูกแบ่งออกเป็นตารางแยกกัน |
ประกอบด้วยตารางข้อเท็จจริงที่ล้อมรอบด้วยตารางมิติ | ตารางข้อเท็จจริงหนึ่งตารางล้อมรอบด้วยตารางมิติซึ่งในทางกลับกันจะล้อมรอบด้วยตารางมิติ |
ในสกีมาแบบดาว การรวมเพียงครั้งเดียวเท่านั้นที่สร้างความสัมพันธ์ระหว่างตารางแฟคท์และตารางไดเมนชันใดๆ | สคีมาเกล็ดหิมะจำเป็นต้องมีการรวมจำนวนมากเพื่อดึงข้อมูล |
การออกแบบฐานข้อมูลอย่างง่าย | การออกแบบฐานข้อมูลที่ซับซ้อนมาก |
โครงสร้างข้อมูลและการสืบค้นแบบ Denormalized ยังทำงานเร็วขึ้นอีกด้วย | โครงสร้างข้อมูลที่ทำให้เป็นมาตรฐาน |
ความซ้ำซ้อนของข้อมูลในระดับสูง | ความซ้ำซ้อนของข้อมูลระดับต่ำมาก |
ตารางมิติเดียวประกอบด้วยข้อมูลที่รวบรวม | ข้อมูลแบ่งออกเป็นตารางมิติต่างๆ |
การประมวลผลคิวบ์เร็วขึ้น | การประมวลผลลูกบาศก์อาจจะช้าเนื่องจากการรวมที่ซับซ้อน |
เสนอการสืบค้นที่มีประสิทธิภาพสูงกว่าโดยใช้ Star Join Query Optimization ตารางอาจเชื่อมต่อกับหลายมิติ |
สคีมา Snowflake แสดงด้วยตารางข้อเท็จจริงแบบรวมศูนย์ซึ่งไม่น่าจะเชื่อมโยงกับหลายมิติ |