โอแลปคืออะไร? คิวบ์ วิเคราะห์ Operaต่างๆ ในคลังข้อมูล
OLAP คืออะไร?
การประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) เป็นซอฟต์แวร์ประเภทหนึ่งที่ให้ผู้ใช้สามารถวิเคราะห์ข้อมูลจากระบบฐานข้อมูลหลายระบบพร้อมกันได้ เป็นเทคโนโลยีที่ช่วยให้นักวิเคราะห์สามารถดึงและดูข้อมูลธุรกิจจากมุมมองที่ต่างกันได้
นักวิเคราะห์มักต้องจัดกลุ่ม รวบรวม และรวมข้อมูลเข้าด้วยกัน การดำเนินการ OLAP ในการขุดข้อมูลนั้นต้องใช้ทรัพยากรจำนวนมาก ด้วย OLAP ข้อมูลสามารถคำนวณล่วงหน้าและรวมไว้ล่วงหน้าได้ ทำให้วิเคราะห์ได้เร็วขึ้น
ฐานข้อมูล OLAP แบ่งออกเป็นลูกบาศก์หนึ่งลูกขึ้นไป ลูกบาศก์ได้รับการออกแบบมาเพื่อให้การสร้างและการดูรายงานเป็นเรื่องง่าย OLAP ย่อมาจาก Online Analytical Processing
OLAP ลูกบาศก์

หัวใจหลักของแนวคิด OLAP คือ OLAP Cube OLAP cube เป็นโครงสร้างข้อมูลที่ปรับให้เหมาะสมเพื่อความรวดเร็วมาก การวิเคราะห์ข้อมูล.
OLAP Cube ประกอบด้วยข้อเท็จจริงที่เป็นตัวเลขที่เรียกว่าหน่วยวัด ซึ่งแบ่งประเภทตามมิติ OLAP Cube มีชื่อเรียกอีกอย่างว่า ไฮเปอร์คิวบ์.
โดยทั่วไป การดำเนินการและวิเคราะห์ข้อมูลจะดำเนินการโดยใช้สเปรดชีตแบบง่าย ซึ่งค่าข้อมูลจะถูกจัดเรียงในรูปแบบแถวและคอลัมน์ ซึ่งเหมาะสำหรับข้อมูลสองมิติ อย่างไรก็ตาม OLAP มีข้อมูลหลายมิติ โดยข้อมูลมักจะได้มาจากแหล่งที่แตกต่างกันและไม่เกี่ยวข้อง การใช้สเปรดชีตไม่ใช่ตัวเลือกที่ดีที่สุด ลูกบาศก์สามารถจัดเก็บและวิเคราะห์ข้อมูลหลายมิติในลักษณะที่เป็นตรรกะและเป็นระเบียบ
มันทำงานอย่างไร?
คลังข้อมูลจะดึงข้อมูลจากแหล่งข้อมูลและรูปแบบต่างๆ เช่น ไฟล์ข้อความ แผ่นงาน Excel ไฟล์มัลติมีเดีย เป็นต้น
ข้อมูลที่แยกออกมาจะถูกล้างและแปลง ข้อมูลจะถูกโหลดลงในเซิร์ฟเวอร์ OLAP (หรือคิวบ์ OLAP) ซึ่งมีการคำนวณข้อมูลล่วงหน้าล่วงหน้าเพื่อการวิเคราะห์เพิ่มเติม
การดำเนินการวิเคราะห์พื้นฐานของ OLAP
การดำเนินการวิเคราะห์ OLAP มี 4 ประเภท ได้แก่:
- ม้วน
- เจาะลงไป
- ฝานและลูกเต๋า
- หมุน (หมุน)
1) โรลอัพ:
Rollup เรียกอีกอย่างว่า “การรวม” หรือ “การรวมกลุ่ม” การดำเนินการ Rollup สามารถดำเนินการได้ 2 วิธี
- การลดขนาด
- ไต่ระดับลำดับชั้นของแนวคิด ลำดับชั้นของแนวคิดคือระบบการจัดกลุ่มสิ่งต่าง ๆ ตามลำดับหรือระดับ
ลองพิจารณาแผนภาพต่อไปนี้
- ในตัวอย่างนี้ เมืองต่างๆ ในนิวเจอร์ซีย์ และเมือง Lost Angles และรวมตัวกันเป็นประเทศสหรัฐอเมริกา
- ตัวเลขยอดขายของรัฐนิวเจอร์ซีย์และลอสแองเจลิสอยู่ที่ 440 และ 1560 ตามลำดับ พวกเขากลายเป็นปี 2000 หลังจากสะสม
- ในกระบวนการรวมข้อมูลนี้ ข้อมูลคือลำดับชั้นของสถานที่จะเลื่อนขึ้นจากเมืองหนึ่งไปยังอีกประเทศหนึ่ง
- ในกระบวนการรวมจะต้องมีการลบมิติข้อมูลอย่างน้อยหนึ่งรายการขึ้นไป ในตัวอย่างนี้ มิติเมืองจะถูกลบออก
2) เจาะลึก
ในการเจาะลึกข้อมูลจะถูกแยกส่วนออกเป็นส่วนเล็กๆ มันตรงกันข้ามกับกระบวนการรวบรวม สามารถทำได้ผ่านทาง
- เลื่อนลำดับชั้นแนวคิดลง
- การเพิ่มมิติ
พิจารณาแผนภาพด้านบน
- ไตรมาสที่ 1 จะเจาะลึกลงไปเป็นเดือนมกราคม กุมภาพันธ์ และมีนาคม การขายที่สอดคล้องกันก็มีการลงทะเบียนด้วย
- ในตัวอย่างนี้ เดือนของมิติจะถูกเพิ่ม
3) ชิ้น:
ที่นี่ มีการเลือกมิติหนึ่ง และสร้างคิวบ์ย่อยใหม่
แผนภาพต่อไปนี้อธิบายวิธีการทำงานของการดำเนินการสไลซ์:
- เวลาของมิติข้อมูลจะถูกแบ่งส่วนโดยมี Q1 เป็นตัวกรอง
- คิวบ์ใหม่ถูกสร้างขึ้นพร้อมกัน
มันบอกว่า:
การดำเนินการนี้จะคล้ายกับการใช้สไลซ์ ความแตกต่างระหว่างลูกเต๋าคือคุณต้องเลือกมิติ 2 มิติขึ้นไปเพื่อสร้างลูกบาศก์ย่อย
4) เดือย
ใน Pivot คุณจะหมุนแกนข้อมูลเพื่อนำเสนอข้อมูลแทน
ในตัวอย่างต่อไปนี้ จุดหมุนจะขึ้นอยู่กับประเภทรายการ
ประเภทของระบบ OLAP
โครงสร้างลำดับชั้นของ OLAP
ประเภทของ OLAP | คำอธิบาย |
---|---|
OLAP เชิงสัมพันธ์ (ROLAP): | ROLAP เป็น RDBMS ที่ขยายพร้อมกับการแมปข้อมูลหลายมิติเพื่อดำเนินการเชิงสัมพันธ์มาตรฐาน |
OLAP หลายมิติ (MOLAP) | MOLAP นำการดำเนินงานไปใช้กับข้อมูลหลายมิติ |
การประมวลผลเชิงวิเคราะห์ออนไลน์แบบไฮบริด (HOLAP) | ในแนวทาง HOLAP ผลรวมที่รวบรวมไว้จะถูกจัดเก็บไว้ในฐานข้อมูลหลายมิติ ในขณะที่ข้อมูลโดยละเอียดจะถูกจัดเก็บไว้ในฐานข้อมูลเชิงสัมพันธ์ ซึ่งมีทั้งประสิทธิภาพข้อมูลของโมเดล ROLAP และประสิทธิภาพของโมเดล MOLAP |
เดสก์ท็อป OLAP (DOLAP) | ใน Desktop OLAP ผู้ใช้จะดาวน์โหลดส่วนหนึ่งของข้อมูลจากฐานข้อมูลภายในเครื่องหรือบนเดสก์ท็อปแล้ววิเคราะห์
การใช้งาน DOLAP มีค่าใช้จ่ายถูกกว่าเมื่อเปรียบเทียบกับระบบ OLAP อื่นๆ เนื่องจากมีฟังก์ชันต่างๆ ไม่มากนัก |
เว็บ OLAP (WOLAP) | Web OLAP ซึ่งเป็นระบบ OLAP ที่สามารถเข้าถึงได้ผ่านเว็บเบราว์เซอร์ WOLAP เป็นสถาปัตยกรรมแบบสามชั้น ประกอบด้วยสามส่วนประกอบ ได้แก่ ไคลเอ็นต์ มิดเดิลแวร์ และเซิร์ฟเวอร์ฐานข้อมูล |
OLAP มือถือ: | Mobile OLAP ช่วยให้ผู้ใช้เข้าถึงและวิเคราะห์ข้อมูล OLAP โดยใช้อุปกรณ์มือถือของตน |
OLAP เชิงพื้นที่ : | SOLAP ถูกสร้างขึ้นเพื่ออำนวยความสะดวกในการจัดการข้อมูลทั้งเชิงพื้นที่และไม่ใช่เชิงพื้นที่ในระบบสารสนเทศภูมิศาสตร์ (GIS) |
โรแลป
ROLAP ทำงานกับข้อมูลที่มีอยู่ในฐานข้อมูลเชิงสัมพันธ์ ตารางข้อเท็จจริงและมิติจะถูกจัดเก็บเป็นตารางเชิงสัมพันธ์ นอกจากนี้ยังช่วยให้วิเคราะห์ข้อมูลหลายมิติได้ และเป็น OLAP ที่เติบโตเร็วที่สุด
ข้อดีของรุ่น ROLAP:
- ประสิทธิภาพของข้อมูลสูง ให้ประสิทธิภาพข้อมูลสูงเนื่องจากประสิทธิภาพการสืบค้นและภาษาในการเข้าถึงได้รับการปรับให้เหมาะสมโดยเฉพาะสำหรับการวิเคราะห์ข้อมูลหลายมิติ
- scalability ระบบ OLAP ประเภทนี้นำเสนอความสามารถในการปรับขนาดสำหรับการจัดการข้อมูลปริมาณมาก และแม้ว่าข้อมูลจะเพิ่มขึ้นอย่างต่อเนื่องก็ตาม
ข้อเสียของโมเดล ROLAP:
- ความต้องการทรัพยากรที่สูงขึ้น: ROLAP ต้องการการใช้กำลังคน ซอฟต์แวร์ และทรัพยากรฮาร์ดแวร์ในระดับสูง
- ข้อจำกัดของข้อมูลโดยรวม การใช้เครื่องมือ ROLAP SQL สำหรับการคำนวณข้อมูลรวมทั้งหมด อย่างไรก็ตาม ไม่มีขีดจำกัดในการจัดการกับการคำนวณ
- ประสิทธิภาพการสืบค้นช้า ประสิทธิภาพการค้นหาในโมเดลนี้ช้าเมื่อเปรียบเทียบกับ MOLAP
โมแลป
MOLAP ใช้เครื่องมือจัดเก็บข้อมูลหลายมิติแบบอาร์เรย์เพื่อแสดงมุมมองข้อมูลหลายมิติ โดยพื้นฐานแล้ว พวกเขาใช้คิวบ์ OLAP
เรียนรู้เพิ่มเติมเกี่ยวกับ MOLAP Good Farm Animal Welfare Awards
ไฮบริด OLAP
Hybrid OLAP เป็นส่วนผสมของทั้ง ROLAP และ MOLAP ให้การคำนวณ MOLAP ที่รวดเร็วและความสามารถในการปรับขนาดที่สูงขึ้นของ ROLAP HOLAP ใช้สองฐานข้อมูล
- ข้อมูลที่รวบรวมหรือคำนวณจะถูกจัดเก็บไว้ในคิวบ์ OLAP หลายมิติ
- ข้อมูลรายละเอียดจะถูกเก็บไว้ในฐานข้อมูลเชิงสัมพันธ์
ประโยชน์ของ OLAP แบบไฮบริด:
- OLAP ประเภทนี้ช่วยประหยัดพื้นที่ดิสก์ และยังมีขนาดกะทัดรัด ซึ่งช่วยหลีกเลี่ยงปัญหาที่เกี่ยวข้องกับความเร็วและความสะดวกในการเข้าถึง
- Hybrid HOLAP ใช้เทคโนโลยีคิวบ์ซึ่งช่วยให้ทำงานได้เร็วขึ้นสำหรับข้อมูลทุกประเภท
- ROLAP ได้รับการอัปเดตทันที และผู้ใช้ HOLAP สามารถเข้าถึงข้อมูลที่อัปเดตแบบเรียลไทม์ได้ทันที MOLAP นำการล้างข้อมูลและการแปลงข้อมูลมาใช้ ซึ่งจะช่วยปรับปรุงความเกี่ยวข้องของข้อมูล สิ่งนี้นำมาซึ่งสิ่งที่ดีที่สุดของทั้งสองโลก
ข้อเสียของ OLAP แบบไฮบริด:
- ระดับความซับซ้อนที่เพิ่มมากขึ้น: ข้อเสียเปรียบที่สำคัญในระบบ HOLAP คือรองรับทั้งเครื่องมือและแอปพลิเคชัน ROLAP และ MOLAP ดังนั้นจึงมีความซับซ้อนมาก
- การทับซ้อนกันที่อาจเกิดขึ้น: มีโอกาสสูงที่จะทับซ้อนกันโดยเฉพาะในฟังก์ชันการทำงาน
ข้อดีของ OLAP
- OLAP เป็นแพลตฟอร์มสำหรับธุรกิจทุกประเภท รวมถึงการวางแผน การจัดทำงบประมาณ การรายงาน และการวิเคราะห์
- ข้อมูลและการคำนวณมีความสอดคล้องกันในคิวบ์ OLAP นี่คือผลประโยชน์ที่สำคัญ
- สร้างและวิเคราะห์สถานการณ์ "จะเป็นอย่างไร" อย่างรวดเร็ว
- ค้นหาฐานข้อมูล OLAP ได้อย่างง่ายดายเพื่อหาคำกว้างๆ หรือเฉพาะเจาะจง
- OLAP จัดเตรียมองค์ประกอบพื้นฐานสำหรับเครื่องมือการสร้างแบบจำลองธุรกิจ เครื่องมือการทำเหมืองข้อมูล เครื่องมือการรายงานประสิทธิภาพ
- อนุญาตให้ผู้ใช้ทำข้อมูลลูกบาศก์ชิ้นและลูกเต๋าทั้งหมดตามมิติ การวัด และตัวกรองต่างๆ
- เหมาะสำหรับการวิเคราะห์อนุกรมเวลา
- การค้นหาคลัสเตอร์และค่าที่ผิดปกติเป็นเรื่องง่ายด้วย OLAP
- เป็นระบบกระบวนการวิเคราะห์ออนไลน์การแสดงภาพที่ทรงพลังซึ่งให้เวลาตอบสนองที่รวดเร็วยิ่งขึ้น
ข้อเสียของ OLAP
- OLAP ต้องการการจัดระเบียบข้อมูลให้เป็นสคีมาแบบดาวหรือเกล็ดหิมะ สคีมาเหล่านี้มีความซับซ้อนในการนำไปใช้และบริหารจัดการ
- คุณไม่สามารถมีมิติจำนวนมากใน OLAP cube เดียวได้
- ข้อมูลธุรกรรมไม่สามารถเข้าถึงได้ด้วยระบบ OLAP
- การแก้ไขใดๆ ในคิวบ์ OLAP จำเป็นต้องได้รับการอัปเดตเต็มรูปแบบของคิวบ์ นี่เป็นกระบวนการที่ใช้เวลานาน
สรุป
- โอลาป อิน คลังข้อมูล เป็นเทคโนโลยีที่ช่วยให้นักวิเคราะห์สามารถดึงและดูข้อมูลธุรกิจจากมุมมองที่แตกต่างกัน
- หัวใจหลักของแนวคิด OLAP คือ OLAP Cube
- แอปพลิเคชันธุรกิจต่างๆ และการดำเนินการข้อมูลอื่นๆ ต้องใช้ OLAP Cube
- มีการดำเนินการวิเคราะห์ OLAP หลัก 1 ประเภทในคลังข้อมูล: 2) การสรุป 3) การเจาะลึก 4) การแบ่ง 5) ลูกเต๋า และ XNUMX) แกนหลัก
- ระบบ OLAP ที่ใช้กันอย่างแพร่หลายสามประเภท ได้แก่ MOLAP, ROLAP และ Hybrid OLAP
- Desktop OLAP, Web OLAP และ Mobile OLAP คือระบบ OLAP ประเภทอื่นๆ