โอแลปคืออะไร? คิวบ์ วิเคราะห์ Operaต่างๆ ในคลังข้อมูล

OLAP คืออะไร?

การประมวลผลเชิงวิเคราะห์ออนไลน์ (OLAP) เป็นซอฟต์แวร์ประเภทหนึ่งที่ให้ผู้ใช้สามารถวิเคราะห์ข้อมูลจากระบบฐานข้อมูลหลายระบบพร้อมกันได้ เป็นเทคโนโลยีที่ช่วยให้นักวิเคราะห์สามารถดึงและดูข้อมูลธุรกิจจากมุมมองที่ต่างกันได้

นักวิเคราะห์มักต้องจัดกลุ่ม รวบรวม และรวมข้อมูลเข้าด้วยกัน การดำเนินการ OLAP ในการขุดข้อมูลนั้นต้องใช้ทรัพยากรจำนวนมาก ด้วย OLAP ข้อมูลสามารถคำนวณล่วงหน้าและรวมไว้ล่วงหน้าได้ ทำให้วิเคราะห์ได้เร็วขึ้น

ฐานข้อมูล OLAP แบ่งออกเป็นลูกบาศก์หนึ่งลูกขึ้นไป ลูกบาศก์ได้รับการออกแบบมาเพื่อให้การสร้างและการดูรายงานเป็นเรื่องง่าย OLAP ย่อมาจาก Online Analytical Processing

OLAP ลูกบาศก์

โอแล็ป คิวบ์
โอแล็ป คิวบ์

หัวใจหลักของแนวคิด OLAP คือ OLAP Cube OLAP cube เป็นโครงสร้างข้อมูลที่ปรับให้เหมาะสมเพื่อความรวดเร็วมาก การวิเคราะห์ข้อมูล.

OLAP Cube ประกอบด้วยข้อเท็จจริงที่เป็นตัวเลขที่เรียกว่าหน่วยวัด ซึ่งแบ่งประเภทตามมิติ OLAP Cube มีชื่อเรียกอีกอย่างว่า ไฮเปอร์คิวบ์.

โดยทั่วไป การดำเนินการและวิเคราะห์ข้อมูลจะดำเนินการโดยใช้สเปรดชีตแบบง่าย ซึ่งค่าข้อมูลจะถูกจัดเรียงในรูปแบบแถวและคอลัมน์ ซึ่งเหมาะสำหรับข้อมูลสองมิติ อย่างไรก็ตาม OLAP มีข้อมูลหลายมิติ โดยข้อมูลมักจะได้มาจากแหล่งที่แตกต่างกันและไม่เกี่ยวข้อง การใช้สเปรดชีตไม่ใช่ตัวเลือกที่ดีที่สุด ลูกบาศก์สามารถจัดเก็บและวิเคราะห์ข้อมูลหลายมิติในลักษณะที่เป็นตรรกะและเป็นระเบียบ

มันทำงานอย่างไร?

คลังข้อมูลจะดึงข้อมูลจากแหล่งข้อมูลและรูปแบบต่างๆ เช่น ไฟล์ข้อความ แผ่นงาน Excel ไฟล์มัลติมีเดีย เป็นต้น

ข้อมูลที่แยกออกมาจะถูกล้างและแปลง ข้อมูลจะถูกโหลดลงในเซิร์ฟเวอร์ OLAP (หรือคิวบ์ OLAP) ซึ่งมีการคำนวณข้อมูลล่วงหน้าล่วงหน้าเพื่อการวิเคราะห์เพิ่มเติม

การดำเนินการวิเคราะห์พื้นฐานของ OLAP

การดำเนินการวิเคราะห์ OLAP มี 4 ประเภท ได้แก่:

  1. ม้วน
  2. เจาะลงไป
  3. ฝานและลูกเต๋า
  4. หมุน (หมุน)

1) โรลอัพ:

Rollup เรียกอีกอย่างว่า “การรวม” หรือ “การรวมกลุ่ม” การดำเนินการ Rollup สามารถดำเนินการได้ 2 วิธี

  1. การลดขนาด
  2. ไต่ระดับลำดับชั้นของแนวคิด ลำดับชั้นของแนวคิดคือระบบการจัดกลุ่มสิ่งต่าง ๆ ตามลำดับหรือระดับ

ลองพิจารณาแผนภาพต่อไปนี้

การดำเนินการ Rollup ใน OLAP
การดำเนินการ Rollup ใน OLAP
  • ในตัวอย่างนี้ เมืองต่างๆ ในนิวเจอร์ซีย์ และเมือง Lost Angles และรวมตัวกันเป็นประเทศสหรัฐอเมริกา
  • ตัวเลขยอดขายของรัฐนิวเจอร์ซีย์และลอสแองเจลิสอยู่ที่ 440 และ 1560 ตามลำดับ พวกเขากลายเป็นปี 2000 หลังจากสะสม
  • ในกระบวนการรวมข้อมูลนี้ ข้อมูลคือลำดับชั้นของสถานที่จะเลื่อนขึ้นจากเมืองหนึ่งไปยังอีกประเทศหนึ่ง
  • ในกระบวนการรวมจะต้องมีการลบมิติข้อมูลอย่างน้อยหนึ่งรายการขึ้นไป ในตัวอย่างนี้ มิติเมืองจะถูกลบออก

2) เจาะลึก

ในการเจาะลึกข้อมูลจะถูกแยกส่วนออกเป็นส่วนเล็กๆ มันตรงกันข้ามกับกระบวนการรวบรวม สามารถทำได้ผ่านทาง

  • เลื่อนลำดับชั้นแนวคิดลง
  • การเพิ่มมิติ
การดำเนินการเจาะลึกใน OLAP
การดำเนินการเจาะลึกใน OLAP

พิจารณาแผนภาพด้านบน

  • ไตรมาสที่ 1 จะเจาะลึกลงไปเป็นเดือนมกราคม กุมภาพันธ์ และมีนาคม การขายที่สอดคล้องกันก็มีการลงทะเบียนด้วย
  • ในตัวอย่างนี้ เดือนของมิติจะถูกเพิ่ม

3) ชิ้น:

ที่นี่ มีการเลือกมิติหนึ่ง และสร้างคิวบ์ย่อยใหม่

แผนภาพต่อไปนี้อธิบายวิธีการทำงานของการดำเนินการสไลซ์:

การดำเนินการสไลซ์ใน OLAP
การดำเนินการสไลซ์ใน OLAP
  • เวลาของมิติข้อมูลจะถูกแบ่งส่วนโดยมี Q1 เป็นตัวกรอง
  • คิวบ์ใหม่ถูกสร้างขึ้นพร้อมกัน

มันบอกว่า:

การดำเนินการนี้จะคล้ายกับการใช้สไลซ์ ความแตกต่างระหว่างลูกเต๋าคือคุณต้องเลือกมิติ 2 มิติขึ้นไปเพื่อสร้างลูกบาศก์ย่อย

การทำงานของลูกเต๋าใน OLAP
การทำงานของลูกเต๋าใน OLAP

4) เดือย

ใน Pivot คุณจะหมุนแกนข้อมูลเพื่อนำเสนอข้อมูลแทน

ในตัวอย่างต่อไปนี้ จุดหมุนจะขึ้นอยู่กับประเภทรายการ

การดำเนินการ Pivot ใน OLAP
การดำเนินการ Pivot ใน OLAP

ประเภทของระบบ OLAP

โครงสร้างลำดับชั้นของ OLAP

ประเภทของระบบ OLAP
ประเภทของระบบ OLAP
ประเภทของ OLAP คำอธิบาย
OLAP เชิงสัมพันธ์ (ROLAP): ROLAP เป็น RDBMS ที่ขยายพร้อมกับการแมปข้อมูลหลายมิติเพื่อดำเนินการเชิงสัมพันธ์มาตรฐาน
OLAP หลายมิติ (MOLAP) MOLAP นำการดำเนินงานไปใช้กับข้อมูลหลายมิติ
การประมวลผลเชิงวิเคราะห์ออนไลน์แบบไฮบริด (HOLAP) ในแนวทาง HOLAP ผลรวมที่รวบรวมไว้จะถูกจัดเก็บไว้ในฐานข้อมูลหลายมิติ ในขณะที่ข้อมูลโดยละเอียดจะถูกจัดเก็บไว้ในฐานข้อมูลเชิงสัมพันธ์ ซึ่งมีทั้งประสิทธิภาพข้อมูลของโมเดล ROLAP และประสิทธิภาพของโมเดล MOLAP
เดสก์ท็อป OLAP (DOLAP) ใน Desktop OLAP ผู้ใช้จะดาวน์โหลดส่วนหนึ่งของข้อมูลจากฐานข้อมูลภายในเครื่องหรือบนเดสก์ท็อปแล้ววิเคราะห์

การใช้งาน DOLAP มีค่าใช้จ่ายถูกกว่าเมื่อเปรียบเทียบกับระบบ OLAP อื่นๆ เนื่องจากมีฟังก์ชันต่างๆ ไม่มากนัก

เว็บ OLAP (WOLAP) Web OLAP ซึ่งเป็นระบบ OLAP ที่สามารถเข้าถึงได้ผ่านเว็บเบราว์เซอร์ WOLAP เป็นสถาปัตยกรรมแบบสามชั้น ประกอบด้วยสามส่วนประกอบ ได้แก่ ไคลเอ็นต์ มิดเดิลแวร์ และเซิร์ฟเวอร์ฐานข้อมูล
OLAP มือถือ: Mobile OLAP ช่วยให้ผู้ใช้เข้าถึงและวิเคราะห์ข้อมูล OLAP โดยใช้อุปกรณ์มือถือของตน
OLAP เชิงพื้นที่ : SOLAP ถูกสร้างขึ้นเพื่ออำนวยความสะดวกในการจัดการข้อมูลทั้งเชิงพื้นที่และไม่ใช่เชิงพื้นที่ในระบบสารสนเทศภูมิศาสตร์ (GIS)

โรแลป

ROLAP ทำงานกับข้อมูลที่มีอยู่ในฐานข้อมูลเชิงสัมพันธ์ ตารางข้อเท็จจริงและมิติจะถูกจัดเก็บเป็นตารางเชิงสัมพันธ์ นอกจากนี้ยังช่วยให้วิเคราะห์ข้อมูลหลายมิติได้ และเป็น OLAP ที่เติบโตเร็วที่สุด

ข้อดีของรุ่น ROLAP:

  • ประสิทธิภาพของข้อมูลสูง ให้ประสิทธิภาพข้อมูลสูงเนื่องจากประสิทธิภาพการสืบค้นและภาษาในการเข้าถึงได้รับการปรับให้เหมาะสมโดยเฉพาะสำหรับการวิเคราะห์ข้อมูลหลายมิติ
  • scalability ระบบ OLAP ประเภทนี้นำเสนอความสามารถในการปรับขนาดสำหรับการจัดการข้อมูลปริมาณมาก และแม้ว่าข้อมูลจะเพิ่มขึ้นอย่างต่อเนื่องก็ตาม

ข้อเสียของโมเดล ROLAP:

  • ความต้องการทรัพยากรที่สูงขึ้น: ROLAP ต้องการการใช้กำลังคน ซอฟต์แวร์ และทรัพยากรฮาร์ดแวร์ในระดับสูง
  • ข้อจำกัดของข้อมูลโดยรวม การใช้เครื่องมือ ROLAP SQL สำหรับการคำนวณข้อมูลรวมทั้งหมด อย่างไรก็ตาม ไม่มีขีดจำกัดในการจัดการกับการคำนวณ
  • ประสิทธิภาพการสืบค้นช้า ประสิทธิภาพการค้นหาในโมเดลนี้ช้าเมื่อเปรียบเทียบกับ MOLAP

โมแลป

MOLAP ใช้เครื่องมือจัดเก็บข้อมูลหลายมิติแบบอาร์เรย์เพื่อแสดงมุมมองข้อมูลหลายมิติ โดยพื้นฐานแล้ว พวกเขาใช้คิวบ์ OLAP

เรียนรู้เพิ่มเติมเกี่ยวกับ MOLAP Good Farm Animal Welfare Awards

ไฮบริด OLAP

Hybrid OLAP เป็นส่วนผสมของทั้ง ROLAP และ MOLAP ให้การคำนวณ MOLAP ที่รวดเร็วและความสามารถในการปรับขนาดที่สูงขึ้นของ ROLAP HOLAP ใช้สองฐานข้อมูล

  1. ข้อมูลที่รวบรวมหรือคำนวณจะถูกจัดเก็บไว้ในคิวบ์ OLAP หลายมิติ
  2. ข้อมูลรายละเอียดจะถูกเก็บไว้ในฐานข้อมูลเชิงสัมพันธ์

ประโยชน์ของ OLAP แบบไฮบริด:

  • OLAP ประเภทนี้ช่วยประหยัดพื้นที่ดิสก์ และยังมีขนาดกะทัดรัด ซึ่งช่วยหลีกเลี่ยงปัญหาที่เกี่ยวข้องกับความเร็วและความสะดวกในการเข้าถึง
  • Hybrid HOLAP ใช้เทคโนโลยีคิวบ์ซึ่งช่วยให้ทำงานได้เร็วขึ้นสำหรับข้อมูลทุกประเภท
  • ROLAP ได้รับการอัปเดตทันที และผู้ใช้ HOLAP สามารถเข้าถึงข้อมูลที่อัปเดตแบบเรียลไทม์ได้ทันที MOLAP นำการล้างข้อมูลและการแปลงข้อมูลมาใช้ ซึ่งจะช่วยปรับปรุงความเกี่ยวข้องของข้อมูล สิ่งนี้นำมาซึ่งสิ่งที่ดีที่สุดของทั้งสองโลก

ข้อเสียของ OLAP แบบไฮบริด:

  • ระดับความซับซ้อนที่เพิ่มมากขึ้น: ข้อเสียเปรียบที่สำคัญในระบบ HOLAP คือรองรับทั้งเครื่องมือและแอปพลิเคชัน ROLAP และ MOLAP ดังนั้นจึงมีความซับซ้อนมาก
  • การทับซ้อนกันที่อาจเกิดขึ้น: มีโอกาสสูงที่จะทับซ้อนกันโดยเฉพาะในฟังก์ชันการทำงาน

ข้อดีของ OLAP

  • OLAP เป็นแพลตฟอร์มสำหรับธุรกิจทุกประเภท รวมถึงการวางแผน การจัดทำงบประมาณ การรายงาน และการวิเคราะห์
  • ข้อมูลและการคำนวณมีความสอดคล้องกันในคิวบ์ OLAP นี่คือผลประโยชน์ที่สำคัญ
  • สร้างและวิเคราะห์สถานการณ์ "จะเป็นอย่างไร" อย่างรวดเร็ว
  • ค้นหาฐานข้อมูล OLAP ได้อย่างง่ายดายเพื่อหาคำกว้างๆ หรือเฉพาะเจาะจง
  • OLAP จัดเตรียมองค์ประกอบพื้นฐานสำหรับเครื่องมือการสร้างแบบจำลองธุรกิจ เครื่องมือการทำเหมืองข้อมูล เครื่องมือการรายงานประสิทธิภาพ
  • อนุญาตให้ผู้ใช้ทำข้อมูลลูกบาศก์ชิ้นและลูกเต๋าทั้งหมดตามมิติ การวัด และตัวกรองต่างๆ
  • เหมาะสำหรับการวิเคราะห์อนุกรมเวลา
  • การค้นหาคลัสเตอร์และค่าที่ผิดปกติเป็นเรื่องง่ายด้วย OLAP
  • เป็นระบบกระบวนการวิเคราะห์ออนไลน์การแสดงภาพที่ทรงพลังซึ่งให้เวลาตอบสนองที่รวดเร็วยิ่งขึ้น

ข้อเสียของ OLAP

  • OLAP ต้องการการจัดระเบียบข้อมูลให้เป็นสคีมาแบบดาวหรือเกล็ดหิมะ สคีมาเหล่านี้มีความซับซ้อนในการนำไปใช้และบริหารจัดการ
  • คุณไม่สามารถมีมิติจำนวนมากใน OLAP cube เดียวได้
  • ข้อมูลธุรกรรมไม่สามารถเข้าถึงได้ด้วยระบบ OLAP
  • การแก้ไขใดๆ ในคิวบ์ OLAP จำเป็นต้องได้รับการอัปเดตเต็มรูปแบบของคิวบ์ นี่เป็นกระบวนการที่ใช้เวลานาน

สรุป

  • โอลาป อิน คลังข้อมูล เป็นเทคโนโลยีที่ช่วยให้นักวิเคราะห์สามารถดึงและดูข้อมูลธุรกิจจากมุมมองที่แตกต่างกัน
  • หัวใจหลักของแนวคิด OLAP คือ OLAP Cube
  • แอปพลิเคชันธุรกิจต่างๆ และการดำเนินการข้อมูลอื่นๆ ต้องใช้ OLAP Cube
  • มีการดำเนินการวิเคราะห์ OLAP หลัก 1 ประเภทในคลังข้อมูล: 2) การสรุป 3) การเจาะลึก 4) การแบ่ง 5) ลูกเต๋า และ XNUMX) แกนหลัก
  • ระบบ OLAP ที่ใช้กันอย่างแพร่หลายสามประเภท ได้แก่ MOLAP, ROLAP และ Hybrid OLAP
  • Desktop OLAP, Web OLAP และ Mobile OLAP คือระบบ OLAP ประเภทอื่นๆ