ما هي نمذجة الأبعاد في مستودع البيانات؟ تعلم الأنواع
النمذجة الأبعاد
نمذجة الأبعاد (DM) هي تقنية بنية بيانات محسنة لتخزين البيانات في مستودع البيانات. الغرض من نمذجة الأبعاد هو تحسين قاعدة البيانات لاسترجاع البيانات بشكل أسرع. تم تطوير مفهوم نمذجة الأبعاد بواسطة رالف كيمبال ويتكون من جداول "الحقيقة" و"الأبعاد".
تم تصميم النموذج البعدي في مستودع البيانات لقراءة وتلخيص وتحليل المعلومات الرقمية مثل القيم والأرصدة والعدد والأوزان وما إلى ذلك في مستودع البيانات. وعلى النقيض من ذلك، تم تحسين نماذج العلاقات لإضافة وتحديث وحذف البيانات في نظام المعاملات عبر الإنترنت في الوقت الفعلي.
تتمتع هذه النماذج ذات الأبعاد والعلائقية بطريقتها الفريدة في تخزين البيانات والتي تتمتع بمزايا محددة.
على سبيل المثال، في الوضع العلائقي، تعمل نماذج التطبيع والتقارير الإلكترونية على تقليل التكرار في البيانات. على العكس من ذلك، يقوم نموذج الأبعاد في مستودع البيانات بترتيب البيانات بطريقة تسهل استرجاع المعلومات وإنشاء التقارير.
ومن ثم يتم استخدام نماذج الأبعاد أنظمة مستودعات البيانات وليس مناسبًا للأنظمة العلائقية.
عناصر نموذج البيانات الأبعاد
حقيقة
الحقائق هي القياسات/المقاييس أو الحقائق من عملية عملك. بالنسبة لعملية أعمال المبيعات، سيكون القياس هو رقم المبيعات ربع السنوي
بعد
يوفر البعد السياق المحيط بحدث عملية الأعمال. بعبارات بسيطة، فإنهم يعطون من وماذا وأين من الحقيقة. في عملية أعمال المبيعات، بالنسبة لرقم المبيعات الربع سنوي، ستكون الأبعاد
- من - أسماء العملاء
- أين - الموقع
- ماذا – اسم المنتج
وبعبارة أخرى، البعد هو نافذة لعرض المعلومات في الحقائق.
السمات
السمات هي الخصائص المختلفة للبعد في نمذجة البيانات الأبعاد.
في بُعد الموقع، يمكن أن تكون السمات
- الولايه او المحافظه
- الدولة
- الرمز البريدي الخ
تُستخدم السمات للبحث عن الحقائق أو تصفيتها أو تصنيفها. تحتوي جداول الأبعاد على السمات
جدول الحقائق
جدول الحقائق هو جدول أساسي في نمذجة الأبعاد.
يحتوي جدول الحقائق
- القياسات / الحقائق
- المفتاح الخارجي لجدول الأبعاد
جدول الأبعاد
- يحتوي جدول الأبعاد على أبعاد الحقيقة.
- يتم ضمهم إلى جدول الحقائق عبر مفتاح خارجي.
- جداول الأبعاد هي جداول غير طبيعية.
- سمات البعد هي الأعمدة المختلفة في جدول الأبعاد
- تقدم الأبعاد خصائص وصفية للحقائق بمساعدة سماتها
- لم يتم تحديد حد محدد لعدد الأبعاد
- يمكن أن يحتوي البعد أيضًا على علاقة هرمية واحدة أو أكثر
أنواع الأبعاد في مستودع البيانات
فيما يلي أنواع الأبعاد في مستودع البيانات:
- البعد المطابق
- البعد المداد
- البعد المنكمش
- أبعاد لعب الأدوار
- البعد إلى جدول الأبعاد
- البعد غير المهم
- البعد المنحل
- البعد القابل للتبديل
- البعد الخطوة
خطوات النمذجة الأبعاد
تحدد الدقة في إنشاء نماذج الأبعاد الخاصة بك مدى نجاح تنفيذ مستودع البيانات الخاص بك. فيما يلي خطوات إنشاء نموذج البعد
- تحديد عملية الأعمال
- تحديد الحبوب (مستوى التفاصيل)
- تحديد الأبعاد
- تحديد الحقائق
- بناء ستار
يجب أن يصف النموذج لماذا، وكم، ومتى، وأين، ومن، وماذا في عملية عملك
الخطوة 1) تحديد عملية الأعمال
تحديد العملية التجارية الفعلية التي يجب أن يغطيها مخزن البيانات. يمكن أن يكون هذا التسويق، والمبيعات، والموارد البشرية، وما إلى ذلك وفقًا لـ تحليل البيانات احتياجات المنظمة. يعتمد اختيار عملية الأعمال أيضًا على جودة البيانات المتاحة لهذه العملية. إنها أهم خطوة في عملية نمذجة البيانات، والفشل هنا سيكون له عيوب متتالية وغير قابلة للإصلاح.
لوصف عملية الأعمال، يمكنك استخدام نص عادي أو استخدام تدوين نمذجة عمليات الأعمال الأساسية (BPMN) أو لغة النمذجة الموحدة (UML).
الخطوة 2) تحديد الحبوب
تصف الحبوب مستوى التفاصيل الخاصة بمشكلة/حل العمل. إنها عملية تحديد أدنى مستوى من المعلومات لأي جدول في مستودع البيانات الخاص بك. إذا كان الجدول يحتوي على بيانات المبيعات لكل يوم، فيجب أن يكون تفصيليًا يوميًا. إذا كان الجدول يحتوي على إجمالي بيانات المبيعات لكل شهر، فإنه يحتوي على تفاصيل شهرية.
خلال هذه المرحلة، يمكنك الإجابة على أسئلة مثل
- هل نحتاج إلى تخزين جميع المنتجات المتوفرة أم مجرد أنواع قليلة من المنتجات؟ يعتمد هذا القرار على العمليات التجارية المحددة لـ Datawarehouse
- هل نقوم بتخزين معلومات بيع المنتج على أساس شهري أو أسبوعي أو يومي أو كل ساعة؟ يعتمد هذا القرار على طبيعة التقارير التي يطلبها المديرون التنفيذيون
- كيف يؤثر الخياران أعلاه على حجم قاعدة البيانات؟
مثال على الحبوب:
يريد الرئيس التنفيذي لشركة MNC العثور على مبيعات منتجات معينة في مواقع مختلفة على أساس يومي.
لذا، فإن الحبوب هي "معلومات بيع المنتج حسب الموقع يوميًا".
الخطوة 3) تحديد الأبعاد
الأبعاد هي أسماء مثل التاريخ والمخزن والمخزون وما إلى ذلك. وهذه الأبعاد هي المكان الذي يجب تخزين جميع البيانات فيه. على سبيل المثال، قد يحتوي بُعد التاريخ على بيانات مثل السنة والشهر وأيام الأسبوع.
مثال على الأبعاد:
يريد الرئيس التنفيذي لشركة MNC العثور على مبيعات منتجات معينة في مواقع مختلفة على أساس يومي.
الأبعاد: المنتج والموقع والوقت
السمات: بالنسبة للمنتج: مفتاح المنتج (المفتاح الخارجي)، الاسم، النوع، المواصفات
التسلسل الهرمي: للموقع: الدولة، الولاية، المدينة، عنوان الشارع، الاسم
الخطوة 4) تحديد الحقيقة
ترتبط هذه الخطوة بمستخدمي النظام من رجال الأعمال لأن هذا هو المكان الذي يمكنهم فيه الوصول إلى البيانات المخزنة في مستودع البيانات. معظم صفوف جدول الحقيقة عبارة عن قيم رقمية مثل السعر أو التكلفة لكل وحدة، وما إلى ذلك.
مثال على الحقائق:
يريد الرئيس التنفيذي لشركة MNC العثور على مبيعات منتجات معينة في مواقع مختلفة على أساس يومي.
الحقيقة هنا هي مجموع المبيعات حسب المنتج حسب الموقع حسب الوقت.
الخطوة 5) بناء المخطط
في هذه الخطوة، يمكنك تنفيذ نموذج البعد. المخطط ليس سوى بنية قاعدة البيانات (ترتيب الجداول). هناك نوعان من المخططات الشعبية
- مخطط النجوم
من السهل تصميم مخطط النجمة. ويُطلق عليه مخطط النجمة لأن الرسم البياني يشبه النجمة، مع نقاط تشع من المركز. يتكون مركز النجمة من جدول الحقائق، ونقاط النجمة عبارة عن جداول الأبعاد.
جداول الحقائق في مخطط النجمة هي الشكل الطبيعي الثالث بينما يتم إلغاء تسوية جداول الأبعاد.
- مخطط ندفة الثلج
مخطط ندفة الثلج هو امتداد لمخطط النجمة. في مخطط ندفة الثلج، يتم تسوية كل بُعد وربطه بمزيد من جداول الأبعاد.
تحقق أيضا: - مخطط النجمة وندفة الثلج في مستودع البيانات مع أمثلة نموذجية
قواعد النمذجة الأبعاد
فيما يلي قواعد ومبادئ النمذجة الأبعادية:
- تحميل البيانات الذرية إلى هياكل ثلاثية الأبعاد.
- بناء نماذج الأبعاد حول العمليات التجارية.
- يجب التأكد من أن كل جدول حقائق يحتوي على جدول أبعاد تاريخ مرتبط.
- تأكد من أن جميع الحقائق الموجودة في جدول الحقائق الواحد تكون على نفس مستوى التفاصيل أو التفاصيل.
- من الضروري تخزين تسميات التقارير وتصفية قيم المجال في جداول الأبعاد
- يجب التأكد من أن جداول الأبعاد تستخدم مفتاحًا بديلاً
- الموازنة المستمرة بين المتطلبات والحقائق لتقديم حلول الأعمال لدعم عملية اتخاذ القرار
فوائد النمذجة الأبعاد
- يتيح توحيد الأبعاد إمكانية إعداد التقارير بسهولة عبر مجالات العمل.
- تقوم جداول الأبعاد بتخزين تاريخ معلومات الأبعاد.
- فهو يسمح بتقديم بُعد جديد تمامًا دون حدوث اضطرابات كبيرة في جدول الحقائق.
- الأبعاد أيضًا لتخزين البيانات بطريقة تجعل من السهل استرجاع المعلومات من البيانات بمجرد تخزين البيانات في قاعدة البيانات.
- مقارنة بجدول الأبعاد النموذجي المقيس يكون من الأسهل فهمه.
- يتم تجميع المعلومات في فئات أعمال واضحة وبسيطة.
- نموذج الأبعاد مفهوم للغاية من قبل رجال الأعمال. يعتمد هذا النموذج على مصطلحات الأعمال، بحيث تعرف الشركة ما تعنيه كل حقيقة أو بُعد أو سمة.
- يتم تشويه نماذج الأبعاد وتحسينها للاستعلام السريع عن البيانات. تتعرف العديد من منصات قواعد البيانات العلائقية على هذا النموذج وتقوم بتحسين خطط تنفيذ الاستعلام للمساعدة في الأداء.
- تعمل نمذجة الأبعاد في مستودع البيانات على إنشاء مخطط مُحسّن لتحقيق الأداء العالي. وهذا يعني عددًا أقل من عمليات الانضمام ويساعد في تقليل تكرار البيانات إلى الحد الأدنى.
- يساعد نموذج الأبعاد أيضًا على تعزيز أداء الاستعلام. إنه غير طبيعي بشكل أكبر وبالتالي فهو مُحسّن للاستعلام.
- يمكن لنماذج الأبعاد أن تستوعب التغيير بشكل مريح. يمكن أن تحتوي جداول الأبعاد على المزيد من الأعمدة المضافة إليها دون التأثير على تطبيقات المعلومات المهنية الموجودة باستخدام هذه الجداول.
ما هو نموذج البيانات متعدد الأبعاد في مستودع البيانات؟
نموذج بيانات متعدد الأبعاد في مستودع البيانات هو نموذج يمثل البيانات في شكل مكعبات بيانات. يسمح بنمذجة وعرض البيانات بأبعاد متعددة ويتم تحديدها بالأبعاد والحقائق. يتم تصنيف نموذج البيانات متعدد الأبعاد بشكل عام حول موضوع مركزي ويتم تمثيله بجدول الحقائق.
الملخص
- النموذج الأبعاد هو تقنية بنية بيانات محسنة من أجلها أدوات تخزين البيانات.
- الحقائق هي القياسات/المقاييس أو الحقائق من عملية عملك.
- يوفر البعد السياق المحيط بحدث عملية الأعمال.
- السمات هي الخصائص المختلفة لنمذجة الأبعاد.
- جدول الحقائق هو جدول أساسي في نموذج الأبعاد.
- يحتوي جدول الأبعاد على أبعاد الحقيقة.
- هناك ثلاثة أنواع من الحقائق 1. المضافة 2. غير المضافة 3. شبه المضافة .
- أنواع الأبعاد هي أبعاد متطابقة، وأبعاد مداد، ومنكمشة، وتمثيل الأدوار، ومن بُعد إلى جدول أبعاد، وأبعاد غير مرغوب فيها، ومنحطة، وقابلة للتبديل، وأبعاد متدرجة.
- خمس خطوات لنمذجة الأبعاد هي 1. تحديد عملية الأعمال 2. تحديد الحبوب (مستوى التفاصيل) 3. تحديد الأبعاد 4. تحديد الحقائق 5. بناء النجم
- بالنسبة لنمذجة الأبعاد في مستودع البيانات، هناك حاجة للتأكد من أن كل جدول حقائق يحتوي على جدول أبعاد تاريخ مرتبط.