डेटा वेयरहाउस में डायमेंशनल मॉडलिंग क्या है? इसके प्रकार जानें

आयामी मॉडलिंग

आयामी मॉडलिंग (डीएम) डेटा वेयरहाउस में डेटा संग्रहण के लिए अनुकूलित एक डेटा संरचना तकनीक है। आयामी मॉडलिंग का उद्देश्य डेटा की तेज़ पुनर्प्राप्ति के लिए डेटाबेस को अनुकूलित करना है। आयामी मॉडलिंग की अवधारणा राल्फ किमबॉल द्वारा विकसित की गई थी और इसमें "तथ्य" और "आयाम" तालिकाएँ शामिल हैं।

डेटा वेयरहाउस में एक आयामी मॉडल को डेटा वेयरहाउस में संख्यात्मक जानकारी जैसे मान, शेष राशि, गणना, वजन आदि को पढ़ने, सारांशित करने, विश्लेषण करने के लिए डिज़ाइन किया गया है। इसके विपरीत, संबंध मॉडल वास्तविक समय ऑनलाइन लेनदेन प्रणाली में डेटा को जोड़ने, अपडेट करने और हटाने के लिए अनुकूलित हैं।

इन आयामी और संबंधपरक मॉडलों में डेटा भंडारण का अपना अनूठा तरीका होता है जिसके विशिष्ट लाभ होते हैं।

उदाहरण के लिए, रिलेशनल मोड में, नॉर्मलाइज़ेशन और ईआर मॉडल डेटा में अतिरेक को कम करते हैं। इसके विपरीत, डेटा वेयरहाउस में डायमेंशनल मॉडल डेटा को इस तरह से व्यवस्थित करता है कि सूचना प्राप्त करना और रिपोर्ट तैयार करना आसान हो जाता है।

इसलिए, आयामी मॉडल का उपयोग किया जाता है डेटा वेयरहाउस सिस्टम और संबंधपरक प्रणालियों के लिए उपयुक्त नहीं है।

आयामी डेटा मॉडल के तत्व

तथ्य

तथ्य आपके व्यवसाय प्रक्रिया से माप/मीट्रिक या तथ्य हैं। बिक्री व्यवसाय प्रक्रिया के लिए, माप तिमाही बिक्री संख्या होगी

आयाम

आयाम एक व्यावसायिक प्रक्रिया घटना के आसपास का संदर्भ प्रदान करता है। सरल शब्दों में, वे किसी तथ्य के बारे में कौन, क्या, कहाँ बताते हैं। बिक्री व्यवसाय प्रक्रिया में, तिमाही बिक्री संख्या के लिए, आयाम होंगे

  • कौन – ग्राहक नाम
  • कहाँ – स्थान
  • क्या – उत्पाद का नाम

दूसरे शब्दों में, आयाम तथ्यों में जानकारी को देखने के लिए एक खिड़की है।

गुण

विशेषताएँ आयामी डेटा मॉडलिंग में आयाम की विभिन्न विशेषताएं हैं।

स्थान आयाम में, विशेषताएँ हो सकती हैं

  • राज्य
  • देश
  • पिनकोड आदि.

विशेषताओं का उपयोग तथ्यों को खोजने, फ़िल्टर करने या वर्गीकृत करने के लिए किया जाता है। आयाम तालिकाओं में विशेषताएँ होती हैं

तथ्य तालिका

तथ्य तालिका आयाम मॉडलिंग में एक प्राथमिक तालिका है।

एक तथ्य तालिका में निम्नलिखित बातें शामिल हैं

  1. माप/तथ्य
  2. आयाम तालिका के लिए विदेशी कुंजी

आयाम तालिका

  • आयाम तालिका में किसी तथ्य के आयाम होते हैं।
  • वे विदेशी कुंजी के माध्यम से तथ्य तालिका से जुड़े होते हैं।
  • आयाम सारणी वि-सामान्यीकृत सारणी होती हैं।
  • आयाम विशेषताएँ आयाम तालिका में विभिन्न स्तंभ हैं
  • आयाम तथ्यों की विशेषताओं की सहायता से उनकी वर्णनात्मक विशेषताएं प्रस्तुत करता है
  • दिए गए आयामों की संख्या के लिए कोई निर्धारित सीमा निर्धारित नहीं है
  • आयाम में एक या अधिक पदानुक्रमिक संबंध भी हो सकते हैं

डेटा वेयरहाउस में आयामों के प्रकार

निम्नलिखित हैं डेटा वेयरहाउस में आयामों के प्रकार:

  • अनुरूप आयाम
  • आउटरिगर आयाम
  • सिकुड़ा हुआ आयाम
  • भूमिका निभाने का आयाम
  • आयाम से आयाम तालिका
  • जंक आयाम
  • विकृत आयाम
  • स्वैपेबल आयाम
  • चरण आयाम

आयामी मॉडलिंग के चरण

आपके डायमेंशनल मॉडलिंग को बनाने में सटीकता आपके डेटा वेयरहाउस कार्यान्वयन की सफलता निर्धारित करती है। डायमेंशन मॉडल बनाने के चरण यहां दिए गए हैं

  1. व्यावसायिक प्रक्रिया की पहचान करें
  2. अनाज की पहचान करें (विस्तार का स्तर)
  3. आयाम पहचानें
  4. तथ्यों की पहचान करें
  5. स्टार बनाएं

मॉडल में आपकी व्यावसायिक प्रक्रिया के बारे में क्यों, कितना, कब/कहाँ/कौन और क्या का वर्णन होना चाहिए

आयामी मॉडलिंग के चरण

चरण 1) व्यवसाय प्रक्रिया की पहचान करें

डेटारीहाउस को किस वास्तविक व्यवसाय प्रक्रिया को कवर करना चाहिए, इसकी पहचान करना। यह मार्केटिंग, बिक्री, एचआर आदि हो सकता है। डेटा विश्लेषण संगठन की ज़रूरतों के हिसाब से व्यवसाय प्रक्रिया का चयन उस प्रक्रिया के लिए उपलब्ध डेटा की गुणवत्ता पर भी निर्भर करता है। यह डेटा मॉडलिंग प्रक्रिया का सबसे महत्वपूर्ण चरण है, और यहाँ विफलता से कैस्केडिंग और अपूरणीय दोष होंगे।

व्यवसाय प्रक्रिया का वर्णन करने के लिए, आप सादे पाठ का उपयोग कर सकते हैं या बुनियादी व्यवसाय प्रक्रिया मॉडलिंग नोटेशन (BPMN) या एकीकृत मॉडलिंग भाषा (यूएमएल).

चरण 2) अनाज की पहचान करें

ग्रेन व्यवसाय समस्या/समाधान के लिए विवरण के स्तर का वर्णन करता है। यह आपके डेटा वेयरहाउस में किसी भी तालिका के लिए सूचना के निम्नतम स्तर की पहचान करने की प्रक्रिया है। यदि किसी तालिका में हर दिन के लिए बिक्री डेटा है, तो यह दैनिक ग्रैन्युलैरिटी होनी चाहिए। यदि किसी तालिका में प्रत्येक महीने के लिए कुल बिक्री डेटा है, तो इसमें मासिक ग्रैन्युलैरिटी होगी।

इस चरण के दौरान, आप इस तरह के प्रश्नों के उत्तर देते हैं

  1. क्या हमें सभी उपलब्ध उत्पादों को स्टोर करने की आवश्यकता है या केवल कुछ प्रकार के उत्पादों को? यह निर्णय डेटावेयरहाउस के लिए चुनी गई व्यावसायिक प्रक्रियाओं पर आधारित है
  2. क्या हम उत्पाद बिक्री की जानकारी मासिक, साप्ताहिक, दैनिक या प्रति घंटे के आधार पर संग्रहीत करते हैं? यह निर्णय अधिकारियों द्वारा अनुरोधित रिपोर्ट की प्रकृति पर निर्भर करता है
  3. उपरोक्त दो विकल्प डेटाबेस के आकार को किस प्रकार प्रभावित करते हैं?

अनाज का उदाहरण:

एक बहुराष्ट्रीय कंपनी का मुख्य कार्यकारी अधिकारी दैनिक आधार पर विभिन्न स्थानों पर विशिष्ट उत्पादों की बिक्री का पता लगाना चाहता है।

तो, अनाज "दिन के हिसाब से स्थान के अनुसार उत्पाद बिक्री की जानकारी" है।

चरण 3) आयामों की पहचान करें

आयाम संज्ञाएं हैं जैसे दिनांक, स्टोर, इन्वेंट्री, आदि। ये आयाम वे हैं जहाँ सभी डेटा संग्रहीत किए जाने चाहिए। उदाहरण के लिए, दिनांक आयाम में वर्ष, महीना और सप्ताह का दिन जैसे डेटा हो सकते हैं।

आयामों का उदाहरण:

एक बहुराष्ट्रीय कंपनी का मुख्य कार्यकारी अधिकारी दैनिक आधार पर विभिन्न स्थानों पर विशिष्ट उत्पादों की बिक्री का पता लगाना चाहता है।

आयाम: उत्पाद, स्थान और समय

विशेषताएँ: उत्पाद के लिए: उत्पाद कुंजी (विदेशी कुंजी), नाम, प्रकार, विनिर्देश

पदानुक्रम: स्थान के लिए: देश, राज्य, शहर, सड़क का पता, नाम

चरण 4) तथ्य की पहचान करें

यह चरण सिस्टम के व्यावसायिक उपयोगकर्ताओं के साथ सह-संबद्ध है क्योंकि यहीं से उन्हें डेटा वेयरहाउस में संग्रहीत डेटा तक पहुँच मिलती है। अधिकांश तथ्य तालिका पंक्तियाँ संख्यात्मक मान हैं जैसे मूल्य या प्रति इकाई लागत, आदि।

तथ्यों का उदाहरण:

एक बहुराष्ट्रीय कंपनी का मुख्य कार्यकारी अधिकारी दैनिक आधार पर विभिन्न स्थानों पर विशिष्ट उत्पादों की बिक्री का पता लगाना चाहता है।

यहां तथ्य यह है कि स्थान, समय और उत्पाद के आधार पर बिक्री का योग है।

चरण 5) स्कीमा बनाएँ

इस चरण में, आप आयाम मॉडल को लागू करते हैं। स्कीमा कुछ और नहीं बल्कि डेटाबेस संरचना (तालिकाओं की व्यवस्था) है। दो लोकप्रिय स्कीमा हैं

  1. स्टार स्कीमा

स्टार स्कीमा आर्किटेक्चर को डिज़ाइन करना आसान है। इसे स्टार स्कीमा इसलिए कहा जाता है क्योंकि आरेख एक तारे जैसा दिखता है, जिसमें केंद्र से निकलने वाले बिंदु होते हैं। तारे के केंद्र में तथ्य तालिका होती है, और तारे के बिंदु आयाम तालिकाएँ होती हैं।

स्टार स्कीमा में तथ्य सारणी तृतीय सामान्य रूप है जबकि आयामी सारणी विसामान्यीकृत हैं।

  1. स्नोफ्लेक स्कीमा

स्नोफ्लेक स्कीमा स्टार स्कीमा का विस्तार है। स्नोफ्लेक स्कीमा में, प्रत्येक आयाम को सामान्यीकृत किया जाता है और अधिक आयाम तालिकाओं से जोड़ा जाता है।

यह भी जांचें: - मॉडल उदाहरणों के साथ डेटा वेयरहाउस में स्टार और स्नोफ्लेक स्कीमा

आयामी मॉडलिंग के नियम

आयामी मॉडलिंग के नियम और सिद्धांत निम्नलिखित हैं:

  • परमाणु डेटा को आयामी संरचनाओं में लोड करें।
  • व्यावसायिक प्रक्रियाओं के इर्द-गिर्द आयामी मॉडल बनाएं।
  • यह सुनिश्चित करने की आवश्यकता है कि प्रत्येक तथ्य तालिका के साथ एक संबद्ध दिनांक आयाम तालिका हो।
  • सुनिश्चित करें कि एक ही तथ्य तालिका में सभी तथ्य एक ही स्तर पर हों।
  • रिपोर्ट लेबल और फ़िल्टर डोमेन मानों को आयाम तालिकाओं में संग्रहीत करना आवश्यक है
  • यह सुनिश्चित करने की आवश्यकता है कि आयाम तालिकाएं सरोगेट कुंजी का उपयोग करें
  • व्यावसायिक निर्णय लेने में सहायता के लिए समाधान प्रदान करने हेतु आवश्यकताओं और वास्तविकताओं के बीच निरंतर संतुलन बनाए रखें

आयामी मॉडलिंग के लाभ

  • आयामों के मानकीकरण से व्यवसाय के विभिन्न क्षेत्रों में रिपोर्टिंग आसान हो जाती है।
  • आयाम तालिकाएं आयामी जानकारी का इतिहास संग्रहीत करती हैं।
  • यह तथ्य तालिका में बड़े व्यवधान के बिना पूरी तरह से नए आयाम को प्रस्तुत करने की अनुमति देता है।
  • आयामी (Dimensional) का उद्देश्य डेटा को इस प्रकार संग्रहीत करना है कि एक बार डेटा को डेटाबेस में संग्रहीत कर लेने के बाद, डेटा से सूचना को पुनः प्राप्त करना आसान हो जाए।
  • सामान्यीकृत मॉडल की तुलना में आयामी तालिका को समझना आसान है।
  • जानकारी को स्पष्ट एवं सरल व्यावसायिक श्रेणियों में बांटा गया है।
  • आयामी मॉडल व्यवसाय के लिए बहुत ही समझने योग्य है। यह मॉडल व्यवसाय की शर्तों पर आधारित है, ताकि व्यवसाय को पता हो कि प्रत्येक तथ्य, आयाम या विशेषता का क्या मतलब है।
  • आयामी मॉडल को तेजी से डेटा क्वेरी करने के लिए विरूपित और अनुकूलित किया जाता है। कई रिलेशनल डेटाबेस प्लेटफ़ॉर्म इस मॉडल को पहचानते हैं और प्रदर्शन में सहायता के लिए क्वेरी निष्पादन योजनाओं को अनुकूलित करते हैं।
  • डेटा वेयरहाउस में आयामी मॉडलिंग एक स्कीमा बनाता है जो उच्च प्रदर्शन के लिए अनुकूलित है। इसका मतलब है कम जॉइन और न्यूनतम डेटा अतिरेक में मदद करता है।
  • आयामी मॉडल क्वेरी प्रदर्शन को बढ़ाने में भी मदद करता है। यह अधिक असामान्य है इसलिए इसे क्वेरी करने के लिए अनुकूलित किया गया है।
  • आयामी मॉडल आराम से बदलाव को समायोजित कर सकते हैं। आयाम तालिकाओं में इन तालिकाओं का उपयोग करके मौजूदा व्यावसायिक इंटेलिजेंस अनुप्रयोगों को प्रभावित किए बिना अधिक कॉलम जोड़े जा सकते हैं।

डेटा वेयरहाउस में बहुआयामी डेटा मॉडल क्या है?

बहुआयामी डेटा मॉडल डेटा वेयरहाउस एक मॉडल है जो डेटा को डेटा क्यूब्स के रूप में दर्शाता है। यह डेटा को कई आयामों में मॉडल करने और देखने की अनुमति देता है और इसे आयामों और तथ्यों द्वारा परिभाषित किया जाता है। बहुआयामी डेटा मॉडल को आम तौर पर एक केंद्रीय विषय के आसपास वर्गीकृत किया जाता है और एक तथ्य तालिका द्वारा दर्शाया जाता है।

सारांश

  • आयामी मॉडल एक डेटा संरचना तकनीक है जो निम्न के लिए अनुकूलित है डेटा वेयरहाउसिंग उपकरण.
  • तथ्य आपके व्यवसाय प्रक्रिया से प्राप्त माप/मीट्रिक या तथ्य हैं।
  • आयाम एक व्यवसाय प्रक्रिया घटना के आसपास का संदर्भ प्रदान करता है।
  • विशेषताएँ आयाम मॉडलिंग की विभिन्न विशेषताएं हैं।
  • तथ्य तालिका, आयामी मॉडल में एक प्राथमिक तालिका होती है।
  • आयाम तालिका में किसी तथ्य के आयाम होते हैं।
  • तथ्य तीन प्रकार के होते हैं 1. योगात्मक 2. अयोगात्मक 3. अर्द्धयोगात्मक।
  • आयामों के प्रकार हैं: अनुरूपित, आउटरिगर, सिकुड़ा हुआ, रोल-प्लेइंग, आयाम से आयाम तालिका, जंक, डीजनरेट, स्वैपेबल और स्टेप आयाम।
  • आयामी मॉडलिंग के पाँच चरण हैं 1. व्यावसायिक प्रक्रिया की पहचान करना 2. ग्रेन (विस्तार का स्तर) की पहचान करना 3. आयामों की पहचान करना 4. तथ्यों की पहचान करना 5. स्टार बनाना
  • डेटा वेयरहाउस में आयामी मॉडलिंग के लिए, यह सुनिश्चित करने की आवश्यकता है कि प्रत्येक तथ्य तालिका में एक संबद्ध दिनांक आयाम तालिका हो।