डेटा वेयरहाउस में डायमेंशनल मॉडलिंग क्या है? इसके प्रकार जानें
आयामी मॉडलिंग
आयामी मॉडलिंग (डीएम) डेटा वेयरहाउस में डेटा संग्रहण के लिए अनुकूलित एक डेटा संरचना तकनीक है। आयामी मॉडलिंग का उद्देश्य डेटा की तेज़ पुनर्प्राप्ति के लिए डेटाबेस को अनुकूलित करना है। आयामी मॉडलिंग की अवधारणा राल्फ किमबॉल द्वारा विकसित की गई थी और इसमें "तथ्य" और "आयाम" तालिकाएँ शामिल हैं।
डेटा वेयरहाउस में एक आयामी मॉडल को डेटा वेयरहाउस में संख्यात्मक जानकारी जैसे मान, शेष राशि, गणना, वजन आदि को पढ़ने, सारांशित करने, विश्लेषण करने के लिए डिज़ाइन किया गया है। इसके विपरीत, संबंध मॉडल वास्तविक समय ऑनलाइन लेनदेन प्रणाली में डेटा को जोड़ने, अपडेट करने और हटाने के लिए अनुकूलित हैं।
इन आयामी और संबंधपरक मॉडलों में डेटा भंडारण का अपना अनूठा तरीका होता है जिसके विशिष्ट लाभ होते हैं।
उदाहरण के लिए, रिलेशनल मोड में, नॉर्मलाइज़ेशन और ईआर मॉडल डेटा में अतिरेक को कम करते हैं। इसके विपरीत, डेटा वेयरहाउस में डायमेंशनल मॉडल डेटा को इस तरह से व्यवस्थित करता है कि सूचना प्राप्त करना और रिपोर्ट तैयार करना आसान हो जाता है।
इसलिए, आयामी मॉडल का उपयोग किया जाता है डेटा वेयरहाउस सिस्टम और संबंधपरक प्रणालियों के लिए उपयुक्त नहीं है।
आयामी डेटा मॉडल के तत्व
तथ्य
तथ्य आपके व्यवसाय प्रक्रिया से माप/मीट्रिक या तथ्य हैं। बिक्री व्यवसाय प्रक्रिया के लिए, माप तिमाही बिक्री संख्या होगी
आयाम
आयाम एक व्यावसायिक प्रक्रिया घटना के आसपास का संदर्भ प्रदान करता है। सरल शब्दों में, वे किसी तथ्य के बारे में कौन, क्या, कहाँ बताते हैं। बिक्री व्यवसाय प्रक्रिया में, तिमाही बिक्री संख्या के लिए, आयाम होंगे
- कौन – ग्राहक नाम
- कहाँ – स्थान
- क्या – उत्पाद का नाम
दूसरे शब्दों में, आयाम तथ्यों में जानकारी को देखने के लिए एक खिड़की है।
गुण
विशेषताएँ आयामी डेटा मॉडलिंग में आयाम की विभिन्न विशेषताएं हैं।
स्थान आयाम में, विशेषताएँ हो सकती हैं
- राज्य
- देश
- पिनकोड आदि.
विशेषताओं का उपयोग तथ्यों को खोजने, फ़िल्टर करने या वर्गीकृत करने के लिए किया जाता है। आयाम तालिकाओं में विशेषताएँ होती हैं
तथ्य तालिका
तथ्य तालिका आयाम मॉडलिंग में एक प्राथमिक तालिका है।
एक तथ्य तालिका में निम्नलिखित बातें शामिल हैं
- माप/तथ्य
- आयाम तालिका के लिए विदेशी कुंजी
आयाम तालिका
- आयाम तालिका में किसी तथ्य के आयाम होते हैं।
- वे विदेशी कुंजी के माध्यम से तथ्य तालिका से जुड़े होते हैं।
- आयाम सारणी वि-सामान्यीकृत सारणी होती हैं।
- आयाम विशेषताएँ आयाम तालिका में विभिन्न स्तंभ हैं
- आयाम तथ्यों की विशेषताओं की सहायता से उनकी वर्णनात्मक विशेषताएं प्रस्तुत करता है
- दिए गए आयामों की संख्या के लिए कोई निर्धारित सीमा निर्धारित नहीं है
- आयाम में एक या अधिक पदानुक्रमिक संबंध भी हो सकते हैं
डेटा वेयरहाउस में आयामों के प्रकार
निम्नलिखित हैं डेटा वेयरहाउस में आयामों के प्रकार:
- अनुरूप आयाम
- आउटरिगर आयाम
- सिकुड़ा हुआ आयाम
- भूमिका निभाने का आयाम
- आयाम से आयाम तालिका
- जंक आयाम
- विकृत आयाम
- स्वैपेबल आयाम
- चरण आयाम
आयामी मॉडलिंग के चरण
आपके डायमेंशनल मॉडलिंग को बनाने में सटीकता आपके डेटा वेयरहाउस कार्यान्वयन की सफलता निर्धारित करती है। डायमेंशन मॉडल बनाने के चरण यहां दिए गए हैं
- व्यावसायिक प्रक्रिया की पहचान करें
- अनाज की पहचान करें (विस्तार का स्तर)
- आयाम पहचानें
- तथ्यों की पहचान करें
- स्टार बनाएं
मॉडल में आपकी व्यावसायिक प्रक्रिया के बारे में क्यों, कितना, कब/कहाँ/कौन और क्या का वर्णन होना चाहिए
चरण 1) व्यवसाय प्रक्रिया की पहचान करें
डेटारीहाउस को किस वास्तविक व्यवसाय प्रक्रिया को कवर करना चाहिए, इसकी पहचान करना। यह मार्केटिंग, बिक्री, एचआर आदि हो सकता है। डेटा विश्लेषण संगठन की ज़रूरतों के हिसाब से व्यवसाय प्रक्रिया का चयन उस प्रक्रिया के लिए उपलब्ध डेटा की गुणवत्ता पर भी निर्भर करता है। यह डेटा मॉडलिंग प्रक्रिया का सबसे महत्वपूर्ण चरण है, और यहाँ विफलता से कैस्केडिंग और अपूरणीय दोष होंगे।
व्यवसाय प्रक्रिया का वर्णन करने के लिए, आप सादे पाठ का उपयोग कर सकते हैं या बुनियादी व्यवसाय प्रक्रिया मॉडलिंग नोटेशन (BPMN) या एकीकृत मॉडलिंग भाषा (यूएमएल).
चरण 2) अनाज की पहचान करें
ग्रेन व्यवसाय समस्या/समाधान के लिए विवरण के स्तर का वर्णन करता है। यह आपके डेटा वेयरहाउस में किसी भी तालिका के लिए सूचना के निम्नतम स्तर की पहचान करने की प्रक्रिया है। यदि किसी तालिका में हर दिन के लिए बिक्री डेटा है, तो यह दैनिक ग्रैन्युलैरिटी होनी चाहिए। यदि किसी तालिका में प्रत्येक महीने के लिए कुल बिक्री डेटा है, तो इसमें मासिक ग्रैन्युलैरिटी होगी।
इस चरण के दौरान, आप इस तरह के प्रश्नों के उत्तर देते हैं
- क्या हमें सभी उपलब्ध उत्पादों को स्टोर करने की आवश्यकता है या केवल कुछ प्रकार के उत्पादों को? यह निर्णय डेटावेयरहाउस के लिए चुनी गई व्यावसायिक प्रक्रियाओं पर आधारित है
- क्या हम उत्पाद बिक्री की जानकारी मासिक, साप्ताहिक, दैनिक या प्रति घंटे के आधार पर संग्रहीत करते हैं? यह निर्णय अधिकारियों द्वारा अनुरोधित रिपोर्ट की प्रकृति पर निर्भर करता है
- उपरोक्त दो विकल्प डेटाबेस के आकार को किस प्रकार प्रभावित करते हैं?
अनाज का उदाहरण:
एक बहुराष्ट्रीय कंपनी का मुख्य कार्यकारी अधिकारी दैनिक आधार पर विभिन्न स्थानों पर विशिष्ट उत्पादों की बिक्री का पता लगाना चाहता है।
तो, अनाज "दिन के हिसाब से स्थान के अनुसार उत्पाद बिक्री की जानकारी" है।
चरण 3) आयामों की पहचान करें
आयाम संज्ञाएं हैं जैसे दिनांक, स्टोर, इन्वेंट्री, आदि। ये आयाम वे हैं जहाँ सभी डेटा संग्रहीत किए जाने चाहिए। उदाहरण के लिए, दिनांक आयाम में वर्ष, महीना और सप्ताह का दिन जैसे डेटा हो सकते हैं।
आयामों का उदाहरण:
एक बहुराष्ट्रीय कंपनी का मुख्य कार्यकारी अधिकारी दैनिक आधार पर विभिन्न स्थानों पर विशिष्ट उत्पादों की बिक्री का पता लगाना चाहता है।
आयाम: उत्पाद, स्थान और समय
विशेषताएँ: उत्पाद के लिए: उत्पाद कुंजी (विदेशी कुंजी), नाम, प्रकार, विनिर्देश
पदानुक्रम: स्थान के लिए: देश, राज्य, शहर, सड़क का पता, नाम
चरण 4) तथ्य की पहचान करें
यह चरण सिस्टम के व्यावसायिक उपयोगकर्ताओं के साथ सह-संबद्ध है क्योंकि यहीं से उन्हें डेटा वेयरहाउस में संग्रहीत डेटा तक पहुँच मिलती है। अधिकांश तथ्य तालिका पंक्तियाँ संख्यात्मक मान हैं जैसे मूल्य या प्रति इकाई लागत, आदि।
तथ्यों का उदाहरण:
एक बहुराष्ट्रीय कंपनी का मुख्य कार्यकारी अधिकारी दैनिक आधार पर विभिन्न स्थानों पर विशिष्ट उत्पादों की बिक्री का पता लगाना चाहता है।
यहां तथ्य यह है कि स्थान, समय और उत्पाद के आधार पर बिक्री का योग है।
चरण 5) स्कीमा बनाएँ
इस चरण में, आप आयाम मॉडल को लागू करते हैं। स्कीमा कुछ और नहीं बल्कि डेटाबेस संरचना (तालिकाओं की व्यवस्था) है। दो लोकप्रिय स्कीमा हैं
- स्टार स्कीमा
स्टार स्कीमा आर्किटेक्चर को डिज़ाइन करना आसान है। इसे स्टार स्कीमा इसलिए कहा जाता है क्योंकि आरेख एक तारे जैसा दिखता है, जिसमें केंद्र से निकलने वाले बिंदु होते हैं। तारे के केंद्र में तथ्य तालिका होती है, और तारे के बिंदु आयाम तालिकाएँ होती हैं।
स्टार स्कीमा में तथ्य सारणी तृतीय सामान्य रूप है जबकि आयामी सारणी विसामान्यीकृत हैं।
- स्नोफ्लेक स्कीमा
स्नोफ्लेक स्कीमा स्टार स्कीमा का विस्तार है। स्नोफ्लेक स्कीमा में, प्रत्येक आयाम को सामान्यीकृत किया जाता है और अधिक आयाम तालिकाओं से जोड़ा जाता है।
यह भी जांचें: - मॉडल उदाहरणों के साथ डेटा वेयरहाउस में स्टार और स्नोफ्लेक स्कीमा
आयामी मॉडलिंग के नियम
आयामी मॉडलिंग के नियम और सिद्धांत निम्नलिखित हैं:
- परमाणु डेटा को आयामी संरचनाओं में लोड करें।
- व्यावसायिक प्रक्रियाओं के इर्द-गिर्द आयामी मॉडल बनाएं।
- यह सुनिश्चित करने की आवश्यकता है कि प्रत्येक तथ्य तालिका के साथ एक संबद्ध दिनांक आयाम तालिका हो।
- सुनिश्चित करें कि एक ही तथ्य तालिका में सभी तथ्य एक ही स्तर पर हों।
- रिपोर्ट लेबल और फ़िल्टर डोमेन मानों को आयाम तालिकाओं में संग्रहीत करना आवश्यक है
- यह सुनिश्चित करने की आवश्यकता है कि आयाम तालिकाएं सरोगेट कुंजी का उपयोग करें
- व्यावसायिक निर्णय लेने में सहायता के लिए समाधान प्रदान करने हेतु आवश्यकताओं और वास्तविकताओं के बीच निरंतर संतुलन बनाए रखें
आयामी मॉडलिंग के लाभ
- आयामों के मानकीकरण से व्यवसाय के विभिन्न क्षेत्रों में रिपोर्टिंग आसान हो जाती है।
- आयाम तालिकाएं आयामी जानकारी का इतिहास संग्रहीत करती हैं।
- यह तथ्य तालिका में बड़े व्यवधान के बिना पूरी तरह से नए आयाम को प्रस्तुत करने की अनुमति देता है।
- आयामी (Dimensional) का उद्देश्य डेटा को इस प्रकार संग्रहीत करना है कि एक बार डेटा को डेटाबेस में संग्रहीत कर लेने के बाद, डेटा से सूचना को पुनः प्राप्त करना आसान हो जाए।
- सामान्यीकृत मॉडल की तुलना में आयामी तालिका को समझना आसान है।
- जानकारी को स्पष्ट एवं सरल व्यावसायिक श्रेणियों में बांटा गया है।
- आयामी मॉडल व्यवसाय के लिए बहुत ही समझने योग्य है। यह मॉडल व्यवसाय की शर्तों पर आधारित है, ताकि व्यवसाय को पता हो कि प्रत्येक तथ्य, आयाम या विशेषता का क्या मतलब है।
- आयामी मॉडल को तेजी से डेटा क्वेरी करने के लिए विरूपित और अनुकूलित किया जाता है। कई रिलेशनल डेटाबेस प्लेटफ़ॉर्म इस मॉडल को पहचानते हैं और प्रदर्शन में सहायता के लिए क्वेरी निष्पादन योजनाओं को अनुकूलित करते हैं।
- डेटा वेयरहाउस में आयामी मॉडलिंग एक स्कीमा बनाता है जो उच्च प्रदर्शन के लिए अनुकूलित है। इसका मतलब है कम जॉइन और न्यूनतम डेटा अतिरेक में मदद करता है।
- आयामी मॉडल क्वेरी प्रदर्शन को बढ़ाने में भी मदद करता है। यह अधिक असामान्य है इसलिए इसे क्वेरी करने के लिए अनुकूलित किया गया है।
- आयामी मॉडल आराम से बदलाव को समायोजित कर सकते हैं। आयाम तालिकाओं में इन तालिकाओं का उपयोग करके मौजूदा व्यावसायिक इंटेलिजेंस अनुप्रयोगों को प्रभावित किए बिना अधिक कॉलम जोड़े जा सकते हैं।
डेटा वेयरहाउस में बहुआयामी डेटा मॉडल क्या है?
बहुआयामी डेटा मॉडल डेटा वेयरहाउस एक मॉडल है जो डेटा को डेटा क्यूब्स के रूप में दर्शाता है। यह डेटा को कई आयामों में मॉडल करने और देखने की अनुमति देता है और इसे आयामों और तथ्यों द्वारा परिभाषित किया जाता है। बहुआयामी डेटा मॉडल को आम तौर पर एक केंद्रीय विषय के आसपास वर्गीकृत किया जाता है और एक तथ्य तालिका द्वारा दर्शाया जाता है।
सारांश
- आयामी मॉडल एक डेटा संरचना तकनीक है जो निम्न के लिए अनुकूलित है डेटा वेयरहाउसिंग उपकरण.
- तथ्य आपके व्यवसाय प्रक्रिया से प्राप्त माप/मीट्रिक या तथ्य हैं।
- आयाम एक व्यवसाय प्रक्रिया घटना के आसपास का संदर्भ प्रदान करता है।
- विशेषताएँ आयाम मॉडलिंग की विभिन्न विशेषताएं हैं।
- तथ्य तालिका, आयामी मॉडल में एक प्राथमिक तालिका होती है।
- आयाम तालिका में किसी तथ्य के आयाम होते हैं।
- तथ्य तीन प्रकार के होते हैं 1. योगात्मक 2. अयोगात्मक 3. अर्द्धयोगात्मक।
- आयामों के प्रकार हैं: अनुरूपित, आउटरिगर, सिकुड़ा हुआ, रोल-प्लेइंग, आयाम से आयाम तालिका, जंक, डीजनरेट, स्वैपेबल और स्टेप आयाम।
- आयामी मॉडलिंग के पाँच चरण हैं 1. व्यावसायिक प्रक्रिया की पहचान करना 2. ग्रेन (विस्तार का स्तर) की पहचान करना 3. आयामों की पहचान करना 4. तथ्यों की पहचान करना 5. स्टार बनाना
- डेटा वेयरहाउस में आयामी मॉडलिंग के लिए, यह सुनिश्चित करने की आवश्यकता है कि प्रत्येक तथ्य तालिका में एक संबद्ध दिनांक आयाम तालिका हो।