डेटा वेयरहाउस में डेटा मार्ट क्या है? प्रकार और उदाहरण

डेटा मार्ट क्या है?

A डेटा मार्ट यह संगठन के किसी एक कार्यात्मक क्षेत्र पर केंद्रित होता है और इसमें डेटा वेयरहाउस में संग्रहीत डेटा का एक उपसमूह होता है। डेटा मार्ट डेटा वेयरहाउस का एक संक्षिप्त संस्करण है और इसे किसी संगठन में किसी विशिष्ट विभाग, इकाई या उपयोगकर्ताओं के समूह द्वारा उपयोग के लिए डिज़ाइन किया गया है। उदाहरण के लिए, मार्केटिंग, बिक्री, मानव संसाधन या वित्त। इसे अक्सर संगठन में किसी एक विभाग द्वारा नियंत्रित किया जाता है।

डेटा वेयरहाउस की तुलना में डेटा मार्ट आमतौर पर केवल कुछ स्रोतों से डेटा खींचता है। डेटा मार्ट आकार में छोटे होते हैं और डेटावेयरहाउस की तुलना में अधिक लचीले होते हैं।

हमें डेटा मार्ट की आवश्यकता क्यों है?

  • डेटा मार्ट डेटा की मात्रा में कमी के कारण उपयोगकर्ता के प्रतिक्रिया समय को बढ़ाने में मदद करता है
  • यह बार-बार अनुरोधित डेटा तक आसान पहुंच प्रदान करता है।
  • कॉर्पोरेट डेटावेयरहाउस की तुलना में डेटा मार्ट को लागू करना आसान है। साथ ही, डेटा मार्ट को लागू करने की लागत निश्चित रूप से एक पूर्ण डेटा वेयरहाउस को लागू करने की तुलना में कम है।
  • डेटा वेयरहाउस की तुलना में डेटामार्ट अधिक चुस्त है। मॉडल में बदलाव की स्थिति में, छोटे आकार के कारण डेटामार्ट को जल्दी बनाया जा सकता है।
  • डेटामार्ट को एक ही विषय विशेषज्ञ द्वारा परिभाषित किया जाता है। इसके विपरीत डेटा वेयरहाउस को विभिन्न डोमेन से अंतःविषय एसएमई द्वारा परिभाषित किया जाता है। इसलिए, डेटा मार्ट डेटावेयरहाउस की तुलना में बदलाव के लिए अधिक खुला है।
  • डेटा विभाजित है और बहुत विस्तृत पहुंच नियंत्रण विशेषाधिकार की अनुमति देता है।
  • डेटा को विभाजित किया जा सकता है तथा विभिन्न हार्डवेयर/सॉफ्टवेयर प्लेटफॉर्म पर संग्रहीत किया जा सकता है।

डेटा मार्ट के प्रकार

डेटा मार्ट के तीन मुख्य प्रकार हैं:

  1. निर्भरआश्रित डेटा मार्ट का निर्माण परिचालन, बाह्य या दोनों स्रोतों से सीधे डेटा प्राप्त करके किया जाता है।
  2. स्वतंत्रस्वतंत्र डेटा मार्ट किसी केंद्रीय डेटा वेयरहाउस के उपयोग के बिना बनाया जाता है।
  3. Hybridइस प्रकार के डेटा मार्ट डेटा वेयरहाउस या परिचालन प्रणालियों से डेटा ले सकते हैं।

आश्रित डेटा मार्ट

एक आश्रित डेटा मार्ट एक ही डेटा वेयरहाउस से संगठन के डेटा को सोर्स करने की अनुमति देता है। यह डेटा मार्ट के उदाहरणों में से एक है जो केंद्रीकरण का लाभ प्रदान करता है। यदि आपको एक या अधिक भौतिक डेटा मार्ट विकसित करने की आवश्यकता है, तो आपको उन्हें आश्रित डेटा मार्ट के रूप में कॉन्फ़िगर करना होगा।

डेटा वेयरहाउस में आश्रित डेटा मार्ट को दो अलग-अलग तरीकों से बनाया जा सकता है। या तो जहां कोई उपयोगकर्ता आवश्यकता के आधार पर डेटा मार्ट और डेटा वेयरहाउस दोनों तक पहुंच सकता है, या जहां पहुंच केवल डेटा मार्ट तक ही सीमित है। दूसरा तरीका इष्टतम नहीं है क्योंकि यह कभी-कभी डेटा जंकयार्ड के रूप में संदर्भित होता है। डेटा जंकयार्ड में, सभी डेटा एक सामान्य स्रोत से शुरू होते हैं, लेकिन उन्हें स्क्रैप किया जाता है, और ज्यादातर जंक किया जाता है।

आश्रित डेटा मार्ट
आश्रित डेटा मार्ट

स्वतंत्र डेटा मार्ट

एक स्वतंत्र डेटा मार्ट केंद्रीय डेटा वेयरहाउस के उपयोग के बिना बनाया जाता है। इस तरह का डेटा मार्ट किसी संगठन के भीतर छोटे समूहों के लिए एक आदर्श विकल्प है।

स्वतंत्र डेटा मार्ट का न तो एंटरप्राइज़ डेटा वेयरहाउस से कोई संबंध होता है और न ही किसी अन्य डेटा मार्ट से। स्वतंत्र डेटा मार्ट में, डेटा अलग से इनपुट किया जाता है, और इसका विश्लेषण भी स्वायत्त रूप से किया जाता है।

स्वतंत्र डेटा मार्ट का कार्यान्वयन डेटा वेयरहाउस बनाने की प्रेरणा के विपरीत है। सबसे पहले, आपको एंटरप्राइज़ डेटा के एक सुसंगत, केंद्रीकृत स्टोर की आवश्यकता होती है जिसका विश्लेषण विभिन्न रुचियों वाले कई उपयोगकर्ताओं द्वारा किया जा सकता है जो व्यापक रूप से भिन्न जानकारी चाहते हैं।

स्वतंत्र डेटा मार्ट

स्वतंत्र डेटा मार्ट

हाइब्रिड डेटा मार्ट

हाइब्रिड डेटा मार्ट डेटा वेयरहाउस के अलावा अन्य स्रोतों से इनपुट को जोड़ता है। यह तब मददगार हो सकता है जब आप एड-हॉक एकीकरण चाहते हैं, जैसे कि संगठन में कोई नया समूह या उत्पाद जोड़े जाने के बाद।

यह किसी भी संगठन के लिए कई डेटाबेस वातावरण और तेज़ कार्यान्वयन बदलाव के लिए उपयुक्त सबसे अच्छा डेटा मार्ट उदाहरण है। इसके लिए कम से कम डेटा सफाई प्रयास की आवश्यकता होती है। हाइब्रिड डेटा मार्ट बड़ी भंडारण संरचनाओं का भी समर्थन करता है, और यह छोटे डेटा-केंद्रित अनुप्रयोगों के लिए लचीलेपन के लिए सबसे उपयुक्त है।

हाइब्रिड डेटा मार्ट

हाइब्रिड डेटा मार्ट

डेटामार्ट को लागू करने के चरण

डेटामार्ट को लागू करने के चरण

डेटा मार्ट को लागू करना एक फायदेमंद लेकिन जटिल प्रक्रिया है। डेटा मार्ट को लागू करने के लिए विस्तृत चरण यहां दिए गए हैं:

डिजाइनिंग

डिजाइनिंग डेटा मार्ट कार्यान्वयन का पहला चरण है। इसमें डेटा मार्ट के लिए अनुरोध आरंभ करने से लेकर आवश्यकताओं के बारे में जानकारी एकत्र करने तक के सभी कार्य शामिल हैं। अंत में, हम तार्किक और भौतिक डेटा मार्ट डिज़ाइन बनाते हैं।

डिज़ाइन चरण में निम्नलिखित कार्य शामिल हैं:

  • व्यावसायिक एवं तकनीकी आवश्यकताओं को एकत्रित करना तथा डेटा स्रोतों की पहचान करना।
  • डेटा के उपयुक्त उपसमूह का चयन करना.
  • डेटा मार्ट की तार्किक और भौतिक संरचना का डिजाइन करना।

डेटा को निम्नलिखित मानदंडों के आधार पर विभाजित किया जा सकता है:

  • तारीख
  • व्यवसाय या कार्यात्मक इकाई
  • भूगोल
  • उपरोक्त में से कोई भी संयोजन

डेटा को एप्लिकेशन या DBMS स्तर पर विभाजित किया जा सकता है। हालाँकि, एप्लिकेशन स्तर पर विभाजन की अनुशंसा की जाती है क्योंकि यह व्यावसायिक वातावरण में परिवर्तन के साथ हर साल अलग-अलग डेटा मॉडल की अनुमति देता है।

आपको किन उत्पादों और प्रौद्योगिकियों की आवश्यकता है?

एक साधारण कलम और कागज़ ही काफी होगा। हालाँकि ऐसे उपकरण हैं जो आपको UML या ईआर आरेख आपके तार्किक और भौतिक डिज़ाइन में मेटा डेटा भी जोड़ देगा।

निर्माण

यह कार्यान्वयन का दूसरा चरण है। इसमें भौतिक डेटाबेस और तार्किक संरचनाएं.

इस चरण में निम्नलिखित कार्य शामिल हैं:

  • पहले चरण में डिज़ाइन किए गए भौतिक डेटाबेस को लागू करना। उदाहरण के लिए, डेटाबेस स्कीमा ऑब्जेक्ट जैसे टेबल, इंडेक्स, व्यू आदि बनाए जाते हैं।

आपको किन उत्पादों और प्रौद्योगिकियों की आवश्यकता है?

आपको ज़रूरत है एक रिलेश्नल डाटाबेस मेनेजमेन्ट सिस्टम डेटा मार्ट का निर्माण करना। RDBMS में कई विशेषताएं हैं जो डेटा मार्ट की सफलता के लिए आवश्यक हैं।

  • भंडारण प्रबंधन: RDBMS डेटा बनाने, जोड़ने और हटाने के लिए डेटा को संग्रहीत और प्रबंधित करता है।
  • तीव्र डेटा पहुंच: SQL क्वेरी के साथ आप कुछ शर्तों/फ़िल्टरों के आधार पर आसानी से डेटा तक पहुँच सकते हैं।
  • डेटा सुरक्षा: RDBMS सिस्टम बिजली की विफलता जैसी सिस्टम विफलताओं से उबरने का एक तरीका भी प्रदान करता है। यह डिस्क के विफल होने की स्थिति में इन बैकअप से डेटा को पुनर्स्थापित करने की भी अनुमति देता है।
  • बहुउपयोगकर्ता समर्थन: डेटा प्रबंधन प्रणाली समवर्ती पहुंच प्रदान करती है, जिसमें एकाधिक उपयोगकर्ताओं को किसी अन्य उपयोगकर्ता द्वारा किए गए परिवर्तनों में हस्तक्षेप किए बिना या उन्हें अधिलेखित किए बिना डेटा तक पहुंचने और संशोधित करने की क्षमता होती है।
  • सुरक्षा: आरडीएमएस प्रणाली उपयोगकर्ताओं द्वारा वस्तुओं और कुछ प्रकार के कार्यों तक पहुंच को विनियमित करने का एक तरीका भी प्रदान करती है।

को आबाद करने

तीसरे चरण में, डेटा को डेटा मार्ट में डाला जाता है।

पॉपुलेटिंग चरण में निम्नलिखित कार्य शामिल हैं:

  • स्रोत डेटा से लक्ष्य डेटा मैपिंग
  • स्रोत डेटा का निष्कर्षण
  • डेटा पर सफाई और परिवर्तन कार्य
  • डेटा मार्ट में डेटा लोड करना
  • मेटाडेटा बनाना और संग्रहीत करना

आपको किन उत्पादों और प्रौद्योगिकियों की आवश्यकता है?

आप इन जनसंख्या कार्यों को एक का उपयोग करके पूरा करते हैं ETL (एक्स्ट्रैक्ट ट्रांसफॉर्म लोड) टूलयह उपकरण आपको डेटा स्रोतों को देखने, स्रोत-से-लक्ष्य मैपिंग करने, डेटा निकालने, उसे रूपांतरित करने, उसे साफ करने और डेटा मार्ट में वापस लोड करने की अनुमति देता है।

इस प्रक्रिया में, यह उपकरण कुछ मेटाडेटा भी बनाता है, जैसे कि डेटा कहां से आया, यह कितना नया है, डेटा में किस प्रकार के परिवर्तन किए गए, तथा किस स्तर का सारांशीकरण किया गया।

एक्सेस करना

एक्सेस करना चौथा चरण है जिसमें डेटा का उपयोग करना शामिल है: डेटा को क्वेरी करना, रिपोर्ट, चार्ट बनाना और उन्हें प्रकाशित करना। अंतिम उपयोगकर्ता डेटाबेस में क्वेरी सबमिट करता है और क्वेरी के परिणाम प्रदर्शित करता है

एक्सेसिंग चरण में निम्नलिखित कार्य निष्पादित करने होंगे:

  • एक मेटा लेयर सेट करें जो डेटाबेस संरचनाओं और ऑब्जेक्ट नामों को व्यावसायिक शब्दों में अनुवादित करता है। इससे गैर-तकनीकी उपयोगकर्ताओं को डेटा मार्ट तक आसानी से पहुँचने में मदद मिलती है।
  • डेटाबेस संरचना स्थापित करें और उसका रखरखाव करें।
  • यदि आवश्यक हो तो API और इंटरफेस सेट अप करें

आपको किन उत्पादों और प्रौद्योगिकियों की आवश्यकता है?

आप कमांड लाइन या GUI का उपयोग करके डेटा मार्ट तक पहुँच सकते हैं। GUI को प्राथमिकता दी जाती है क्योंकि यह आसानी से ग्राफ़ बना सकता है और कमांड लाइन की तुलना में उपयोगकर्ता के अनुकूल है।

प्रबंध

यह डेटा मार्ट कार्यान्वयन प्रक्रिया का अंतिम चरण है। इस चरण में प्रबंधन कार्य शामिल हैं जैसे-

  • चल रहे उपयोगकर्ता पहुँच प्रबंधन.
  • उन्नत प्रदर्शन प्राप्त करने के लिए सिस्टम अनुकूलन और फ़ाइन-ट्यूनिंग।
  • डेटा मार्ट में नया डेटा जोड़ना और प्रबंधित करना।
  • पुनर्प्राप्ति परिदृश्यों की योजना बनाना तथा सिस्टम के विफल होने की स्थिति में सिस्टम की उपलब्धता सुनिश्चित करना।

आपको किन उत्पादों और प्रौद्योगिकियों की आवश्यकता है?

आप डेटा मार्ट प्रबंधन के लिए GUI या कमांड लाइन का उपयोग कर सकते हैं।

डेटा मार्ट को लागू करने के लिए सर्वोत्तम अभ्यास

डेटा मार्ट कार्यान्वयन प्रक्रिया के दौरान आपको निम्नलिखित सर्वोत्तम प्रथाओं का पालन करना होगा:

  • डेटा मार्ट का स्रोत विभागीय रूप से संरचित होना चाहिए
  • डेटा मार्ट के कार्यान्वयन चक्र को छोटी अवधि में मापा जाना चाहिए, अर्थात महीनों या वर्षों के बजाय हफ्तों में।
  • योजना और डिजाइनिंग चरण में सभी हितधारकों को शामिल करना महत्वपूर्ण है क्योंकि डेटा मार्ट का कार्यान्वयन जटिल हो सकता है।
  • डेटा मार्ट हार्डवेयर/सॉफ्टवेयर, नेटवर्किंग और कार्यान्वयन लागत को आपकी योजना में सटीक रूप से बजट किया जाना चाहिए
  • भले ही डेटा मार्ट को उसी हार्डवेयर पर बनाया गया हो, फिर भी उन्हें उपयोगकर्ता प्रश्नों को संभालने के लिए कुछ अलग सॉफ़्टवेयर की आवश्यकता हो सकती है। तेज़ उपयोगकर्ता प्रतिक्रिया के लिए अतिरिक्त प्रोसेसिंग पावर और डिस्क स्टोरेज आवश्यकताओं का मूल्यांकन किया जाना चाहिए
  • डेटा मार्ट डेटा वेयरहाउस से अलग स्थान पर हो सकता है। इसलिए यह सुनिश्चित करना महत्वपूर्ण है कि डेटा मार्ट में डेटा स्थानांतरित करने के लिए आवश्यक डेटा वॉल्यूम को संभालने के लिए उनके पास पर्याप्त नेटवर्किंग क्षमता हो।.
  • कार्यान्वयन लागत में डेटामार्ट लोडिंग प्रक्रिया में लगने वाले समय को शामिल किया जाना चाहिए। परिवर्तनों की जटिलता बढ़ने के साथ लोड समय भी बढ़ता है।

डेटा मार्ट के फायदे और नुकसान

फायदे

  • डेटा मार्ट में संगठन-व्यापी डेटा का एक उपसमूह होता है। यह डेटा किसी संगठन में लोगों के एक विशिष्ट समूह के लिए मूल्यवान होता है।
  • यह लागत प्रभावी विकल्प है डाटा गोदामजिसके निर्माण में उच्च लागत लग सकती है।
  • डेटा मार्ट डेटा तक तीव्र पहुंच की अनुमति देता है।
  • डेटा मार्ट का उपयोग करना आसान है क्योंकि इसे विशेष रूप से अपने उपयोगकर्ताओं की ज़रूरतों के लिए डिज़ाइन किया गया है। इस प्रकार डेटा मार्ट व्यवसाय प्रक्रियाओं को गति दे सकता है।
  • डेटा मार्ट को डेटा वेयरहाउस सिस्टम की तुलना में कम कार्यान्वयन समय की आवश्यकता होती है। डेटा मार्ट को लागू करना तेज़ है क्योंकि आपको केवल डेटा के एक ही उपसमूह पर ध्यान केंद्रित करने की आवश्यकता है।
  • इसमें ऐतिहासिक डेटा होता है जो विश्लेषक को डेटा प्रवृत्तियों को निर्धारित करने में सक्षम बनाता है।

नुकसान

  • कई बार उद्यम बिना किसी खास लाभ के बहुत सारे अलग-अलग और असंबंधित डेटा मार्ट बना लेते हैं। इसे बनाए रखना एक बड़ी बाधा बन सकता है।
  • डेटा मार्ट कंपनी-व्यापी सेवा प्रदान नहीं कर सकता डेटा विश्लेषण क्योंकि उनका डेटा सेट सीमित है।

सारांश

  • डेटा मार्ट को परिभाषित करें: डेटा मार्ट को डेटा वेयरहाउस के एक उपसमूह के रूप में परिभाषित किया जाता है जो किसी संगठन के एकल कार्यात्मक क्षेत्र पर केंद्रित होता है।
  • डेटा मार्ट डेटा की मात्रा में कमी के कारण उपयोगकर्ता के प्रतिक्रिया समय को बढ़ाने में मदद करता है।
  • डेटा मार्ट तीन प्रकार के होते हैं 1) आश्रित 2) स्वतंत्र 3) हाइब्रिड
  • डेटा मार्ट के महत्वपूर्ण कार्यान्वयन चरण हैं 1) डिजाइनिंग 2) निर्माण 3) पॉपुलेटिंग 4) एक्सेस करना और 5) प्रबंधन करना
  • डेटा मार्ट के कार्यान्वयन चक्र को छोटी अवधि में मापा जाना चाहिए, अर्थात महीनों या वर्षों के बजाय हफ्तों में।
  • डेटा मार्ट, डेटा वेयरहाउस का लागत प्रभावी विकल्प है, जिसके निर्माण में उच्च लागत आ सकती है।
  • डेटा मार्ट कंपनी-व्यापी डेटा विश्लेषण प्रदान नहीं कर सकता क्योंकि डेटा सेट सीमित है।