शुरुआती लोगों के लिए डेटास्टेज ट्यूटोरियल: IBM डेटास्टेज (ईटीएल टूल) प्रशिक्षण

डेटास्टेज क्या है?

डेटास्टेज एक ETL उपकरण है जिसका उपयोग स्रोत से लक्ष्य गंतव्य तक डेटा निकालने, बदलने और लोड करने के लिए किया जाता है। इन डेटा के स्रोत में अनुक्रमिक फ़ाइलें, अनुक्रमित फ़ाइलें, संबंधपरक डेटाबेस, बाहरी डेटा स्रोत, अभिलेखागार, एंटरप्राइज़ एप्लिकेशन आदि शामिल हो सकते हैं। डेटास्टेज का उपयोग व्यावसायिक विश्लेषण को सुविधाजनक बनाने के लिए किया जाता है, ताकि व्यावसायिक बुद्धिमत्ता प्राप्त करने में मदद करने के लिए गुणवत्तापूर्ण डेटा प्रदान किया जा सके।

डेटास्टेज ETL टूल का उपयोग बड़े संगठन में विभिन्न प्रणालियों के बीच एक इंटरफ़ेस के रूप में किया जाता है। यह स्रोत से लक्ष्य गंतव्य तक डेटा के निष्कर्षण, अनुवाद और लोडिंग का ख्याल रखता है। इसे पहली बार VMark द्वारा 90 के दशक के मध्य में लॉन्च किया गया था। IBM 2005 में डेटास्टेज का अधिग्रहण करने के बाद इसका नाम बदलकर कर दिया गया IBM वेबस्फीयर डेटास्टेज और बाद में IBM इन्फोस्फीयर.

अब तक बाजार में डेटास्टेज के विभिन्न संस्करण उपलब्ध हैं, जैसे एंटरप्राइज एडिशन (पीएक्स), सर्वर एडिशन, एमवीएस एडिशन, पीपलसॉफ्ट के लिए डेटास्टेज इत्यादि। नवीनतम संस्करण है IBM इन्फोस्फीयर डेटास्टेज

IBM सूचना सर्वर में निम्नलिखित उत्पाद शामिल हैं,

  • IBM इन्फोस्फीयर डेटास्टेज
  • IBM इन्फोस्फीयर क्वालिटीस्टेज
  • IBM इन्फोस्फीयर सूचना सेवा निदेशक
  • IBM इन्फोस्फीयर सूचना विश्लेषक
  • IBM सूचना सर्वर फास्टट्रैक
  • IBM इन्फोस्फीयर बिजनेस शब्दावली

डेटास्टेज अवलोकन

डेटास्टेज में निम्नलिखित क्षमताएं हैं।

  • यह उद्यम और बाहरी डेटा स्रोतों की व्यापक रेंज से डेटा को एकीकृत कर सकता है
  • डेटा सत्यापन नियमों को लागू करता है
  • यह बड़ी मात्रा में डेटा को संसाधित करने और परिवर्तित करने में उपयोगी है
  • यह स्केलेबल समानांतर प्रसंस्करण दृष्टिकोण का उपयोग करता है
  • यह जटिल परिवर्तनों को संभाल सकता है और कई एकीकरण प्रक्रियाओं का प्रबंधन कर सकता है
  • स्रोत या लक्ष्य के रूप में एंटरप्राइज़ अनुप्रयोगों से सीधे संपर्क का लाभ उठाएँ
  • विश्लेषण और रखरखाव के लिए मेटाडेटा का लाभ उठाएँ
  • Operaबैच में, वास्तविक समय में, या वेब सेवा के रूप में

इस डेटास्टेज ट्यूटोरियल के निम्नलिखित अनुभागों में, हम संक्षेप में निम्नलिखित पहलुओं का वर्णन करते हैं IBM इन्फोस्फीयर डेटास्टेज:

  • डेटा परिवर्तन
  • नौकरियां
  • समानांतर प्रसंस्करण

इन्फोस्फीयर डेटास्टेज और क्वालिटीस्टेज एंटरप्राइज़ अनुप्रयोगों और डेटा स्रोतों में डेटा तक पहुंच सकते हैं जैसे:

प्रसंस्करण चरण प्रकार

IBM इन्फोस्फीयर जॉब में अलग-अलग चरण होते हैं जो एक दूसरे से जुड़े होते हैं। यह डेटा स्रोत से डेटा लक्ष्य तक डेटा के प्रवाह का वर्णन करता है। आमतौर पर, एक चरण में कम से कम एक डेटा इनपुट और/या एक डेटा आउटपुट होता है। हालाँकि, कुछ चरण एक से अधिक डेटा इनपुट स्वीकार कर सकते हैं और एक से अधिक चरणों में आउटपुट कर सकते हैं।

जॉब डिज़ाइन में आप विभिन्न चरणों का उपयोग कर सकते हैं:

  • रूपांतरण चरण
  • फ़िल्टर चरण
  • एग्रीगेटर चरण
  • डुप्लिकेट हटाएँ चरण
  • मंच से जुड़ें
  • लुकअप चरण
  • कॉपी चरण
  • सॉर्ट चरण
  • कंटेनरों

डेटास्टेज घटक और Archiटेक्चर

डेटास्टेज के चार मुख्य घटक हैं,

  1. प्रशासक: इसका उपयोग प्रशासन कार्यों के लिए किया जाता है। इसमें डेटास्टेज उपयोगकर्ताओं को सेट करना, शुद्धिकरण मानदंड सेट करना और प्रोजेक्ट बनाना और स्थानांतरित करना शामिल है।
  2. प्रबंधक: यह ETL DataStage के रिपॉजिटरी का मुख्य इंटरफ़ेस है। इसका उपयोग पुन: प्रयोज्य मेटाडेटा के भंडारण और प्रबंधन के लिए किया जाता है। DataStage प्रबंधक के माध्यम से, कोई भी रिपॉजिटरी की सामग्री को देख और संपादित कर सकता है।
  3. डिजाइनर: डेटास्टेज एप्लिकेशन या जॉब बनाने के लिए उपयोग किया जाने वाला डिज़ाइन इंटरफ़ेस। यह डेटा स्रोत, आवश्यक परिवर्तन और डेटा के गंतव्य को निर्दिष्ट करता है। जॉब्स को एक निष्पादन योग्य बनाने के लिए संकलित किया जाता है जिसे डायरेक्टर द्वारा शेड्यूल किया जाता है और सर्वर द्वारा चलाया जाता है
  4. निर्देशक: इसका उपयोग डेटास्टेज सर्वर जॉब्स और समानांतर जॉब्स को मान्य करने, शेड्यूल करने, निष्पादित करने और मॉनिटर करने के लिए किया जाता है।
डेटास्टेज Archiटेक्चर आरेख
डेटास्टेज Archiटेक्चर आरेख

उपरोक्त चित्र बताता है कि कैसे IBM इन्फोस्फीयर डेटास्टेज अन्य तत्वों के साथ बातचीत करता है IBM सूचना सर्वर प्लेटफ़ॉर्म। डेटास्टेज को दो भागों में विभाजित किया गया है, साझा घटक, और रनटाइम Archiटेक्चर.

   
क्रियाएँ

साझा

एकीकृत उपयोगकर्ता इंटरफ़ेस

  • इन्फोस्फीयर डेटास्टेज अनुप्रयोगों (जिन्हें जॉब्स के नाम से जाना जाता है) को बनाने के लिए एक ग्राफिकल डिज़ाइन इंटरफ़ेस का उपयोग किया जाता है।
  • प्रत्येक कार्य डेटा स्रोत, आवश्यक रूपांतरण और डेटा के गंतव्य को निर्धारित करता है।
  • समानांतर जॉब फ़्लो और पुनः प्रयोज्य घटक बनाने के लिए जॉब्स को संकलित किया जाता है। उन्हें InfoSphere DataStage और QualityStage Director द्वारा शेड्यूल और चलाया जाता है।
  • डिज़ाइनर क्लाइंट रिपॉजिटरी में मेटाडेटा का प्रबंधन करता है। जबकि संकलित निष्पादन डेटा को सूचना सर्वर इंजन टियर पर तैनात किया जाता है।

सामान्य सेवाएँ

  • मेटाडेटा सेवाएँ जैसे प्रभाव विश्लेषण और खोज
  • डिज़ाइन सेवाएँ जो InfoSphere DataStage कार्यों के विकास और रखरखाव का समर्थन करती हैं
  • निष्पादन सेवाएँ जो सभी InfoSphere DataStage फ़ंक्शनों का समर्थन करती हैं

सामान्य समानांतर प्रसंस्करण

  • इंजन निष्पादन योग्य कार्य चलाता है जो विभिन्न प्रकार की सेटिंग्स में डेटा को निकालता है, परिवर्तित करता है और लोड करता है।
  • इंजन उच्च मात्रा में कार्य को संभालने के लिए समानांतर प्रसंस्करण और पाइपलाइनिंग के दृष्टिकोण का चयन करता है।

क्रम Archiटेक्चर

OSH स्क्रिप्ट

  • यह OSH (ऑर्केस्ट्रेट शेल स्क्रिप्ट) की पीढ़ी और उसके निष्पादन प्रवाह का वर्णन करता है IBM और प्रवाह IBM सूचना सर्वर इंजन का उपयोग करके इन्फोस्फेयर डेटास्टेज
  • यह आपको लक्ष्य फ़ाइलों में डेटा निकालने, साफ़ करने, रूपांतरित करने, एकीकृत करने और लोड करने के लिए जॉब फ़्लो विकसित करने हेतु ग्राफ़िकल पॉइंट-एंड-क्लिक तकनीकों का उपयोग करने में सक्षम बनाता है।

डेटास्टेज टूल के लिए पूर्वापेक्षाएँ

डेटास्टेज के लिए आपको निम्नलिखित सेटअप की आवश्यकता होगी।

  • InfoSphere
  • डेटास्टेज सर्वर 9.1.2 या उससे ऊपर
  • Microsoft विजुअल स्टूडियो .NET 2010 एक्सप्रेस संस्करण C++
  • Oracle क्लाइंट (पूर्ण क्लाइंट, तत्काल क्लाइंट नहीं) यदि किसी से कनेक्ट हो रहा है Oracle डेटाबेस
  • DB2 क्लाइंट यदि DB2 डेटाबेस से कनेक्ट हो रहा है

अब इस डेटास्टेज ट्यूटोरियल्स फॉर बिगिनर्स श्रृंखला में, हम सीखेंगे कि इन्फोस्फीयर सूचना सर्वर को कैसे डाउनलोड और इंस्टॉल किया जाए।

डाउनलोड और स्थापना InfoSphere सूचना सर्वर

डेटास्टेज तक पहुंचने के लिए, का नवीनतम संस्करण डाउनलोड और इंस्टॉल करें IBM InfoSphere सर्वर। सर्वर AIX, Linux और का समर्थन करता है Windows ऑपरेटिंग सिस्टम आप आवश्यकतानुसार चुन सकते हैं।

अपने डेटा को इन्फोस्फेयर के पुराने संस्करण से नए संस्करण में स्थानांतरित करने के लिए एसेट इंटरचेंज टूल का उपयोग करें।

स्थापना फ़ाइलें

इन्फोस्फेयर डेटास्टेज को स्थापित और कॉन्फ़िगर करने के लिए, आपके सेटअप में निम्नलिखित फ़ाइलें होनी चाहिए।

के लिए Windows,

  • EtlDeploymentPackage-windows-oracle.pkg
  • EtlDeploymentPackage-windows-db2.pkg

लिनक्स के लिए,

  • EtlDeploymentPackage-linux-db2.pkg
  • EtlDeploymentPackage-linux-oracle.pkg

सी.डी.सी. ट्रांजेक्शन स्टेज जॉब में परिवर्तन डेटा का प्रक्रिया प्रवाह

सी.डी.सी. में परिवर्तन डेटा की प्रक्रिया प्रवाह

  1. डेटाबेस के लिए 'इंफोस्फीयर सीडीसी' सेवा स्रोत डेटाबेस से परिवर्तन की निगरानी और कैप्चर करती है
  2. प्रतिकृति परिभाषा के अनुसार "InfoSphere CDC" परिवर्तन डेटा को "InfoSphere DataStage के लिए InfoSphere CDC" में स्थानांतरित करता है।
  3. “InfoSphere CDC for InfoSphere DataStage” सर्वर TCP/IP सत्र के माध्यम से “CDC ट्रांजेक्शन स्टेज” को डेटा भेजता है। “InfoSphere CDC for InfoSphere DataStage” सर्वर कैप्चर किए गए लॉग में ट्रांजेक्शन सीमा को चिह्नित करने के लिए एक COMMIT संदेश (बुकमार्क जानकारी के साथ) भी भेजता है।
  4. “InfoSphere CDC for InfoSphere DataStage” सर्वर द्वारा भेजे गए प्रत्येक COMMIT संदेश के लिए, “CDC ट्रांजेक्शन स्टेज” एंड-ऑफ-वेव (EOW) मार्कर बनाता है। ये मार्कर लक्ष्य डेटाबेस कनेक्टर स्टेज के सभी आउटपुट लिंक पर भेजे जाते हैं।
  5. जब "लक्ष्य डेटाबेस कनेक्टर चरण" सभी इनपुट लिंक पर एंड-ऑफ-वेव मार्कर प्राप्त करता है, तो यह बुकमार्क जानकारी को बुकमार्क तालिका में लिखता है और फिर लक्ष्य डेटाबेस में लेनदेन को प्रतिबद्ध करता है।
  6. “InfoSphere CDC for InfoSphere DataStage” सर्वर “लक्ष्य डेटाबेस” पर बुकमार्क तालिका से बुकमार्क जानकारी का अनुरोध करता है।
  7. “InfoSphere CDC for InfoSphere DataStage” सर्वर बुकमार्क जानकारी प्राप्त करता है।

इस जानकारी का उपयोग निम्नलिखित के लिए किया जाता है,

  • लेनदेन लॉग में प्रारंभिक बिंदु निर्धारित करें जहां प्रतिकृतिकरण शुरू होने पर परिवर्तन पढ़े जाते हैं।
  • यह निर्धारित करने के लिए कि क्या मौजूदा लेनदेन लॉग को साफ़ किया जा सकता है

SQL प्रतिकृति सेट अप करना

डेटास्टेज शुरू करने से पहले, आपको डेटाबेस सेटअप करना होगा। आप दो DB2 डेटाबेस बनाएंगे।

  • एक प्रतिकृति स्रोत के रूप में काम करने के लिए और
  • एक को लक्ष्य बनाया गया।

आप दो टेबल (उत्पाद और इन्वेंट्री) भी बनाएंगे और उन्हें नमूना डेटा से भरेंगे। फिर आप अपने एकीकरण का परीक्षण कर सकते हैं एसक्यूएल प्रतिकृति और डेटास्टेज.

आगे बढ़ते हुए आप SQL प्रतिकृति बनाकर सेट अप करेंगे नियंत्रण तालिकाएँ, सदस्यता सेट, पंजीकरण और सदस्यता सेट सदस्यहम इसके बारे में अगले भाग में विस्तार से जानेंगे।

यहाँ हम अपने डेटाबेस के रूप में खुदरा बिक्री आइटम का एक उदाहरण लेंगे और दो टेबल इन्वेंटरी और उत्पाद बनाएंगे। ये टेबल इन सेटों के माध्यम से स्रोत से लक्ष्य तक डेटा लोड करेंगे। (नियंत्रण तालिकाएँ, सदस्यता सेट, पंजीकरण और सदस्यता सेट सदस्य.)

चरण 1) एक स्रोत डेटाबेस बनाएँ जिसे संदर्भित किया जाता है बिक्रीइस डेटाबेस के अंतर्गत दो तालिकाएँ बनाएँ उत्पाद और इन्वेंटरी.

चरण 2) SALES डेटाबेस बनाने के लिए निम्नलिखित कमांड चलाएँ।

db2 create database SALES

चरण 3) SALES डेटाबेस के लिए अभिलेखीय लॉगिंग चालू करें। साथ ही, निम्न कमांड का उपयोग करके डेटाबेस का बैकअप लें

db2 update db cfg for SALES using LOGARCHMETH3 LOGRETAIN
db2 backup db SALES

चरण 4) उसी कमांड प्रॉम्प्ट में, sqlrepl-datastage-tutorial निर्देशिका में setupDB उपनिर्देशिका में बदलें जिसे आपने डाउनलोड की गई संपीड़ित फ़ाइल से निकाला था।

SQL प्रतिकृति सेट अप करना

चरण 5) इन्वेंटरी तालिका बनाने के लिए निम्नलिखित कमांड का उपयोग करें और निम्नलिखित कमांड चलाकर तालिका में डेटा आयात करें।

db2 inventory.ixf से import करें ixf create से inventory में

चरण 6) एक लक्ष्य तालिका बनाएँ। लक्ष्य डेटाबेस का नाम इस प्रकार रखें STAGEDB.

चूंकि अब आपने दोनों डेटाबेस स्रोत और लक्ष्य बना लिए हैं, इसलिए इस डेटास्टेज ट्यूटोरियल में अगला चरण यह होगा कि हम देखेंगे कि इसे कैसे दोहराया जाए।

निम्नलिखित जानकारी सहायक हो सकती है ODBC डेटा स्रोत सेट अप करना.

SQL प्रतिकृति ऑब्जेक्ट बनाना

नीचे दी गई छवि दिखाती है कि स्रोत से लक्ष्य डेटाबेस तक परिवर्तन डेटा का प्रवाह कैसे वितरित किया जाता है। आप तालिकाओं के बीच एक स्रोत-से-लक्ष्य मैपिंग बनाते हैं जिसे कहा जाता है सदस्यता सेट सदस्य और सदस्यों को एक समूह में बांटें अंशदान.

SQL प्रतिकृति ऑब्जेक्ट बनाना

इन्फोस्फीयर सी.डी.सी. (चेंज डेटा कैप्चर) के अंतर्गत प्रतिकृति की इकाई को सदस्यता कहा जाता है।

  • स्रोत में किए गए परिवर्तन "कैप्चर कंट्रोल टेबल" में कैप्चर किए जाते हैं, जिसे सीडी टेबल और फिर लक्ष्य टेबल पर भेजा जाता है। जबकि अप्लाई प्रोग्राम में उस पंक्ति के बारे में विवरण होगा जहाँ से परिवर्तन किए जाने की आवश्यकता है। यह सब्सक्रिप्शन सेट में सीडी टेबल को भी शामिल करेगा।
  • सदस्यता में मैपिंग विवरण शामिल होते हैं जो निर्दिष्ट करते हैं कि स्रोत डेटा स्टोर में डेटा को लक्ष्य डेटा स्टोर पर कैसे लागू किया जाता है। ध्यान दें, CDC को अब इस रूप में संदर्भित किया जाता है इन्फोस्फेयर डेटा प्रतिकृति.
  • जब कोई सदस्यता निष्पादित होती है, तो InfoSphere CDC स्रोत डेटाबेस पर परिवर्तनों को कैप्चर करता है। InfoSphere CDC लक्ष्य को परिवर्तन डेटा वितरित करता है, और लक्ष्य डेटाबेस में बुकमार्क तालिका में सिंक पॉइंट जानकारी संग्रहीत करता है।
  • InfoSphere CDC, InfoSphere DataStage कार्य की प्रगति की निगरानी के लिए बुकमार्क जानकारी का उपयोग करता है।
  • विफलता के मामले में, बुकमार्क जानकारी को पुनः आरंभ बिंदु के रूप में उपयोग किया जाता है। हमारे उदाहरण में, ASN.IBMSNAP_FEEDETL तालिका डेटास्टेज से संबंधित सिंकपॉइंट जानकारी संग्रहीत करती है जिसका उपयोग डेटास्टेज प्रगति को ट्रैक करने के लिए किया जाता है।

के इस अनुभाग में IBM डेटास्टेज प्रशिक्षण ट्यूटोरियल, आपको निम्नलिखित चीजें करनी होंगी,

  • प्रतिकृति विकल्पों को संग्रहीत करने के लिए CAPTURE CONTROL तालिकाएँ और APPLY CONTROL तालिकाएँ बनाएँ
  • उत्पाद और इन्वेंटरी तालिकाओं को प्रतिकृति स्रोतों के रूप में पंजीकृत करें
  • दो सदस्यों वाला सदस्यता सेट बनाएँ
  • सदस्यता सेट सदस्य और लक्ष्य CCD तालिकाएँ बनाएँ

SQL प्रतिकृति सेटअप करने के लिए ASNCLP कमांड लाइन प्रोग्राम का उपयोग करें

चरण 1) sqlrepl-datastage-tutorial/setupSQLRep निर्देशिका में crtCtlTablesCaptureServer.asnclp स्क्रिप्ट फ़ाइल का पता लगाएँ।

चरण 2) फ़ाइल में प्रतिस्थापित करें और " ” को अपने यूजर आईडी और पासवर्ड के साथ SALES डेटाबेस से कनेक्ट करें।

चरण 3) निर्देशिकाओं को sqlrepl-datastage-tutorial/setupSQLRep निर्देशिका में बदलें और स्क्रिप्ट चलाएँ। निम्न कमांड का उपयोग करें। कमांड SALES डेटाबेस से कनेक्ट होगा, कैप्चर कंट्रोल टेबल बनाने के लिए एक SQL स्क्रिप्ट जेनरेट करेगा।

asnclp –f crtCtlTablesCaptureServer.asnclp

चरण 4) उसी निर्देशिका में crtCtlTablesApplyCtlServer.asnclp स्क्रिप्ट फ़ाइल ढूँढें। अब दो इंस्टेंस बदलें और " ” STAGEDB डाटाबेस से कनेक्ट करने के लिए उपयोगकर्ता आईडी और पासवर्ड के साथ।

चरण 5) अब उसी कमांड प्रॉम्प्ट में लागू नियंत्रण तालिकाएँ बनाने के लिए निम्नलिखित कमांड का उपयोग करें।

asnclp –f crtCtlTablesApplyCtlServer.asnclp

चरण 6) crtRegistration.asnclp स्क्रिप्ट फ़ाइलों का पता लगाएँ और सभी इंस्टेंस को प्रतिस्थापित करें SALES डेटाबेस से कनेक्ट करने के लिए यूजर आईडी के साथ। इसके अलावा, “ ” को कनेक्शन पासवर्ड में जोड़ें.

चरण 7) स्रोत तालिकाओं को पंजीकृत करने के लिए, निम्न स्क्रिप्ट का उपयोग करें। पंजीकरण बनाने के भाग के रूप में, ASNCLP प्रोग्राम दो CD तालिकाएँ बनाएगा। CDPRODUCT और CDINVENTORY.

asnclp –f crtRegistration.asnclp

CREATE REGISTRATION कमांड निम्नलिखित विकल्पों का उपयोग करता है:

  • विभेदक रिफ्रेश: यह प्रोग्राम को लक्ष्य तालिका को अद्यतन करने के लिए तभी संकेत देता है जब स्रोत तालिका में पंक्तियाँ बदल जाती हैं
  • छवि दोनों: इस विकल्प का उपयोग परिवर्तन होने से पहले स्रोत कॉलम में मान पंजीकृत करने के लिए किया जाता है, और परिवर्तन होने के बाद मान के लिए भी इसका उपयोग किया जाता है।

चरण 8) लक्ष्य डेटाबेस (STAGEDB) से कनेक्ट करने के लिए, निम्नलिखित चरणों का उपयोग करें।

  • crtTableSpaceApply.bat फ़ाइल ढूंढें, इसे टेक्स्ट एडिटर में खोलें
  • प्रतिस्थापित करें और उपयोगकर्ता आईडी और पासवर्ड के साथ
  • DB2 कमांड विंडो में, crtTableSpaceApply.bat दर्ज करें और फ़ाइल चलाएँ।
  • यह बैच फ़ाइल लक्ष्य डेटाबेस (STAGEDB) पर एक नया टेबलस्पेस बनाती है

चरण 9) crtSubscriptionSetAndAddMembers.asnclp स्क्रिप्ट फ़ाइल का पता लगाएँ और निम्नलिखित परिवर्तन करें।

  • के सभी उदाहरण बदलें और SALES डेटाबेस से कनेक्ट करने के लिए उपयोगकर्ता आईडी और पासवर्ड के साथ (स्रोत)।
  • के सभी उदाहरण बदलें और STAGEDB डाटाबेस (लक्ष्य) से कनेक्ट करने के लिए उपयोगकर्ता आईडी के साथ।

परिवर्तन के बाद सब्सक्रिप्शन सेट (ST00) बनाने के लिए स्क्रिप्ट चलाएँ जो स्रोत और लक्ष्य तालिकाओं को समूहीकृत करता है। स्क्रिप्ट दो सब्सक्रिप्शन सेट सदस्य भी बनाती है, और लक्ष्य डेटाबेस में CCD (संगत परिवर्तन डेटा) जो संशोधित डेटा संग्रहीत करेगा। यह डेटा इन्फोस्फीयर डेटास्टेज द्वारा उपयोग किया जाएगा।

चरण 10) सदस्यता सेट, सदस्यता-सेट सदस्य और CCD तालिकाएँ बनाने के लिए स्क्रिप्ट चलाएँ।

asnclp –f crtSubscriptionSetAndAddMembers.asnclp

सदस्यता सेट और दो सदस्य बनाने के लिए उपयोग किए जाने वाले विभिन्न विकल्पों में शामिल हैं

  • संघनित बंद पर पूरा करें
  • बाहरी
  • लोड प्रकार आयात निर्यात
  • समय निरंतर

चरण 11) प्रतिकृति प्रशासन उपकरण में दोष के कारण। आपको TARGET_CAPTURE_SCHEMA कॉलम को सेट करने के लिए एक और बैच फ़ाइल निष्पादित करनी होगी IBMSNAP_SUBS_SET नियंत्रण तालिका को शून्य करें.

  • updateTgtCapSchema.bat फ़ाइल ढूँढें। इसे टेक्स्ट एडिटर में खोलें। और STAGEDB डाटाबेस से कनेक्ट करने के लिए उपयोगकर्ता आईडी के साथ।
  • DB2 कमांड विंडो में, कमांड updateTgtCapSchema.bat दर्ज करें और फ़ाइल को निष्पादित करें।

सीसीडी तालिकाओं को डेटास्टेज पर मैप करने के लिए परिभाषा फ़ाइलें बनाना

अगले चरण में प्रतिकृति करने से पहले, हमें CCD टेबल को DataStage से कनेक्ट करना होगा। इस अनुभाग में, हम देखेंगे कि SQL को DataStage से कैसे कनेक्ट किया जाए।

CCD टेबल को DataStage से जोड़ने के लिए, आपको Datastage परिभाषा (.dxs) फ़ाइलें बनाने की आवश्यकता है। .dsx फ़ाइल प्रारूप का उपयोग DataStage द्वारा जॉब परिभाषाओं को आयात और निर्यात करने के लिए किया जाता है। आप दो .dsx फ़ाइलें बनाने के लिए ASNCLP स्क्रिप्ट का उपयोग करेंगे। उदाहरण के लिए, यहाँ हमने दो .dsx फ़ाइलें बनाई हैं।

  • stagedb_AQ00_SET00_sJobs.dsx: एक कार्य अनुक्रम बनाता है जो चार समानांतर कार्यों के वर्कफ़्लो को निर्देशित करता है।
  • stagedb_AQ00_SET00_pJobs.dsx : चार समानांतर नौकरियाँ बनाता है

ASNCLP प्रोग्राम स्वचालित रूप से CCD कॉलम को डेटास्टेज कॉलम प्रारूप में मैप करता है। यह केवल तभी समर्थित है जब ASNCLP चलता है Windows, लिनक्स, या यूनिक्स प्रक्रिया.

सीसीडी तालिकाओं को डेटास्टेज पर मैप करने के लिए परिभाषा फ़ाइलें

डेटास्टेज जॉब्स सीसीडी तालिका से पंक्तियाँ खींचते हैं।

  1. एक जॉब एक ​​सिंकपॉइंट सेट करता है जहाँ डेटास्टेज ने दो टेबल से डेटा निकालने में काम छोड़ा था। जॉब को यह जानकारी ST00 सब्सक्रिप्शन सेट के लिए SYNCHPOINT मान का चयन करके मिलती है। IBMSNAP_SUBS_SET तालिका को MAX_SYNCHPOINT कॉलम में प्रविष्ट करना IBMSNAP_FEEDETL तालिका.
  2. दो जॉब जो PRODUCT_CCD और INVENTORY_CCD टेबल से डेटा निकालते हैं। जॉब को पता होता है कि MIN_SYNCHPOINT और MAX_SYNCHPOINT मानों को चुनकर कौन सी पंक्तियाँ निकालना शुरू करना है IBMसदस्यता सेट के लिए SNAP_FEEDETL तालिका.

प्रतिकृतिकरण प्रारंभ करना

प्रतिकृतिकरण शुरू करने के लिए, आप नीचे दिए गए चरणों का उपयोग करेंगे। जब CCD तालिकाएँ डेटा से भरी जाती हैं, तो यह दर्शाता है कि प्रतिकृतिकरण सेटअप मान्य है। लक्ष्य CCD तालिकाओं में प्रतिकृतिकृत डेटा देखने के लिए DB2 नियंत्रण केंद्र ग्राफ़िकल यूज़र इंटरफ़ेस का उपयोग करें।

चरण 1) सुनिश्चित करें कि DB2 चल रहा है, यदि नहीं तो उपयोग करें db2 प्रारंभ आदेश।

चरण 2) फिर प्रोग्राम कैप्चर करना शुरू करने के लिए ऑपरेटिंग सिस्टम प्रॉम्प्ट से asncap कमांड का उपयोग करें। उदाहरण के लिए।

asncap capture_server=SALES

उपरोक्त कमांड SALES डेटाबेस को कैप्चर सर्वर के रूप में निर्दिष्ट करता है। कैप्चर चलने के दौरान कमांड विंडो को खुला रखें।

चरण 3) अब एक नया कमांड प्रॉम्प्ट खोलें। फिर शुरू करें APPLY asnapply कमांड का उपयोग करके प्रोग्राम।

asnapply control_server=STAGEDB apply_qual=AQ00

प्रतिकृतिकरण प्रारंभ करना

  • यह आदेश STAGEDB डाटाबेस को अप्लाई कंट्रोल सर्वर (वह डाटाबेस जिसमें अप्लाई कंट्रोल टेबल्स होती हैं) के रूप में निर्दिष्ट करता है।
  • AQ00 को लागू करें क्वालीफायर के रूप में (नियंत्रण तालिकाओं के इस सेट के लिए पहचानकर्ता)

'Apply' चालू रहने पर कमांड विंडो को खुला छोड़ दें।

चरण 4) अब एक और कमांड प्रॉम्प्ट खोलें और DB2 कंट्रोल सेंटर लॉन्च करने के लिए db2cc कमांड जारी करें। डिफ़ॉल्ट कंट्रोल सेंटर को स्वीकार करें।

चरण 5) अब बाएं नेविगेशन ट्री में, सभी डेटाबेस > STAGEDB खोलें और फिर टेबल्स पर क्लिक करें। Double टेबल खोलने के लिए टेबल नाम (प्रोडक्ट सीसीडी) पर क्लिक करें। यह कुछ इस तरह दिखेगा।

प्रतिकृतिकरण प्रारंभ करना

इसी तरह, आप INVENTORY के लिए CCD तालिका भी खोल सकते हैं।

प्रतिकृतिकरण प्रारंभ करना

डेटास्टेज टूल में प्रोजेक्ट कैसे बनाएं

सबसे पहले, आपको DataStage में एक प्रोजेक्ट बनाना होगा। इसके लिए, आपको InfoSphere DataStage एडमिनिस्ट्रेटर होना चाहिए।

एक बार इंस्टॉलेशन और प्रतिकृति हो जाने के बाद, आपको एक प्रोजेक्ट बनाना होगा। डेटास्टेज में, प्रोजेक्ट आपके डेटा को व्यवस्थित करने का एक तरीका है। इसमें किसी विशिष्ट प्रोजेक्ट में डेटा फ़ाइलें, स्टेज और बिल्ड जॉब को परिभाषित करना शामिल है।

डेटास्टेज में प्रोजेक्ट बनाने के लिए, नीचे दिए गए चरणों का पालन करें:

चरण 1) डेटास्टेज सॉफ्टवेयर लॉन्च करें

डेटास्टेज और क्वालिटीस्टेज एडमिनिस्ट्रेटर लॉन्च करें। फिर स्टार्ट > सभी प्रोग्राम > पर क्लिक करें IBM सूचना सर्वर > IBM वेबस्फीयर डेटास्टेज और क्वालिटीस्टेज प्रशासक।

चरण 2) डेटास्टेज सर्वर और क्लाइंट को कनेक्ट करें

अपने डेटास्टेज क्लाइंट से डेटास्टेज सर्वर से कनेक्ट करने के लिए, डोमेन नाम, उपयोगकर्ता आईडी, पासवर्ड और सर्वर जानकारी जैसे विवरण दर्ज करें।

चरण 3) एक नया प्रोजेक्ट जोड़ें

वेबस्फीयर डेटास्टेज एडमिनिस्ट्रेशन विंडो में, प्रोजेक्ट्स टैब पर क्लिक करें और फिर जोड़ें पर क्लिक करें।

चरण 4) परियोजना विवरण दर्ज करें

वेबस्फीयर डेटास्टेज एडमिनिस्ट्रेशन विंडो में, विवरण दर्ज करें जैसे

  1. नाम
  2. फ़ाइल का स्थान
  3. ओके पर क्लिक करें'

डेटास्टेज टूल में प्रोजेक्ट बनाएं

प्रत्येक परियोजना में शामिल हैं:

  • डेटास्टेज नौकरियां
  • अंतर्निहित घटक। ये किसी कार्य में प्रयुक्त पूर्वनिर्धारित घटक होते हैं।
  • उपयोगकर्ता-परिभाषित घटक। ये डेटास्टेज प्रबंधक या डेटास्टेज डिज़ाइनर का उपयोग करके बनाए गए अनुकूलित घटक हैं।

हम देखेंगे कि डेटास्टेज इन्फोस्फेयर में प्रतिकृति नौकरियों को कैसे आयात किया जाए।

डेटास्टेज और क्वालिटीस्टेज डिज़ाइनर में प्रतिकृति कार्य कैसे आयात करें

आप नौकरियों का आयात करेंगे IBM InfoSphere DataStage और QualityStage डिज़ाइनर क्लाइंट। और आप उन्हें निष्पादित करते हैं IBM इन्फोस्फीयर डेटास्टेज और क्वालिटीस्टेज डायरेक्टर क्लाइंट।

डिज़ाइनर-क्लाइंट जॉब बनाने के लिए एक खाली कैनवास की तरह है। यह डेटा को निकालता है, बदलता है, लोड करता है और उसकी गुणवत्ता की जांच करता है। यह ऐसे उपकरण प्रदान करता है जो जॉब के बुनियादी निर्माण खंड बनाते हैं। इसमें शामिल हैं

  • इंटर्नशिपयह फ़ाइलों को पढ़ने या लिखने और डेटा को संसाधित करने के लिए डेटा स्रोतों से जुड़ता है।
  • लिंक: यह उन चरणों को जोड़ता है जिनके साथ आपका डेटा प्रवाहित होता है

InfoSphere DataStage और QualityStage डिज़ाइनर क्लाइंट में स्थित स्टेजेस को डिज़ाइनर टूल पैलेट में संग्रहीत किया जाता है।

इन्फोस्फीयर क्वालिटीस्टेज में निम्नलिखित चरण शामिल हैं:

  • जांच चरण
  • मानकीकरण चरण
  • मिलान आवृत्ति चरण
  • एक-स्रोत मिलान चरण
  • दो-स्रोत मिलान चरण
  • जीवित रहने का चरण
  • मानकीकरण गुणवत्ता मूल्यांकन (एसक्यूए) चरण

आप डेटास्टेज इन्फोस्फेयर में 4 प्रकार की नौकरियां बना सकते हैं।

  • समानांतर नौकरी
  • अनुक्रम नौकरी
  • मेनफ्रेम जॉब
  • सर्वर जॉब

आइए चरण दर चरण देखें कि प्रतिकृति कार्य फ़ाइलों को कैसे आयात किया जाता है।

चरण 1) डेटास्टेज और क्वालिटीस्टेज डिज़ाइनर शुरू करें। स्टार्ट > सभी प्रोग्राम > पर क्लिक करें IBM सूचना सर्वर > IBM वेबस्फीयर डेटास्टेज और क्वालिटीस्टेज डिज़ाइनर

चरण 2) प्रोजेक्ट से संलग्न करें विंडो में, निम्नलिखित विवरण दर्ज करें।

  • डोमेन
  • उपयोगकर्ता नाम
  • पासवर्ड
  • परियोजना का नाम
  • OK

डेटास्टेज और क्वालिटीस्टेज में प्रतिकृति कार्य आयात करें

चरण 3) अब फ़ाइल मेनू से आयात पर क्लिक करें -> डेटास्टेज घटक.

एक नई डेटास्टेज रिपॉजिटरी आयात विंडो खुलेगी।

  1. इस विंडो में ब्राउज़ करें STAGEDB_AQ00_ST00_sJobs.dsx वह फ़ाइल जो हमने पहले बनाई थी
  2. “सभी आयात करें” विकल्प चुनें।
  3. “प्रभाव विश्लेषण करें” चेकबॉक्स को चिह्नित करें।
  4. ओके पर क्लिक करें।'

डेटास्टेज और क्वालिटीस्टेज में प्रतिकृति कार्य आयात करें

एक बार जॉब आयात हो जाने पर, DataStage STAGEDB_AQ00_ST00_sequence जॉब बनाएगा।

चरण 4) आयात करने के लिए समान चरणों का पालन करें STAGEDB_AQ00_ST00_pJobs.dsx फ़ाइलयह आयात चार समानांतर नौकरियां बनाता है.

चरण 5) डिज़ाइनर रिपॉजिटरी पैन के अंतर्गत -> SQLREP फ़ोल्डर खोलें। फ़ोल्डर के अंदर, आपको अनुक्रम जॉब और चार समानांतर जॉब दिखाई देंगे।

डेटास्टेज और क्वालिटीस्टेज में प्रतिकृति कार्य आयात करें

चरण 6) अनुक्रम कार्य देखने के लिए। रिपोजिटरी ट्री पर जाएँ, STAGEDB_AQ00_ST00_sequence कार्य पर राइट-क्लिक करें और Edit पर क्लिक करें। यह उन चार समानांतर कार्यों का वर्कफ़्लो दिखाएगा जिन्हें कार्य अनुक्रम नियंत्रित करता है।

डेटास्टेज और क्वालिटीस्टेज में प्रतिकृति कार्य आयात करें

प्रत्येक चिह्न एक मंच है,

  • getExtractRange चरण: यह अद्यतन करता है IBMSNAP_FEEDETL तालिका। यह डेटा निष्कर्षण के लिए प्रारंभिक बिंदु को उस बिंदु पर सेट करेगा जहां DataStage ने अंतिम बार पंक्तियों को निकाला था और अंतिम बिंदु को उस अंतिम लेनदेन पर सेट करेगा जो सदस्यता सेट के लिए संसाधित किया गया था।
  • getExtractRangeसफलता: यह चरण प्रारंभिक बिंदुओं को extractFromINVENTORY_CCD चरण और extractFromPRODUCT_CCD चरण में फीड करता है
  • सभीअर्कसफलता: यह चरण सुनिश्चित करता है कि extractFromINVENTORY_CCD और extractFromPRODUCT_CCD दोनों सफलतापूर्वक पूर्ण हो गए हैं। फिर setRangeProcessed चरण में लाई गई अंतिम पंक्तियों के लिए सिंक पॉइंट पास करता है।
  • setRangeProcessed चरण: यह अद्यतन करता है IBMSNAP_FEEDETL तालिका। इसलिए, डेटास्टेज को पता है कि डेटा निष्कर्षण का अगला दौर कहाँ से शुरू करना है

चरण 7) समानांतर जॉब्स देखने के लिए। STAGEDB_ASN_INVENTORY_CCD पर राइट-क्लिक करें और रिपॉजिटरी के अंतर्गत एडिट चुनें। यह नीचे दिखाए अनुसार विंडो खोलेगा।

डेटास्टेज और क्वालिटीस्टेज में प्रतिकृति कार्य आयात करें

यहाँ ऊपर की छवि में, आप देख सकते हैं कि इन्वेंटरी सीसीडी तालिका और से डेटा SyncFEEDETL तालिका से h बिंदु विवरण Lookup_6 चरण में प्रस्तुत किया जाता है।

DataStage से STAGEDB डेटाबेस तक डेटा कनेक्शन बनाना

अब अगला कदम InfoSphere DataStage और SQL Replication लक्ष्य डेटाबेस के बीच डेटा कनेक्शन बनाना है। इसमें CCD टेबल शामिल हैं।

डेटास्टेज में, आप जॉब डिज़ाइन में डेटा स्रोत से कनेक्शन को त्वरित रूप से परिभाषित करने के लिए संबंधित कनेक्टर चरणों के साथ डेटा कनेक्शन ऑब्जेक्ट का उपयोग करते हैं।

चरण 1) STAGEDB में वे दोनों अप्लाई कंट्रोल टेबल शामिल हैं जिनका उपयोग DataStage अपने डेटा निष्कर्षण को सिंक्रनाइज़ करने के लिए करता है और वे CCD टेबल जिनसे डेटा निकाला जाता है। निम्न कमांड का उपयोग करें

db2 catalog tcpip node SQLREP remote ip_address server 50000
db2 catalog database STAGEDB as STAGEDB2 at node SQLREP

नोट: उस सिस्टम का IP पता जहाँ STAGEDB बनाया गया था

चरण 2) फ़ाइल > नया > अन्य > डेटा कनेक्शन पर क्लिक करें।

चरण 3) आपके सामने दो टैब वाली एक विंडो होगी, पैरामीटर्स और जनरल।

डेटास्टेज से STAGEDB डाटाबेस तक डेटा कनेक्शन

चरण 4) इस चरण में,

  1. सामान्यतः, टैब, डेटा कनेक्शन का नाम sqlreplConnect रखें
  2. पैरामीटर्स टैब में, जैसा कि नीचे दिखाया गया है
  • 'स्टेज प्रकार फ़ील्ड का उपयोग करके कनेक्ट करें' के आगे ब्राउज़ बटन पर क्लिक करें, और
  • विंडो खोलें और रिपोजिटरी ट्री को स्टेज प्रकार -> समानांतर -> डेटाबेस -> डीबी2 कनेक्टर पर नेविगेट करें।
  • Open पर क्लिक करें।

डेटास्टेज से STAGEDB डाटाबेस तक डेटा कनेक्शन

चरण 5) कनेक्शन पैरामीटर तालिका में, विवरण दर्ज करें जैसे

  • connectionstring: स्टेजडीबी2
  • उपयोगकर्ता नाम: STAGEDB डेटाबेस से कनेक्ट करने के लिए उपयोगकर्ता आईडी
  • पासवर्ड: STAGEDB डाटाबेस से कनेक्ट करने के लिए पासवर्ड
  • उदाहरण: DB2 इंस्टेंस का नाम जिसमें STAGEDB डेटाबेस शामिल है

चरण 6) अगली विंडो में डेटा कनेक्शन सेव करें। 'सेव' बटन पर क्लिक करें।

STAGEDB से DataStage में तालिका परिभाषाएँ आयात करना

पिछले चरण में, हमने देखा कि InfoSphere DataStage और STAGEDB डेटाबेस जुड़े हुए हैं। अब, PRODUCT_CCD और INVENTORY_CCD तालिकाओं के लिए कॉलम परिभाषा और अन्य मेटाडेटा को सूचना सर्वर रिपॉजिटरी में आयात करें।

डिज़ाइनर विंडो में, नीचे दिए गए चरणों का पालन करें।

चरण 1) आयात > तालिका परिभाषाएँ > कनेक्टर आयात विज़ार्ड प्रारंभ करें चुनें

चरण 2) विज़ार्ड के कनेक्टर चयन पृष्ठ से, DB2 कनेक्टर का चयन करें और अगला क्लिक करें।

STAGEDB से DataStage में तालिका परिभाषाएँ आयात करना

चरण 3) कनेक्शन विवरण पृष्ठ पर लोड पर क्लिक करें। यह विज़ार्ड फ़ील्ड को आपके द्वारा पिछले अध्याय में बनाए गए डेटा कनेक्शन से कनेक्शन जानकारी से भर देगा।

STAGEDB से DataStage में तालिका परिभाषाएँ आयात करना

चरण 4) उसी पेज पर टेस्ट कनेक्शन पर क्लिक करें। यह डेटास्टेज को STAGEDB डेटाबेस से कनेक्शन का प्रयास करने के लिए प्रेरित करेगा। आप संदेश देख सकते हैं "कनेक्शन सफल हुआ"। अगला क्लिक करें।

STAGEDB से DataStage में तालिका परिभाषाएँ आयात करना

चरण 5) सुनिश्चित करें कि डेटा स्रोत स्थान पृष्ठ पर होस्टनाम और डेटाबेस नाम फ़ील्ड सही ढंग से भरे गए हैं। फिर अगला क्लिक करें।

चरण 6) स्कीमा पेज पर। अप्लाई कंट्रोल टेबल (ASN) की स्कीमा दर्ज करें या जाँच करें कि ASN स्कीमा स्कीमा फ़ील्ड में पहले से भरी हुई है। फिर अगला क्लिक करें। चयन पृष्ठ ASN स्कीमा में परिभाषित तालिकाओं की सूची दिखाएगा।

STAGEDB से DataStage में तालिका परिभाषाएँ आयात करना

चरण 7) पहली तालिका जिससे हमें मेटाडेटा आयात करना है वह है IBMSNAP_FEEDETL, एक अप्लाई कंट्रोल टेबल। इसमें सिंक्रोनाइजेशन पॉइंट्स के बारे में विवरण है जो डेटास्टेज को यह ट्रैक रखने की अनुमति देता है कि उसने CCD टेबल्स से कौन सी पंक्तियाँ प्राप्त की हैं। चुनें IBMSNAP_FEEDETL और अगला क्लिक करें।

चरण 8) आयात को पूरा करने के लिए IBMSNAP_FEEDETL तालिका परिभाषा। आयात पर क्लिक करें और फिर खुली खिड़की में खोलें पर क्लिक करें।

चरण 9) PRODUCT_CCD तालिका और फिर INVENTORY_CCD तालिका के लिए परिभाषाएँ आयात करने के लिए चरण 1-8 को दो बार और दोहराएँ।

ध्यान देंइन्वेंट्री और उत्पाद के लिए परिभाषाएँ आयात करते समय, सुनिश्चित करें कि आप ASN से स्कीमा को उस स्कीमा में बदल दें जिसके अंतर्गत PRODUCT_CCD और INVENTORY_CCD बनाए गए थे।

अब डेटास्टेज के पास SQL ​​प्रतिकृति लक्ष्य डेटाबेस से कनेक्ट करने के लिए आवश्यक सभी विवरण हैं।

डेटास्टेज जॉब्स के लिए गुण सेट करना

हमारे पास मौजूद चार DataStage समानांतर जॉब्स में से प्रत्येक में एक या अधिक स्टेज होते हैं जो STAGEDB डेटाबेस से जुड़ते हैं। कनेक्शन जानकारी जोड़ने और DataStage द्वारा पॉप्युलेट की जाने वाली डेटासेट फ़ाइलों से लिंक करने के लिए आपको स्टेज को संशोधित करने की आवश्यकता है।

चरणों में पूर्वनिर्धारित गुण होते हैं जो संपादन योग्य होते हैं। यहाँ हम STAGEDB_ASN_PRODUCT_CCD_extract समानांतर कार्य के लिए इनमें से कुछ गुणों को बदलेंगे।

चरण 1) डिज़ाइनर रिपोजिटरी ट्री ब्राउज़ करें। SQLREP फ़ोल्डर के अंतर्गत STAGEDB_ASN_PRODUCT_CCD_extract समानांतर जॉब चुनें। संपादित करने के लिए, जॉब पर राइट-क्लिक करें। समानांतर जॉब की डिज़ाइन विंडो डिज़ाइनर पैलेट में खुलती है।

चरण 2) हरे रंग का आइकन ढूँढ़ें। यह आइकन DB2 कनेक्टर स्टेज को दर्शाता है। इसका उपयोग CCD टेबल से डेटा निकालने के लिए किया जाता है। Double-आइकन पर क्लिक करें। एक स्टेज एडिटर विंडो खुलती है।

डेटास्टेज जॉब्स के लिए गुण सेट करना

डेटास्टेज जॉब्स के लिए गुण सेट करना

चरण 3) एडिटर में कनेक्शन जानकारी के साथ फ़ील्ड भरने के लिए लोड पर क्लिक करें। स्टेज एडिटर को बंद करने और अपने बदलावों को सहेजने के लिए ओके पर क्लिक करें।

चरण 4) अब STAGEDB_ASN_PRODUCT_CCD_extract समानांतर जॉब के लिए डिज़ाइन विंडो पर वापस जाएँ। get के लिए आइकन ढूँढेंSynchPoints DB2 कनेक्टर स्टेज। फिर आइकन पर डबल-क्लिक करें।

चरण 5) अब कनेक्शन जानकारी वाले फ़ील्ड भरने के लिए लोड बटन पर क्लिक करें।

ध्यान दें: यदि आप अपने अप्लाई कंट्रोल सर्वर के रूप में STAGEDB के अलावा किसी अन्य डेटाबेस का उपयोग कर रहे हैं। फिर get के लिए कनेक्शन जानकारी लोड करने के लिए विकल्प का चयन करेंSynchPoints चरण, जो CCD तालिका के बजाय नियंत्रण तालिकाओं के साथ अंतःक्रिया करता है।

चरण 6) इस चरण में,

  • उस सिस्टम पर एक खाली टेक्स्ट फ़ाइल बनाएं जहां InfoSphere DataStage चलता है।
  • इस फ़ाइल का नाम productdataset.ds रखें और ध्यान रखें कि आपने इसे कहाँ सहेजा है।
  • डेटास्टेज, CCD तालिका से परिवर्तन प्राप्त करने के बाद, इस फ़ाइल में परिवर्तन लिखेगा।
  • डेटा सेट या फ़ाइल जो लिंक किए गए जॉब के बीच डेटा को स्थानांतरित करने के लिए उपयोग किए जाते हैं उन्हें स्थायी डेटा सेट के रूप में जाना जाता है। इसे डेटासेट स्टेज द्वारा दर्शाया जाता है।

चरण 7) अब डिज़ाइन विंडो में स्टेज एडिटर खोलें, और insert_into_a_dataset आइकन पर डबल क्लिक करें। यह एक और विंडो खोलेगा।

डेटास्टेज जॉब्स के लिए गुण सेट करना

चरण 8) इस खिड़की में,

डेटास्टेज जॉब्स के लिए गुण सेट करना

  • गुण टैब के अंतर्गत यह सुनिश्चित करें कि Target फ़ोल्डर खुला है और फ़ाइल = DATASETNAME गुण हाइलाइट किया गया है।
  • दाईं ओर, आपके पास एक फ़ाइल फ़ील्ड होगी
  • productdataset.ds फ़ाइल का पूरा पथ दर्ज करें
  • ओके पर क्लिक करें'।

अब आपने उत्पाद CCD तालिका के लिए सभी आवश्यक गुण अपडेट कर लिए हैं। डिज़ाइन विंडो बंद करें और सभी परिवर्तन सहेजें।

चरण 9) अब डिज़ाइनर के रिपोजिटरी पैन से STAGEDB_ASN_INVENTORY_CCD_extract समानांतर जॉब ढूंढें और खोलें तथा चरण 3-8 को दोहराएं।

ध्यान दें:

  • आपको नियंत्रण सर्वर डेटाबेस के लिए कनेक्शन जानकारी को स्टेज संपादक में लोड करना होगाSynchPoints चरण. यदि आपका नियंत्रण सर्वर STAGEDB नहीं है.
  • STAGEDB_ST00_AQ00_getExtractRange और STAGEDB_ST00_AQ00_markRangeProcessed समानांतर जॉब्स के लिए, सभी DB2 कनेक्टर स्टेज खोलें। फिर STAGEDB डेटाबेस के लिए कनेक्शन जानकारी जोड़ने के लिए लोड फ़ंक्शन का उपयोग करें

डेटास्टेज जॉब्स को संकलित करना और चलाना

जब डेटास्टेज कार्य संकलित करने के लिए तैयार हो जाता है, तो डिज़ाइनर इनपुट, रूपांतरण, अभिव्यक्ति और अन्य विवरणों को देखकर कार्य के डिज़ाइन को मान्य करता है।

जब जॉब संकलन सफलतापूर्वक हो जाता है, तो यह चलने के लिए तैयार है। हम सभी पाँच जॉब संकलित करेंगे, लेकिन केवल "जॉब अनुक्रम" चलाएँगे। ऐसा इसलिए है क्योंकि यह जॉब सभी चार समानांतर जॉब को नियंत्रित करता है।

चरण 1) SQLREP फ़ोल्डर के अंतर्गत। (Cntrl+) द्वारा पाँचों जॉब में से प्रत्येक का चयन करेंShift) फिर राइट क्लिक करें और मल्टीपल जॉब कम्पाइल विकल्प चुनें।

डेटास्टेज जॉब्स को संकलित करना और चलाना

चरण 2) आप देखेंगे कि डेटास्टेज संकलन विज़ार्ड में पाँच कार्य चयनित हैं। अगला क्लिक करें।

डेटास्टेज जॉब्स को संकलित करना और चलाना

चरण 3) संकलन शुरू हो जाता है और पूरा होने पर “सफलतापूर्वक संकलित” संदेश प्रदर्शित होता है।

डेटास्टेज जॉब्स को संकलित करना और चलाना

चरण 4) अब DataStage और QualityStage Director शुरू करें। प्रारंभ > सभी प्रोग्राम > चुनें IBM सूचना सर्वर > IBM वेबस्फीयर डेटास्टेज और क्वालिटीस्टेज डायरेक्टर।

चरण 5) प्रोजेक्ट नेविगेशन पैन में बाईं ओर SQLREP फ़ोल्डर पर क्लिक करें। यह सभी पाँच जॉब्स को डायरेक्टर स्टेटस टेबल में ले आता है।

चरण 6) STAGEDB_AQ00_S00_sequence जॉब चुनें। मेनू बार से जॉब > रन नाउ पर क्लिक करें।

डेटास्टेज जॉब्स को संकलित करना और चलाना

एक बार संकलन पूरा हो जाने पर, आपको समाप्त स्थिति दिखाई देगी।

डेटास्टेज जॉब्स को संकलित करना और चलाना

अब जाँचें कि क्या PRODUCT_CCD और INVENTORY_CCD तालिकाओं में संग्रहीत परिवर्तित पंक्तियाँ DataStage द्वारा निकाली गईं और दो डेटा सेट फ़ाइलों में डाली गईं।

चरण 7) डिज़ाइनर पर वापस जाएँ और STAGEDB_ASN_PRODUCT_CCD_extract जॉब खोलें। स्टेज एडिटर खोलने के लिए Double- insert_into_a_dataset आइकन पर क्लिक करें। फिर view data पर क्लिक करें।

चरण 8) प्रदर्शित की जाने वाली पंक्तियों में डिफ़ॉल्ट को स्वीकार करें। फिर OK पर क्लिक करें। डेटा सेट फ़ाइल की सामग्री दिखाने के लिए एक डेटा ब्राउज़र विंडो खुलेगी।

डेटास्टेज जॉब्स को संकलित करना और चलाना

SQL प्रतिकृति और डेटास्टेज के बीच एकीकरण का परीक्षण

पिछले चरण में, हमने जॉब को संकलित और निष्पादित किया। इस अनुभाग में, हम SQL प्रतिकृति और DataStage के एकीकरण की जाँच करेंगे। इसके लिए, हम स्रोत तालिका में परिवर्तन करेंगे और देखेंगे कि क्या वही परिवर्तन DataStage में अपडेट किया गया है।

चरण 1) अपने ऑपरेटिंग सिस्टम के लिए sqlrepl-datastage-scripts फ़ोल्डर पर जाएँ।

चरण 2) निम्न चरणों का पालन करके SQL प्रतिकृति प्रारंभ करें:

  • startSQLCapture.bat चलाएँ (Windows) फ़ाइल का उपयोग करके SALES डेटाबेस पर कैप्चर प्रोग्राम प्रारंभ करें।
  • startSQLApply.bat चलाएँ (Windows) फ़ाइल का उपयोग करके STAGEDB डाटाबेस पर Apply प्रोग्राम प्रारंभ करें।

चरण 3) अब updateSourceTables.sql फ़ाइल खोलें। SALES डेटाबेस से कनेक्ट करने के लिए और उपयोगकर्ता आईडी और पासवर्ड के साथ.

चरण 4) DB2 कमांड विंडो खोलें। डायरेक्टरी को sqlrepl-datastage-tutorial\scripts में बदलें, और दिए गए कमांड द्वारा समस्या को चलाएँ:

db2 -tvf updateSourceTables.sql

SQL स्क्रिप्ट बिक्री डेटाबेस में दोनों तालिकाओं (उत्पाद, इन्वेंटरी) पर अद्यतन, सम्मिलित और हटाना जैसे विभिन्न कार्य करेगी।

चरण 5) उस सिस्टम पर जहाँ DataStage चल रहा है। DataStage Director खोलें और STAGEDB_AQ00_S00_sequence जॉब निष्पादित करें। जॉब > अभी चलाएँ पर क्लिक करें।

SQL प्रतिकृति और डेटास्टेज के बीच एकीकरण

जब आप कार्य चलाएंगे तो निम्नलिखित गतिविधियाँ संपन्न होंगी।

  • कैप्चर प्रोग्राम SALES डेटाबेस लॉग में छह-पंक्ति परिवर्तनों को पढ़ता है और उन्हें CD तालिकाओं में सम्मिलित करता है।
  • अप्लाई प्रोग्राम SALES पर CD तालिकाओं से परिवर्तन पंक्तियों को प्राप्त करता है और उन्हें STAGEDB पर CCD तालिकाओं में सम्मिलित करता है।
  • दो डेटास्टेज एक्सट्रेक्ट जॉब्स CCD तालिकाओं से परिवर्तनों को उठाते हैं और उन्हें productdataset.ds और inventory dataset.ds फाइलों में लिखते हैं।

आप डेटा सेट देखकर यह जांच सकते हैं कि उपरोक्त चरण हुए हैं या नहीं।

चरण 6) नीचे दिए गए चरणों का पालन करें,

  • डिज़ाइनर प्रारंभ करें.STAGEDB_ASN_PRODUCT_CCD_extract कार्य खोलें.
  • फिर Double-स्टेज एडिटर में insert_into_a_dataset आइकन पर क्लिक करें। डेटा देखें पर क्लिक करें।
  • प्रदर्शित होने वाली पंक्तियों की विंडो में डिफ़ॉल्ट को स्वीकार करें और ओके पर क्लिक करें।

डेटासेट में तीन नई पंक्तियाँ हैं। यह जाँचने का सबसे आसान तरीका है कि परिवर्तन लागू किए गए हैं या नहीं, डेटा ब्राउज़र के दाईं ओर नीचे स्क्रॉल करना। अब अंतिम तीन पंक्तियों को देखें (नीचे चित्र देखें)

SQL प्रतिकृति और डेटास्टेज के बीच एकीकरण

अक्षर I, U और D INSERT, UPDATE और DELETE ऑपरेशन को निर्दिष्ट करते हैं जिसके परिणामस्वरूप प्रत्येक नई पंक्ति बनती है।

आप इन्वेंटरी तालिका के लिए भी यही जांच कर सकते हैं।

सारांश

  • डेटास्टेज एक ईटीएल उपकरण जो डेटा निकालता है, डेटा को रूपांतरित करता है और स्रोत से लक्ष्य तक लोड करता है।
  • यह सुविधा देता है व्यापार विश्लेषण व्यावसायिक खुफिया जानकारी प्राप्त करने में सहायता के लिए गुणवत्तापूर्ण डेटा प्रदान करना।
  • डेटास्टेज को दो खंडों में विभाजित किया गया है, साझा घटक, और रनटाइम Archiटेक्चर.
  • डेटास्टेज के चार मुख्य घटक हैं,
  • प्रशासक
  • प्रबंधक
  • डिजाइनर
  • निदेशक
  • इसके प्रमुख पहलू निम्नलिखित हैं IBM इन्फोस्फीयर डेटास्टेज
  • डेटा परिवर्तन
  • नौकरियां
  • समानांतर प्रसंस्करण
  • नौकरी डिजाइन में विभिन्न चरण शामिल हैं
  • रूपांतरण चरण
  • फ़िल्टर चरण
  • एग्रीगेटर चरण
  • डुप्लिकेट हटाएँ चरण
  • मंच से जुड़ें
  • लुकअप चरण

इस पोस्ट को संक्षेप में इस प्रकार लिखें: