शुरुआती लोगों के लिए डेटास्टेज ट्यूटोरियल: IBM ईटीएल उपकरण

⚡ स्मार्ट सारांश

डेटास्टेज से IBM इन्फोस्फीयर पूर्वtracयह पेज बड़े पैमाने पर एंटरप्राइज़ डेटा को प्रोसेस, ट्रांसफ़ॉर्म और लोड करता है। यह पेज आर्किटेक्चर, कंपोनेंट्स, पैरेलल प्रोसेसिंग, SQL रेप्लिकेशन सेटअप, प्रोजेक्ट क्रिएशन, जॉब कंपाइलेशन और इंटीग्रेशन टेस्टिंग को एक व्यावहारिक DB2 रिटेल उदाहरण के साथ समझाता है।

🧩 मूल परिभाषा: DataStage अनुक्रमिक फ़ाइलों, संबंधपरक डेटाबेस, मेनफ्रेम, ERP और CRM सिस्टम से डेटा को एक नियंत्रित लक्ष्य स्थान पर स्थानांतरित करता है।
🏗️ Archiसंरचना परतें: एडमिनिस्ट्रेटर, मैनेजर, डिज़ाइनर और डायरेक्टर क्लाइंट साझा सेवाओं और एक स्केलेबल पैरेलल रनटाइम इंजन के ऊपर स्थित होते हैं।
⚡ समानांतर निष्पादन: पाइपलाइन समानांतरता विभिन्न चरणों के बीच रिकॉर्ड को स्ट्रीम करती है, जबकि विभाजन समानांतरता लगभग रैखिक स्केलेबिलिटी के लिए वॉल्यूम को नोड्स में विभाजित करती है।
🔁 प्रतिकृति सेटअप: ASNCLP स्क्रिप्ट DB2 के अंदर कैप्चर और अप्लाई कंट्रोल टेबल, रजिस्ट्रेशन, सब्सक्रिप्शन सेट और CCD टेबल बनाती हैं।
️ नौकरी का जीवनचक्र: डिजाइनर चरणों और लिंक को इकट्ठा करता है, फिर डायरेक्टर संकलित समानांतर और अनुक्रम कार्यों को मान्य करता है, शेड्यूल करता है, निष्पादित करता है और उनकी निगरानी करता है।
✅ सत्यापन चरण: स्रोत पंक्तियों को अपडेट करने और अनुक्रम कार्य को पुनः चलाने से पुष्टि होती है कि I, U और D फ़्लैग पूर्व स्तर तक पहुँच गए हैं।tracडेटा सेट।

विस्तार में पढ़ें

डेटास्टेज क्या है?

डेटास्टेज यह एक ईटीएल टूल है जिसका उपयोग एक्स के लिए किया जाता हैtracडेटास्टेज स्रोत से लक्ष्य स्थान तक डेटा को स्थानांतरित, रूपांतरित और लोड करता है। इन डेटा के स्रोतों में अनुक्रमिक फाइलें, अनुक्रमित फाइलें, संबंधपरक डेटाबेस, बाहरी डेटा स्रोत, अभिलेखागार, उद्यम अनुप्रयोग आदि शामिल हो सकते हैं। डेटास्टेज गुणवत्तापूर्ण डेटा प्रदान करके व्यावसायिक बुद्धिमत्ता प्राप्त करने में सहायता करता है, जिससे व्यावसायिक विश्लेषण को सुगम बनाया जा सके।

एक बड़े संगठन में विभिन्न प्रणालियों के बीच इंटरफ़ेस के रूप में DataStage ETL टूल का उपयोग किया जाता है। यह पूर्व-निर्धारित प्रक्रियाओं का ध्यान रखता है।tracस्रोत से लक्ष्य तक डेटा का स्थानांतरण, अनुवाद और लोडिंग। इसे सर्वप्रथम 90 के दशक के मध्य में वीमार्क द्वारा लॉन्च किया गया था। IBM 2005 में डेटास्टेज का अधिग्रहण करने के बाद इसका नाम बदलकर कर दिया गया IBM वेबस्फीयर डेटास्टेज और बाद में IBM इन्फोस्फीयर.

अब तक बाजार में डेटास्टेज के विभिन्न संस्करण उपलब्ध हैं, जैसे एंटरप्राइज एडिशन (पीएक्स), सर्वर एडिशन, एमवीएस एडिशन, पीपलसॉफ्ट के लिए डेटास्टेज इत्यादि। नवीनतम संस्करण है IBM इंफोस्फीयर डेटास्टेज।

IBM सूचना सर्वर में निम्नलिखित उत्पाद शामिल हैं,

IBM इन्फोस्फीयर डेटास्टेज
IBM इन्फोस्फीयर क्वालिटीस्टेज
IBM इन्फोस्फीयर सूचना सेवा निदेशक
IBM इन्फोस्फीयर सूचना विश्लेषक
IBM सूचना सर्वर तेज़Track
IBM इन्फोस्फीयर बिजनेस शब्दावली

परिभाषा तय हो जाने के बाद, अगला भाग यह देखता है कि उत्पाद वास्तव में किसी वस्तु के अंदर क्या कर सकता है। विवरण भण्डारण पर्यावरण.

डेटास्टेज अवलोकन

डेटास्टेज में निम्नलिखित क्षमताएं हैं।

यह उद्यम और बाहरी डेटा स्रोतों की व्यापक रेंज से डेटा को एकीकृत कर सकता है
डेटा सत्यापन नियमों को लागू करता है
यह बड़ी मात्रा में डेटा को संसाधित करने और परिवर्तित करने में उपयोगी है
यह स्केलेबल समानांतर प्रसंस्करण दृष्टिकोण का उपयोग करता है
यह जटिल परिवर्तनों को संभाल सकता है और कई एकीकरण प्रक्रियाओं का प्रबंधन कर सकता है
स्रोत या लक्ष्य के रूप में एंटरप्राइज़ अनुप्रयोगों से सीधे संपर्क का लाभ उठाएँ
विश्लेषण और रखरखाव के लिए मेटाडेटा का लाभ उठाएँ
Operaबैच में, वास्तविक समय में, या वेब सेवा के रूप में

इस डेटास्टेज ट्यूटोरियल के निम्नलिखित अनुभागों में, हम संक्षेप में निम्नलिखित पहलुओं का वर्णन करते हैं IBM इन्फोस्फीयर डेटास्टेज:

डेटा परिवर्तन
नौकरियां
समानांतर प्रसंस्करण

इन्फोस्फीयर डेटास्टेज और क्वालिटीस्टेज एंटरप्राइज़ अनुप्रयोगों और डेटा स्रोतों में डेटा तक पहुंच सकते हैं जैसे:

रिलेशनल डेटाबेस
मेनफ्रेम डेटाबेस
व्यवसाय और विश्लेषणात्मक अनुप्रयोग
उद्यम संसाधन योजना (ईआरपी) या ग्राहक संबंध प्रबंधन (सीआरएम) डेटाबेस
ऑनलाइन विश्लेषणात्मक प्रसंस्करण (OLAP) या प्रदर्शन प्रबंधन डेटाबेस

प्रसंस्करण चरण प्रकार

IBM इन्फोस्फीयर जॉब में अलग-अलग चरण होते हैं जो एक दूसरे से जुड़े होते हैं। यह डेटा स्रोत से डेटा लक्ष्य तक डेटा के प्रवाह का वर्णन करता है। आमतौर पर, एक चरण में कम से कम एक डेटा इनपुट और/या एक डेटा आउटपुट होता है। हालाँकि, कुछ चरण एक से अधिक डेटा इनपुट स्वीकार कर सकते हैं और एक से अधिक चरणों में आउटपुट कर सकते हैं।

जॉब डिज़ाइन में आप विभिन्न चरणों का उपयोग कर सकते हैं:

रूपांतरण चरण
फ़िल्टर चरण
एग्रीगेटर चरण
डुप्लिकेट हटाएँ चरण
मंच से जुड़ें
लुकअप चरण
कॉपी चरण
सॉर्ट चरण
कंटेनरों

डेटा एकीकरण के लिए DataStage का उपयोग क्यों करें?

किसी टूल की विशेषताओं की सूची जानना एक बात है; लेकिन यह जानना कि वह टूल लाइसेंस की लागत को कब सार्थक बनाता है, दूसरी बात है। DataStage को ऐसे कार्यभारों के लिए चुना जाता है जहाँ मात्रा, प्रबंधन और विभिन्न स्रोतों के कारण हाथ से लिखे गए स्क्रिप्ट का उपयोग करना असंभव हो जाता है।

इसका सबसे स्पष्ट कारण थ्रूपुट है। चूंकि इंजन डेटा को नोड्स में विभाजित करता है और साथ ही साथ विभिन्न चरणों के बीच रिकॉर्ड स्ट्रीम करता है, इसलिए हार्डवेयर जोड़ने से थ्रूपुट लगभग रैखिक रूप से बढ़ जाता है। दो-नोड वाले डेवलपमेंट बॉक्स पर डिज़ाइन किया गया कार्य आठ-नोड वाले प्रोडक्शन क्लस्टर पर बिना किसी बदलाव के चलता है।

अन्य कारण तकनीकी के बजाय संगठनात्मक हैं:

साझा मेटाडेटा: टेबल की परिभाषाएँ, कनेक्शन और व्यावसायिक शर्तें रिपॉजिटरी में एक बार संग्रहीत की जाती हैं और प्रत्येक जॉब द्वारा पुन: उपयोग की जाती हैं, जिससे वह विचलन दूर हो जाता है जो तब उत्पन्न होता है जब प्रत्येक डेवलपर स्वतंत्र रूप से एक स्रोत को परिभाषित करता है।
अंतर्निर्मित डेटा गुणवत्ता: QualityStage, ETL प्रवाह के साथ-साथ जांच, मानकीकरण, मिलान और उत्तरजीविता प्रक्रिया चलाता है, इसलिए सफाई के लिए किसी दूसरे उत्पाद की आवश्यकता नहीं होती है।
व्यापक कनेक्टिविटी: नेटिव कनेक्टर DB2 तक पहुँचते हैं, Oracleटेराडेटा, मेनफ्रेम वीएसएएम, SAPकस्टम कोड के बिना Salesforce और क्लाउड ऑब्जेक्ट स्टोरेज का उपयोग करना।
Operaक्षेत्रीय नियंत्रण: डायरेक्टर रन हिस्ट्री, रो काउंट, वार्निंग और रीस्टार्ट पॉइंट देता है, जिसे ऑडिटर एक नियंत्रित डेटा पाइपलाइन के प्रमाण के रूप में स्वीकार करते हैं।
पुनर्प्रयोग: साझा कंटेनर और पैरामीटर सेट एक ही परीक्षण किए गए रूपांतरण को कई कार्यों में उपयोग करने की अनुमति देते हैं, बजाय इसके कि इसे प्रत्येक कार्य में कॉपी किया जाए।

ये लाभ सीधे तौर पर इस बात पर निर्भर करते हैं कि उत्पाद को कैसे असेंबल किया जाता है, जिसे अगले अनुभाग में समझाया गया है।

डेटास्टेज घटक और Archiटेक्चर

डेटास्टेज के चार मुख्य घटक हैं,

प्रशासक: इसका उपयोग प्रशासन कार्यों के लिए किया जाता है। इसमें डेटास्टेज उपयोगकर्ताओं को सेट करना, शुद्धिकरण मानदंड सेट करना और प्रोजेक्ट बनाना और स्थानांतरित करना शामिल है।
प्रबंधक: यह ETL DataStage के रिपॉजिटरी का मुख्य इंटरफ़ेस है। इसका उपयोग पुन: प्रयोज्य डेटा के भंडारण और प्रबंधन के लिए किया जाता है। DataStage मैनेजर के माध्यम से, रिपॉजिटरी की सामग्री को देखा और संपादित किया जा सकता है।
डिजाइनर: डेटास्टेज एप्लिकेशन या जॉब बनाने के लिए उपयोग किया जाने वाला डिज़ाइन इंटरफ़ेस। यह डेटा स्रोत, आवश्यक परिवर्तन और डेटा के गंतव्य को निर्दिष्ट करता है। जॉब्स को एक निष्पादन योग्य बनाने के लिए संकलित किया जाता है जिसे डायरेक्टर द्वारा शेड्यूल किया जाता है और सर्वर द्वारा चलाया जाता है
निर्देशक: इसका उपयोग डेटास्टेज सर्वर जॉब्स और समानांतर जॉब्स को मान्य करने, शेड्यूल करने, निष्पादित करने और मॉनिटर करने के लिए किया जाता है।

उपरोक्त चित्र बताता है कि कैसे IBM इन्फोस्फीयर डेटास्टेज अन्य तत्वों के साथ बातचीत करता है IBM सूचना सर्वर प्लेटफ़ॉर्म। डेटास्टेज को दो भागों में विभाजित किया गया है, साझा घटक, और रनटाइम Archiटेक्चरनीचे दी गई तालिका में इन दोनों अनुभागों के योगदान को विस्तार से दर्शाया गया है।

		क्रियाएँ
साझा	एकीकृत उपयोगकर्ता इंटरफ़ेस	इन्फोस्फीयर डेटास्टेज अनुप्रयोगों (जिन्हें जॉब्स के नाम से जाना जाता है) को बनाने के लिए एक ग्राफिकल डिज़ाइन इंटरफ़ेस का उपयोग किया जाता है। प्रत्येक कार्य डेटा स्रोत, आवश्यक रूपांतरण और डेटा के गंतव्य को निर्धारित करता है। समानांतर जॉब फ़्लो और पुनः प्रयोज्य घटक बनाने के लिए जॉब्स को संकलित किया जाता है। उन्हें InfoSphere DataStage और QualityStage Director द्वारा शेड्यूल और चलाया जाता है। डिज़ाइनर क्लाइंट रिपॉजिटरी में मेटाडेटा का प्रबंधन करता है। जबकि संकलित निष्पादन डेटा को सूचना सर्वर इंजन टियर पर तैनात किया जाता है।
	सामान्य सेवाएँ	प्रभाव विश्लेषण और खोज जैसी डेटा सेवाएं डिज़ाइन सेवाएँ जो InfoSphere DataStage कार्यों के विकास और रखरखाव का समर्थन करती हैं निष्पादन सेवाएँ जो सभी InfoSphere DataStage फ़ंक्शनों का समर्थन करती हैं
	सामान्य समानांतर प्रसंस्करण	इंजन निष्पादन योग्य कार्यों को चलाता है जो...tracविभिन्न प्रकार की परिस्थितियों में डेटा को रूपांतरित, परिवर्तित और लोड करना। इंजन उच्च मात्रा में कार्य को संभालने के लिए समानांतर प्रसंस्करण और पाइपलाइनिंग के दृष्टिकोण का चयन करता है।
क्रम Archiटेक्चर	OSH स्क्रिप्ट	यह OSH (ऑर्केस्ट्रेट शेल स्क्रिप्ट) की पीढ़ी और उसके निष्पादन प्रवाह का वर्णन करता है IBM और प्रवाह IBM सूचना सर्वर इंजन का उपयोग करके इन्फोस्फेयर डेटास्टेज यह आपको पूर्व के लिए जॉब फ्लो विकसित करने के लिए ग्राफिकल पॉइंट-एंड-क्लिक तकनीकों का उपयोग करने में सक्षम बनाता है।tracडेटा को छांटना, साफ करना, रूपांतरित करना, एकीकृत करना और लक्षित फाइलों में लोड करना।

DataStage में समानांतर प्रोसेसिंग कैसे काम करती है

ऊपर दी गई आर्किटेक्चर तालिका में सामान्य समानांतर प्रोसेसिंग को एक साझा सेवा के रूप में दर्शाया गया है। यह अनुभाग बताता है कि वह सेवा वास्तव में किसी कार्य को कैसे निष्पादित करती है, क्योंकि इस अवधारणा का उल्लेख अवलोकन में किया गया था, और यह निर्धारित करती है कि कोई कार्य कितनी तेज़ी से पूरा होगा।

एक पैरेलल जॉब एक ही समय में दो तंत्रों का उपयोग करती है, और दोनों को मैन्युअल रूप से कोड करने के बजाय रनटाइम पर स्वचालित रूप से लागू किया जाता है।

1. पाइपलाइन समानांतरता। किसी भी कार्य का प्रत्येक चरण पिछले चरण के समाप्त होने की प्रतीक्षा किए बिना एक साथ शुरू होता है। स्रोत चरण पंक्तियों को पढ़ना शुरू करता है और उन्हें मेमोरी पाइपलाइन में भेजता है। जैसे ही पहली पंक्तियाँ आती हैं, ट्रांसफ़ॉर्मर शुरू हो जाता है और अपना आउटपुट दूसरी पाइपलाइन में भेजता है। इसके तुरंत बाद लक्ष्य कनेक्टर लिखना शुरू कर देता है। कोई मध्यवर्ती लैंडिंग फ़ाइल नहीं लिखी जाती है, इसलिए तीन-चरण का कार्य पढ़ने, रूपांतरण और लिखने को क्रम से चलाने के बजाय ओवरलैप करता है।

2. विभाजन समानांतरता। पंक्तियों को अलग-अलग विभाजनों में विभाजित किया जाता है, और प्रत्येक विभाजन के लिए स्टेज लॉजिक की पूरी प्रतिलिपि उसके अपने नोड पर चलाई जाती है। आठ विभाजनों का अर्थ है आठ एक साथ चलने वाले ट्रांसफ़ॉर्मर इंस्टेंस। प्रवाह के अंत में, लक्ष्य के लिए विभाजनों को एक ही स्ट्रीम में एकत्रित कर लिया जाता है।

सही विभाजन विधि का चयन करना ही डेवलपर द्वारा लिया जाने वाला सबसे महत्वपूर्ण निर्णय है:

ऑटो: डिफ़ॉल्ट सेटिंग। इंजन चरण की आवश्यकता के आधार पर एक विधि का चयन करता है।
हैश: समान कुंजी मान वाली पंक्तियों को एक ही नोड पर भेजता है। जॉइन, एग्रीगेटर और डुप्लिकेट हटाएं से पहले आवश्यक है ताकि मिलान करने वाली कुंजियाँ मिल सकें।
राउंड रोबिन: यह पंक्तियों को एक-एक करके समान रूप से व्यवस्थित करता है। फ्लैट फ़ाइल लोड करने के लिए सबसे उपयुक्त है जहाँ कुंजी समूहping कोई फर्क नही।
पूरा: यह संपूर्ण डेटा सेट को प्रत्येक नोड पर कॉपी करता है। इसका उपयोग लुकअप चरण में छोटी संदर्भ तालिकाओं के लिए किया जाता है।
वही: यह मौजूदा विभाजन को अपरिवर्तित रखता है, जिससे दो चरणों के बीच अनावश्यक पुनर्विभाजन से बचा जा सकता है।
रेंज और मापांक: जब समान वितरण की आवश्यकता हो, तो पंक्तियों को मान बैंड या संख्यात्मक कुंजी शेषफल के आधार पर वितरित करें।

एक कॉन्फ़िगरेशन फ़ाइल (APT_CONFIG_FILE) यह बताती है कि कितने नोड मौजूद हैं। चूंकि नोड संख्या जॉब से बाहर रहती है, इसलिए एक ही कंपाइल की गई जॉब बिना किसी डिज़ाइन परिवर्तन के लैपटॉप से लेकर प्रोडक्शन ग्रिड तक स्केल हो सकती है।

इन सब चीजों को आजमाने से पहले, अनुकूल वातावरण का होना जरूरी है।

डेटास्टेज टूल के लिए पूर्वापेक्षाएँ

डेटास्टेज के लिए आपको निम्नलिखित सेटअप की आवश्यकता होगी।

InfoSphere
डेटास्टेज सर्वर 9.1.2 या उससे ऊपर
Microsoft विजुअल स्टूडियो .NET 2010 एक्सप्रेस संस्करण C++
Oracle क्लाइंट (पूर्ण क्लाइंट, तत्काल क्लाइंट नहीं) यदि किसी से कनेक्ट हो रहा है Oracle डेटाबेस
DB2 क्लाइंट यदि DB2 डेटाबेस से कनेक्ट हो रहा है

अब इस डेटास्टेज ट्यूटोरियल्स फॉर बिगिनर्स श्रृंखला में, हम सीखेंगे कि इन्फोस्फीयर सूचना सर्वर को कैसे डाउनलोड और इंस्टॉल किया जाए।

डाउनलोड और स्थापना InfoSphere सूचना सर्वर

डेटास्टेज तक पहुंचने के लिए, का नवीनतम संस्करण डाउनलोड और इंस्टॉल करें IBM InfoSphere सर्वर। सर्वर AIX, Linux और का समर्थन करता है Windows ऑपरेटिंग सिस्टम आप आवश्यकतानुसार चुन सकते हैं।

अपने डेटा को इन्फोस्फेयर के पुराने संस्करण से नए संस्करण में स्थानांतरित करने के लिए एसेट इंटरचेंज टूल का उपयोग करें।

स्थापना फ़ाइलें

इन्फोस्फेयर डेटास्टेज को स्थापित और कॉन्फ़िगर करने के लिए, आपके सेटअप में निम्नलिखित फ़ाइलें होनी चाहिए।

के लिए Windows,

EtlDeploymentPackage-windows-oracle.pkg
EtlDeploymentPackage-windows-db2.pkg

लिनक्स के लिए,

EtlDeploymentPackage-linux-db2.pkg
EtlDeploymentPackage-linux-oracle.pkg

सर्वर स्थापित हो जाने के बाद, इस पृष्ठ के शेष भाग में दिया गया उदाहरण परिवर्तन डेटा कैप्चर का उपयोग करता है, इसलिए इसे बनाने से पहले यह देखना उपयोगी होगा कि परिवर्तन डेटा कैसे प्रवाहित होता है।

सी.डी.सी. ट्रांजेक्शन स्टेज जॉब में परिवर्तन डेटा का प्रक्रिया प्रवाह

ऊपर दिया गया आरेख tracयह स्रोत डेटाबेस से लक्ष्य डेटाबेस में नीचे दिए गए क्रम में एक ही परिवर्तन करता है।

डेटाबेस के लिए 'इंफोस्फीयर सीडीसी' सेवा स्रोत डेटाबेस से परिवर्तन की निगरानी और कैप्चर करती है
प्रतिकृति परिभाषा के अनुसार "InfoSphere CDC" परिवर्तन डेटा को "InfoSphere DataStage के लिए InfoSphere CDC" में स्थानांतरित करता है।
“InfoSphere CDC for InfoSphere DataStage” सर्वर TCP/IP सत्र के माध्यम से “CDC ट्रांजेक्शन स्टेज” को डेटा भेजता है। “InfoSphere CDC for InfoSphere DataStage” सर्वर कैप्चर किए गए लॉग में ट्रांजेक्शन सीमा को चिह्नित करने के लिए एक COMMIT संदेश (बुकमार्क जानकारी के साथ) भी भेजता है।
“InfoSphere CDC for InfoSphere DataStage” सर्वर द्वारा भेजे गए प्रत्येक COMMIT संदेश के लिए, “CDC ट्रांजेक्शन स्टेज” एंड-ऑफ-वेव (EOW) मार्कर बनाता है। ये मार्कर लक्ष्य डेटाबेस कनेक्टर स्टेज के सभी आउटपुट लिंक पर भेजे जाते हैं।
जब "लक्ष्य डेटाबेस कनेक्टर चरण" सभी इनपुट लिंक पर एंड-ऑफ-वेव मार्कर प्राप्त करता है, तो यह बुकमार्क जानकारी को बुकमार्क तालिका में लिखता है और फिर लक्ष्य डेटाबेस में लेनदेन को प्रतिबद्ध करता है।
“InfoSphere CDC for InfoSphere DataStage” सर्वर “लक्ष्य डेटाबेस” पर बुकमार्क तालिका से बुकमार्क जानकारी का अनुरोध करता है।
“InfoSphere CDC for InfoSphere DataStage” सर्वर बुकमार्क जानकारी प्राप्त करता है।

इस जानकारी का उपयोग निम्नलिखित के लिए किया जाता है,

लेनदेन लॉग में प्रारंभिक बिंदु निर्धारित करें जहां प्रतिकृतिकरण शुरू होने पर परिवर्तन पढ़े जाते हैं।
यह निर्धारित करने के लिए कि क्या मौजूदा लेनदेन लॉग को साफ़ किया जा सकता है

SQL प्रतिकृति सेट अप करना

डेटास्टेज शुरू करने से पहले, आपको डेटाबेस सेटअप करना होगा। आप दो DB2 डेटाबेस बनाएंगे।

एक प्रतिकृति स्रोत के रूप में काम करने के लिए और
एक को लक्ष्य बनाया गया।

आप दो टेबल (उत्पाद और इन्वेंट्री) भी बनाएंगे और उन्हें नमूना डेटा से भरेंगे। फिर आप अपने एकीकरण का परीक्षण कर सकते हैं एसक्यूएल प्रतिकृति और डेटास्टेज.

आगे बढ़ते हुए आप SQL प्रतिकृति बनाकर सेट अप करेंगे नियंत्रण तालिकाएँ, सदस्यता सेट, पंजीकरण और सदस्यता सेट सदस्यहम इसके बारे में अगले भाग में विस्तार से जानेंगे।

यहाँ हम अपने डेटाबेस के रूप में खुदरा बिक्री आइटम का एक उदाहरण लेंगे और दो टेबल इन्वेंटरी और उत्पाद बनाएंगे। ये टेबल इन सेटों के माध्यम से स्रोत से लक्ष्य तक डेटा लोड करेंगे। (नियंत्रण तालिकाएँ, सदस्यता सेट, पंजीकरण और सदस्यता सेट सदस्य.)

चरण 1) एक स्रोत डेटाबेस बनाएँ जिसे संदर्भित किया जाता है बिक्रीइस डेटाबेस के अंतर्गत दो तालिकाएँ बनाएँ उत्पाद और इन्वेंटरी.

चरण 2) SALES डेटाबेस बनाने के लिए निम्नलिखित कमांड चलाएँ।

db2 create database SALES

चरण 3) SALES डेटाबेस के लिए अभिलेखीय लॉगिंग चालू करें। साथ ही, निम्न कमांड का उपयोग करके डेटाबेस का बैकअप लें

db2 update db cfg for SALES using LOGARCHMETH3 LOGRETAIN
db2 backup db SALES

चरण 4) उसी कमांड प्रॉम्प्ट में, sqlrepl-datastage-tutorial डायरेक्टरी में setupDB सबडायरेक्टरी में जाएं जिसे आपने पहले खोला था।tracडाउनलोड की गई संपीड़ित फ़ाइल से।

चरण 5) इन्वेंटरी तालिका बनाने के लिए निम्नलिखित कमांड का उपयोग करें और निम्नलिखित कमांड चलाकर तालिका में डेटा आयात करें।

db2 import from inventory.ixf of ixf create into inventory

चरण 6) एक लक्ष्य तालिका बनाएँ। लक्ष्य डेटाबेस का नाम इस प्रकार रखें STAGEDB.

चूंकि अब आपने दोनों डेटाबेस स्रोत और लक्ष्य बना लिए हैं, इसलिए इस डेटास्टेज ट्यूटोरियल में अगला चरण यह होगा कि हम देखेंगे कि इसे कैसे दोहराया जाए।

निम्नलिखित जानकारी सहायक हो सकती है ओडीबीसी डेटा स्रोत स्थापित करना में IBM इंफोस्फीयर इंफॉर्मेशन सर्वर का दस्तावेज़ीकरण।

SQL प्रतिकृति ऑब्जेक्ट बनाना

नीचे दी गई छवि दर्शाती है कि परिवर्तन डेटा का प्रवाह स्रोत से लक्ष्य डेटाबेस तक कैसे पहुंचाया जाता है। आप एक स्रोत-से-लक्ष्य मानचित्र बनाते हैं।ping टेबलों के बीच जिन्हें इस नाम से जाना जाता है सदस्यता सेट सदस्य और सदस्यों को एक समूह में बांटें अंशदान.

इन्फोस्फीयर सी.डी.सी. (चेंज डेटा कैप्चर) के अंतर्गत प्रतिकृति की इकाई को सदस्यता कहा जाता है।

स्रोत में किए गए परिवर्तन "कैप्चर कंट्रोल टेबल" में कैप्चर किए जाते हैं, जिसे सीडी टेबल और फिर लक्ष्य टेबल पर भेजा जाता है। जबकि अप्लाई प्रोग्राम में उस पंक्ति के बारे में विवरण होगा जहाँ से परिवर्तन किए जाने की आवश्यकता है। यह सब्सक्रिप्शन सेट में सीडी टेबल को भी शामिल करेगा।
सदस्यता में मानचित्र शामिल हैping वे विवरण जो यह निर्दिष्ट करते हैं कि स्रोत डेटा स्टोर में मौजूद डेटा को लक्ष्य डेटा स्टोर पर कैसे लागू किया जाता है। ध्यान दें, अब CDC को इस प्रकार संदर्भित किया जाता है। इन्फोस्फेयर डेटा प्रतिकृति.
जब कोई सदस्यता निष्पादित होती है, तो InfoSphere CDC स्रोत डेटाबेस पर परिवर्तनों को कैप्चर करता है। InfoSphere CDC लक्ष्य को परिवर्तन डेटा वितरित करता है, और लक्ष्य डेटाबेस में बुकमार्क तालिका में सिंक पॉइंट जानकारी संग्रहीत करता है।
InfoSphere CDC, InfoSphere DataStage कार्य की प्रगति की निगरानी के लिए बुकमार्क जानकारी का उपयोग करता है।
विफलता के मामले में, बुकमार्क जानकारी को पुनः आरंभ बिंदु के रूप में उपयोग किया जाता है। हमारे उदाहरण में, ASN.IBMSNAP_FEEDETL टेबल में DataStage से संबंधित सिंकपॉइंट जानकारी संग्रहीत होती है जिसका उपयोग किया जाता है track DataStage की प्रगति।

के इस अनुभाग में IBM डेटास्टेज प्रशिक्षण ट्यूटोरियल, आपको निम्नलिखित चीजें करनी होंगी,

प्रतिकृति विकल्पों को संग्रहीत करने के लिए CAPTURE CONTROL तालिकाएँ और APPLY CONTROL तालिकाएँ बनाएँ
उत्पाद और इन्वेंटरी तालिकाओं को प्रतिकृति स्रोतों के रूप में पंजीकृत करें
दो सदस्यों वाला सदस्यता सेट बनाएँ
सदस्यता सेट सदस्य और लक्ष्य CCD तालिकाएँ बनाएँ

SQL प्रतिकृति सेटअप करने के लिए ASNCLP कमांड लाइन प्रोग्राम का उपयोग करें

चरण 1) sqlrepl-datastage-tutorial/setupSQLRep निर्देशिका में crtCtlTablesCaptureServer.asnclp स्क्रिप्ट फ़ाइल का पता लगाएँ।

चरण 2) फ़ाइल में प्रतिस्थापित करें और " ” को अपने यूजर आईडी और पासवर्ड के साथ SALES डेटाबेस से कनेक्ट करें।

चरण 3) निर्देशिकाओं को sqlrepl-datastage-tutorial/setupSQLRep निर्देशिका में बदलें और स्क्रिप्ट चलाएँ। निम्न कमांड का उपयोग करें। कमांड SALES डेटाबेस से कनेक्ट होगा, कैप्चर कंट्रोल टेबल बनाने के लिए एक SQL स्क्रिप्ट जेनरेट करेगा।

asnclp –f crtCtlTablesCaptureServer.asnclp

चरण 4) उसी निर्देशिका में crtCtlTablesApplyCtlServer.asnclp स्क्रिप्ट फ़ाइल ढूँढें। अब दो इंस्टेंस बदलें और " ” STAGEDB डाटाबेस से कनेक्ट करने के लिए उपयोगकर्ता आईडी और पासवर्ड के साथ।

चरण 5) अब उसी कमांड प्रॉम्प्ट में लागू नियंत्रण तालिकाएँ बनाने के लिए निम्नलिखित कमांड का उपयोग करें।

asnclp –f crtCtlTablesApplyCtlServer.asnclp

चरण 6) crtRegistration.asnclp स्क्रिप्ट फ़ाइलों का पता लगाएँ और सभी इंस्टेंस को प्रतिस्थापित करें SALES डेटाबेस से कनेक्ट करने के लिए यूजर आईडी के साथ। इसके अलावा, “ ” को कनेक्शन पासवर्ड में जोड़ें.

चरण 7) स्रोत तालिकाओं को पंजीकृत करने के लिए, निम्न स्क्रिप्ट का उपयोग करें। पंजीकरण बनाने के भाग के रूप में, ASNCLP प्रोग्राम दो CD तालिकाएँ बनाएगा। CDPRODUCT और CDINVENTORY.

asnclp –f crtRegistration.asnclp

CREATE REGISTRATION कमांड निम्नलिखित विकल्पों का उपयोग करता है:

विभेदक रिफ्रेश: यह प्रोग्राम को लक्ष्य तालिका को अद्यतन करने के लिए तभी संकेत देता है जब स्रोत तालिका में पंक्तियाँ बदल जाती हैं
छवि दोनों: इस विकल्प का उपयोग परिवर्तन होने से पहले स्रोत कॉलम में मान पंजीकृत करने के लिए किया जाता है, और परिवर्तन होने के बाद मान के लिए भी इसका उपयोग किया जाता है।

चरण 8) लक्ष्य डेटाबेस (STAGEDB) से कनेक्ट करने के लिए, निम्नलिखित चरणों का उपयोग करें।

crtTableSpaceApply.bat फ़ाइल ढूंढें, इसे टेक्स्ट एडिटर में खोलें
प्रतिस्थापित करें और उपयोगकर्ता आईडी और पासवर्ड के साथ
DB2 कमांड विंडो में, crtTableSpaceApply.bat दर्ज करें और फ़ाइल चलाएँ।
यह बैच फ़ाइल लक्ष्य डेटाबेस (STAGEDB) पर एक नया टेबलस्पेस बनाती है

चरण 9) crtSubscriptionSetAndAddMembers.asnclp स्क्रिप्ट फ़ाइल का पता लगाएँ और निम्नलिखित परिवर्तन करें।

के सभी उदाहरण बदलें और SALES डेटाबेस से कनेक्ट करने के लिए उपयोगकर्ता आईडी और पासवर्ड के साथ (स्रोत)।
के सभी उदाहरण बदलें और STAGEDB डाटाबेस (लक्ष्य) से कनेक्ट करने के लिए उपयोगकर्ता आईडी के साथ।

परिवर्तन के बाद सब्सक्रिप्शन सेट (ST00) बनाने के लिए स्क्रिप्ट चलाएँ जो स्रोत और लक्ष्य तालिकाओं को समूहीकृत करता है। स्क्रिप्ट दो सब्सक्रिप्शन सेट सदस्य भी बनाती है, और लक्ष्य डेटाबेस में CCD (संगत परिवर्तन डेटा) जो संशोधित डेटा संग्रहीत करेगा। यह डेटा इन्फोस्फीयर डेटास्टेज द्वारा उपयोग किया जाएगा।

चरण 10) सदस्यता सेट, सदस्यता-सेट सदस्य और CCD तालिकाएँ बनाने के लिए स्क्रिप्ट चलाएँ।

asnclp –f crtSubscriptionSetAndAddMembers.asnclp

सदस्यता सेट और दो सदस्य बनाने के लिए उपयोग किए जाने वाले विभिन्न विकल्पों में शामिल हैं

संघनित बंद पर पूरा करें
बाहरी
लोड प्रकार आयात निर्यात
समय निरंतर

चरण 11) प्रतिकृति प्रशासन उपकरण में दोष के कारण। आपको TARGET_CAPTURE_SCHEMA कॉलम को सेट करने के लिए एक और बैच फ़ाइल निष्पादित करनी होगी IBMSNAP_SUBS_SET नियंत्रण तालिका को शून्य करें.

updateTgtCapSchema.bat फ़ाइल ढूँढें। इसे टेक्स्ट एडिटर में खोलें। और STAGEDB डाटाबेस से कनेक्ट करने के लिए उपयोगकर्ता आईडी के साथ।
DB2 कमांड विंडो में, कमांड updateTgtCapSchema.bat दर्ज करें और फ़ाइल को निष्पादित करें।

सीसीडी तालिकाओं को डेटास्टेज पर मैप करने के लिए परिभाषा फ़ाइलें बनाना

अगले चरण में प्रतिकृति करने से पहले, हमें CCD टेबल को DataStage से कनेक्ट करना होगा। इस अनुभाग में, हम देखेंगे कि SQL को DataStage से कैसे कनेक्ट किया जाए।

CCD टेबल को DataStage से जोड़ने के लिए, आपको DataStage परिभाषा (.dsx) फ़ाइलें बनानी होंगी। .dsx फ़ाइल फ़ॉर्मेट का उपयोग DataStage द्वारा जॉब परिभाषाओं को आयात और निर्यात करने के लिए किया जाता है। आप ASNCLP स्क्रिप्ट का उपयोग करके दो .dsx फ़ाइलें बनाएंगे। उदाहरण के लिए, यहां हमने दो .dsx फ़ाइलें बनाई हैं।

stagedb_AQ00_SET00_sJobs.dsx: एक कार्य अनुक्रम बनाता है जो चार समानांतर कार्यों के वर्कफ़्लो को निर्देशित करता है।
stagedb_AQ00_SET00_pJobs.dsx : चार समानांतर नौकरियाँ बनाता है

ASNCLP प्रोग्राम स्वचालित रूप से CCD कॉलम को डेटास्टेज कॉलम प्रारूप में मैप करता है। यह केवल तभी समर्थित है जब ASNCLP चलता है Windows, लिनक्स, या यूनिक्स प्रक्रिया.

डेटास्टेज जॉब्स सीसीडी तालिका से पंक्तियाँ खींचते हैं।

एक जॉब एक सिंक पॉइंट सेट करती है जहाँ DataStage ने ex में काम करना बंद कर दिया थाtracयह जॉब दो तालिकाओं से डेटा प्राप्त करता है। यह जॉब ST00 सब्सक्रिप्शन सेट के लिए SYNCHPOINT मान का चयन करके यह जानकारी प्राप्त करता है। IBMSNAP_SUBS_SET तालिका को MAX_SYNCHPOINT कॉलम में प्रविष्ट करना IBMSNAP_FEEDETL तालिका.
दो नौकरियां जो पूर्वtracPRODUCT_CCD और INVENTORY_CCD तालिकाओं से डेटा लिया जाता है। जॉब्स को पता होता है कि किन पंक्तियों से शुरू करना है।tracMIN_SYNCHPOINT और MAX_SYNCHPOINT मानों का चयन करके टिंग करें IBMसदस्यता सेट के लिए SNAP_FEEDETL तालिका.

परिभाषाओं का मानचित्रण हो जाने के बाद, प्रतिकृति शुरू की जा सकती है जिससे सीसीडी तालिकाएँ भरने लगेंगी।

प्रतिकृतिकरण प्रारंभ करना

प्रतिकृतिकरण शुरू करने के लिए, आप नीचे दिए गए चरणों का उपयोग करेंगे। जब CCD तालिकाएँ डेटा से भरी जाती हैं, तो यह दर्शाता है कि प्रतिकृतिकरण सेटअप मान्य है। लक्ष्य CCD तालिकाओं में प्रतिकृतिकृत डेटा देखने के लिए DB2 नियंत्रण केंद्र ग्राफ़िकल यूज़र इंटरफ़ेस का उपयोग करें।

चरण 1) सुनिश्चित करें कि DB2 चल रहा है, यदि नहीं तो उपयोग करें db2 प्रारंभ आदेश।

चरण 2) फिर प्रोग्राम कैप्चर करना शुरू करने के लिए ऑपरेटिंग सिस्टम प्रॉम्प्ट से asncap कमांड का उपयोग करें। उदाहरण के लिए।

asncap capture_server=SALES

उपरोक्त कमांड SALES डेटाबेस को कैप्चर सर्वर के रूप में निर्दिष्ट करता है। कैप्चर चलने के दौरान कमांड विंडो को खुला रखें।

चरण 3) अब एक नया कमांड प्रॉम्प्ट खोलें। फिर शुरू करें APPLY asnapply कमांड का उपयोग करके प्रोग्राम।

asnapply control_server=STAGEDB apply_qual=AQ00

यह आदेश STAGEDB डाटाबेस को अप्लाई कंट्रोल सर्वर (वह डाटाबेस जिसमें अप्लाई कंट्रोल टेबल्स होती हैं) के रूप में निर्दिष्ट करता है।
AQ00 को लागू करें क्वालीफायर के रूप में (नियंत्रण तालिकाओं के इस सेट के लिए पहचानकर्ता)

'Apply' चालू रहने पर कमांड विंडो को खुला छोड़ दें।

चरण 4) अब एक और कमांड प्रॉम्प्ट खोलें और DB2 कंट्रोल सेंटर लॉन्च करने के लिए db2cc कमांड जारी करें। डिफ़ॉल्ट कंट्रोल सेंटर को स्वीकार करें।

चरण 5) अब बाएं नेविगेशन ट्री में, सभी डेटाबेस > STAGEDB खोलें और फिर टेबल्स पर क्लिक करें। Double टेबल खोलने के लिए टेबल नाम (प्रोडक्ट सीसीडी) पर क्लिक करें। यह कुछ इस तरह दिखेगा।

इसी तरह, आप INVENTORY के लिए CCD तालिका भी खोल सकते हैं।

अब प्रतिकृति के माध्यम से सीसीडी तालिकाओं में डेटा फीड किया जा रहा है, इसलिए ध्यान डेटाबेस पक्ष से हटकर डेटास्टेज क्लाइंट्स पर केंद्रित हो गया है।

डेटास्टेज टूल में प्रोजेक्ट कैसे बनाएं

सबसे पहले, आपको DataStage में एक प्रोजेक्ट बनाना होगा। इसके लिए, आपको InfoSphere DataStage एडमिनिस्ट्रेटर होना चाहिए।

एक बार इंस्टॉलेशन और प्रतिकृति हो जाने के बाद, आपको एक प्रोजेक्ट बनाना होगा। डेटास्टेज में, प्रोजेक्ट आपके डेटा को व्यवस्थित करने का एक तरीका है। इसमें किसी विशिष्ट प्रोजेक्ट में डेटा फ़ाइलें, स्टेज और बिल्ड जॉब को परिभाषित करना शामिल है।

डेटास्टेज में प्रोजेक्ट बनाने के लिए, नीचे दिए गए चरणों का पालन करें:

चरण 1) डेटास्टेज सॉफ्टवेयर लॉन्च करें

डेटास्टेज और क्वालिटीस्टेज एडमिनिस्ट्रेटर लॉन्च करें। फिर स्टार्ट > सभी प्रोग्राम > पर क्लिक करें IBM सूचना सर्वर > IBM वेबस्फीयर डेटास्टेज और क्वालिटीस्टेज प्रशासक।

चरण 2) डेटास्टेज सर्वर और क्लाइंट को कनेक्ट करें

अपने डेटास्टेज क्लाइंट से डेटास्टेज सर्वर से कनेक्ट करने के लिए, डोमेन नाम, उपयोगकर्ता आईडी, पासवर्ड और सर्वर जानकारी जैसे विवरण दर्ज करें।

चरण 3) एक नया प्रोजेक्ट जोड़ें

वेबस्फीयर डेटास्टेज एडमिनिस्ट्रेशन विंडो में, प्रोजेक्ट्स टैब पर क्लिक करें और फिर जोड़ें पर क्लिक करें।

चरण 4) परियोजना विवरण दर्ज करें

वेबस्फीयर डेटास्टेज एडमिनिस्ट्रेशन विंडो में, विवरण दर्ज करें जैसे

नाम
फ़ाइल का स्थान
ओके पर क्लिक करें'

प्रत्येक परियोजना में शामिल हैं:

डेटास्टेज नौकरियां
अंतर्निहित घटक। ये किसी कार्य में प्रयुक्त पूर्वनिर्धारित घटक होते हैं।
उपयोगकर्ता-परिभाषित घटक। ये डेटास्टेज प्रबंधक या डेटास्टेज डिज़ाइनर का उपयोग करके बनाए गए अनुकूलित घटक हैं।

हम देखेंगे कि डेटास्टेज इन्फोस्फेयर में प्रतिकृति नौकरियों को कैसे आयात किया जाए।

डेटास्टेज और क्वालिटीस्टेज डिज़ाइनर में प्रतिकृति कार्य कैसे आयात करें

आप नौकरियों का आयात करेंगे IBM InfoSphere DataStage और QualityStage डिज़ाइनर क्लाइंट। और आप उन्हें निष्पादित करते हैं IBM इन्फोस्फीयर डेटास्टेज और क्वालिटीस्टेज डायरेक्टर क्लाइंट।

डिजाइनर-ग्राहक एक खाली कैनवास की तरह होते हैं, जिन पर काम किया जा सकता है।tracडेटा को रूपांतरित, लोड और उसकी गुणवत्ता की जाँच करना। यह जॉब के मूलभूत निर्माण खंडों को बनाने वाले उपकरण प्रदान करता है। इसमें शामिल हैं:

इंटर्नशिपयह फ़ाइलों को पढ़ने या लिखने और डेटा को संसाधित करने के लिए डेटा स्रोतों से जुड़ता है।
लिंक: यह उन चरणों को जोड़ता है जिनके साथ आपका डेटा प्रवाहित होता है

InfoSphere DataStage और QualityStage डिज़ाइनर क्लाइंट में स्थित स्टेजेस को डिज़ाइनर टूल पैलेट में संग्रहीत किया जाता है।

इन्फोस्फीयर क्वालिटीस्टेज में निम्नलिखित चरण शामिल हैं:

जांच चरण
मानकीकरण चरण
मिलान आवृत्ति चरण
एक-स्रोत मिलान चरण
दो-स्रोत मिलान चरण
जीवित रहने का चरण
मानकीकरण गुणवत्ता मूल्यांकन (एसक्यूए) चरण

आप डेटास्टेज इन्फोस्फेयर में 4 प्रकार की नौकरियां बना सकते हैं।

समानांतर नौकरी
अनुक्रम नौकरी
मेनफ्रेम जॉब
सर्वर जॉब

आइए चरण दर चरण देखें कि प्रतिकृति कार्य फ़ाइलों को कैसे आयात किया जाता है।

चरण 1) डेटास्टेज और क्वालिटीस्टेज डिज़ाइनर शुरू करें। स्टार्ट > सभी प्रोग्राम > पर क्लिक करें IBM सूचना सर्वर > IBM वेबस्फीयर डेटास्टेज और क्वालिटीस्टेज डिज़ाइनर

चरण 2) प्रोजेक्ट से संलग्न करें विंडो में, निम्नलिखित विवरण दर्ज करें।

डोमेन
उपयोगकर्ता नाम
पासवर्ड
परियोजना का नाम
OK

चरण 3) अब फ़ाइल मेनू से आयात पर क्लिक करें -> डेटास्टेज घटक.

एक नई डेटास्टेज रिपॉजिटरी आयात विंडो खुलेगी।

इस विंडो में ब्राउज़ करें STAGEDB_AQ00_ST00_sJobs.dsx वह फ़ाइल जो हमने पहले बनाई थी
“सभी आयात करें” विकल्प चुनें।
“प्रभाव विश्लेषण करें” चेकबॉक्स को चिह्नित करें।
ओके पर क्लिक करें।'

एक बार जॉब आयात हो जाने पर, DataStage STAGEDB_AQ00_ST00_sequence जॉब बनाएगा।

चरण 4) आयात करने के लिए समान चरणों का पालन करें STAGEDB_AQ00_ST00_pJobs.dsx फ़ाइलयह आयात चार समानांतर नौकरियां बनाता है.

चरण 5) डिज़ाइनर रिपॉजिटरी पैन के अंतर्गत -> SQLREP फ़ोल्डर खोलें। फ़ोल्डर के अंदर, आपको अनुक्रम जॉब और चार समानांतर जॉब दिखाई देंगे।

चरण 6) अनुक्रम कार्य देखने के लिए। रिपोजिटरी ट्री पर जाएँ, STAGEDB_AQ00_ST00_sequence कार्य पर राइट-क्लिक करें और Edit पर क्लिक करें। यह उन चार समानांतर कार्यों का वर्कफ़्लो दिखाएगा जिन्हें कार्य अनुक्रम नियंत्रित करता है।

प्रत्येक चिह्न एक मंच है,

getExtractRange चरण: यह अद्यतन करता है IBMSNAP_FEEDETL टेबल। यह डेटा के लिए प्रारंभिक बिंदु निर्धारित करेगा।tracउस बिंदु तक जहां DataStage ने आखिरी बारtracपंक्तियों को हटा दें और समाप्ति बिंदु को सदस्यता सेट के लिए संसाधित किए गए अंतिम लेनदेन पर सेट करें।
getExtractRangeSuccessयह चरण पूर्व के लिए प्रारंभिक बिंदु प्रदान करता हैtractFromINVENTORY_CCD स्टेज और पूर्वtractFromPRODUCT_CCD चरण
ऑलएक्सtracटीएस सफलता: यह चरण सुनिश्चित करता है कि दोनों पूर्वtractFromINVENTORY_CCD और extractFromPRODUCT_CCD सफलतापूर्वक पूरा हो गया। फिर यह सेट रेंज प्रोसेस्ड स्टेज को फ़ेच की गई अंतिम पंक्तियों के लिए सिंक पॉइंट पास करता है।
setRangeProcessed चरण: यह अद्यतन करता है IBMSNAP_FEEDETL टेबल। इस प्रकार, DataStage को पता होता है कि डेटा के अगले चरण को कहाँ से शुरू करना है।tracउत्पादन

चरण 7) समानांतर जॉब्स देखने के लिए। STAGEDB_ASN_INVENTORY_CCD पर राइट-क्लिक करें और रिपॉजिटरी के अंतर्गत एडिट चुनें। यह नीचे दिखाए अनुसार विंडो खोलेगा।

यहाँ ऊपर की छवि में, आप देख सकते हैं कि इन्वेंटरी सीसीडी तालिका और से डेटा SyncFEEDETL तालिका से h बिंदु विवरण Lookup_6 चरण में प्रस्तुत किया जाता है।

आयातित जॉब अभी भी किसी चीज़ की ओर इशारा नहीं कर रहे हैं, इसलिए आगे एक डेटा कनेक्शन ऑब्जेक्ट को परिभाषित करना होगा।

DataStage से STAGEDB डेटाबेस तक डेटा कनेक्शन बनाना

अब अगला कदम InfoSphere DataStage और SQL Replication लक्ष्य डेटाबेस के बीच डेटा कनेक्शन बनाना है। इसमें CCD टेबल शामिल हैं।

डेटास्टेज में, आप जॉब डिज़ाइन में डेटा स्रोत से कनेक्शन को त्वरित रूप से परिभाषित करने के लिए संबंधित कनेक्टर चरणों के साथ डेटा कनेक्शन ऑब्जेक्ट का उपयोग करते हैं।

चरण 1) STAGEDB में वे अप्लाई कंट्रोल टेबल शामिल हैं जिनका उपयोग DataStage अपने डेटा को सिंक्रोनाइज़ करने के लिए करता है।tracऔर सीसीडी तालिकाएँ जिनसे डेटा निकाला जाता हैtracटेड। निम्नलिखित कमांड का उपयोग करें

db2 catalog tcpip node SQLREP remote ip_address server 50000
db2 catalog database STAGEDB as STAGEDB2 at node SQLREP

नोट: उस सिस्टम का IP पता जहाँ STAGEDB बनाया गया था

चरण 2) फ़ाइल > नया > अन्य > डेटा कनेक्शन पर क्लिक करें।

चरण 3) आपके सामने दो टैब वाली एक विंडो होगी, पैरामीटर्स और जनरल।

चरण 4) इस चरण में,

सामान्यतः, टैब, डेटा कनेक्शन का नाम sqlreplConnect रखें
पैरामीटर्स टैब में, जैसा कि नीचे दिखाया गया है

'स्टेज प्रकार फ़ील्ड का उपयोग करके कनेक्ट करें' के आगे ब्राउज़ बटन पर क्लिक करें, और
विंडो खोलें और रिपोजिटरी ट्री को स्टेज प्रकार -> समानांतर -> डेटाबेस -> डीबी2 कनेक्टर पर नेविगेट करें।
Open पर क्लिक करें।

चरण 5) कनेक्शन पैरामीटर तालिका में, विवरण दर्ज करें जैसे

connectionstring: स्टेजडीबी2
उपयोगकर्ता नाम: STAGEDB डेटाबेस से कनेक्ट करने के लिए उपयोगकर्ता आईडी
पासवर्ड: STAGEDB डाटाबेस से कनेक्ट करने के लिए पासवर्ड
उदाहरण: DB2 इंस्टेंस का नाम जिसमें STAGEDB डेटाबेस शामिल है

चरण 6) अगली विंडो में डेटा कनेक्शन सेव करें। 'सेव' बटन पर क्लिक करें।

STAGEDB से DataStage में तालिका परिभाषाएँ आयात करना

पिछले चरण में, हमने देखा कि InfoSphere DataStage और STAGEDB डेटाबेस जुड़े हुए हैं। अब, PRODUCT_CCD और INVENTORY_CCD तालिकाओं के लिए कॉलम परिभाषा और अन्य मेटाडेटा को सूचना सर्वर रिपॉजिटरी में आयात करें।

डिज़ाइनर विंडो में, नीचे दिए गए चरणों का पालन करें।

चरण 1) आयात > तालिका परिभाषाएँ > कनेक्टर आयात विज़ार्ड प्रारंभ करें चुनें

चरण 2) विज़ार्ड के कनेक्टर चयन पृष्ठ से, DB2 कनेक्टर का चयन करें और अगला क्लिक करें।

चरण 3) कनेक्शन विवरण पृष्ठ पर लोड पर क्लिक करें। यह विज़ार्ड फ़ील्ड को आपके द्वारा पिछले अध्याय में बनाए गए डेटा कनेक्शन से कनेक्शन जानकारी से भर देगा।

चरण 4) उसी पेज पर टेस्ट कनेक्शन पर क्लिक करें। यह डेटास्टेज को STAGEDB डेटाबेस से कनेक्शन का प्रयास करने के लिए प्रेरित करेगा। आप संदेश देख सकते हैं "कनेक्शन सफल हुआ"। अगला क्लिक करें।

चरण 5) सुनिश्चित करें कि डेटा स्रोत स्थान पृष्ठ पर होस्टनाम और डेटाबेस नाम फ़ील्ड सही ढंग से भरे गए हैं। फिर अगला क्लिक करें।

चरण 6) स्कीमा पेज पर। अप्लाई कंट्रोल टेबल (ASN) की स्कीमा दर्ज करें या जाँच करें कि ASN स्कीमा स्कीमा फ़ील्ड में पहले से भरी हुई है। फिर अगला क्लिक करें। चयन पृष्ठ ASN स्कीमा में परिभाषित तालिकाओं की सूची दिखाएगा।

चरण 7) पहली तालिका जिससे हमें मेटाडेटा आयात करना है वह है IBMSNAP_FEEDETL, एक अप्लाई कंट्रोल टेबल है। इसमें सिंक्रोनाइज़ेशन पॉइंट्स की जानकारी होती है, जिससे DataStage डेटा को अपडेट रख पाता है। track जिसकी पंक्तियाँ इसने CCD तालिकाओं से प्राप्त की हैं। चुनें IBMSNAP_FEEDETL और अगला क्लिक करें।

चरण 8) आयात को पूरा करने के लिए IBMSNAP_FEEDETL तालिका परिभाषा। आयात पर क्लिक करें और फिर खुली खिड़की में खोलें पर क्लिक करें।

चरण 9) PRODUCT_CCD तालिका और फिर INVENTORY_CCD तालिका के लिए परिभाषाएँ आयात करने के लिए चरण 1-8 को दो बार और दोहराएँ।

ध्यान देंइन्वेंट्री और उत्पाद के लिए परिभाषाएँ आयात करते समय, सुनिश्चित करें कि आप ASN से स्कीमा को उस स्कीमा में बदल दें जिसके अंतर्गत PRODUCT_CCD और INVENTORY_CCD बनाए गए थे।

अब डेटास्टेज के पास SQL प्रतिकृति लक्ष्य डेटाबेस से कनेक्ट करने के लिए आवश्यक सभी विवरण हैं।

डेटास्टेज जॉब्स के लिए गुण सेट करना

हमारे पास मौजूद चार DataStage समानांतर जॉब्स में से प्रत्येक में एक या अधिक स्टेज होते हैं जो STAGEDB डेटाबेस से जुड़ते हैं। कनेक्शन जानकारी जोड़ने और DataStage द्वारा पॉप्युलेट की जाने वाली डेटासेट फ़ाइलों से लिंक करने के लिए आपको स्टेज को संशोधित करने की आवश्यकता है।

स्टेज में पूर्वनिर्धारित गुण होते हैं जिन्हें संपादित किया जा सकता है। यहां हम STAGEDB_ASN_PRODUCT_CCD_ex के लिए इनमें से कुछ गुणों को बदलेंगे।tracसमानांतर कार्य।

चरण 1) डिज़ाइनर रिपॉज़िटरी ट्री ब्राउज़ करें। SQLREP फ़ोल्डर के अंतर्गत STAGEDB_ASN_PRODUCT_CCD_ex फ़ोल्डर चुनें।tracयह एक समानांतर जॉब है। इसे संपादित करने के लिए, जॉब पर राइट-क्लिक करें। डिज़ाइनर पैलेट में समानांतर जॉब की डिज़ाइन विंडो खुल जाएगी।

चरण 2) हरे रंग के आइकन को ढूंढें। यह आइकन DB2 कनेक्टर चरण को दर्शाता है। इसका उपयोग उदाहरण के लिए किया जाता है।tracसीसीडी तालिका से डेटा प्राप्त करना। Double-आइकन पर क्लिक करें। एक स्टेज एडिटर विंडो खुलती है।

चरण 3) एडिटर में कनेक्शन जानकारी के साथ फ़ील्ड भरने के लिए लोड पर क्लिक करें। स्टेज एडिटर को बंद करने और अपने बदलावों को सहेजने के लिए ओके पर क्लिक करें।

चरण 4) अब STAGEDB_ASN_PRODUCT_CCD_ex के लिए डिज़ाइन विंडो पर वापस जाएँtracसमानांतर कार्य। गेट आइकन का पता लगाएंSynchPoints DB2 कनेक्टर स्टेज। फिर आइकन पर डबल-क्लिक करें।

चरण 5) अब कनेक्शन जानकारी वाले फ़ील्ड भरने के लिए लोड बटन पर क्लिक करें।

ध्यान दें: यदि आप अपने अप्लाई कंट्रोल सर्वर के रूप में STAGEDB के अलावा किसी अन्य डेटाबेस का उपयोग कर रहे हैं। फिर get के लिए कनेक्शन जानकारी लोड करने के लिए विकल्प का चयन करेंSynchPoints चरण, जो CCD तालिका के बजाय नियंत्रण तालिकाओं के साथ अंतःक्रिया करता है।

चरण 6) इस चरण में,

उस सिस्टम पर एक खाली टेक्स्ट फ़ाइल बनाएं जहां InfoSphere DataStage चलता है।
इस फ़ाइल का नाम productdataset.ds रखें और ध्यान रखें कि आपने इसे कहाँ सहेजा है।
डेटास्टेज, CCD तालिका से परिवर्तन प्राप्त करने के बाद, इस फ़ाइल में परिवर्तन लिखेगा।
डेटा सेट या फ़ाइल जो लिंक किए गए जॉब के बीच डेटा को स्थानांतरित करने के लिए उपयोग किए जाते हैं उन्हें स्थायी डेटा सेट के रूप में जाना जाता है। इसे डेटासेट स्टेज द्वारा दर्शाया जाता है।

चरण 7) अब डिज़ाइन विंडो में स्टेज एडिटर खोलें, और insert_into_a_dataset आइकन पर डबल क्लिक करें। यह एक और विंडो खोलेगा।

चरण 8) इस खिड़की में,

गुण टैब के अंतर्गत यह सुनिश्चित करें कि Target फ़ोल्डर खुला है और फ़ाइल = DATASETNAME गुण हाइलाइट किया गया है।
दाईं ओर, आपके पास एक फ़ाइल फ़ील्ड होगी
productdataset.ds फ़ाइल का पूरा पथ दर्ज करें
ओके पर क्लिक करें'।

अब आपने उत्पाद CCD तालिका के लिए सभी आवश्यक गुण अपडेट कर लिए हैं। डिज़ाइन विंडो बंद करें और सभी परिवर्तन सहेजें।

चरण 9) अब STAGEDB_ASN_INVENTORY_CCD_ex फ़ाइल को ढूंढें और खोलें।tracडिजाइनर के रिपॉजिटरी फलक से समानांतर जॉब चुनें और चरण 3-8 दोहराएं।

ध्यान दें:

आपको नियंत्रण सर्वर डेटाबेस के लिए कनेक्शन जानकारी को स्टेज संपादक में लोड करना होगाSynchPoints चरण. यदि आपका नियंत्रण सर्वर STAGEDB नहीं है.
STAGEDB_ST00_AQ00_getEx के लिएtractRange और STAGEDB_ST00_AQ00_markRangeProcessed समानांतर जॉब्स चलाकर, सभी DB2 कनेक्टर स्टेज खोलें। फिर लोड फ़ंक्शन का उपयोग करके STAGEDB डेटाबेस के लिए कनेक्शन जानकारी जोड़ें।

सभी प्रॉपर्टीज अब सेट हो चुकी हैं, इसलिए जॉब्स को कंपाइल और एग्जीक्यूट किया जा सकता है।

डेटास्टेज जॉब्स को संकलित करना और चलाना

जब डेटास्टेज कार्य संकलित करने के लिए तैयार हो जाता है, तो डिज़ाइनर इनपुट, रूपांतरण, अभिव्यक्ति और अन्य विवरणों को देखकर कार्य के डिज़ाइन को मान्य करता है।

जब जॉब संकलन सफलतापूर्वक हो जाता है, तो यह चलने के लिए तैयार है। हम सभी पाँच जॉब संकलित करेंगे, लेकिन केवल "जॉब अनुक्रम" चलाएँगे। ऐसा इसलिए है क्योंकि यह जॉब सभी चार समानांतर जॉब को नियंत्रित करता है।

चरण 1) SQLREP फ़ोल्डर के अंतर्गत। (Cntrl+) द्वारा पाँचों जॉब में से प्रत्येक का चयन करेंShift) फिर राइट क्लिक करें और मल्टीपल जॉब कम्पाइल विकल्प चुनें।

चरण 2) आप देखेंगे कि डेटास्टेज संकलन विज़ार्ड में पाँच कार्य चयनित हैं। अगला क्लिक करें।

चरण 3) संकलन शुरू हो जाता है और पूरा होने पर “सफलतापूर्वक संकलित” संदेश प्रदर्शित होता है।

चरण 4) अब DataStage और QualityStage Director शुरू करें। प्रारंभ > सभी प्रोग्राम > चुनें IBM सूचना सर्वर > IBM वेबस्फीयर डेटास्टेज और क्वालिटीस्टेज डायरेक्टर।

चरण 5) प्रोजेक्ट नेविगेशन पैन में बाईं ओर SQLREP फ़ोल्डर पर क्लिक करें। यह सभी पाँच जॉब्स को डायरेक्टर स्टेटस टेबल में ले आता है।

चरण 6) STAGEDB_AQ00_S00_sequence जॉब चुनें। मेनू बार से जॉब > रन नाउ पर क्लिक करें।

एक बार संकलन पूरा हो जाने पर, आपको समाप्त स्थिति दिखाई देगी।

अब जांचें कि PRODUCT_CCD और INVENTORY_CCD तालिकाओं में संग्रहीत परिवर्तित पंक्तियाँ मौजूद थीं या नहीं।tracDataStage द्वारा संसाधित किया गया और दो डेटा सेट फ़ाइलों में डाला गया।

चरण 7) डिजाइनर पर वापस जाएं और STAGEDB_ASN_PRODUCT_CCD_ex फ़ाइल खोलें।tracटी जॉब। स्टेज एडिटर खोलने के लिए Double- insert_into_a_dataset आइकन पर क्लिक करें। फिर view data पर क्लिक करें।

चरण 8) प्रदर्शित की जाने वाली पंक्तियों में डिफ़ॉल्ट को स्वीकार करें। फिर OK पर क्लिक करें। डेटा सेट फ़ाइल की सामग्री दिखाने के लिए एक डेटा ब्राउज़र विंडो खुलेगी।

SQL प्रतिकृति और डेटास्टेज के बीच एकीकरण का परीक्षण

पिछले चरण में, हमने जॉब को संकलित और निष्पादित किया। इस अनुभाग में, हम SQL प्रतिकृति और DataStage के एकीकरण की जाँच करेंगे। इसके लिए, हम स्रोत तालिका में परिवर्तन करेंगे और देखेंगे कि क्या वही परिवर्तन DataStage में अपडेट किया गया है।

चरण 1) अपने ऑपरेटिंग सिस्टम के लिए sqlrepl-datastage-scripts फ़ोल्डर पर जाएँ।

चरण 2) निम्न चरणों का पालन करके SQL प्रतिकृति प्रारंभ करें:

startSQLCapture.bat चलाएँ (Windows) फ़ाइल का उपयोग करके SALES डेटाबेस पर कैप्चर प्रोग्राम प्रारंभ करें।
startSQLApply.bat चलाएँ (Windows) फ़ाइल का उपयोग करके STAGEDB डाटाबेस पर Apply प्रोग्राम प्रारंभ करें।

चरण 3) अब updateSourceTables.sql फ़ाइल खोलें। SALES डेटाबेस से कनेक्ट करने के लिए और उपयोगकर्ता आईडी और पासवर्ड के साथ.

चरण 4) DB2 कमांड विंडो खोलें। डायरेक्टरी को sqlrepl-datastage-tutorial\scripts में बदलें, और दिए गए कमांड द्वारा समस्या को चलाएँ:

db2 -tvf updateSourceTables.sql

SQL स्क्रिप्ट बिक्री डेटाबेस में दोनों तालिकाओं (उत्पाद, इन्वेंटरी) पर अद्यतन, सम्मिलित और हटाना जैसे विभिन्न कार्य करेगी।

चरण 5) उस सिस्टम पर जहाँ DataStage चल रहा है। DataStage Director खोलें और STAGEDB_AQ00_S00_sequence जॉब निष्पादित करें। जॉब > अभी चलाएँ पर क्लिक करें।

जब आप कार्य चलाएंगे तो निम्नलिखित गतिविधियाँ संपन्न होंगी।

कैप्चर प्रोग्राम SALES डेटाबेस लॉग में छह-पंक्ति परिवर्तनों को पढ़ता है और उन्हें CD तालिकाओं में सम्मिलित करता है।
अप्लाई प्रोग्राम SALES पर CD तालिकाओं से परिवर्तन पंक्तियों को प्राप्त करता है और उन्हें STAGEDB पर CCD तालिकाओं में सम्मिलित करता है।
दो डेटास्टेज पूर्वtract जॉब्स CCD टेबल से बदलावों को उठाते हैं और उन्हें productdataset.ds और inventory dataset.ds फाइलों में लिखते हैं।

आप डेटा सेट देखकर यह जांच सकते हैं कि उपरोक्त चरण हुए हैं या नहीं।

चरण 6) नीचे दिए गए चरणों का पालन करें,

डिज़ाइनर शुरू करें। STAGEDB_ASN_PRODUCT_CCD_ex फ़ाइल खोलें।tracनौकरी।
फिर Double-स्टेज एडिटर में insert_into_a_dataset आइकन पर क्लिक करें। डेटा देखें पर क्लिक करें।
प्रदर्शित होने वाली पंक्तियों की विंडो में डिफ़ॉल्ट को स्वीकार करें और ओके पर क्लिक करें।

डेटासेट में तीन नई पंक्तियाँ हैं। यह जाँचने का सबसे आसान तरीका है कि परिवर्तन लागू किए गए हैं या नहीं, डेटा ब्राउज़र के दाईं ओर नीचे स्क्रॉल करना। अब अंतिम तीन पंक्तियों को देखें (नीचे चित्र देखें)

अक्षर I, U और D INSERT, UPDATE और DELETE ऑपरेशन को निर्दिष्ट करते हैं जिसके परिणामस्वरूप प्रत्येक नई पंक्ति बनती है।

आप इन्वेंटरी तालिका के लिए भी यही जांच कर सकते हैं।

DataStage बनाम अन्य लोकप्रिय ETL उपकरण

एक बार जब संपूर्ण प्रक्रिया सुचारू रूप से चलने लगती है, तो अगला प्रश्न यह उठता है कि किसी टीम के पास पहले से मौजूद विकल्पों की तुलना में DataStage कहाँ खड़ा है। नीचे दी गई तालिका में तीन व्यापक रूप से उपयोग किए जाने वाले प्लेटफार्मों के साथ उनकी तुलना उन मानदंडों पर की गई है जो अक्सर खरीदारी का निर्णय लेते हैं।

मापदंड	IBM डेटास्टेज	सूचना विज्ञान पावरसेंटर	Talend	लघु उद्योगों
प्रसंस्करण मॉडल	पाइपलाइन प्लस विभाजन समानांतरता	डेटा-संचालित विभाजन	जनरेट किया गया Java or Spark कोड	मेमोरी में डेटा प्रवाह
सबसे अच्छा फिट	बहुत बड़े उद्यम बैच और सीडीसी वर्कलोड	भारी प्रशासनिक व्यवस्था वाली जटिल विरासत वास्तुकला	क्लाउड-आधारित और लागत-संवेदनशील टीमें	Microsoft SQL Server सम्पदा
लाइसेंसिंग	वाणिज्यिक, प्रीमियम श्रेणी	व्यावसायिक	ओपन-सोर्स संस्करण के साथ-साथ वाणिज्यिक स्तर भी उपलब्ध हैं।	SQL सर्वर के साथ बंडल किया गया
सीखने की अवस्था	स्टीप को ईटीएल विशेषज्ञों की आवश्यकता है	खड़ी	मध्यम स्तर का कोडिंग कौशल सहायक होता है।	मध्यम
आँकड़े की गुणवत्ता	इस सूट में क्वालिटीस्टेज शामिल है।	पृथक डेटा गुणवत्ता उत्पाद	टैलेंड डेटा गुणवत्ता शामिल है	ऐड-ऑन घटक

संक्षेप में, DataStage का चयन तब किया जाता है जब लाइसेंस की लागत की तुलना में रॉ थ्रूपुट, मेनफ्रेम रीच और ऑडिट के लिए तैयार डेटा वंशावली अधिक मायने रखती है। मुख्य रूप से क्लाउड में काम करने वाली टीमें डेटा झील वास्तुकला या पूर्व की तुलना करनाtracपहले क्रम में निर्णय लेने से लाभ-हानि का पता चल सकता है। ईटीएल बनाम ईएलटी अधिक प्रासंगिक, और एक व्यापक शॉर्टलिस्ट राउंड-अप में दिखाई देती है। ETL उपकरण और डेटा एकीकरण उपकरण.

अक्सर पूछे जाने वाले प्रश्न

एक सर्वर जॉब सीमित स्टेज सेट का उपयोग करके एक ही नोड पर चलती है। एक पैरेलल जॉब पैरेलल इंजन पर चलती है, नोड्स में विभाजन का समर्थन करती है, और अधिक व्यापक स्टेज पैलेट का उपयोग करती है, इसलिए यह कहीं अधिक बड़े वॉल्यूम को संभालने में सक्षम है।

जी हाँ। ऑन-प्रिमाइसेस सूचना सर्वर के साथ-साथ, IBM DataStage को प्रबंधित सेवा के रूप में प्रदान करता है। IBM क्लाउड पाक फॉर डेटा और वाटसनएक्स.डेटा के साथ एकीकरण की सुविधा उपलब्ध है, जिससे स्थानीय सर्वर प्रशासन के बिना भी समान फ्लो डिजाइन चलाए जा सकते हैं।

अधिकांश कार्य ग्राफिकल है। उपयोगी अतिरिक्त सुविधाएँ निम्नलिखित हैं: एसक्यूएल स्रोत संबंधी प्रश्नों के लिए, जॉब नियंत्रण के लिए शेल स्क्रिप्टिंग, और ट्रांसफॉर्मर स्टेज डेरिवेशन और रूटीन के अंदर उपयोग की जाने वाली डेटास्टेज बेसिक अभिव्यक्ति भाषा।

एआई सहायकों में IBM क्लाउड पाक फॉर डेटा स्रोत-से-लक्ष्य मानचित्र का सुझाव देता हैpingयह सरल भाषा से रूपांतरण अभिव्यक्तियाँ उत्पन्न करता है, स्कीमा विचलन का पता लगाता है, और जब कोई कार्य अपने बेसलाइन से धीमा चलता है तो विभाजन परिवर्तनों की अनुशंसा करता है।

नहीं। एआई मानचित्र को गति देता है।pingदस्तावेज़ीकरण और ट्यूनिंग संबंधी सुझाव देने का काम डेवलपर्स के पास रहता है, लेकिन डेटा मॉडलिंग, व्यावसायिक नियम, अपवाद प्रबंधन और उत्पादन संबंधी जवाबदेही अभी भी डेवलपर्स की ही रहती है। यह भूमिका समाप्त होने के बजाय समीक्षा और डिज़ाइन की ओर अग्रसर होती है।

शुरुआती लोगों के लिए डेटास्टेज ट्यूटोरियल: IBM ईटीएल उपकरण

डेटास्टेज क्या है?

डेटास्टेज अवलोकन

प्रसंस्करण चरण प्रकार

डेटा एकीकरण के लिए DataStage का उपयोग क्यों करें?

डेटास्टेज घटक और Archiटेक्चर

DataStage में समानांतर प्रोसेसिंग कैसे काम करती है

डेटास्टेज टूल के लिए पूर्वापेक्षाएँ

डाउनलोड और स्थापना InfoSphere सूचना सर्वर

सी.डी.सी. ट्रांजेक्शन स्टेज जॉब में परिवर्तन डेटा का प्रक्रिया प्रवाह

SQL प्रतिकृति सेट अप करना

SQL प्रतिकृति ऑब्जेक्ट बनाना

सीसीडी तालिकाओं को डेटास्टेज पर मैप करने के लिए परिभाषा फ़ाइलें बनाना

प्रतिकृतिकरण प्रारंभ करना

डेटास्टेज टूल में प्रोजेक्ट कैसे बनाएं

डेटास्टेज और क्वालिटीस्टेज डिज़ाइनर में प्रतिकृति कार्य कैसे आयात करें

DataStage से STAGEDB डेटाबेस तक डेटा कनेक्शन बनाना

STAGEDB से DataStage में तालिका परिभाषाएँ आयात करना

डेटास्टेज जॉब्स के लिए गुण सेट करना

डेटास्टेज जॉब्स को संकलित करना और चलाना

SQL प्रतिकृति और डेटास्टेज के बीच एकीकरण का परीक्षण

DataStage बनाम अन्य लोकप्रिय ETL उपकरण

अक्सर पूछे जाने वाले प्रश्न

इस पोस्ट को संक्षेप में इस प्रकार लिखें:

न्यूज़लैटर के लिए साइन अप करें

डेटास्टेज क्या है?

डेटास्टेज अवलोकन

प्रसंस्करण चरण प्रकार

संबंधित आलेख

डेटा एकीकरण के लिए DataStage का उपयोग क्यों करें?

डेटास्टेज घटक और Archiटेक्चर

DataStage में समानांतर प्रोसेसिंग कैसे काम करती है

डेटास्टेज टूल के लिए पूर्वापेक्षाएँ

डाउनलोड और स्थापना InfoSphere सूचना सर्वर

सी.डी.सी. ट्रांजेक्शन स्टेज जॉब में परिवर्तन डेटा का प्रक्रिया प्रवाह

SQL प्रतिकृति सेट अप करना

SQL प्रतिकृति ऑब्जेक्ट बनाना

सीसीडी तालिकाओं को डेटास्टेज पर मैप करने के लिए परिभाषा फ़ाइलें बनाना

प्रतिकृतिकरण प्रारंभ करना

डेटास्टेज टूल में प्रोजेक्ट कैसे बनाएं

डेटास्टेज और क्वालिटीस्टेज डिज़ाइनर में प्रतिकृति कार्य कैसे आयात करें

DataStage से STAGEDB डेटाबेस तक डेटा कनेक्शन बनाना

STAGEDB से DataStage में तालिका परिभाषाएँ आयात करना

डेटास्टेज जॉब्स के लिए गुण सेट करना

डेटास्टेज जॉब्स को संकलित करना और चलाना

SQL प्रतिकृति और डेटास्टेज के बीच एकीकरण का परीक्षण

DataStage बनाम अन्य लोकप्रिय ETL उपकरण

अक्सर पूछे जाने वाले प्रश्न

इस पोस्ट को संक्षेप में इस प्रकार लिखें:

न्यूज़लैटर के लिए साइन अप करें