ETL परीक्षण ट्यूटोरियल

⚡ स्मार्ट सारांश

ईटीएल टेस्टिंग यह सत्यापित करती है कि डेटा स्रोत सिस्टम से रूपांतरण तर्क के माध्यम से लक्ष्य डेटा वेयरहाउस तक कैसे प्रवाहित होता है, जिससे सटीकता, पूर्णता और विश्वसनीयता की पुष्टि होती है। यह संसाधन प्रक्रिया के चरणों, परीक्षण के प्रकारों, सामान्य बग श्रेणियों, स्वचालन दृष्टिकोणों और व्यावहारिक सर्वोत्तम प्रथाओं की व्याख्या करता है, जो शुरुआती और मध्यवर्ती स्तर के परीक्षकों के लिए आवश्यक हैं।

  • 🎯 ईटीएल टेस्टिंग को परिभाषित करें: Ex में डेटा की अखंडता सत्यापित करेंtracस्रोत और लक्ष्य प्रणालियों के बीच टी, ट्रांसफॉर्म और लोड चरण।
  • 🔁 प्रक्रिया चरण: स्रोतों की पहचान करें, डेटा प्राप्त करें, व्यावसायिक तर्क और आयामी मॉडलिंग लागू करें, फिर रिपोर्ट तैयार करें और प्रस्तुत करें।
  • 🧪 परीक्षण के प्रकार: उत्पादन सत्यापन, स्रोत-से-लक्ष्य, मेटाडेटा, पूर्णता, सटीकता, रूपांतरण और वृद्धिशील परीक्षण।
  • 🐞 बग श्रेणियाँ: यूआई, बाउंड्री वैल्यू एनालिसिस, इक्विवेलेंस पार्टिशनिंग, कैलकुलेशन, लोड, रेस कंडीशन और वर्जन कंट्रोल से संबंधित दोष।
  • 🤖 स्वचालन फोकस: इनफॉर्मेटिका और एआई-सहायता प्राप्त स्क्रिप्ट जैसे उपकरण मैन्युअल प्रयास को कम करते हैं और परीक्षण कवरेज का विस्तार करते हैं।
  • सर्वोत्तम प्रथाएं: रूपांतरणों को मान्य करें, अपवादों को लक्षित करें, कवरेज लागू करें और स्केलेबल लोड समयसीमा की पुष्टि करें।

ETL परीक्षण ट्यूटोरियल

ETL क्या है?

ईटीएल के लिए खड़ा है Extracटी-ट्रांसफॉर्म-लोडऔर यह बताता है कि डेटा स्रोत सिस्टम से डेटा वेयरहाउस में कैसे जाता है। डेटाtracडेटा को OLTP डेटाबेस से लिया जाता है, डेटा वेयरहाउस स्कीमा से मेल खाने के लिए रूपांतरित किया जाता है, और वेयरहाउस डेटाबेस में लोड किया जाता है। कई वेयरहाउस टेक्स्ट फ़ाइलों, पुराने एप्लिकेशन और स्प्रेडशीट जैसे गैर-OLTP सिस्टम से भी डेटा शामिल करते हैं।

उदाहरण के लिए, एक रिटेल स्टोर में बिक्री, मार्केटिंग और लॉजिस्टिक्स जैसे अलग-अलग विभाग हो सकते हैं। प्रत्येक विभाग ग्राहक की जानकारी को स्वतंत्र रूप से संभालता है, और उस डेटा को स्टोर करने का तरीका भी अलग-अलग होता है। बिक्री विभाग ग्राहक के नाम से रिकॉर्ड स्टोर कर सकता है, जबकि मार्केटिंग विभाग ग्राहक आईडी का उपयोग करता है।

यदि व्यावसायिक टीमें विभिन्न मार्केटिंग अभियानों में किसी ग्राहक के संपूर्ण खरीद इतिहास की समीक्षा करना चाहती हैं, तो असंबद्ध डेटा इसे बहुत थकाऊ बना देता है। इसका समाधान एक का उपयोग करना है। datawarehouse ईटीएल का उपयोग करके विभिन्न स्रोतों से प्राप्त जानकारी को एक समान संरचना में संग्रहित करना। ईटीएल भिन्न-भिन्न डेटा सेटों को एक एकीकृत संरचना में परिवर्तित कर सकता है, जिससे बीआई उपकरण बाद में सार्थक अंतर्दृष्टि और रिपोर्ट प्राप्त कर सकें।

निम्नलिखित आरेख ईटीएल परीक्षण प्रक्रिया प्रवाह और उन मुख्य अवधारणाओं को दर्शाता है जिनका उपयोग आप इस मार्गदर्शिका में करेंगे:

Extracटी-ट्रांसफॉर्म-लोड

1) पूर्वtract

  • Extracएक या अधिक स्रोत प्रणालियों से प्रासंगिक डेटा।

2) रूपांतरण

  • डेटा को डेटा वेयरहाउस (DW) प्रारूप में रूपांतरित करें।
  • कुंजी बनाएं: कुंजी एक या एक से अधिक डेटा विशेषताएँ होती हैं जो किसी इकाई की विशिष्ट रूप से पहचान करती हैं। विभिन्न चाबियों के प्रकार प्राथमिक कुंजी, वैकल्पिक कुंजी, विदेशी कुंजी, मिश्रित कुंजी और सरोगेट कुंजी हैं। डेटा वेयरहाउस इन कुंजियों का मालिक होता है और किसी अन्य इकाई को इन्हें असाइन करने की अनुमति नहीं देता है।
  • डेटा की सफाई: डेटा के निर्यात के बादtracइसके बाद, सिस्टम सफाई और अनुरूपता के अगले चरण में प्रवेश करता है। सफाई से कमियों को दूर किया जाता है और त्रुटियों की पहचान की जाती है। अनुरूपता असंगत डेटा सेटों के बीच के टकरावों को हल करती है ताकि उन्हें एंटरप्राइज़ डेटा वेयरहाउस में उपयोग किया जा सके। सिस्टम मेटाडेटा भी बनाता है जो स्रोत सिस्टम की समस्याओं का निदान करने और डेटा की गुणवत्ता में सुधार करने में मदद करता है।

3) लोड

  • डेटा को डेटा वेयरहाउस (DW) में लोड करें।
  • एग्रीगेट बनाएं: एक एग्रीगेट विभिन्न स्रोतों से प्राप्त डेटा को सारांशित और संग्रहीत करता है। तथ्य तालिका अंतिम उपयोगकर्ता प्रश्नों के प्रदर्शन में सुधार करने के लिए।

ईटीएल परीक्षण क्या है?

ईटीएल टेस्टिंग यह सुनिश्चित करने के लिए की जाती है कि व्यावसायिक परिवर्तन के बाद स्रोत से गंतव्य तक लोड किया गया डेटा सटीक हो। इसमें स्रोत और गंतव्य के बीच के विभिन्न मध्यवर्ती चरणों में डेटा का सत्यापन भी शामिल है। चूंकि ईटीएल का मतलब एक्सप्रेशन है,tracटी-ट्रांसफॉर्म-लोड, ईटीएल टेस्टिंग इन तीनों चरणों और उन बिंदुओं को कवर करती है जहां डेटा इन चरणों के बीच क्रॉस करता है।

ईटीएल परीक्षण

ईटीएल टेस्टिंग क्यों महत्वपूर्ण है?

एक बार जब आप समझ जाते हैं कि ईटीएल टेस्टिंग क्या है, तो अगला सवाल यह उठता है कि संगठन इसमें इतना प्रयास क्यों करते हैं। व्यावसायिक निर्णय सही, पूर्ण और भरोसेमंद डेटा पर निर्भर करते हैं, इसलिए एक भी रूपांतरण त्रुटि वित्तीय रिपोर्टों, ग्राहक विश्लेषण और नियामक खुलासों पर व्यापक प्रभाव डाल सकती है।

निम्नलिखित बिंदु सशक्त ईटीएल परीक्षण के व्यावहारिक महत्व को स्पष्ट करते हैं:

  • डेटा सटीकता: यह पुष्टि करता है कि व्यावसायिक नियमों द्वारा रूपांतरित मान प्रलेखित मानचित्र से मेल खाते हैं।ping विनिर्देशों के माध्यम से, मौन भ्रष्टाचार को रोका जा सकता है।
  • विश्वसनीय रिपोर्टिंग: डैशबोर्ड और बीआई टूल डेटा वेयरहाउस पर निर्भर करते हैं, इसलिए सत्यापित ईटीएल पाइपलाइन प्रत्येक डाउनस्ट्रीम रिपोर्ट और केपीआई की सुरक्षा करती हैं।
  • नियामक अनुपालन: बैंकिंग, स्वास्थ्य सेवा और बीमा जैसे उद्योगों को यह साबित करना होगा कि डेटा की उत्पत्ति और अखंडता को शुरू से अंत तक संरक्षित रखा जाता है।
  • पुनःकार्य में कमी: निम्न स्तर के वातावरण में दोषों का पता लगाने से महंगे उत्पादन रीलोड, मैन्युअल मिलान और ग्राहक-संबंधी त्रुटियों से बचा जा सकता है।
  • प्रदर्शन आश्वासन: ईटीएल टेस्टिंग लोड विंडो, थ्रूपुट और बॉटलनेक को मापता है ताकि डेटा की मात्रा बढ़ने पर भी वेयरहाउस का स्केलिंग जारी रहे।

इन उद्देश्यों के स्पष्ट होने के बाद, अगला खंड उस संरचित प्रक्रिया का वर्णन करता है जिसका पालन ईटीएल परीक्षक वास्तविक परियोजनाओं पर करते हैं।

टॉप पिक
डेटाडैडो

Dataddo एक पूर्णतः प्रबंधित, बिना कोड वाला डेटा एकीकरण प्लेटफ़ॉर्म है जो क्लाउड ऐप्स, डैशबोर्ड और डेटा वेयरहाउस को आपस में जोड़ना आसान बनाता है। इस ETL प्लेटफ़ॉर्म में कस्टम कनेक्टर हैं जिन्हें 10 कार्यदिवसों के भीतर बनाया जा सकता है। यह टूल रिवर्स ETL, डेटाबेस प्रतिकृति और पारंपरिक ETL कार्यक्षमता का समर्थन करता है।

Dataddo पर जाएँ

ईटीएल परीक्षण प्रक्रिया

अन्य परीक्षण प्रक्रियाओं की तरह, ईटीएल भी विभिन्न चरणों से गुजरता है। ईटीएल परीक्षण प्रक्रिया के विभिन्न चरण इस प्रकार हैं:

ईटीएल परीक्षण प्रक्रिया

ईटीएल टेस्टिंग पांच चरणों में की जाती है:

  1. डेटा स्रोतों और आवश्यकताओं की पहचान करना
  2. डाटा अधिग्रहण
  3. व्यावसायिक तर्क और आयामी मॉडलिंग को लागू करें
  4. डेटा बनाएँ और भरें
  5. रिपोर्ट बनाएं

ईटीएल परीक्षण प्रक्रिया

उच्च-स्तरीय प्रक्रिया को ध्यान में रखते हुए, आइए उन विशिष्ट परीक्षण प्रकारों पर एक नज़र डालें जो इस जीवनचक्र के अंतर्गत आते हैं।

ईटीएल परीक्षण के प्रकार

  1. उत्पादन सत्यापन परीक्षण
    परीक्षण प्रक्रिया: इसे "टेबल बैलेंसिंग" या "प्रोडक्शन रिकॉन्सिलिएशन" भी कहा जाता है। इस प्रकार की ईटीएल टेस्टिंग डेटा पर तब की जाती है जब वह प्रोडक्शन सिस्टम में जाता है। व्यावसायिक निर्णयों को समर्थन देने के लिए, प्रोडक्शन डेटा सही क्रम में होना आवश्यक है। सूचना विज्ञान डेटा वैलिडेशन विकल्प ईटीएल टेस्टिंग के स्वचालन और प्रबंधन की क्षमता प्रदान करता है ताकि उत्पादन प्रणालियाँ खराब डेटा से प्रभावित न हों।
  2. स्रोत Target परीक्षण (सत्यापन परीक्षण)
    परीक्षण प्रक्रिया: इस प्रकार का परीक्षण यह सत्यापित करता है कि रूपांतरित डेटा मान अपेक्षित लक्ष्य मानों से मेल खाते हैं या नहीं।
  3. आवेदन Upgrades
    परीक्षण प्रक्रिया: इस प्रकार की ईटीएल टेस्टिंग स्वचालित रूप से उत्पन्न की जा सकती है, जिससे टेस्ट डेवलपमेंट में लगने वाला काफी समय बचता है। यह जांच करती है कि डेटा निर्यातtracकिसी पुराने एप्लिकेशन या रिपॉजिटरी से प्राप्त डेटा किसी नए एप्लिकेशन या रिपॉजिटरी में मौजूद डेटा से मेल खाता है।
  4. डेटा परीक्षण
    परीक्षण प्रक्रिया: डेटा परीक्षण में डेटा प्रकार की जाँच, डेटा लंबाई की जाँच और सूचकांक या बाधा जाँच शामिल हैं।
  5. डेटा पूर्णता परीक्षण
    परीक्षण प्रक्रिया: डेटा पूर्णता परीक्षण यह सत्यापित करता है कि अपेक्षित सभी डेटा स्रोत से लक्ष्य में लोड हो गया है। सामान्य परीक्षणों में सरल या अनुपस्थित रूपांतरण की स्थिति में स्रोत और लक्ष्य कॉलम के बीच रिकॉर्ड गणना, समुच्चय और वास्तविक डेटा की तुलना और सत्यापन शामिल है।
  6. डेटा सटीकता परीक्षण
    परीक्षण प्रक्रिया: यह परीक्षण सुनिश्चित करता है कि डेटा को अपेक्षा के अनुरूप सटीक रूप से लोड और रूपांतरित किया गया है।
  7. डेटा रूपांतरण परीक्षण
    परीक्षण प्रक्रिया: परीक्षण डेटा रूपांतरण अक्सर एक ही स्रोत से प्राप्त नहीं किया जा सकता है। एसक्यूएल क्वेरी और आउटपुट की तुलना। रूपांतरण नियमों को सत्यापित करने के लिए प्रत्येक पंक्ति के लिए कई SQL क्वेरी की आवश्यकता हो सकती है।
  8. डेटा गुणवत्ता परीक्षण
    परीक्षण प्रक्रिया:

    डेटा गुणवत्ता परीक्षणों में सिंटैक्स परीक्षण और संदर्भ परीक्षण शामिल हैं। ये परीक्षण गलत तिथियों या ऑर्डर नंबरों के कारण होने वाली व्यावसायिक प्रक्रिया त्रुटियों को रोकते हैं।

    सिंटैक्स परीक्षण अमान्य वर्णों, वर्ण पैटर्न और गलत अपर या लोअर केस क्रम के आधार पर त्रुटिपूर्ण डेटा की रिपोर्ट करते हैं।

    संदर्भ परीक्षण डेटा की तुलना डेटा मॉडल से करते हैं। उदाहरण के लिए: ग्राहक आईडी।

    डेटा गुणवत्ता परीक्षण में संख्या जांच, दिनांक जांच, परिशुद्धता जांच, डेटा जांच और शून्य जांच भी शामिल हैं।

  9. वृद्धिशील ईटीएल परीक्षण
    परीक्षण प्रक्रिया: यह परीक्षण नए डेटा को जोड़ने के साथ-साथ पुराने और नए डेटा की डेटा अखंडता की जाँच करता है। इंक्रीमेंटल परीक्षण यह सत्यापित करता है कि इंक्रीमेंटल ईटीएल प्रक्रिया के दौरान इंसर्ट और अपडेट अपेक्षा के अनुसार संसाधित होते हैं।
  10. GUI/नेविगेशन परीक्षण
    परीक्षण प्रक्रिया: यह परीक्षण फ्रंट-एंड रिपोर्ट के नेविगेशन और जीयूआई पहलुओं की जांच करता है।

ETL टेस्ट केस कैसे बनाएं

ईटीएल टेस्टिंग एक ऐसी अवधारणा है जिसे सूचना प्रबंधन उद्योग में विभिन्न उपकरणों और डेटाबेस पर लागू किया जा सकता है। ईटीएल टेस्टिंग का उद्देश्य यह सुनिश्चित करना है कि व्यावसायिक परिवर्तन के बाद स्रोत से गंतव्य तक लोड किया गया डेटा सटीक हो। इसमें स्रोत और गंतव्य के बीच विभिन्न मध्यवर्ती चरणों में डेटा का सत्यापन भी शामिल है।

ईटीएल टेस्टिंग करते समय, ईटीएल टेस्टर द्वारा हमेशा दो दस्तावेज़ों का उपयोग किया जाता है:

  1. ईटीएल मानचित्रping शीट: एक ईटीएल मानचित्रping शीट में स्रोत और गंतव्य तालिकाओं की सभी जानकारी होती है, जिसमें प्रत्येक कॉलम और संदर्भ तालिकाओं में उसका लुक-अप शामिल होता है। ईटीएल परीक्षकों को SQL क्वेरीज़ में निपुण होना चाहिए क्योंकि ईटीएल परीक्षण में किसी भी चरण में डेटा को मान्य करने के लिए कई जॉइन के साथ बड़ी क्वेरीज़ लिखना शामिल हो सकता है। ईटीएल मैपping डेटा सत्यापन के लिए क्वेरी लिखते समय शीटें काफी मददगार साबित होती हैं।
  2. स्रोत और लक्ष्य का डेटाबेस स्कीमा: मानचित्र में किसी भी जानकारी की पुष्टि करने के लिए इसे हमेशा पास रखना चाहिए।ping चादरें।

ईटीएल परीक्षण परिदृश्य और परीक्षण मामले

  1. नक्शाping दस्तावेज़ सत्यापन
    परीक्षण के मामलों: जांचें कि मानचित्र में संबंधित ईटीएल जानकारी प्रदान की गई है या नहीं।ping दस्तावेज़। प्रत्येक मानचित्र में एक परिवर्तन लॉग बनाए रखा जाना चाहिए।ping डॉक।
  2. मान्यकरण
    परीक्षण के मामलों:

    1) स्रोत और लक्ष्य तालिका संरचना को संबंधित मानचित्र के विरुद्ध सत्यापित करेंping डॉक।
    2) स्रोत डेटा प्रकार और लक्ष्य डेटा प्रकार समान होने चाहिए।
    3) स्रोत और लक्ष्य दोनों में डेटा प्रकारों की लंबाई बराबर होनी चाहिए।
    4) सुनिश्चित करें कि डेटा फ़ील्ड प्रकार और प्रारूप निर्दिष्ट किए गए हैं।
    5) स्रोत डेटा प्रकार की लंबाई लक्ष्य डेटा प्रकार की लंबाई से कम नहीं होनी चाहिए।
    6) तालिका में कॉलम के नामों को मानचित्र के साथ सत्यापित करेंping डॉक।

  3. बाधा सत्यापन
    परीक्षण के मामलों: यह सुनिश्चित करें कि विशिष्ट तालिका के लिए अपेक्षा के अनुसार बाधाएं परिभाषित की गई हैं।
  4. डेटा संगतता संबंधी समस्याएं
    परीक्षण के मामलों:

    1) किसी विशेष विशेषता के लिए डेटा प्रकार और लंबाई फाइलों या तालिकाओं में भिन्न हो सकती है, भले ही अर्थ संबंधी परिभाषा समान हो।
    2) अखंडता संबंधी बाधाओं का दुरुपयोग।

  5. पूर्णता संबंधी मुद्दे
    परीक्षण के मामलों:

    1) सुनिश्चित करें कि सभी अपेक्षित डेटा लक्ष्य तालिका में लोड हो गया है।
    2) स्रोत और लक्ष्य के बीच रिकॉर्ड गणना की तुलना करें।
    3) अस्वीकृत रिकॉर्ड की जाँच करें।
    4) यह सुनिश्चित करें कि लक्ष्य तालिकाओं के स्तंभों में डेटा छोटा न हो।
    5) सीमा मान विश्लेषण की जाँच करें।
    6) डेटा वेयरहाउस में लोड किए गए डेटा और स्रोत डेटा के बीच प्रमुख फ़ील्ड के अद्वितीय मानों की तुलना करें।

  6. शुद्धता के मुद्दे
    परीक्षण के मामलों:

    1) वह डेटा जिसमें वर्तनी की त्रुटि हो या जो गलत तरीके से दर्ज किया गया हो।
    2) शून्य, गैर-अद्वितीय या सीमा से बाहर का डेटा।

  7. परिवर्तन
    परीक्षण के मामलों: मैप में मौजूद प्रत्येक व्यावसायिक नियम और परिवर्तन तर्क की पुष्टि करें।ping लक्ष्य डेटा तक पहुंचने से पहले दस्तावेज़ को स्रोत डेटा पर सही ढंग से लागू किया जाता है।
  8. डेटा की गुणवत्ता
    परीक्षण के मामलों:

    1) संख्या जांच: संख्यात्मक प्रारूपों और मानों को मान्य करें।
    2) तिथि जांच: तिथियों को एक ही प्रारूप का पालन करना चाहिए और सभी रिकॉर्डों में एकरूप होना चाहिए।
    3) परिशुद्धता जांच।
    4) डेटा जांच।
    5) शून्य जाँच।

  9. शून्य मान्य करें
    परीक्षण के मामलों: किसी विशिष्ट कॉलम के लिए जहां "नॉट नल" निर्दिष्ट किया गया है, वहां नल मानों की जांच करें।
  10. डुप्लिकेट चेक
    परीक्षण के मामलों:

    1) यह सुनिश्चित करने के लिए कि कोई डुप्लिकेट पंक्तियाँ न हों, अद्वितीय कुंजी, प्राथमिक कुंजी और व्यावसायिक आवश्यकताओं के अनुसार अद्वितीय होने वाले किसी भी अन्य कॉलम को मान्य करें।
    2) जांचें कि किसी कॉलम में कोई डुप्लिकेट मान मौजूद तो नहीं है।tracकई स्रोत कॉलमों से डेटा लिया गया और उसे एक कॉलम में संयोजित किया गया।
    3) ग्राहक की आवश्यकताओं के अनुसार, यह सुनिश्चित करें कि लक्ष्य के भीतर कई कॉलमों के संयोजन में कोई डुप्लिकेट मौजूद न हो।

  11. दिनांक मान्यता
    परीक्षण के मामलों: दिनांक मानों का उपयोग ईटीएल विकास के कई क्षेत्रों में किया जाता है:

    1) पंक्ति निर्माण तिथि जानने के लिए।
    2) ईटीएल विकास के परिप्रेक्ष्य से सक्रिय रिकॉर्ड की पहचान करें।
    3) व्यावसायिक आवश्यकताओं के परिप्रेक्ष्य से सक्रिय रिकॉर्ड की पहचान करें।
    4) कभी-कभी, दिनांक मानों के आधार पर, अपडेट और इन्सर्ट उत्पन्न होते हैं।

  12. पूर्ण डेटा सत्यापन
    परीक्षण के मामलों:

    1) स्रोत और लक्ष्य तालिकाओं में संपूर्ण डेटा सेट को मान्य करने के लिए माइनस क्वेरी का उपयोग करें, जो सर्वोत्तम समाधान है।
    2) आपको स्रोत में से लक्ष्य को घटाना होगा और लक्ष्य में से स्रोत को घटाना होगा।
    3) यदि माइनस क्वेरी कोई मान लौटाती है, तो उन पंक्तियों को बेमेल माना जाना चाहिए।
    4) इंटरसेक्ट स्टेटमेंट का उपयोग करके स्रोत और लक्ष्य के बीच की पंक्तियों का मिलान करें।
    5) इंटरसेक्ट द्वारा लौटाया गया मान स्रोत और लक्ष्य तालिकाओं के व्यक्तिगत मानों से मेल खाना चाहिए।
    6) यदि माइनस क्वेरी पंक्तियाँ लौटाती है और इंटरसेक्ट काउंट स्रोत या लक्ष्य काउंट से कम है, तो डुप्लिकेट पंक्तियाँ मौजूद हैं।

  13. डेटा शुद्धता
    परीक्षण के मामलों: स्टेजिंग क्षेत्र में लोड करने से पहले अनावश्यक कॉलम हटा दिए जाने चाहिए।

ETL बग के प्रकार

मजबूत टेस्ट केस होने के बावजूद, ETL पाइपलाइन कई तरह से विफल हो सकती हैं। नीचे दी गई छवि उन बग श्रेणियों का सारांश प्रस्तुत करती है जिन पर आपको ध्यान देना चाहिए, और इसके बाद दी गई तालिका प्रत्येक श्रेणी का वर्णन करती है।

ETL बग के प्रकार

बग के प्रकार विवरण
उपयोगकर्ता इंटरफ़ेस बग/कॉस्मेटिक बग • एप्लिकेशन के GUI से संबंधित
• फ़ॉन्ट शैली, फ़ॉन्ट आकार, रंग, संरेखण, वर्तनी की गलतियाँ, नेविगेशन इत्यादि।
सीमा मूल्य विश्लेषण (BVA) से संबंधित बग • न्यूनतम और अधिकतम मान
समतुल्यता वर्ग विभाजन (ECP) से संबंधित बग • मान्य और अमान्य प्रकार
इनपुट/आउटपुट बग • मान्य मान स्वीकार नहीं किए जाते
• अमान्य मान स्वीकार किए गए
गणना संबंधी त्रुटियाँ • गणितीय त्रुटियाँ
• अंतिम आउटपुट गलत है
लोड स्थिति बग • एकाधिक उपयोगकर्ताओं की अनुमति नहीं देता है
• ग्राहक द्वारा अपेक्षित भार की अनुमति नहीं देता है
रेस कंडीशन बग • सिस्टम क्रैश और हैंग हो जाना
• सिस्टम क्लाइंट प्लेटफ़ॉर्म नहीं चला सकता
संस्करण नियंत्रण बग • कोई लोगो मिलान नहीं
• कोई संस्करण जानकारी उपलब्ध नहीं है
• आमतौर पर होता है प्रतिगमन परीक्षण
एच/डब्ल्यू बग • डिवाइस एप्लिकेशन पर प्रतिक्रिया नहीं दे रहा है
सहायता बग स्रोत • सहायता दस्तावेज़ों में गलतियाँ

डेटा वेयरहाउस परीक्षण

डेटा वेयरहाउस परीक्षण यह एक परीक्षण विधि है जिसमें डेटा वेयरहाउस के अंदर मौजूद डेटा की अखंडता, विश्वसनीयता, सटीकता और स्थिरता की जांच की जाती है ताकि यह कंपनी के डेटा फ्रेमवर्क के अनुरूप हो। डेटा वेयरहाउस परीक्षण का मुख्य उद्देश्य यह सुनिश्चित करना है कि वेयरहाउस के अंदर एकीकृत डेटा कंपनी के निर्णय लेने के लिए पर्याप्त रूप से विश्वसनीय हो। जबकि ईटीएल परीक्षण डेटा की आवाजाही पर केंद्रित होता है, डेटा वेयरहाउस परीक्षण व्यापक भंडारण और रिपोर्टिंग परत को कवर करता है जिसे अंततः ईटीएल डेटा प्रदान करता है।

डेटाबेस परीक्षण और ETL परीक्षण के बीच अंतर

हालांकि दोनों विषय संरचित डेटा के साथ काम करते हैं, लेकिन वे अलग-अलग सवालों के जवाब देते हैं। नीचे दी गई तालिका व्यावहारिक अंतर को दर्शाती है:

ईटीएल परीक्षण डाटा बेस परीक्षण
यह सत्यापित करता है कि डेटा अपेक्षा के अनुरूप स्थानांतरित हुआ है या नहीं। इसका प्राथमिक लक्ष्य यह जांचना है कि डेटा डेटा मॉडल में परिभाषित नियमों और मानकों का पालन कर रहा है या नहीं।
यह सत्यापित करता है कि स्रोत और लक्ष्य में गणनाएँ मेल खा रही हैं या नहीं, और यह कि रूपांतरित डेटा अपेक्षा के अनुरूप है या नहीं। यह सत्यापित करता है कि कोई अनाथ रिकॉर्ड मौजूद नहीं हैं और विदेशी-प्राथमिक कुंजी संबंध बनाए रखे गए हैं।
यह सत्यापित करता है कि ईटीएल के दौरान विदेशी प्राथमिक कुंजी संबंध संरक्षित रहते हैं। यह सत्यापित करता है कि कोई अनावश्यक तालिकाएँ नहीं हैं और डेटाबेस को सर्वोत्तम रूप से सामान्यीकृत किया गया है।
लोड किए गए डेटा में डुप्लिकेशन की जांच करता है। यह जांचता है कि आवश्यक होने पर कॉलम में डेटा अनुपस्थित तो नहीं है।

ETL में प्रदर्शन परीक्षण

ETL में प्रदर्शन परीक्षण यह एक परीक्षण तकनीक है जो यह सुनिश्चित करती है कि ईटीएल सिस्टम कई उपयोगकर्ताओं और लेनदेन के भार को संभाल सकता है। ईटीएल का प्राथमिक लक्ष्य प्रदर्शन का परीक्षण इसका उद्देश्य प्रदर्शन संबंधी बाधाओं की पहचान करके और उन्हें दूर करके सत्र के प्रदर्शन को अनुकूलित और बेहतर बनाना है। स्रोत और लक्ष्य डेटाबेस, मैपpingईमेल, सेशन और सिस्टम में ही बाधाएं हो सकती हैं।

परफॉर्मेंस टेस्टिंग और ट्यूनिंग के लिए इस्तेमाल किए जाने वाले सबसे अच्छे टूल्स में से एक इंफॉर्मेटिका है।

ईटीएल परीक्षक की जिम्मेदारियां

ईटीएल टेस्टर की प्रमुख जिम्मेदारियों को तीन श्रेणियों में विभाजित किया गया है:

  • स्टेज टेबल / एसएफएस या एमएफएस
  • व्यवसाय परिवर्तन तर्क लागू किया गया
  • Target रूपांतरण लागू करने के बाद स्टेज फ़ाइल या टेबल से टेबल लोड करना

एक ईटीएल टेस्टर की कुछ दैनिक जिम्मेदारियां इस प्रकार हैं:

  • ETL सॉफ्टवेयर का परीक्षण करें
  • ईटीएल डेटा वेयरहाउस के परीक्षण घटक
  • बैकएंड डेटा-संचालित परीक्षण निष्पादित करें
  • सृजन, डिजाइन और क्रियान्वयन परीक्षण के मामलों, परीक्षण योजनाएँ और परीक्षण हार्नेस
  • समस्याओं की पहचान करें और संभावित मुद्दों के लिए समाधान प्रदान करें।
  • आवश्यकताओं और डिजाइन विनिर्देशों को मंजूरी दें
  • डेटा स्थानान्तरण को मान्य करें और फ्लैट फ़ाइलों का परीक्षण करें
  • विभिन्न परिदृश्यों जैसे कि गणना परीक्षण के लिए SQL क्वेरी लिखें।

ईटीएल परीक्षण का स्वचालन

ईटीएल परीक्षण की सामान्य पद्धति एसक्यूएल स्क्रिप्टिंग या डेटा का दृश्य विश्लेषण करना है। ये तरीके समय लेने वाले, त्रुटि-प्रवण होते हैं और शायद ही कभी पूर्ण परिणाम देते हैं। परीक्षण कवरेजक्रियान्वयन में तेजी लाने, कवरेज बढ़ाने, लागत कम करने और सुधार करने के लिए। दोष उत्पादन और विकास परिवेशों में पहचान के लिए स्वचालन समय की आवश्यकता है। ऐसा ही एक उपकरण इन्फॉर्मेटिका है।

आधुनिक टीमें पारंपरिक स्वचालन को एआई-सहायता प्राप्त सहायक उपकरणों के साथ भी जोड़ती हैं जो परिवर्तन परीक्षणों का सुझाव देते हैं, कृत्रिम स्रोत डेटा उत्पन्न करते हैं और स्कीमा विचलन को चिह्नित करते हैं, जिससे परीक्षकों को दोहरावदार स्क्रिप्ट रखरखाव के बजाय जटिल व्यावसायिक तर्क पर ध्यान केंद्रित करने की स्वतंत्रता मिलती है।

ETL परीक्षण के लिए सर्वोत्तम अभ्यास

  1. सुनिश्चित करें कि डेटा सही ढंग से रूपांतरित किया गया है।
  2. बिना किसी डेटा हानि या कटौती के, अनुमानित डेटा को डेटा वेयरहाउस में लोड किया जाना चाहिए।
  3. यह सुनिश्चित करें कि ईटीएल एप्लिकेशन अमान्य डेटा को उचित रूप से अस्वीकार करे, जहां लागू हो वहां उसे डिफ़ॉल्ट मानों से प्रतिस्थापित करे और इसकी रिपोर्ट करे।
  4. स्केलेबिलिटी और परफॉर्मेंस को सत्यापित करने के लिए यह सुनिश्चित करें कि डेटा निर्धारित और अपेक्षित समय सीमा के भीतर वेयरहाउस में लोड हो गया है।
  5. दृश्यता की परवाह किए बिना, सभी विधियों में उपयुक्त इकाई परीक्षण होने चाहिए।
  6. उनकी प्रभावशीलता को मापने के लिए, सभी यूनिट परीक्षणों में उपयुक्त कवरेज तकनीकों का उपयोग किया जाना चाहिए।
  7. प्रत्येक टेस्ट केस के लिए एक ही अभिकथन रखने का प्रयास करें।
  8. बनाएं इकाई परीक्षण जो अपवादों को लक्षित करते हैं।

चेक आउट - ETL परीक्षण साक्षात्कार प्रश्न और उत्तर

अक्सर पूछे जाने वाले प्रश्न

ETL डेटा को वेयरहाउस में लोड करने से पहले उसे रूपांतरित करता है, जबकि ELT पहले कच्चे डेटा को लोड करता है और फिर उसे लक्ष्य वेयरहाउस में रूपांतरित करता है। ELT इलास्टिक कंप्यूट वाले क्लाउड वेयरहाउस के लिए उपयुक्त है, जबकि ETL संरचित, ऑन-प्रिमाइसेस पाइपलाइन के लिए उपयुक्त है।

सामान्य चुनौतियों में बड़ी मात्रा में डेटा, बार-बार स्कीमा परिवर्तन, अनुपलब्ध परीक्षण डेटा, अलिखित व्यावसायिक नियम, जटिल रूपांतरण और प्रदर्शन संबंधी बाधाएं शामिल हैं। स्ट्रॉन्ग मैपping दस्तावेज़, स्वचालन और पुन: प्रयोज्य सत्यापन क्वेरी इन जोखिमों को काफी हद तक कम कर देते हैं।

लोकप्रिय टूल में शामिल हैं सूचना विज्ञान डेटा सत्यापन विकल्प, क्वेरीसर्ज, टैलेंड, IBM InfoSphere DataStage और dbt टेस्ट जैसे ओपन-सोर्स यूटिलिटीज। सही विकल्प वेयरहाउस प्लेटफॉर्म, बजट और आवश्यक ऑटोमेशन स्तर पर निर्भर करता है।

कृत्रिम बुद्धिमत्ता (AI) विसंगतियों का पता लगाकर, स्कीमा विचलन की भविष्यवाणी करके, कृत्रिम स्रोत डेटा उत्पन्न करके और कवरेज अंतराल की अनुशंसा करके ETL परीक्षण में सुधार करती है। मशीन लर्निंग मॉडल उत्पादन डेटा का विश्लेषण भी कर सकते हैं और ऐसे सत्यापन नियम प्रस्तावित कर सकते हैं जिन्हें मनुष्य अनदेखा कर सकते हैं।

जी हां। एआई सहायक मानचित्र पढ़ सकते हैं।ping दस्तावेज़ तैयार करना, रूपांतरण नियमों का अनुमान लगाना और स्वचालित रूप से SQL सत्यापन स्क्रिप्ट बनाना। परीक्षक अभी भी व्यावसायिक सटीकता के लिए तैयार किए गए मामलों की समीक्षा करते हैं, लेकिन बार-बार की जाने वाली जाँचों के लिए निर्माण समय अक्सर घंटों से घटकर मिनटों में आ जाता है।

इस पोस्ट को संक्षेप में इस प्रकार लिखें: