टेराडाटा ट्यूटोरियल: टेराडाटा SQL क्या है? डेटाबेस Archiटेक्चर

टेराडाटा क्या है?

Teradata बड़े पैमाने पर डेटा वेयरहाउसिंग एप्लिकेशन विकसित करने के लिए एक ओपन-सोर्स डेटाबेस मैनेजमेंट सिस्टम है। यह टूल समानांतरता की अवधारणा का उपयोग करके एक साथ कई डेटा वेयरहाउस संचालन के लिए समर्थन प्रदान करता है। टेराडाटा एक व्यापक रूप से खुला प्रसंस्करण सिस्टम है जो यूनिक्स/लिनक्स/Windows सर्वर प्लेटफ़ॉर्म.

टेराडाटा सॉफ्टवेयर टेराडाटा कॉर्पोरेशन द्वारा विकसित किया गया है, जो एक अमेरिकी आईटी फर्म है। यह एनालिटिक्स डेटा प्लेटफ़ॉर्म, एप्लिकेशन और अन्य संबंधित सेवाओं का विक्रेता है। फर्म विभिन्न स्रोतों से डेटा को एकत्रित करने और विश्लेषण के लिए डेटा उपलब्ध कराने के लिए एक उत्पाद विकसित करती है।

टेराडाटा का इतिहास

टेराडाटा एनसीआर कॉर्पोरेशन का एक प्रभाग था। इसे 1979 में शामिल किया गया था लेकिन अक्टूबर 2007 में यह एनसीआर से अलग हो गया। माइकल कोहलर टेराडाटा के पहले सीईओ बने।

टेराडाटा कॉर्पोरेशन की उपलब्धियां:

  • 1979 – टेराडाटा को शामिल किया गया
  • 1984 - पहला डेटाबेस कंप्यूटर DBC/1012 जारी किया गया
  • 1986 - फॉर्च्यून पत्रिका ने टेराडाटा को 'वर्ष का सर्वश्रेष्ठ उत्पाद' घोषित किया
  • 1999 - टेराडाटा का उपयोग करके 130 टेराबाइट्स के साथ सबसे बड़ा डेटाबेस बनाया गया
  • 2002 - संपीड़न और विभाजन प्राथमिक के साथ टेराडाटा V2R5 संस्करण जारी
  • 2006 – टेराडाटा मास्टर डेटा प्रबंधन समाधान का शुभारंभ
  • 2008 - टेराडाटा 13.0 सक्रिय डेटा वेयरहाउसिंग के साथ जारी किया गया
  • 2011 – टेराडाटा एस्टर का अधिग्रहण किया और एडवांस्ड एनालिटिक्स स्पेस में प्रवेश किया
  • 2012 – टेराडाटा 14.0 पेश किया गया
  • 2014 – टेराडाटा 15.0 पेश किया गया
  • 2015- टेराडाटा ने ऐप्स मार्केटिंग प्लेटफॉर्म ऐपॉक्सी को खरीदा
  • 2016- टेराडा ने बिग डेटा के साथ हाथ मिलाया
  • 2017- टेराडाटा ने सैन डिएगो के स्टैकआईक्यू का अधिग्रहण किया

टेराडाटा क्यों?

  • टेराडाटा सेवाओं का एक पूरा सेट प्रदान करता है जो निम्न पर केंद्रित है विवरण भण्डारण
  • यह सिस्टम ओपन आर्किटेक्चर पर बनाया गया है। इसलिए जब भी कोई तेज़ डिवाइस उपलब्ध होगी, तो उसे पहले से बने आर्किटेक्चर में शामिल किया जा सकेगा।
  • टेराडाटा 50+ पेटाबाइट्स डेटा का समर्थन करता है।
  • सर्विस वर्कस्टेशन का उपयोग करने वाले बड़े टेराडाटा मल्टी-नोड सिस्टम के लिए एकल ऑपरेशन दृश्य
  • की विस्तृत श्रृंखला के साथ संगत बीआई उपकरण डेटा लाने के लिए.
  • यह डीबीए के लिए प्रबंधन हेतु एकल नियंत्रण बिंदु के रूप में कार्य कर सकता है। डाटाबेस.
  • उच्च प्रदर्शन, विविध प्रश्न, इन-डेटाबेस एनालिटिक्स और परिष्कृत कार्यभार प्रबंधन
  • टेराडाटा आपको एकाधिक परिनियोजन विकल्पों पर समान डेटा प्राप्त करने की अनुमति देता है

इस टेराडाटा ट्यूटोरियल में आगे हम टेराडाटा की विशेषताओं के बारे में जानेंगे।

टेराडाटा एसक्यूएल की विशेषताएं

टेराडाटा निम्नलिखित शक्तिशाली विशेषताएं प्रदान करता है:

  • रैखिक मापनीयता: सिस्टम के प्रदर्शन को बढ़ाने के लिए नोड्स जोड़कर बड़ी मात्रा में डेटा से निपटने के लिए रैखिक मापनीयता प्रदान करता है।
  • असीमित समानता: टेराडाटा एमपीपी (मैसिवली पैरेलल प्रोसेसिंग) पर आधारित है Archiटेक्चर)। इसलिए, इसे शुरू से ही समानांतर रहने के लिए डिज़ाइन किया गया है। यह एक बड़े कार्य को छोटे-छोटे कार्यों में विभाजित कर सकता है और उन्हें समानांतर रूप से चला सकता है
  • परिपक्व अनुकूलक: टेराडाटा ऑप्टिमाइज़र एक क्वेरी में 64 जॉइन तक को संभाल सकता है।
  • कम टीसीओ: टेरा डेटा की स्वामित्व लागत कम है। इसे स्थापित करना, बनाए रखना और प्रबंधित करना आसान है।
  • लोड और अनलोड उपयोगिताएँ: टेराडाटा, टेराडाटा सिस्टम से/में डेटा स्थानांतरित करने के लिए लोड और अनलोड सुविधाएं प्रदान करता है।
  • संपर्क: यह एमपीपी प्रणाली मेनफ्रेम या नेटवर्क-संलग्न प्रणालियों जैसे चैनल-संलग्न प्रणालियों से जुड़ सकती है।
  • एसक्यूएल: टेराडाटा समर्थन करता है एसक्यूएल तालिकाओं में संग्रहीत डेटा के साथ बातचीत करने के लिए। यह इसका विस्तार प्रदान करता है।
  • मजबूत उपयोगिताएँ: टेराडाटा, टेराडाटा प्रणालियों से/तक डेटा आयात/निर्यात करने के लिए फास्टएक्सपोर्ट, फास्टलोड, मल्टीलोड और टीपीटी जैसी मजबूत सुविधाएं प्रदान करता है।
  • स्वचालित वितरण: Teradata बिना किसी मानवीय हस्तक्षेप के डेटा को डिस्क पर स्वचालित रूप से वितरित किया जा सकता है।

इस Teradata SQL ट्यूटोरियल में आगे, हम Teradata के बारे में जानेंगे Archiटेकचर.

Teradata Archiटेक्चर

टेराडाटा आर्किटेक्चर एक व्यापक समानांतर प्रसंस्करण है Archiटेकचर.

टेराडाटा के तीन महत्वपूर्ण घटक हैं:

  • पार्सिंग इंजन
  • बायनेट
  • एक्सेस मॉड्यूल प्रोसेसर (AMPs)

टेराडाटा स्टोरेज Archiटेक्चर डेटाबेस Archiटेक्चर आरेख:

Teradata Archiटेक्चर
Teradata Archiटेक्चर आरेख

टेराडाटा स्टोरेज Archiटेक्चर

पार्सिंग इंजन:

पार्सिंग इंजन क्वेरीज़ को पार्स करता है और निष्पादन योजना तैयार करता है। यह उपयोगकर्ताओं के लिए सत्रों का प्रबंधन करता है। यह उपयोगकर्ताओं को अनुरोध अनुकूलित करता है और भेजता है।

इसलिए, जब क्लाइंट रिकॉर्ड डालने के लिए क्वेरी निष्पादित करता है, तो पार्सिंग इंजन रिकॉर्ड को मैसेज पासिंग लेयर पर भेजता है। मैसेज पासिंग लेयर या BYNET एक सॉफ्टवेयर और हार्डवेयर घटक है। यह नेटवर्किंग क्षमता प्रदान करता है। यह रिकॉर्ड को पुनः प्राप्त करता है और पंक्ति को लक्ष्य AMP पर भेजता है।

एएमपी:

AMP का मतलब है एक्सेस मॉड्यूल प्रोसेसर। यह इन डिस्क पर रिकॉर्ड संग्रहीत करता है। AMP निम्नलिखित गतिविधियाँ संचालित करता है:

  • डेटाबेस के एक हिस्से का प्रबंधन करता है
  • प्रत्येक तालिका के एक हिस्से का प्रबंधन करता है
  • परिणाम सेट बनाने से जुड़े सभी कार्य निष्पादित करें जैसे सॉर्ट, एग्रीगेशन और जॉइन
  • लॉक और स्पेस प्रबंधन करें

टेराडाटा पुनर्प्राप्ति Archiटेक्चर

जब क्लाइंट रिकॉर्ड प्राप्त करने के लिए क्वेरी चलाता है, तो पार्सिंग इंजन BYNET को एक अनुरोध भेजता है। फिर BYNET उपयुक्त AMPs को पुनर्प्राप्ति अनुरोध भेजता है।

AMPs समानांतर रूप से अपनी डिस्क खोजते हैं और आवश्यक रिकॉर्ड पहचानते हैं और उन्हें BYNET को भेजते हैं। BYNET रिकॉर्ड को पार्सिंग इंजन को भेजता है, जो बदले में क्लाइंट को भेजा जाएगा।

इस टेराडाटा डेटाबेस ट्यूटोरियल में आगे हम टेराडाटा SQL कमांड के बारे में जानेंगे।

टेराडाटा SQL कमांड के प्रकार

टेराडाटा डेटाबेस निम्नलिखित बुनियादी SQL कमांड का समर्थन करता है:

  1. डेटा डेफ़िनेशन लैंग्वेज (DDL) कमांड
  2. डेटा नियंत्रण भाषा (DCL) आदेश
  3. डेटा मैनिपुलेशन लैंग्वेज (डीएमएल) कमांड

डेटा परिभाषा भाषा आदेश

कमान विवरण
बनाएँ एक नया डाटाबेस, तालिका, उपयोगकर्ता आदि बनाता है।
ड्रॉप नया डाटाबेस, तालिका, उपयोगकर्ता आदि हटाता है।
बदलने तालिका, कॉलम, ट्रिगर आदि को बदलता है.
संशोधित डेटाबेस या उपयोगकर्ता परिभाषा में परिवर्तन करता है
नाम बदलें तालिकाओं, दृश्यों, मैक्रोज़ आदि का नाम बदलता है.

डेटा नियंत्रण भाषा आदेश

कमान विवरण
अनुदान/निरस्त करना किसी ऑब्जेक्ट पर उपयोगकर्ता के विशेषाधिकारों को नियंत्रित करने के लिए उपयोग किया जाता है
लॉगऑन प्रदान करें/लॉगऑन निरस्त करें किसी होस्ट या होस्ट समूह पर लॉगऑन विशेषाधिकारों को नियंत्रित करने के लिए उपयोग किया जाता है
GIVE एक डेटाबेस ऑब्जेक्ट को दूसरे डेटाबेस ऑब्जेक्ट को देने के लिए उपयोग किया जाता है

टेराडाटा डेटाबेस SQL ​​डेटा मैनिपुलेशन लैंग्वेज कमांड

कमान विवरण
हटाएँ तालिका से एक पंक्ति हटाता है
इको क्लाइंट को स्ट्रिंग या कमांड प्रतिध्वनित करने के लिए उपयोग किया जाता है
चेकप्वाइंट जर्नल में एक पुनर्प्राप्ति बिंदु निर्धारित करता है जिसका उपयोग बाद में तालिका सामग्री को पुनर्स्थापित करने के लिए किया जा सकता है
चुनते हैं तालिका रूप में एक विशिष्ट पंक्ति डेटा वापस करने के लिए उपयोग किया जाता है
अद्यतन तालिका की एक या अधिक पंक्तियों में डेटा संशोधित करता है

टेराडाटा डेटाबेस के अनुप्रयोग

टेराडाटा के लोकप्रिय अनुप्रयोग निम्नलिखित हैं:

  • ग्राहक डेटा प्रबंधन: ग्राहकों के साथ दीर्घकालिक संबंध बनाए रखने में सहायता करता है।
  • मास्टर डेटा प्रबंधन: एक ऐसा वातावरण विकसित करने में सहायता करता है जहां मास्टर डेटा का उपयोग, समन्वयन और भंडारण किया जा सके।
  • वित्त और प्रदर्शन प्रबंधन: यह संगठन को वित्तीय रिपोर्टिंग की गति और गुणवत्ता में सुधार करने में मदद करता है। यह वित्तीय अवसंरचना लागत को कम करता है, और उद्यम प्रदर्शन को सक्रिय रूप से प्रबंधित करता है।
  • आपूर्ति श्रृंखला प्रबंधन: आपूर्ति श्रृंखला संचालन में सुधार करें जिससे ग्राहक सेवा में सुधार, चक्र समय में कमी, तथा इन्वेंट्री में कमी लाने में मदद मिलेगी।
  • मांग श्रृंखला प्रबंधन: ग्राहक सेवा स्तर और बिक्री बढ़ाने में मदद करता है। यह कंपनियों को उनके स्टोर आइटम की मांग का सटीक अनुमान लगाने में भी मदद करता है।

इस टेराडाटा फॉर बिगिनर्स ट्यूटोरियल में आगे, हम टेराडाटा और अन्य के बीच अंतर के बारे में जानेंगे आरडीबीएमएस.

टेराडाटा और अन्य RDBMS के बीच अंतर

प्राचल टेरा डेटा आरडीबीएमएस
Archiटेक्चर्स फ़ॉलो करता है साझा कुछ भी नहीं Archiटेकचर. सब कुछ साझा किया और संसाधन विवाद की अनुमति देता है।
प्रक्रियाओं एमआईपीएस [लाखों निर्देश/सेकंड] केआईपीएस [हजारों संस्थान/सेकंड]
अनुक्रमित बेहतर वितरण और पुनर्प्राप्ति केवल FASI पुनर्प्राप्ति प्रदान करता है
समानता बिना शर्त समानता का समर्थन करता है। समांतरता सशर्त और अप्रत्याशित है
थोक भार टेराडाटा बल्क लोड की अनुमति देता है। केवल सीमित मात्रा में थोक भार की अनुमति देता है।
अनुमापकता एक ढलान के साथ रैखिक मापनीयता घटते प्रतिफल के साथ मापनीयता
डेटाबेस बफर सभी UoP द्वारा उपयोग किया जाने वाला एकल डेटाबेस बफर। (समानांतरता की एक इकाई)। सभी UoP द्वारा एक्सेस किया जाने वाला एकल डेटा स्टोर क्वेरी नियंत्रक उन UoP को फ़ंक्शन भेजता है जिनके पास डेटा का स्वामित्व होता है
स्टोर यह टेरा बाइट्स संग्रहीत करता है[Billपंक्तियों के आयन] गीगा बाइट्स[लाखों पंक्तियाँ]

एमपीपी बनाम एसएमपी

एमपीपी एसएमपी
एमपीपी - मैसिवली पैरेलल प्रोसेसिंग। यह एक कंप्यूटर सिस्टम है जो कई स्वतंत्र अंकगणितीय इकाइयों या पूरे माइक्रोप्रोसेसरों से जुड़ा होता है, जो समानांतर रूप से चलते हैं। सममित बहु-प्रसंस्करण। एसएमपी प्रसंस्करण प्रणाली में, सीपीयू एक ही मेमोरी साझा करते हैं, और परिणामस्वरूप एक सिस्टम में चलने वाला कोड दूसरे द्वारा उपयोग की जाने वाली मेमोरी को प्रभावित कर सकता है।
नये सीपीयू जोड़कर डाटाबेस का विस्तार किया जा सकता है। एसएमपी डेटाबेस सामान्यतः डेटाबेस खोज करने के लिए एक सीपीयू का उपयोग करते हैं।
एमपीपी वातावरण में, प्रदर्शन में सुधार होता है, क्योंकि भौतिक कंप्यूटरों के बीच संसाधनों को साझा नहीं किया जाना चाहिए। समानांतर कार्य के लिए कार्यभार सिस्टम में प्रोसेसरों में वितरित किया जाता है।
मैसिव पैरेलल प्रोसेसिंग सिस्टम का प्रदर्शन रैखिक होता है। हालाँकि, यह नोड्स की संख्या के अनुपात में बढ़ेगा। एसएमपी डेटाबेस कई सर्वरों पर चल सकते हैं। हालाँकि, वे एक और संसाधन साझा करेंगे।

सारांश

  • टेराडाटा अर्थ: टेराडाटा एक ओपन-सोर्स है डेटाबेस प्रबंधन प्रणाली बड़े पैमाने पर डेटा वेयरहाउसिंग अनुप्रयोगों को विकसित करने के लिए।
  • टेराडाटा एनसीआर कॉर्पोरेशन का एक प्रभाग था। इसे 1979 में निगमित किया गया था लेकिन अक्टूबर 2007 में यह एनसीआर से अलग हो गया
  • टेराडाटा सेवाओं का एक पूरा सेट प्रदान करता है जो डेटा वेयरहाउसिंग पर केंद्रित है
  • टेराडाटा सिस्टम के प्रदर्शन को बढ़ाने के लिए नोड्स जोड़कर बड़ी मात्रा में डेटा से निपटने के लिए रैखिक मापनीयता प्रदान करता है।
  • टेराडाटा के तीन महत्वपूर्ण घटक हैं 1) पार्सिंग इंजन 2) एमपीपी 3) एक्सेस मॉड्यूल प्रोसेसर (एएमपी)
  • टेराडाटा किसी भी संगठन की डेटा वेयरहाउसिंग और ईटीएल आवश्यकताओं को पूरा करने के लिए उत्पाद सूट की एक पूरी श्रृंखला प्रदान करता है
  • टेराडाटा एप्लिकेशन मुख्य रूप से आपूर्ति श्रृंखला प्रबंधन, मास्टर डेटा प्रबंधन, मांग श्रृंखला प्रबंधन आदि के लिए उपयोग किया जाता है।