शुरुआती लोगों के लिए हाइव ट्यूटोरियल
हाइव ट्यूटोरियल सारांश
अपाचे हाइव बड़े डेटासेट को बहुत तेजी से क्वेरी करने और प्रबंधित करने में मदद करता है। यह एक ईटीएल उपकरण Hadoop पारिस्थितिकी तंत्र के लिए। शुरुआती लोगों के लिए इस अपाचे हाइव ट्यूटोरियल में, आप हाइव की मूल बातें और HQL क्वेरीज़, डेटा एक्सट्रैक्शन, पार्टीशन, बकेट इत्यादि जैसे महत्वपूर्ण विषयों को सीखेंगे। यह हाइव ट्यूटोरियल श्रृंखला आपको हाइव अवधारणाओं और मूल बातें सीखने में मदद करेगी।
मुझे क्या पता होना चाहिए?
इस हाइव क्वेरी ट्यूटोरियल को सीखने के लिए, आपको बुनियादी ज्ञान की आवश्यकता है एसक्यूएल, Hadoop और अन्य डेटाबेस का ज्ञान अतिरिक्त सहायता प्रदान करेगा।
हाइव कोर्स पाठ्यक्रम
परिचय
👉 Less1 पर | हाइव क्या है? - Archiटेक्चर और मोड |
👉 Less2 पर | HIVE डाउनलोड करें और इंस्टॉल करें — HIVE को कैसे डाउनलोड और इंस्टॉल करें Ubuntu |
👉 Less3 पर | HIVE मेटास्टोर कॉन्फ़िगरेशन — इसका उपयोग क्यों करें MySQL? |
👉 Less4 पर | हाइव डेटा प्रकार — हाइव में डेटाबेस बनाएं और हटाएं |
उन्नत सामग्री
👉 Less1 पर | हाइव तालिका बनाएं — प्रकार और इसका उपयोग |
👉 Less2 पर | हाइव विभाजन और बाल्टियाँ — उदाहरण के साथ सीखें |
👉 Less3 पर | हाइव इंडेक्स और दृश्य — उदाहरण के साथ सीखें |
👉 Less4 पर | हाइव क्वेरीज़ — उदाहरण के साथ सीखें |
👉 Less5 पर | हाइव जॉइन और सबक्वेरी ट्यूटोरियल — उदाहरण के साथ सीखें |
👉 Less6 पर | हाइव क्वेरी लैंग्वेज ट्यूटोरियल — अंतर्निहित Operaमरोड़ |
👉 Less7 पर | हाइव फ़ंक्शन — अंतर्निहित और उपयोगकर्ता परिभाषित फ़ंक्शन |
👉 Less8 पर | हाइव ईटीएल — JSON, XML, टेक्स्ट डेटा उदाहरण लोड करना |
हाइव का परिचय
हाइव, हडॉप मैप-रिड्यूस फ्रेमवर्क के शीर्ष पर निर्मित एक डेटा वेयरहाउसिंग समाधान के रूप में विकसित हुआ।
उद्योग में एकत्रित और विश्लेषित किए जा रहे डेटा सेटों का आकार व्यापारिक सूचना बढ़ रहा है और एक तरह से, यह पारंपरिक डेटा वेयरहाउसिंग समाधानों को अधिक महंगा बना रहा है। Hadoop MapReduce फ्रेमवर्क के साथ, विशाल आकार वाले डेटा सेट का विश्लेषण करने के लिए वैकल्पिक समाधान के रूप में उपयोग किया जा रहा है। हालाँकि, Hadoop विशाल डेटा सेट पर काम करने के लिए उपयोगी साबित हुआ है, लेकिन इसका MapReduce फ्रेमवर्क बहुत निम्न स्तर का है और इसके लिए प्रोग्रामर को कस्टम प्रोग्राम लिखने की आवश्यकता होती है, जिन्हें बनाए रखना और पुनः उपयोग करना कठिन होता है। हाइव प्रोग्रामर के बचाव के लिए यहाँ आता है।
हाइव इंजन इन क्वेरीज़ को Hadoop पर निष्पादित करने के लिए Map-Reduce जॉब्स में संकलित करता है। इसके अलावा, कस्टम Map-Reduce स्क्रिप्ट को भी क्वेरीज़ में प्लग किया जा सकता है। Hive टेबल में संग्रहीत डेटा पर काम करता है जिसमें आदिम डेटा प्रकार और संग्रह डेटा प्रकार जैसे कि सरणियाँ और मानचित्र शामिल होते हैं।
हाइव एक कमांड-लाइन शेल इंटरफ़ेस के साथ आता है जिसका उपयोग तालिकाएँ बनाने और क्वेरीज़ निष्पादित करने के लिए किया जा सकता है।
हाइव क्वेरी भाषा SQL के समान है जिसमें यह सबक्वेरी का समर्थन करती है। हाइव क्वेरी भाषा के साथ, हाइव टेबल में मैपरेड्यूस जॉइन लेना संभव है। इसमें सरल के लिए समर्थन है SQL जैसे फ़ंक्शन– CONCAT, SUBSTR, ROUND आदि, और एकत्रीकरण कार्य- SUM, COUNT, MAX आदि। यह GROUP BY और SORT BY क्लॉज़ का भी समर्थन करता है। हाइव क्वेरी भाषा में उपयोगकर्ता परिभाषित फ़ंक्शन लिखना भी संभव है।
हाइव क्या है?
अपाचे हाइव HDFS में संग्रहीत डेटा की क्वेरी और विश्लेषण के लिए एक डेटा वेयरहाउस फ्रेमवर्क है। इसे Hadoop के शीर्ष पर विकसित किया गया है। Hive Hadoop पर बड़े डेटा सेट का विश्लेषण करने के लिए एक ओपन-सोर्स सॉफ़्टवेयर है। यह क्वेरीज़ को व्यक्त करने के लिए HiveQL नामक SQL जैसी घोषणात्मक भाषा प्रदान करता है। Hive-QL का उपयोग करके, इससे जुड़े उपयोगकर्ता एसक्यूएल डेटा विश्लेषण बहुत आसानी से कर सकते हैं.
हाइव बनाम मैप रिड्यूस
इन दो विकल्पों में से किसी एक को चुनने से पहले हमें उनकी कुछ विशेषताओं पर गौर करना होगा।
हाइव और मैप रिड्यूस के बीच चयन करते समय निम्नलिखित कारकों को ध्यान में रखा जाता है;
- डेटा का प्रकार
- डेटा की मात्रा
- कोड की जटिलता
हाइव बनाम मैप रिड्यूस?
Feature | करंड | मानचित्र छोटा करना |
---|---|---|
भाषा | यह इंटरेक्शन और डेटा मॉडलिंग के लिए SQL जैसी क्वेरी भाषा का समर्थन करता है |
|
अमूर्तता का स्तर | एचडीएफएस के शीर्ष पर अमूर्तता का उच्चतर स्तर | अमूर्तता का निम्न स्तर |
कोड में दक्षता | मैप रिड्यूस की तुलना में तुलनात्मक रूप से कम | उच्च दक्षता प्रदान करता है |
कोड की सीमा | Less निष्पादन के लिए आवश्यक कोड की पंक्तियों की संख्या | कोड की अधिक संख्या में पंक्तियों को परिभाषित किया जाना है |
अपेक्षित विकास कार्य का प्रकार | Less विकास कार्य आवश्यक | अधिक विकास कार्य की आवश्यकता |
क्लिक करें अगला ट्यूटोरियल