बिग डेटा क्या है? परिचय, प्रकार, विशेषताएँ, उदाहरण
डेटा क्या है?
वे मात्राएँ, वर्ण या प्रतीक जिन पर कंप्यूटर द्वारा कार्य किया जाता है, जिन्हें विद्युत संकेतों के रूप में संग्रहीत और प्रेषित किया जा सकता है तथा चुंबकीय, ऑप्टिकल या यांत्रिक रिकॉर्डिंग मीडिया पर रिकॉर्ड किया जा सकता है।
अब, आइए बिग डेटा की परिभाषा जानें
बिग डेटा क्या है?
बड़ा डेटा डेटा का एक संग्रह है जो मात्रा में बहुत बड़ा है, फिर भी समय के साथ तेजी से बढ़ रहा है। यह इतना बड़ा आकार और जटिलता वाला डेटा है कि कोई भी पारंपरिक डेटा प्रबंधन उपकरण इसे संग्रहीत या कुशलतापूर्वक संसाधित नहीं कर सकता है। बड़ा डेटा भी एक डेटा है लेकिन बहुत बड़ा आकार है।

बिग डेटा का उदाहरण क्या है?
बिग डेटा के कुछ उदाहरण निम्नलिखित हैं-
RSI न्यूयॉर्क स्टॉक एक्सचेंज बिग डेटा का एक उदाहरण है जो लगभग उत्पन्न करता है एक टेराबाइट प्रतिदिन नये व्यापार डेटा की मात्रा।
सोशल मीडिया
आंकड़े बताते हैं कि 500+टेराबाइट्स सोशल मीडिया साइट के डेटाबेस में नए डेटा का समावेश हो जाता है फेसबुक, हर दिन। यह डेटा मुख्य रूप से फोटो और वीडियो अपलोड, संदेश आदान-प्रदान, टिप्पणी डालने आदि के संदर्भ में उत्पन्न होता है।
एक एकल जेट इंजिन उत्पन्न कर सकते हैं 10+टेराबाइट्स में डेटा का 30 मिनट उड़ान समय का। प्रतिदिन कई हज़ार उड़ानों के साथ, डेटा का उत्पादन कई तक पहुँच जाता है पेटाबाइट्स।
बिग डेटा के प्रकार
बिग डेटा के प्रकार निम्नलिखित हैं:
- संरचित
- असंरचित
- अर्द्ध संरचित
संरचित
कोई भी डेटा जिसे निश्चित प्रारूप के रूप में संग्रहीत, एक्सेस और संसाधित किया जा सकता है, उसे 'संरचित' डेटा कहा जाता है। समय के साथ, कंप्यूटर विज्ञान में प्रतिभा ने इस तरह के डेटा (जहां प्रारूप पहले से ही अच्छी तरह से जाना जाता है) के साथ काम करने के लिए तकनीकों को विकसित करने और इससे मूल्य प्राप्त करने में अधिक सफलता हासिल की है। हालाँकि, आजकल, हम समस्याओं का अनुमान लगा रहे हैं जब इस तरह के डेटा का आकार बहुत अधिक बढ़ जाता है, सामान्य आकार कई ज़ेटाबाइट्स के दायरे में होते हैं।
जानती हो? 1021 बाइट्स के बराबर 1 ज़ेटाबाइट्स or एक अरब टेराबाइट्स रूपों एक ज़ेटाबाइट.
इन आंकड़ों को देखकर कोई भी आसानी से समझ सकता है कि बिग डेटा नाम क्यों दिया गया है और इसके भंडारण और प्रसंस्करण में शामिल चुनौतियों की कल्पना कर सकता है।
जानती हो? रिलेशनल डेटाबेस प्रबंधन प्रणाली में संग्रहीत डेटा इसका एक उदाहरण है 'संरचित' डेटा.
संरचित डेटा के उदाहरण
डेटाबेस में 'कर्मचारी' तालिका संरचित डेटा का एक उदाहरण है
| कर्मचारी आयडी | कर्मचारी_नाम | लिंग | विभाग | वेतन_लाखों_में |
|---|---|---|---|---|
| 2365 | राजेश कुलकर्णी | नर | वित्त (फाइनेंस) | 650000 |
| 3398 | प्रतिभा जोशी | महिला | व्यवस्थापक | 650000 |
| 7465 | सुशील रॉय | नर | व्यवस्थापक | 500000 |
| 7500 | शुभोजित दास | नर | वित्त (फाइनेंस) | 500000 |
| 7699 | प्रिया साने | महिला | वित्त (फाइनेंस) | 550000 |
असंरचित
किसी भी अज्ञात रूप या संरचना वाले डेटा को असंरचित डेटा के रूप में वर्गीकृत किया जाता है। आकार में विशाल होने के अलावा, असंरचित डेटा से मूल्य प्राप्त करने के लिए इसके प्रसंस्करण के संदर्भ में कई चुनौतियाँ होती हैं। असंरचित डेटा का एक विशिष्ट उदाहरण एक विषम डेटा स्रोत है जिसमें सरल टेक्स्ट फ़ाइलें, चित्र, वीडियो आदि का संयोजन होता है। आजकल संगठनों के पास डेटा का खजाना उपलब्ध है, लेकिन दुर्भाग्य से, वे नहीं जानते कि इससे मूल्य कैसे प्राप्त किया जाए क्योंकि यह डेटा अपने कच्चे रूप या असंरचित प्रारूप में है।
असंरचित डेटा के उदाहरण
'Google सर्च' द्वारा लौटाया गया आउटपुट

अर्द्ध संरचित
अर्ध-संरचित डेटा में डेटा के दोनों रूप हो सकते हैं। हम अर्ध-संरचित डेटा को संरचित रूप में देख सकते हैं लेकिन वास्तव में इसे रिलेशनल में टेबल परिभाषा के साथ परिभाषित नहीं किया गया है। डीबीएमएसअर्ध-संरचित डेटा का उदाहरण XML फ़ाइल में दर्शाया गया डेटा है।
अर्ध-संरचित डेटा के उदाहरण
XML फ़ाइल में संग्रहीत व्यक्तिगत डेटा-
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
पिछले कुछ वर्षों में डेटा वृद्धि

कृपया ध्यान दें कि वेब आवेदन डेटा, जो असंरचित होता है, में लॉग फ़ाइलें, लेनदेन इतिहास फ़ाइलें आदि शामिल होती हैं। OLTP सिस्टम संरचित डेटा के साथ काम करने के लिए बनाए गए हैं जिसमें डेटा संबंधों (तालिकाओं) में संग्रहीत किया जाता है।
बिग डेटा की विशेषताएँ
बिग डेटा को निम्नलिखित विशेषताओं द्वारा वर्णित किया जा सकता है:
- खंड
- विविधता
- वेग
- परिवर्तनशीलता
(i) आयतन – बिग डेटा नाम अपने आप में एक विशाल आकार से जुड़ा है। डेटा का आकार डेटा से मूल्य निर्धारित करने में बहुत महत्वपूर्ण भूमिका निभाता है। साथ ही, किसी विशेष डेटा को वास्तव में बिग डेटा माना जा सकता है या नहीं, यह डेटा की मात्रा पर निर्भर करता है। इसलिए, 'वॉल्यूम' यह एक विशेषता है जिस पर बिग डेटा समाधानों से निपटते समय विचार किया जाना चाहिए।
(ii) विविधता – बिग डेटा का अगला पहलू है विविधता.
विविधता का तात्पर्य विषम स्रोतों और डेटा की प्रकृति से है, जो संरचित और असंरचित दोनों हैं। पहले के दिनों में, स्प्रेडशीट और डेटाबेस ही अधिकांश अनुप्रयोगों द्वारा विचार किए जाने वाले डेटा के एकमात्र स्रोत थे। आजकल, विश्लेषण अनुप्रयोगों में ईमेल, फोटो, वीडियो, मॉनिटरिंग डिवाइस, पीडीएफ, ऑडियो आदि के रूप में डेटा पर भी विचार किया जा रहा है। असंरचित डेटा की यह विविधता भंडारण, खनन और डेटा के विश्लेषण के लिए कुछ मुद्दे पैदा करती है।
(iii) वेग – अवधि 'वेग' डेटा के उत्पादन की गति को संदर्भित करता है। मांग को पूरा करने के लिए डेटा कितनी तेजी से उत्पन्न और संसाधित किया जाता है, यह डेटा में वास्तविक क्षमता निर्धारित करता है।
बिग डेटा वेलोसिटी उस गति से संबंधित है जिस पर डेटा व्यावसायिक प्रक्रियाओं, एप्लिकेशन लॉग, नेटवर्क और सोशल मीडिया साइटों, सेंसर जैसे स्रोतों से प्रवाहित होता है। मोबाइल डेटा का प्रवाह विशाल और निरंतर है।
(iv) परिवर्तनशीलता – यह उस असंगति को संदर्भित करता है जो कभी-कभी डेटा द्वारा प्रदर्शित की जा सकती है, जिससे डेटा को प्रभावी ढंग से संभालने और प्रबंधित करने की प्रक्रिया में बाधा उत्पन्न हो सकती है।
बिग डेटा प्रोसेसिंग के लाभ
डीबीएमएस में बड़े डेटा को संसाधित करने की क्षमता कई लाभ लाती है, जैसे-
- व्यवसाय निर्णय लेते समय बाहरी खुफिया जानकारी का उपयोग कर सकते हैं
सामाजिक डेटा तक पहुंच खोज इंजन और फेसबुक, ट्विटर जैसी साइटें संगठनों को अपनी व्यावसायिक रणनीतियों को बेहतर बनाने में सक्षम बना रही हैं।
- बेहतर ग्राहक सेवा
पारंपरिक ग्राहक प्रतिक्रिया प्रणालियों को बिग डेटा प्रौद्योगिकियों के साथ डिज़ाइन की गई नई प्रणालियों द्वारा प्रतिस्थापित किया जा रहा है। इन नई प्रणालियों में, उपभोक्ता प्रतिक्रियाओं को पढ़ने और उनका मूल्यांकन करने के लिए बिग डेटा और प्राकृतिक भाषा प्रसंस्करण प्रौद्योगिकियों का उपयोग किया जा रहा है।
- उत्पाद/सेवाओं के लिए जोखिम की शीघ्र पहचान, यदि कोई हो
- बेहतर परिचालन दक्षता
बिग डेटा प्रौद्योगिकियों का उपयोग नए डेटा के लिए स्टेजिंग क्षेत्र या लैंडिंग ज़ोन बनाने के लिए किया जा सकता है, इससे पहले कि यह निर्धारित किया जाए कि कौन सा डेटा स्थानांतरित किया जाना चाहिए। डाटा गोदामइसके अलावा, बिग डेटा प्रौद्योगिकियों और डेटा वेयरहाउस का ऐसा एकीकरण किसी संगठन को कम बार एक्सेस किए जाने वाले डेटा को ऑफलोड करने में मदद करता है।
सारांश
- बिग डेटा की परिभाषा: बिग डेटा का अर्थ है ऐसा डेटा जो आकार में बहुत बड़ा हो। बिगडेटा एक ऐसा शब्द है जिसका उपयोग डेटा के ऐसे संग्रह का वर्णन करने के लिए किया जाता है जो आकार में बहुत बड़ा है और फिर भी समय के साथ तेजी से बढ़ रहा है।
- बिग डेटा एनालिटिक्स के उदाहरणों में स्टॉक एक्सचेंज, सोशल मीडिया साइट्स, जेट इंजन आदि शामिल हैं।
- बिग डेटा हो सकता है 1) संरचित, 2) असंरचित, 3) अर्ध-संरचित
- वॉल्यूम, विविधता, वेग और परिवर्तनशीलता बिग डेटा की कुछ विशेषताएं हैं
- बेहतर ग्राहक सेवा, बेहतर परिचालन दक्षता, बेहतर निर्णय लेना बिगडेटा के कुछ लाभ हैं



