बिग डेटा क्या है? परिचय, प्रकार, विशेषताएँ, उदाहरण

इससे पहले कि हम बिग डेटा का परिचय दें, आपको पहले यह जानना होगा

डेटा क्या है?

वे मात्राएँ, वर्ण या प्रतीक जिन पर कंप्यूटर द्वारा कार्य किया जाता है, जिन्हें विद्युत संकेतों के रूप में संग्रहीत और प्रेषित किया जा सकता है तथा चुंबकीय, ऑप्टिकल या यांत्रिक रिकॉर्डिंग मीडिया पर रिकॉर्ड किया जा सकता है।

अब, आइए बिग डेटा की परिभाषा जानें

बिग डेटा क्या है?

बड़ा डेटा डेटा का एक संग्रह है जो मात्रा में बहुत बड़ा है, फिर भी समय के साथ तेजी से बढ़ रहा है। यह इतना बड़ा आकार और जटिलता वाला डेटा है कि कोई भी पारंपरिक डेटा प्रबंधन उपकरण इसे संग्रहीत या कुशलतापूर्वक संसाधित नहीं कर सकता है। बड़ा डेटा भी एक डेटा है लेकिन बहुत बड़ा आकार है।

बड़ा डेटा
बिग डेटा क्या है?

बिग डेटा का उदाहरण क्या है?

बिग डेटा के कुछ उदाहरण निम्नलिखित हैं-

RSI न्यूयॉर्क स्टॉक एक्सचेंज बिग डेटा का एक उदाहरण है जो लगभग उत्पन्न करता है एक टेराबाइट प्रतिदिन नये व्यापार डेटा की मात्रा।

बिग डेटा का उदाहरण

सोशल मीडिया

आंकड़े बताते हैं कि 500+टेराबाइट्स सोशल मीडिया साइट के डेटाबेस में नए डेटा का समावेश हो जाता है फेसबुक, हर दिन। यह डेटा मुख्य रूप से फोटो और वीडियो अपलोड, संदेश आदान-प्रदान, टिप्पणी डालने आदि के संदर्भ में उत्पन्न होता है।

बिग डेटा का उदाहरण

एक एकल जेट इंजिन उत्पन्न कर सकते हैं 10+टेराबाइट्स में डेटा का 30 मिनट उड़ान समय का। प्रतिदिन कई हज़ार उड़ानों के साथ, डेटा का उत्पादन कई तक पहुँच जाता है पेटाबाइट्स।

बिग डेटा का उदाहरण

बिग डेटा के प्रकार

बिग डेटा के प्रकार निम्नलिखित हैं:

  1. संरचित
  2. असंरचित
  3. अर्द्ध संरचित

संरचित

कोई भी डेटा जिसे निश्चित प्रारूप के रूप में संग्रहीत, एक्सेस और संसाधित किया जा सकता है, उसे 'संरचित' डेटा कहा जाता है। समय के साथ, कंप्यूटर विज्ञान में प्रतिभा ने इस तरह के डेटा (जहां प्रारूप पहले से ही अच्छी तरह से जाना जाता है) के साथ काम करने के लिए तकनीकों को विकसित करने और इससे मूल्य प्राप्त करने में अधिक सफलता हासिल की है। हालाँकि, आजकल, हम समस्याओं का अनुमान लगा रहे हैं जब इस तरह के डेटा का आकार बहुत अधिक बढ़ जाता है, सामान्य आकार कई ज़ेटाबाइट्स के दायरे में होते हैं।

जानती हो? 1021 बाइट्स के बराबर 1 ज़ेटाबाइट्स or एक अरब टेराबाइट्स रूपों एक ज़ेटाबाइट.

इन आंकड़ों को देखकर कोई भी आसानी से समझ सकता है कि बिग डेटा नाम क्यों दिया गया है और इसके भंडारण और प्रसंस्करण में शामिल चुनौतियों की कल्पना कर सकता है।

जानती हो? रिलेशनल डेटाबेस प्रबंधन प्रणाली में संग्रहीत डेटा इसका एक उदाहरण है 'संरचित' डेटा.

संरचित डेटा के उदाहरण

डेटाबेस में 'कर्मचारी' तालिका संरचित डेटा का एक उदाहरण है

कर्मचारी आयडी कर्मचारी_नाम लिंग विभाग वेतन_लाखों_में
2365 राजेश कुलकर्णी नर वित्त (फाइनेंस) 650000
3398 प्रतिभा जोशी महिला व्यवस्थापक 650000
7465 सुशील रॉय नर व्यवस्थापक 500000
7500 शुभोजित दास नर वित्त (फाइनेंस) 500000
7699 प्रिया साने महिला वित्त (फाइनेंस) 550000

असंरचित

किसी भी अज्ञात रूप या संरचना वाले डेटा को असंरचित डेटा के रूप में वर्गीकृत किया जाता है। आकार में विशाल होने के अलावा, असंरचित डेटा से मूल्य प्राप्त करने के लिए इसके प्रसंस्करण के संदर्भ में कई चुनौतियाँ होती हैं। असंरचित डेटा का एक विशिष्ट उदाहरण एक विषम डेटा स्रोत है जिसमें सरल टेक्स्ट फ़ाइलें, चित्र, वीडियो आदि का संयोजन होता है। आजकल संगठनों के पास डेटा का खजाना उपलब्ध है, लेकिन दुर्भाग्य से, वे नहीं जानते कि इससे मूल्य कैसे प्राप्त किया जाए क्योंकि यह डेटा अपने कच्चे रूप या असंरचित प्रारूप में है।

असंरचित डेटा के उदाहरण

'Google सर्च' द्वारा लौटाया गया आउटपुट

असंरचित डेटा का उदाहरण
असंरचित डेटा का उदाहरण

अर्द्ध संरचित

अर्ध-संरचित डेटा में डेटा के दोनों रूप हो सकते हैं। हम अर्ध-संरचित डेटा को संरचित रूप में देख सकते हैं लेकिन वास्तव में इसे रिलेशनल में टेबल परिभाषा के साथ परिभाषित नहीं किया गया है। डीबीएमएसअर्ध-संरचित डेटा का उदाहरण XML फ़ाइल में दर्शाया गया डेटा है।

अर्ध-संरचित डेटा के उदाहरण

XML फ़ाइल में संग्रहीत व्यक्तिगत डेटा-

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

पिछले कुछ वर्षों में डेटा वृद्धि

पिछले कुछ वर्षों में डेटा वृद्धि
पिछले कुछ वर्षों में डेटा वृद्धि

कृपया ध्यान दें कि वेब आवेदन डेटा, जो असंरचित होता है, में लॉग फ़ाइलें, लेनदेन इतिहास फ़ाइलें आदि शामिल होती हैं। OLTP सिस्टम संरचित डेटा के साथ काम करने के लिए बनाए गए हैं जिसमें डेटा संबंधों (तालिकाओं) में संग्रहीत किया जाता है।

बिग डेटा की विशेषताएँ

बिग डेटा को निम्नलिखित विशेषताओं द्वारा वर्णित किया जा सकता है:

  • खंड
  • विविधता
  • वेग
  • परिवर्तनशीलता

(i) आयतन – बिग डेटा नाम अपने आप में एक विशाल आकार से जुड़ा है। डेटा का आकार डेटा से मूल्य निर्धारित करने में बहुत महत्वपूर्ण भूमिका निभाता है। साथ ही, किसी विशेष डेटा को वास्तव में बिग डेटा माना जा सकता है या नहीं, यह डेटा की मात्रा पर निर्भर करता है। इसलिए, 'वॉल्यूम' यह एक विशेषता है जिस पर बिग डेटा समाधानों से निपटते समय विचार किया जाना चाहिए।

(ii) विविधता – बिग डेटा का अगला पहलू है विविधता.

विविधता का तात्पर्य विषम स्रोतों और डेटा की प्रकृति से है, जो संरचित और असंरचित दोनों हैं। पहले के दिनों में, स्प्रेडशीट और डेटाबेस ही अधिकांश अनुप्रयोगों द्वारा विचार किए जाने वाले डेटा के एकमात्र स्रोत थे। आजकल, विश्लेषण अनुप्रयोगों में ईमेल, फोटो, वीडियो, मॉनिटरिंग डिवाइस, पीडीएफ, ऑडियो आदि के रूप में डेटा पर भी विचार किया जा रहा है। असंरचित डेटा की यह विविधता भंडारण, खनन और डेटा के विश्लेषण के लिए कुछ मुद्दे पैदा करती है।

(iii) वेग – अवधि 'वेग' डेटा के उत्पादन की गति को संदर्भित करता है। मांग को पूरा करने के लिए डेटा कितनी तेजी से उत्पन्न और संसाधित किया जाता है, यह डेटा में वास्तविक क्षमता निर्धारित करता है।

बिग डेटा वेलोसिटी उस गति से संबंधित है जिस पर डेटा व्यावसायिक प्रक्रियाओं, एप्लिकेशन लॉग, नेटवर्क और सोशल मीडिया साइटों, सेंसर जैसे स्रोतों से प्रवाहित होता है। मोबाइल डेटा का प्रवाह विशाल और निरंतर है।

(iv) परिवर्तनशीलता – यह उस असंगति को संदर्भित करता है जो कभी-कभी डेटा द्वारा प्रदर्शित की जा सकती है, जिससे डेटा को प्रभावी ढंग से संभालने और प्रबंधित करने की प्रक्रिया में बाधा उत्पन्न हो सकती है।

बिग डेटा प्रोसेसिंग के लाभ

डीबीएमएस में बड़े डेटा को संसाधित करने की क्षमता कई लाभ लाती है, जैसे-

  • व्यवसाय निर्णय लेते समय बाहरी खुफिया जानकारी का उपयोग कर सकते हैं

सामाजिक डेटा तक पहुंच खोज इंजन और फेसबुक, ट्विटर जैसी साइटें संगठनों को अपनी व्यावसायिक रणनीतियों को बेहतर बनाने में सक्षम बना रही हैं।

  • बेहतर ग्राहक सेवा

पारंपरिक ग्राहक प्रतिक्रिया प्रणालियों को बिग डेटा प्रौद्योगिकियों के साथ डिज़ाइन की गई नई प्रणालियों द्वारा प्रतिस्थापित किया जा रहा है। इन नई प्रणालियों में, उपभोक्ता प्रतिक्रियाओं को पढ़ने और उनका मूल्यांकन करने के लिए बिग डेटा और प्राकृतिक भाषा प्रसंस्करण प्रौद्योगिकियों का उपयोग किया जा रहा है।

  • उत्पाद/सेवाओं के लिए जोखिम की शीघ्र पहचान, यदि कोई हो
  • बेहतर परिचालन दक्षता

बिग डेटा प्रौद्योगिकियों का उपयोग नए डेटा के लिए स्टेजिंग क्षेत्र या लैंडिंग ज़ोन बनाने के लिए किया जा सकता है, इससे पहले कि यह निर्धारित किया जाए कि कौन सा डेटा स्थानांतरित किया जाना चाहिए। डाटा गोदामइसके अलावा, बिग डेटा प्रौद्योगिकियों और डेटा वेयरहाउस का ऐसा एकीकरण किसी संगठन को कम बार एक्सेस किए जाने वाले डेटा को ऑफलोड करने में मदद करता है।

सारांश

  • बिग डेटा की परिभाषा: बिग डेटा का अर्थ है ऐसा डेटा जो आकार में बहुत बड़ा हो। बिगडेटा एक ऐसा शब्द है जिसका उपयोग डेटा के ऐसे संग्रह का वर्णन करने के लिए किया जाता है जो आकार में बहुत बड़ा है और फिर भी समय के साथ तेजी से बढ़ रहा है।
  • बिग डेटा एनालिटिक्स के उदाहरणों में स्टॉक एक्सचेंज, सोशल मीडिया साइट्स, जेट इंजन आदि शामिल हैं।
  • बिग डेटा हो सकता है 1) संरचित, 2) असंरचित, 3) अर्ध-संरचित
  • वॉल्यूम, विविधता, वेग और परिवर्तनशीलता बिग डेटा की कुछ विशेषताएं हैं
  • बेहतर ग्राहक सेवा, बेहतर परिचालन दक्षता, बेहतर निर्णय लेना बिगडेटा के कुछ लाभ हैं

इस पोस्ट को संक्षेप में इस प्रकार लिखें: