पर्यवेक्षित बनाम अपर्यवेक्षित शिक्षण: उनके बीच अंतर

पर्यवेक्षित और अपर्यवेक्षित शिक्षा के बीच मुख्य अंतर

  • पर्यवेक्षित शिक्षण में, आप मशीन को डेटा का उपयोग करके प्रशिक्षित करते हैं जो अच्छी तरह से "लेबल" किया गया है।
  • अप्रशिक्षित शिक्षण एक मशीन लर्निंग तकनीक है, जिसमें आपको मॉडल का पर्यवेक्षण करने की आवश्यकता नहीं होती है।
  • पर्यवेक्षित शिक्षण आपको डेटा एकत्र करने या पिछले अनुभव से डेटा आउटपुट तैयार करने की अनुमति देता है।
  • अप्रशिक्षित मशीन लर्निंग आपको डेटा में सभी प्रकार के अज्ञात पैटर्न खोजने में मदद करती है।
  • प्रतिगमन और वर्गीकरण पर्यवेक्षित मशीन लर्निंग तकनीक के दो प्रकार हैं।
  • Clusterसीखना और संबद्धता, अपर्यवेक्षित सीखने के दो प्रकार हैं।
  • पर्यवेक्षित शिक्षण मॉडल में इनपुट और आउटपुट चर दिए जाएंगे जबकि अपर्यवेक्षित शिक्षण मॉडल में केवल इनपुट डेटा दिया जाएगा

पर्यवेक्षित मशीन लर्निंग क्या है?

पर्यवेक्षित शिक्षण में, आप मशीन को डेटा का उपयोग करके प्रशिक्षित करते हैं जो अच्छी तरह से समझा जाता है। “लेबलइसका मतलब है कि कुछ डेटा पहले से ही सही उत्तर के साथ टैग किया गया है। इसकी तुलना पर्यवेक्षक या शिक्षक की मौजूदगी में होने वाली शिक्षा से की जा सकती है।

एक पर्यवेक्षित शिक्षण एल्गोरिथ्म लेबल किए गए प्रशिक्षण डेटा से सीखता है, आपको अप्रत्याशित डेटा के लिए परिणामों की भविष्यवाणी करने में मदद करता है। सटीक पर्यवेक्षित मशीन लर्निंग डेटा विज्ञान मॉडल का सफलतापूर्वक निर्माण, स्केलिंग और तैनाती करने के लिए अत्यधिक कुशल डेटा वैज्ञानिकों की एक टीम से समय और तकनीकी विशेषज्ञता की आवश्यकता होती है। इसके अलावा, डेटा वैज्ञानिक को यह सुनिश्चित करने के लिए मॉडल का पुनर्निर्माण करना चाहिए कि दी गई अंतर्दृष्टि तब तक सत्य बनी रहे जब तक कि उसका डेटा बदल न जाए।

अनसुपरवाइज्ड लर्निंग क्या है?

अनसुपरवाइज्ड लर्निंग एक मशीन लर्निंग तकनीक है, जिसमें आपको मॉडल की निगरानी करने की ज़रूरत नहीं होती। इसके बजाय, आपको जानकारी खोजने के लिए मॉडल को अपने आप काम करने देना होता है। यह मुख्य रूप से बिना लेबल वाले डेटा से संबंधित है।

अनसुपरवाइज्ड लर्निंग एल्गोरिदम आपको सुपरवाइज्ड लर्निंग की तुलना में अधिक जटिल प्रोसेसिंग कार्य करने की अनुमति देते हैं। हालाँकि, अनसुपरवाइज्ड लर्निंग अन्य प्राकृतिक लर्निंग डीप लर्निंग और रीइन्फोर्समेंट लर्निंग विधियों की तुलना में अधिक अप्रत्याशित हो सकती है।

पर्यवेक्षित शिक्षण क्यों?

  • पर्यवेक्षित शिक्षण आपको डेटा एकत्र करने या पिछले अनुभव से डेटा आउटपुट तैयार करने की अनुमति देता है।
  • अनुभव का उपयोग करके प्रदर्शन मानदंड को अनुकूलित करने में आपकी सहायता करता है
  • पर्यवेक्षित मशीन लर्निंग आपको विभिन्न प्रकार की वास्तविक दुनिया की संगणना समस्याओं को हल करने में मदद करती है।

अप्रशिक्षित शिक्षण क्यों?

यहां, अप्रशिक्षित शिक्षण का उपयोग करने के प्रमुख कारण दिए गए हैं:

  • अपर्यवेक्षित मशीन लर्निंग डेटा में सभी प्रकार के अज्ञात पैटर्न का पता लगाती है।
  • अपर्यवेक्षित विधियां आपको ऐसी विशेषताएं ढूंढने में मदद करती हैं जो वर्गीकरण के लिए उपयोगी हो सकती हैं।
  • यह वास्तविक समय में किया जाता है, इसलिए सभी इनपुट डेटा का विश्लेषण और लेबलिंग शिक्षार्थियों की उपस्थिति में किया जाता है।
  • लेबलयुक्त डेटा की तुलना में कंप्यूटर से लेबल रहित डेटा प्राप्त करना अधिक आसान है, क्योंकि इसके लिए मैन्युअल हस्तक्षेप की आवश्यकता होती है।

पर्यवेक्षित शिक्षण कैसे काम करता है?

उदाहरण के लिए, आप एक मशीन को प्रशिक्षित करना चाहते हैं जो आपको यह अनुमान लगाने में मदद करे कि आपको अपने कार्यस्थल से घर तक ड्राइव करने में कितना समय लगेगा। यहाँ, आप लेबल किए गए डेटा का एक सेट बनाकर शुरू करते हैं। इस डेटा में शामिल है

  • मौसम की स्थिति
  • दिन के समय
  • छुट्टियां

ये सभी विवरण आपके इनपुट हैं। आउटपुट वह समय है जो उस दिन घर वापस आने में लगा।

पर्यवेक्षित शिक्षण कैसे काम करता है
पर्यवेक्षित शिक्षण कैसे काम करता है

आप सहज रूप से जानते हैं कि अगर बाहर बारिश हो रही है, तो आपको घर पहुंचने में ज़्यादा समय लगेगा। लेकिन मशीन को डेटा और सांख्यिकी की ज़रूरत होती है।

आइए अब देखें कि आप इस उदाहरण का एक पर्यवेक्षित शिक्षण मॉडल कैसे विकसित कर सकते हैं जो उपयोगकर्ता को यात्रा का समय निर्धारित करने में मदद करता है। पहली चीज़ जो आपको बनाने की आवश्यकता है वह है एक प्रशिक्षण डेटा सेट। इस प्रशिक्षण सेट में कुल यात्रा समय और मौसम, समय आदि जैसे संबंधित कारक शामिल होंगे। इस प्रशिक्षण सेट के आधार पर, आपकी मशीन देख सकती है कि बारिश की मात्रा और घर पहुंचने में लगने वाले समय के बीच सीधा संबंध है।

इसलिए, यह पता लगाता है कि जितनी ज़्यादा बारिश होगी, आपको अपने घर वापस जाने के लिए उतना ही ज़्यादा समय गाड़ी चलानी होगी। यह आपके काम से निकलने के समय और सड़क पर रहने के समय के बीच संबंध भी देख सकता है।

शाम के 6 बजे के जितना करीब आप होंगे, आपको घर पहुंचने में उतना ही अधिक समय लगेगा। आपकी मशीन आपके लेबल किए गए डेटा के साथ कुछ संबंध पा सकती है।

सीखने का चरण
सीखने का चरण

यह आपके डेटा मॉडल की शुरुआत है। यह इस बात पर असर डालना शुरू करता है कि बारिश लोगों के गाड़ी चलाने के तरीके को कैसे प्रभावित करती है। यह यह भी देखना शुरू करता है कि दिन के किसी खास समय में ज़्यादा लोग यात्रा करते हैं।

अप्रशिक्षित शिक्षण कैसे काम करता है?

आइये, एक बच्चे और उसके परिवार के कुत्ते का मामला लें।

अप्रशिक्षित शिक्षण कैसे काम करता है
अप्रशिक्षित शिक्षण कैसे काम करता है

वह इस कुत्ते को जानती है और पहचानती है। कुछ सप्ताह बाद एक पारिवारिक मित्र एक कुत्ते को साथ लेकर आता है और बच्चे के साथ खेलने की कोशिश करता है।

अप्रशिक्षित शिक्षण कैसे काम करता है

बेबी ने इस कुत्ते को पहले कभी नहीं देखा है। लेकिन वह कई विशेषताओं (2 कान, आंखें, 4 पैरों पर चलना) को पहचानती है जो उसके पालतू कुत्ते की तरह हैं। वह एक नए जानवर को कुत्ते की तरह पहचानती है। यह अप्रशिक्षित सीखना है, जहाँ आपको सिखाया नहीं जाता है लेकिन आप डेटा से सीखते हैं (इस मामले में कुत्ते के बारे में डेटा।) अगर यह पर्यवेक्षित सीखना होता, तो परिवार के दोस्त ने बच्चे को बताया होता कि यह एक कुत्ता है।

पर्यवेक्षित मशीन लर्निंग तकनीकों के प्रकार

पर्यवेक्षित मशीन लर्निंग तकनीकों के प्रकार
पर्यवेक्षित मशीन लर्निंग तकनीकों के प्रकार

प्रतीपगमन

रिग्रेशन तकनीक प्रशिक्षण डेटा का उपयोग करके एकल आउटपुट मान की भविष्यवाणी करती है।

उदाहरण: आप प्रशिक्षण डेटा से घर की कीमत का अनुमान लगाने के लिए प्रतिगमन का उपयोग कर सकते हैं। इनपुट चर स्थानीयता, घर का आकार आदि होंगे।

वर्गीकरण

वर्गीकरण का अर्थ है आउटपुट को एक वर्ग के अंदर समूहीकृत करना। यदि एल्गोरिथ्म इनपुट को दो अलग-अलग वर्गों में लेबल करने का प्रयास करता है, तो इसे बाइनरी वर्गीकरण कहा जाता है। दो से अधिक वर्गों के बीच चयन करना मल्टीक्लास वर्गीकरण कहलाता है।

उदाहरणयह निर्धारित करना कि कोई व्यक्ति ऋण का चूककर्ता होगा या नहीं।

ताकतआउटपुट की हमेशा एक संभाव्य व्याख्या होती है, और ओवरफिटिंग से बचने के लिए एल्गोरिथ्म को नियमित किया जा सकता है।

कमजोरियों: लॉजिस्टिक रिग्रेशन तब कमज़ोर हो सकता है जब कई या गैर-रैखिक निर्णय सीमाएँ हों। यह विधि लचीली नहीं है, इसलिए यह अधिक जटिल संबंधों को नहीं पकड़ पाती है।

अनसुपरवाइज्ड मशीन लर्निंग तकनीकों के प्रकार

अपर्यवेक्षित शिक्षण समस्याओं को आगे क्लस्टरिंग और एसोसिएशन समस्याओं में वर्गीकृत किया गया।

Clusterआईएनजी

Clusterआईएनजी

Clusterजब बात अनसुपरवाइज्ड लर्निंग की आती है तो ing एक महत्वपूर्ण अवधारणा है। यह मुख्य रूप से अवर्गीकृत डेटा के संग्रह में एक संरचना या पैटर्न खोजने से संबंधित है। Clusterएल्गोरिदम आपके डेटा को प्रोसेस करेंगे और अगर डेटा में प्राकृतिक क्लस्टर (समूह) मौजूद हैं, तो उन्हें खोज लेंगे। आप यह भी संशोधित कर सकते हैं कि आपके एल्गोरिदम को कितने क्लस्टर की पहचान करनी चाहिए। यह आपको इन समूहों की ग्रैन्युलैरिटी को समायोजित करने की अनुमति देता है।

संघ

एसोसिएशन नियम आपको बड़े डेटाबेस के अंदर डेटा ऑब्जेक्ट्स के बीच एसोसिएशन स्थापित करने की अनुमति देते हैं। यह अप्रशिक्षित तकनीक बड़े डेटाबेस में चर के बीच रोमांचक संबंधों की खोज करने के बारे में है। उदाहरण के लिए, जो लोग नया घर खरीदते हैं, वे नए फर्नीचर खरीदने की सबसे अधिक संभावना रखते हैं।

अन्य उदाहरण:

  • कैंसर रोगियों का एक उपसमूह, उनके जीन अभिव्यक्ति माप के आधार पर वर्गीकृत किया गया
  • ब्राउज़िंग और खरीदारी इतिहास के आधार पर खरीदारों के समूह
  • फिल्म दर्शकों द्वारा दी गई रेटिंग के आधार पर फिल्म समूह

पर्यवेक्षित और अपर्यवेक्षित शिक्षा के बीच अंतर

पर्यवेक्षित बनाम अपर्यवेक्षित शिक्षण
पर्यवेक्षित बनाम अपर्यवेक्षित शिक्षण
पैरामीटर्स पर्यवेक्षित मशीन लर्निंग तकनीक अप्रशिक्षित मशीन लर्निंग तकनीक
प्रक्रिया पर्यवेक्षित शिक्षण मॉडल में इनपुट और आउटपुट चर दिए जाएंगे। अप्रशिक्षित शिक्षण मॉडल में केवल इनपुट डेटा दिया जाएगा
इनपुट डेटा Algorithms लेबल किए गए डेटा का उपयोग करके प्रशिक्षित किया जाता है। Algorithms उन डेटा के विरुद्ध उपयोग किया जाता है जिन्हें लेबल नहीं किया गया है
Algorithms प्रयुक्त सपोर्ट वेक्टर मशीन, न्यूरल नेटवर्क, रैखिक और लॉजिस्टिक्स प्रतिगमन, यादृच्छिक वन और वर्गीकरण वृक्ष। अपर्यवेक्षित एल्गोरिदम को विभिन्न श्रेणियों में विभाजित किया जा सकता है: जैसे Cluster एल्गोरिदम, के-मीन्स, पदानुक्रमित क्लस्टरिंग, आदि।
अभिकलनात्मक जटिलता पर्यवेक्षित शिक्षण एक सरल विधि है। अपर्यवेक्षित शिक्षण कम्प्यूटेशनल रूप से जटिल है
डेटा का उपयोग पर्यवेक्षित शिक्षण मॉडल इनपुट और आउटपुट के बीच संबंध जानने के लिए प्रशिक्षण डेटा का उपयोग करता है। अपर्यवेक्षित शिक्षण में आउटपुट डेटा का उपयोग नहीं किया जाता है।
परिणामों की सटीकता अत्यंत सटीक एवं विश्वसनीय विधि. Less सटीक और विश्वसनीय विधि.
वास्तविक समय सीखना सीखने की विधि ऑफलाइन होती है। सीखने की विधि वास्तविक समय में होती है।
वर्गों की संख्या कक्षाओं की संख्या ज्ञात है. कक्षाओं की संख्या ज्ञात नहीं है।
मुख्य कमी पर्यवेक्षित शिक्षण में बड़े डेटा को वर्गीकृत करना एक वास्तविक चुनौती हो सकती है। आप डेटा सॉर्टिंग के संबंध में सटीक जानकारी प्राप्त नहीं कर सकते हैं, तथा अपर्यवेक्षित शिक्षण में प्रयुक्त डेटा के रूप में आउटपुट लेबल किया जाता है तथा वह ज्ञात नहीं होता है।