शुरुआती लोगों के लिए डीप लर्निंग ट्यूटोरियल: न्यूरल नेटवर्क की मूल बातें
डीप लर्निंग क्या है?
गहरी सीख एक कंप्यूटर सॉफ्टवेयर है जो मस्तिष्क में न्यूरॉन्स के नेटवर्क की नकल करता है। यह कृत्रिम तंत्रिका नेटवर्क पर आधारित मशीन लर्निंग का एक उपसमूह है जिसमें प्रतिनिधित्व सीखने की क्षमता है। इसे डीप लर्निंग कहा जाता है क्योंकि यह डीप न्यूरल नेटवर्क का उपयोग करता है। यह लर्निंग पर्यवेक्षित, अर्ध-पर्यवेक्षित या अप्रशिक्षित हो सकती है।
गहन शिक्षण एल्गोरिदम का निर्माण जुड़ी हुई परतों के साथ किया जाता है।
- पहली परत को इनपुट परत कहा जाता है
- अंतिम परत को आउटपुट परत कहा जाता है
- बीच की सभी परतों को छिपी हुई परतें कहा जाता है। गहरे शब्द का मतलब है कि नेटवर्क दो से ज़्यादा परतों में न्यूरॉन्स को जोड़ता है।
प्रत्येक छिपी परत न्यूरॉन्स से बनी होती है। न्यूरॉन्स एक दूसरे से जुड़े होते हैं। न्यूरॉन अपने ऊपर की परत से प्राप्त इनपुट सिग्नल को प्रोसेस करेगा और फिर प्रसारित करेगा। अगली परत में न्यूरॉन को दिए गए सिग्नल की ताकत वजन, पूर्वाग्रह और सक्रियण फ़ंक्शन पर निर्भर करती है।
नेटवर्क बड़ी मात्रा में इनपुट डेटा का उपभोग करता है और उन्हें कई परतों के माध्यम से संचालित करता है; नेटवर्क प्रत्येक परत पर डेटा की बढ़ती जटिल विशेषताओं को सीख सकता है।
गहन शिक्षण प्रक्रिया
डीप न्यूरल नेटवर्क ऑब्जेक्ट डिटेक्शन से लेकर स्पीच रिकग्निशन तक कई कार्यों में अत्याधुनिक सटीकता प्रदान करता है। वे प्रोग्रामर द्वारा स्पष्ट रूप से कोड किए गए पूर्वनिर्धारित ज्ञान के बिना, स्वचालित रूप से सीख सकते हैं।
गहन शिक्षण के विचार को समझने के लिए, एक परिवार की कल्पना करें, जिसमें एक शिशु और माता-पिता हों। बच्चा अपनी छोटी उंगली से वस्तुओं की ओर इशारा करता है और हमेशा 'बिल्ली' शब्द बोलता है। चूंकि उसके माता-पिता उसकी शिक्षा के बारे में चिंतित हैं, इसलिए वे उसे 'हां, वह बिल्ली है' या 'नहीं, वह बिल्ली नहीं है' कहते रहते हैं। शिशु वस्तुओं की ओर इशारा करना जारी रखता है, लेकिन 'बिल्लियों' के साथ अधिक सटीक हो जाता है। छोटा बच्चा, अंदर से, यह नहीं जानता कि वह क्यों कह सकता है कि यह बिल्ली है या नहीं। उसने अभी-अभी सीखा है कि पालतू जानवर को समग्र रूप से देखकर बिल्ली के साथ आने वाली जटिल विशेषताओं को कैसे क्रमबद्ध किया जाए और अपना मन बनाने से पहले पूंछ या नाक जैसे विवरणों पर ध्यान केंद्रित करना जारी रखें।
न्यूरल नेटवर्क बिल्कुल इसी तरह काम करता है। प्रत्येक परत ज्ञान के गहरे स्तर, यानी ज्ञान के पदानुक्रम का प्रतिनिधित्व करती है। चार परतों वाला न्यूरल नेटवर्क दो परतों वाले की तुलना में ज़्यादा जटिल विशेषताएँ सीखेगा।
सीखना दो चरणों में होता है:
पहला चरणपहले चरण में इनपुट का गैर-रेखीय रूपांतरण लागू करना और आउटपुट के रूप में एक सांख्यिकीय मॉडल बनाना शामिल है।
दूसरा चरणदूसरे चरण का उद्देश्य व्युत्पन्न नामक गणितीय विधि से मॉडल में सुधार करना है।
तंत्रिका नेटवर्क इन दो चरणों को सैकड़ों से हज़ारों बार दोहराता है जब तक कि यह सटीकता के एक सहनीय स्तर तक नहीं पहुँच जाता। इन दो चरणों के दोहराव को पुनरावृत्ति कहा जाता है।
डीप लर्निंग का उदाहरण देने के लिए, नीचे दिए गए मोशन पर नज़र डालें, मॉडल डांस करना सीखने की कोशिश कर रहा है। 10 मिनट की ट्रेनिंग के बाद, मॉडल को डांस करना नहीं आता और यह एक स्क्रिबल जैसा दिखता है।
48 घंटे की शिक्षा के बाद, कंप्यूटर नृत्य कला में निपुण हो जाता है।
तंत्रिका नेटवर्क का वर्गीकरण
उथला तंत्रिका नेटवर्कउथले तंत्रिका नेटवर्क में इनपुट और आउटपुट के बीच केवल एक छिपी हुई परत होती है।
गहरी तंत्रिका नेटवर्कडीप न्यूरल नेटवर्क में एक से ज़्यादा परतें होती हैं। उदाहरण के लिए, इमेज पहचान के लिए गूगल लेनेट मॉडल में 22 परतें होती हैं।
आजकल डीप लर्निंग का उपयोग कई तरीकों से किया जाता है जैसे चालक रहित कार, मोबाइल फोन, गूगल सर्च इंजन, धोखाधड़ी का पता लगाना, टीवी, इत्यादि।
डीप लर्निंग नेटवर्क के प्रकार
अब इस डीप न्यूरल नेटवर्क ट्यूटोरियल में, हम डीप लर्निंग नेटवर्क के प्रकारों के बारे में जानेंगे:
फ़ीड-फ़ॉरवर्ड तंत्रिका नेटवर्क
कृत्रिम तंत्रिका नेटवर्क का सबसे सरल प्रकार। इस प्रकार की वास्तुकला के साथ, सूचना केवल एक दिशा में, आगे की ओर प्रवाहित होती है। इसका मतलब है, सूचना का प्रवाह इनपुट परत से शुरू होता है, "छिपी हुई" परतों तक जाता है, और आउटपुट परत पर समाप्त होता है। नेटवर्क
इसमें कोई लूप नहीं है। सूचना आउटपुट लेयर पर रुक जाती है।
आवर्तक तंत्रिका नेटवर्क (RNN)
RNN एक बहु-स्तरित तंत्रिका नेटवर्क है जो संदर्भ नोड्स में जानकारी संग्रहीत कर सकता है, जिससे यह डेटा अनुक्रमों को सीख सकता है और एक संख्या या किसी अन्य अनुक्रम को आउटपुट कर सकता है। सरल शब्दों में, यह एक कृत्रिम तंत्रिका नेटवर्क है जिसके न्यूरॉन्स के बीच कनेक्शन में लूप शामिल हैं। RNN इनपुट के अनुक्रमों को संसाधित करने के लिए अच्छी तरह से अनुकूल हैं।
उदाहरण के लिए, यदि कार्य वाक्य में अगले शब्द की भविष्यवाणी करना है “क्या आप एक ………… चाहते हैं?”
- आरएनएन न्यूरॉन्स एक संकेत प्राप्त करेंगे जो वाक्य के आरंभ की ओर संकेत करेगा।
- नेटवर्क इनपुट के रूप में "डू" शब्द प्राप्त करता है और संख्या का एक वेक्टर बनाता है। नेटवर्क को मेमोरी प्रदान करने के लिए इस वेक्टर को न्यूरॉन को वापस भेजा जाता है। यह चरण नेटवर्क को यह याद रखने में मदद करता है कि उसे "डू" प्राप्त हुआ था और उसने इसे पहली स्थिति में प्राप्त किया था।
- नेटवर्क इसी तरह अगले शब्दों पर आगे बढ़ेगा। यह "आप" और "चाहते हैं" शब्द लेता है। प्रत्येक शब्द प्राप्त करने पर न्यूरॉन्स की स्थिति अपडेट हो जाती है।
- अंतिम चरण "a" शब्द प्राप्त करने के बाद होता है। तंत्रिका नेटवर्क प्रत्येक अंग्रेजी शब्द के लिए एक संभावना प्रदान करेगा जिसका उपयोग वाक्य को पूरा करने के लिए किया जा सकता है। एक अच्छी तरह से प्रशिक्षित RNN संभवतः "कैफ़े", "ड्रिंक", "बर्गर" आदि को उच्च संभावना प्रदान करता है।
आरएनएन के सामान्य उपयोग
- प्रतिभूति व्यापारियों को विश्लेषणात्मक रिपोर्ट तैयार करने में सहायता करें
- वित्तीय विवरण के अनुबंध में असामान्यताओं का पता लगाना
- धोखाधड़ी वाले क्रेडिट-कार्ड लेनदेन का पता लगाएं
- छवियों के लिए कैप्शन प्रदान करें
- पावर चैटबॉट्स
- आरएनएन का मानक उपयोग तब होता है जब अभ्यासकर्ता समय-श्रृंखला डेटा या अनुक्रम (जैसे, ऑडियो रिकॉर्डिंग या पाठ) के साथ काम कर रहे होते हैं।
संवेदी तंत्रिका नेटवर्क (CNN)
सीएनएन यह एक बहु-स्तरीय तंत्रिका नेटवर्क है जिसमें एक अद्वितीय वास्तुकला है जिसे आउटपुट निर्धारित करने के लिए प्रत्येक परत पर डेटा की बढ़ती जटिल विशेषताओं को निकालने के लिए डिज़ाइन किया गया है। CNN अवधारणात्मक कार्यों के लिए अच्छी तरह से अनुकूल हैं।
सीएनएन का प्रयोग ज्यादातर तब किया जाता है जब कोई असंरचित डेटा सेट (जैसे, चित्र) उपलब्ध हो और चिकित्सकों को उसमें से जानकारी निकालने की आवश्यकता हो।
उदाहरण के लिए, यदि कार्य किसी चित्र कैप्शन का पूर्वानुमान लगाना है:
- मान लीजिए कि CNN को एक बिल्ली की छवि प्राप्त होती है, यह छवि, कंप्यूटर की भाषा में, पिक्सेल का एक संग्रह है। आम तौर पर, ग्रेस्केल चित्र के लिए एक परत और रंगीन चित्र के लिए तीन परतें होती हैं।
- फीचर लर्निंग (अर्थात, छिपी हुई परतें) के दौरान, नेटवर्क विशिष्ट विशेषताओं की पहचान करेगा, उदाहरण के लिए, बिल्ली की पूंछ, कान, आदि।
- जब नेटवर्क ने किसी तस्वीर को पहचानना अच्छी तरह सीख लिया, तो वह अपनी हर छवि के लिए एक संभावना प्रदान कर सकता है। सबसे ज़्यादा संभावना वाला लेबल नेटवर्क की भविष्यवाणी बन जाएगा।
सुदृढीकरण सीखना
सुदृढीकरण सीखना मशीन लर्निंग का एक उपक्षेत्र है जिसमें सिस्टम को आभासी "पुरस्कार" या "दंड" प्राप्त करके प्रशिक्षित किया जाता है, जो अनिवार्य रूप से परीक्षण और त्रुटि द्वारा सीखा जाता है। Google के डीपमाइंड ने गो गेम में मानव चैंपियन को हराने के लिए सुदृढीकरण सीखने का उपयोग किया है। वीडियो गेम में भी बेहतर बॉट प्रदान करके गेमिंग अनुभव को बेहतर बनाने के लिए सुदृढीकरण सीखने का उपयोग किया जाता है।
सबसे प्रसिद्ध एल्गोरिदम में से एक हैं:
- क्यू-लर्निंग
- डीप क्यू नेटवर्क
- राज्य-कार्रवाई-पुरस्कार-राज्य-कार्रवाई (SARSA)
- डीप डिटर्मिनिस्टिक पॉलिसी ग्रेडिएंट (DDPG)
गहन शिक्षण अनुप्रयोगों के उदाहरण
अब शुरुआती लोगों के लिए डीप लर्निंग के इस ट्यूटोरियल में, आइए डीप लर्निंग अनुप्रयोगों के बारे में जानें:
वित्त में एआई
वित्तीय प्रौद्योगिकी क्षेत्र ने समय बचाने, लागत कम करने और मूल्य जोड़ने के लिए पहले ही AI का उपयोग करना शुरू कर दिया है। डीप लर्निंग अधिक मजबूत क्रेडिट स्कोरिंग का उपयोग करके ऋण उद्योग को बदल रहा है। ऋण निर्णयकर्ता आवेदकों के चरित्र और क्षमता को ध्यान में रखते हुए मशीन इंटेलिजेंस का उपयोग करके तेज़, अधिक सटीक जोखिम मूल्यांकन प्राप्त करने के लिए मजबूत ऋण ऋण आवेदनों के लिए AI का उपयोग कर सकते हैं।
अंडरराइट एक फिनटेक कंपनी है जो क्रेडिट मेकर कंपनियों के लिए AI समाधान प्रदान करती है। underwrite.ai यह पता लगाने के लिए AI का उपयोग करती है कि कौन सा आवेदक ऋण वापस करने की अधिक संभावना रखता है। उनका तरीका पारंपरिक तरीकों से कहीं बेहतर है।
मानव संसाधन में कृत्रिम बुद्धिमत्ता
अंडर आर्मर, एक स्पोर्ट्सवियर कंपनी है जो एआई की मदद से भर्ती में क्रांतिकारी बदलाव लाती है और उम्मीदवार के अनुभव को आधुनिक बनाती है। वास्तव में, अंडर आर्मर ने अपने खुदरा स्टोर के लिए भर्ती समय को 35% तक कम कर दिया है। अंडर आर्मर को 2012 में बढ़ती लोकप्रियता का सामना करना पड़ा। उनके पास औसतन हर महीने 30000 रिज्यूमे आते थे। उन सभी आवेदनों को पढ़ना और स्क्रीनिंग और साक्षात्कार प्रक्रिया शुरू करना बहुत लंबा समय ले रहा था। लोगों को काम पर रखने और उन्हें शामिल करने की लंबी प्रक्रिया ने अंडर आर्मर की अपने खुदरा स्टोर को पूरी तरह से स्टाफ़, रैंप और संचालन के लिए तैयार करने की क्षमता को प्रभावित किया।
उस समय, अंडर आर्मर के पास सभी 'जरूरी' एचआर तकनीक मौजूद थी जैसे सोर्सिंग, आवेदन, ट्रैकिंग और ऑनबोर्डिंग के लिए लेन-देन संबंधी समाधान लेकिन वे उपकरण पर्याप्त उपयोगी नहीं थे। अंडर आर्मर ने चुना HireVue, ऑन-डिमांड और लाइव इंटरव्यू दोनों के लिए एचआर समाधान के लिए एक एआई प्रदाता। परिणाम धोखा देने वाले थे; वे भरने के लिए समय को 35% तक कम करने में कामयाब रहे। बदले में, उच्च गुणवत्ता वाले कर्मचारियों को काम पर रखा गया।
मार्केटिंग में ए.आई.
ग्राहक सेवा प्रबंधन और वैयक्तिकरण चुनौतियों के लिए AI एक मूल्यवान उपकरण है। AI तकनीकों के अनुप्रयोग के परिणामस्वरूप कॉल-सेंटर प्रबंधन और कॉल रूटिंग में बेहतर वाक् पहचान ग्राहकों के लिए अधिक सहज अनुभव की अनुमति देती है।
उदाहरण के लिए, ऑडियो का गहन-शिक्षण विश्लेषण सिस्टम को ग्राहक के भावनात्मक स्वर का आकलन करने की अनुमति देता है। यदि ग्राहक खराब प्रतिक्रिया दे रहा है ए चेट्बोट, सिस्टम को बातचीत को वास्तविक, मानव ऑपरेटरों तक पुनः निर्देशित किया जा सकता है जो मुद्दे को अपने हाथ में ले लेते हैं।
उपरोक्त तीन डीप लर्निंग उदाहरणों के अलावा, एआई का उपयोग अन्य क्षेत्रों/उद्योगों में भी व्यापक रूप से किया जाता है।
डीप लर्निंग क्यों महत्वपूर्ण है?
डीप लर्निंग भविष्यवाणी को कार्रवाई योग्य परिणाम बनाने के लिए एक शक्तिशाली उपकरण है। डीप लर्निंग पैटर्न डिस्कवरी (अनसुपरवाइज्ड लर्निंग) और ज्ञान-आधारित भविष्यवाणी में उत्कृष्ट है। बिग डेटा गहन शिक्षा के लिए ईंधन है। जब दोनों को मिला दिया जाता है, तो एक संगठन उत्पादकता, बिक्री, प्रबंधन और नवाचार के मामले में अभूतपूर्व परिणाम प्राप्त कर सकता है।
डीप लर्निंग पारंपरिक पद्धति से बेहतर प्रदर्शन कर सकती है। उदाहरण के लिए, डीप लर्निंग एल्गोरिदम इमेज वर्गीकरण में मशीन लर्निंग एल्गोरिदम की तुलना में 41% अधिक सटीक हैं, चेहरे की पहचान में 27% अधिक सटीक हैं और आवाज की पहचान में 25% अधिक सटीक हैं।
गहन शिक्षण की सीमाएँ
अब इस न्यूरल नेटवर्क ट्यूटोरियल में, हम डीप लर्निंग की सीमाओं के बारे में जानेंगे:
डेटा लेबलिंग
अधिकांश वर्तमान AI मॉडल "पर्यवेक्षित शिक्षण" के माध्यम से प्रशिक्षित किए जाते हैं। इसका मतलब है कि मनुष्यों को अंतर्निहित डेटा को लेबल और वर्गीकृत करना होगा, जो एक बड़ा और त्रुटि-प्रवण काम हो सकता है। उदाहरण के लिए, स्व-चालित कार तकनीक विकसित करने वाली कंपनियाँ इन प्रणालियों को प्रशिक्षित करने में मदद करने के लिए प्रोटोटाइप वाहनों से घंटों के वीडियो फ़ीड को मैन्युअल रूप से एनोटेट करने के लिए सैकड़ों लोगों को काम पर रख रही हैं।
विशाल प्रशिक्षण डेटासेट प्राप्त करें
यह दिखाया गया है कि सी.एन.एन. जैसी सरल गहन शिक्षण तकनीकें, कुछ मामलों में, चिकित्सा और अन्य क्षेत्रों के विशेषज्ञों के ज्ञान की नकल कर सकती हैं। यंत्र अधिगमहालाँकि, इसके लिए ऐसे प्रशिक्षण डेटा सेट की आवश्यकता होती है जो न केवल लेबलयुक्त हों बल्कि पर्याप्त रूप से व्यापक और सार्वभौमिक भी हों।
डीप-लर्निंग विधियों को वर्गीकरण कार्यों में अपेक्षाकृत बेहतर बनने के लिए मॉडलों के लिए हजारों अवलोकनों की आवश्यकता होती है और कुछ मामलों में, मनुष्यों के स्तर पर प्रदर्शन करने के लिए लाखों की आवश्यकता होती है। आश्चर्य की बात नहीं है कि डीप लर्निंग विशाल तकनीकी कंपनियों में प्रसिद्ध है; वे डेटा के पेटाबाइट्स को इकट्ठा करने के लिए बड़े डेटा का उपयोग कर रहे हैं। यह उन्हें एक प्रभावशाली और अत्यधिक सटीक डीप लर्निंग मॉडल बनाने की अनुमति देता है।
समस्या समझाएँ
बड़े और जटिल मॉडलों को मानवीय दृष्टि से समझाना कठिन हो सकता है। उदाहरण के लिए, कोई विशेष निर्णय क्यों लिया गया। यह एक कारण है कि कुछ AI उपकरणों की स्वीकृति उन अनुप्रयोग क्षेत्रों में धीमी है जहाँ व्याख्यात्मकता उपयोगी है या वास्तव में आवश्यक है।
इसके अलावा, जैसे-जैसे एआई का अनुप्रयोग बढ़ता है, नियामक आवश्यकताएं भी अधिक व्याख्या योग्य एआई मॉडल की आवश्यकता को बढ़ावा दे सकती हैं।
सारांश
गहन शिक्षण अवलोकन: डीप लर्निंग नई अत्याधुनिक तकनीक है कृत्रिम बुद्धिमत्ताडीप लर्निंग आर्किटेक्चर एक इनपुट लेयर, हिडन लेयर और एक आउटपुट लेयर से बना होता है। डीप शब्द का मतलब है कि दो से ज़्यादा पूरी तरह से जुड़ी हुई लेयर हैं।
तंत्रिका नेटवर्क की एक विशाल मात्रा है, जहां प्रत्येक आर्किटेक्चर को किसी दिए गए कार्य को करने के लिए डिज़ाइन किया गया है। उदाहरण के लिए, CNN चित्रों के साथ बहुत अच्छी तरह से काम करता है, RNN समय श्रृंखला और पाठ विश्लेषण के साथ प्रभावशाली परिणाम प्रदान करता है।
डीप लर्निंग अब वित्त से लेकर मार्केटिंग, सप्लाई चेन और मार्केटिंग तक के विभिन्न क्षेत्रों में सक्रिय है। बड़ी कंपनियाँ डीप लर्निंग का उपयोग करने वाली पहली कंपनियाँ हैं क्योंकि उनके पास पहले से ही डेटा का एक बड़ा भंडार है। डीप लर्निंग के लिए एक व्यापक प्रशिक्षण डेटासेट की आवश्यकता होती है।