NLTK को कैसे डाउनलोड और इंस्टॉल करें? Windows/मैक
NLTK को स्थापित करना Windows
इस भाग में, हम सीखेंगे कि टर्मिनल (विंडोज़ में कमांड प्रॉम्प्ट) के माध्यम से NLTK को कैसे सेटअप किया जाए।
नीचे दिए गए निर्देश इस धारणा पर आधारित हैं कि आपके पास python इंस्टॉल नहीं है। तो, पहला कदम python इंस्टॉल करना है।
का अधिष्ठापन Python in Windows
चरण 1) लिंक पर जाएं https://www.python.org/downloads/, और विंडोज़ के लिए नवीनतम संस्करण का चयन करें।
नोटयदि आप नवीनतम संस्करण डाउनलोड नहीं करना चाहते हैं, तो आप डाउनलोड टैब पर जाकर सभी रिलीज़ देख सकते हैं।
चरण 2) डाउनलोड की गई फ़ाइल पर क्लिक करें
चरण 3)स्थापना अनुकूलित करें चुनें
चरण 4) अगला पर क्लिक करें
चरण 5) अगली स्क्रीन में
- उन्नत विकल्प चुनें
- कस्टम इंस्टॉल स्थान दें। मेरे मामले में, ऑपरेशन में आसानी के लिए C ड्राइव पर एक फ़ोल्डर चुना गया है
- इंस्टॉल करें पर क्लिक करें
चरण 6) इंस्टॉल हो जाने पर बंद करें बटन पर क्लिक करें।
चरण 7) अपने स्क्रिप्ट फ़ोल्डर का पथ कॉपी करें.
चरण 8) विंडोज़ कमांड प्रॉम्प्ट में
- पाइप फ़ोल्डर के स्थान पर नेविगेट करें
- NLTK स्थापित करने के लिए कमांड दर्ज करें
pip3 install nltk
- स्थापना सफलतापूर्वक होनी चाहिए
ध्यान दें: के लिये Python2 कमांड का उपयोग करेंpip2 install nltk
चरण 9) In Windows स्टार्ट मेनू, खोजें और खोलें Pythonखोल
चरण 10) आप नीचे दिए गए आदेश का उपयोग करके सत्यापित कर सकते हैं कि स्थापना सही है या नहीं
import nltk
यदि आपको कोई त्रुटि नहीं दिखती है, तो स्थापना पूर्ण हो गई है।
मैक/लिनक्स में NLTK स्थापित करना
मैक/यूनिक्स में NLTK को इंस्टॉल करने के लिए nltk को इंस्टॉल करने के लिए python पैकेज मैनेजर pip की आवश्यकता होती है। यदि pip इंस्टॉल नहीं है, तो कृपया प्रक्रिया को पूरा करने के लिए नीचे दिए गए निर्देशों का पालन करें
स्टेप 1) नीचे दिए गए आदेश को टाइप करके पैकेज इंडेक्स को अपडेट करें
sudo apt update
स्टेप 2) के लिए पाइप स्थापित करना Python 3:
sudo apt install python3-pip
आप easy_install का उपयोग करके भी pip स्थापित कर सकते हैं।
sudo apt-get install python-setuptools python-dev build-essential
अब easy_install इंस्टॉल हो गया है। pip इंस्टॉल करने के लिए नीचे दिया गया कमांड चलाएँ
sudo easy_install pip
स्टेप 3)NLTK को स्थापित करने के लिए निम्नलिखित कमांड का उपयोग करें
sudo pip install -U nltk sudo pip3 install -U nltk
एनाकोंडा के माध्यम से एनएलटीके स्थापित करना
स्टेप 1) कृपया एनाकोंडा स्थापित करें (जिसका उपयोग विभिन्न पैकेजों को स्थापित करने के लिए भी किया जा सकता है) https://www.anaconda.com/products/individual और चुनें कि आपको एनाकोंडा के लिए पायथन का कौन सा संस्करण स्थापित करना है।
नोट: विस्तृत चरणों के लिए इस ट्यूटोरियल का संदर्भ लें एनाकोंडा स्थापित करें
चरण 2)एनाकोंडा प्रॉम्प्ट में,
- कमांड दर्ज करें
conda install -c anaconda nltk
- Revपैकेज अपग्रेड, डाउनग्रेड, इंस्टॉल जानकारी देखें और हां दर्ज करें
- NLTK डाउनलोड और इंस्टॉल हो गया है
एनएलटीके डेटासेट
NLTK मॉड्यूल में कई डेटासेट उपलब्ध हैं जिन्हें इस्तेमाल करने के लिए आपको डाउनलोड करना होगा। तकनीकी रूप से इसे कहा जाता है देह.कुछ उदाहरण इस प्रकार हैं रोक, गुटेनबर्ग, फ्रेमनेट_v15, बड़े_व्याकरणऔर इतना पर.
एनएलटीके के सभी पैकेज कैसे डाउनलोड करें
चरण 1)चलाएं Python दुभाषिया in Windows या लिनक्स
चरण 2)
- आदेश दर्ज करें
import nltk nltk.download ()
- NLTK डाउनलोड की गई विंडो खुलती है। डेटासेट डाउनलोड करने के लिए डाउनलोड बटन पर क्लिक करें। आपके इंटरनेट कनेक्शन के आधार पर इस प्रक्रिया में समय लगेगा
नोट: आप फ़ाइल> डाउनलोड निर्देशिका बदलें पर क्लिक करके डाउनलोड स्थान बदल सकते हैं
चरण 3) स्थापित डेटा का परीक्षण करने के लिए निम्नलिखित कोड का उपयोग करें
>>> from nltk.corpus import brown >>>brown.words()
['द', 'फुल्टन', 'काउंटी', 'ग्रैंड', 'जूरी', 'ने कहा', …]
एनएलपी स्क्रिप्ट चलाना
हम चर्चा करने जा रहे हैं कि NLP स्क्रिप्ट हमारे स्थानीय पीसी पर कैसे निष्पादित होगी। बाजार में नेचुरल लैंग्वेज प्रोसेसिंग के लिए कई लाइब्रेरी मौजूद हैं। इसलिए लाइब्रेरी चुनना आपकी आवश्यकताओं के अनुसार निर्भर करता है। यहाँ उनकी सूची दी गई है एनएलपी पुस्तकालय.
NLTK स्क्रिप्ट कैसे चलाएँ
स्टेप 1) अपने पसंदीदा कोड संपादक में, कोड को कॉपी करें और फ़ाइल को इस रूप में सहेजें "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
कोड स्पष्टीकरण:
- इस कार्यक्रम में, उद्देश्य दिए गए पाठ से सभी प्रकार के विराम चिह्नों को हटाना था। हमने “RegexpTokenizer” को आयात किया जो कि एक मॉड्यूल है एनएलटीकेयह सभी अभिव्यक्ति, प्रतीक, वर्ण, अंक या कोई भी चीज़ जो आप चाहते हैं उसे हटा देता है।
- आपने अभी नियमित अभिव्यक्ति को “RegexpTokenizer” मॉड्यूल में पास किया है।
- इसके अलावा, हमने “tokenize” मॉड्यूल का उपयोग करके शब्द को टोकनाइज़ किया। आउटपुट “filterdText” वेरिएबल में संग्रहीत है।
- और उन्हें “print()” का उपयोग करके प्रिंट किया।
स्टेप 2) कमांड प्रॉम्प्ट में
- उस स्थान पर जाएँ जहाँ आपने फ़ाइल सहेजी है
- कमांड चलाएं Python NLTKsample.py
इससे आउटपुट इस प्रकार दिखेगा:
['नमस्ते', 'गुरु99', 'आपने', 'बनाया', 'एक', 'बहुत', 'अच्छा', 'साइट', 'और', 'मैं', 'प्यार करता हूँ', 'आपकी', 'साइट']