NLTK को कैसे डाउनलोड और इंस्टॉल करें? Windows/मैक

NLTK को स्थापित करना Windows

इस भाग में, हम सीखेंगे कि टर्मिनल (विंडोज़ में कमांड प्रॉम्प्ट) के माध्यम से NLTK को कैसे सेटअप किया जाए।

नीचे दिए गए निर्देश इस धारणा पर आधारित हैं कि आपके पास python इंस्टॉल नहीं है। तो, पहला कदम python इंस्टॉल करना है।

का अधिष्ठापन Python in Windows

चरण 1) लिंक पर जाएं https://www.python.org/downloads/, और विंडोज़ के लिए नवीनतम संस्करण का चयन करें।

का अधिष्ठापन Python in Windows

नोटयदि आप नवीनतम संस्करण डाउनलोड नहीं करना चाहते हैं, तो आप डाउनलोड टैब पर जाकर सभी रिलीज़ देख सकते हैं।

का अधिष्ठापन Python in Windows

चरण 2) डाउनलोड की गई फ़ाइल पर क्लिक करें

का अधिष्ठापन Python in Windows

चरण 3)स्थापना अनुकूलित करें चुनें

का अधिष्ठापन Python in Windows

चरण 4) अगला पर क्लिक करें

का अधिष्ठापन Python in Windows

चरण 5) अगली स्क्रीन में

  1. उन्नत विकल्प चुनें
  2. कस्टम इंस्टॉल स्थान दें। मेरे मामले में, ऑपरेशन में आसानी के लिए C ड्राइव पर एक फ़ोल्डर चुना गया है
  3. इंस्टॉल करें पर क्लिक करें

का अधिष्ठापन Python in Windows

चरण 6) इंस्टॉल हो जाने पर बंद करें बटन पर क्लिक करें।

का अधिष्ठापन Python in Windows

चरण 7) अपने स्क्रिप्ट फ़ोल्डर का पथ कॉपी करें.

का अधिष्ठापन Python in Windows

चरण 8) विंडोज़ कमांड प्रॉम्प्ट में

  • पाइप फ़ोल्डर के स्थान पर नेविगेट करें
  • NLTK स्थापित करने के लिए कमांड दर्ज करें
    pip3 install nltk
  • स्थापना सफलतापूर्वक होनी चाहिए

का अधिष्ठापन Python in Windows

ध्यान दें: के लिये Python2 कमांड का उपयोग करेंpip2 install nltk

चरण 9) In Windows स्टार्ट मेनू, खोजें और खोलें Pythonखोल

का अधिष्ठापन Python in Windows

चरण 10) आप नीचे दिए गए आदेश का उपयोग करके सत्यापित कर सकते हैं कि स्थापना सही है या नहीं

import nltk

का अधिष्ठापन Python in Windows

यदि आपको कोई त्रुटि नहीं दिखती है, तो स्थापना पूर्ण हो गई है।

मैक/लिनक्स में NLTK स्थापित करना

मैक/यूनिक्स में NLTK को इंस्टॉल करने के लिए nltk को इंस्टॉल करने के लिए python पैकेज मैनेजर pip की आवश्यकता होती है। यदि pip इंस्टॉल नहीं है, तो कृपया प्रक्रिया को पूरा करने के लिए नीचे दिए गए निर्देशों का पालन करें

स्टेप 1) नीचे दिए गए आदेश को टाइप करके पैकेज इंडेक्स को अपडेट करें

sudo apt update

स्टेप 2) के लिए पाइप स्थापित करना Python 3:

sudo apt install python3-pip

आप easy_install का उपयोग करके भी pip स्थापित कर सकते हैं।

sudo apt-get install python-setuptools  python-dev build-essential

अब easy_install इंस्टॉल हो गया है। pip इंस्टॉल करने के लिए नीचे दिया गया कमांड चलाएँ

sudo easy_install pip

स्टेप 3)NLTK को स्थापित करने के लिए निम्नलिखित कमांड का उपयोग करें

sudo pip install -U nltk
sudo pip3 install -U nltk

एनाकोंडा के माध्यम से एनएलटीके स्थापित करना

स्टेप 1) कृपया एनाकोंडा स्थापित करें (जिसका उपयोग विभिन्न पैकेजों को स्थापित करने के लिए भी किया जा सकता है) https://www.anaconda.com/products/individual और चुनें कि आपको एनाकोंडा के लिए पायथन का कौन सा संस्करण स्थापित करना है।

एनाकोंडा के माध्यम से एनएलटीके स्थापित करना

नोट: विस्तृत चरणों के लिए इस ट्यूटोरियल का संदर्भ लें एनाकोंडा स्थापित करें

चरण 2)एनाकोंडा प्रॉम्प्ट में,

  1. कमांड दर्ज करें
    conda install -c anaconda nltk
  2. Revपैकेज अपग्रेड, डाउनग्रेड, इंस्टॉल जानकारी देखें और हां दर्ज करें
  3. NLTK डाउनलोड और इंस्टॉल हो गया है

एनाकोंडा के माध्यम से एनएलटीके स्थापित करना

एनएलटीके डेटासेट

NLTK मॉड्यूल में कई डेटासेट उपलब्ध हैं जिन्हें इस्तेमाल करने के लिए आपको डाउनलोड करना होगा। तकनीकी रूप से इसे कहा जाता है देह.कुछ उदाहरण इस प्रकार हैं रोक, गुटेनबर्ग, फ्रेमनेट_v15, बड़े_व्याकरणऔर इतना पर.

एनएलटीके के सभी पैकेज कैसे डाउनलोड करें

चरण 1)चलाएं Python दुभाषिया in Windows या लिनक्स

चरण 2)

  1. आदेश दर्ज करें
import nltk
nltk.download ()
  1. NLTK डाउनलोड की गई विंडो खुलती है। डेटासेट डाउनलोड करने के लिए डाउनलोड बटन पर क्लिक करें। आपके इंटरनेट कनेक्शन के आधार पर इस प्रक्रिया में समय लगेगा

NLTK के सभी पैकेज डाउनलोड करें

नोट: आप फ़ाइल> डाउनलोड निर्देशिका बदलें पर क्लिक करके डाउनलोड स्थान बदल सकते हैं

NLTK के सभी पैकेज डाउनलोड करें

चरण 3) स्थापित डेटा का परीक्षण करने के लिए निम्नलिखित कोड का उपयोग करें

>>> from nltk.corpus import brown
>>>brown.words()

['द', 'फुल्टन', 'काउंटी', 'ग्रैंड', 'जूरी', 'ने कहा', …]

NLTK के सभी पैकेज डाउनलोड करें

एनएलपी स्क्रिप्ट चलाना

हम चर्चा करने जा रहे हैं कि NLP स्क्रिप्ट हमारे स्थानीय पीसी पर कैसे निष्पादित होगी। बाजार में नेचुरल लैंग्वेज प्रोसेसिंग के लिए कई लाइब्रेरी मौजूद हैं। इसलिए लाइब्रेरी चुनना आपकी आवश्यकताओं के अनुसार निर्भर करता है। यहाँ उनकी सूची दी गई है एनएलपी पुस्तकालय.

NLTK स्क्रिप्ट कैसे चलाएँ

स्टेप 1) अपने पसंदीदा कोड संपादक में, कोड को कॉपी करें और फ़ाइल को इस रूप में सहेजें "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

NLTK स्क्रिप्ट चलाएँ

कोड स्पष्टीकरण:

  1. इस कार्यक्रम में, उद्देश्य दिए गए पाठ से सभी प्रकार के विराम चिह्नों को हटाना था। हमने “RegexpTokenizer” को आयात किया जो कि एक मॉड्यूल है एनएलटीकेयह सभी अभिव्यक्ति, प्रतीक, वर्ण, अंक या कोई भी चीज़ जो आप चाहते हैं उसे हटा देता है।
  2. आपने अभी नियमित अभिव्यक्ति को “RegexpTokenizer” मॉड्यूल में पास किया है।
  3. इसके अलावा, हमने “tokenize” मॉड्यूल का उपयोग करके शब्द को टोकनाइज़ किया। आउटपुट “filterdText” वेरिएबल में संग्रहीत है।
  4. और उन्हें “print()” का उपयोग करके प्रिंट किया।

स्टेप 2) कमांड प्रॉम्प्ट में

  • उस स्थान पर जाएँ जहाँ आपने फ़ाइल सहेजी है
  • कमांड चलाएं Python NLTKsample.py

NLTK स्क्रिप्ट चलाएँ

इससे आउटपुट इस प्रकार दिखेगा:

['नमस्ते', 'गुरु99', 'आपने', 'बनाया', 'एक', 'बहुत', 'अच्छा', 'साइट', 'और', 'मैं', 'प्यार करता हूँ', 'आपकी', 'साइट']