كيفية تنزيل وتثبيت NLTK على Windows/ماك

تثبيت NLTK في Windows

في هذا الجزء، سوف نتعلم كيفية إعداد NLTK عبر الوحدة الطرفية (موجه الأوامر في windows).

تعتمد التعليمات الواردة أدناه على افتراض عدم تثبيت لغة python لديك. لذا، الخطوة الأولى هي تثبيت بايثون.

تثبيت بايثون في Windows

الخطوة 1) انتقل إلى الارتباط https://www.python.org/downloads/, وحدد أحدث إصدار لـ windows.

تثبيت بايثون في Windows

ملاحظات: إذا كنت لا ترغب في تنزيل أحدث إصدار، فيمكنك زيارة علامة تبويب التنزيل والاطلاع على جميع الإصدارات.

تثبيت بايثون في Windows

الخطوة 2) انقر على الملف الذي تم تنزيله

تثبيت بايثون في Windows

الخطوة 3)حدد تخصيص التثبيت

تثبيت بايثون في Windows

الخطوة 4) انقر فوق التالي

تثبيت بايثون في Windows

الخطوة 5) في الشاشة التالية

  1. حدد الخيارات المتقدمة
  2. إعطاء موقع تثبيت مخصص. في حالتي، يتم اختيار مجلد على محرك الأقراص C لسهولة التشغيل
  3. انقر على تثبيت

تثبيت بايثون في Windows

الخطوة 6) انقر فوق الزر "إغلاق" بمجرد الانتهاء من التثبيت.

تثبيت بايثون في Windows

الخطوة 7) انسخ مسار مجلد البرامج النصية الخاص بك.

تثبيت بايثون في Windows

الخطوة 8) In windows الأوامر

  • انتقل إلى موقع مجلد النقطة
  • أدخل الأمر لتثبيت NLTK
    pip3 install nltk
  • يجب أن يتم التثبيت بنجاح

تثبيت بايثون في Windows

ملحوظة: بالنسبة إلى Python2، استخدم الأمر Commandpip2 install nltk

الخطوة 9) In Windows قائمة ابدأ، ابحث وافتح PythonShell

تثبيت بايثون في Windows

الخطوة 10) يمكنك التحقق مما إذا كان التثبيت دقيقًا من خلال توفير الأمر أدناه

import nltk

تثبيت بايثون في Windows

إذا لم تشاهد أي خطأ، فهذا يعني أن التثبيت قد اكتمل.

تثبيت NLTK في نظام التشغيل Mac/Linux

يتطلب تثبيت NLTK في Mac/Unix نقطة مدير حزم python لتثبيت nltk. إذا لم يتم تثبيت النقطة، يرجى اتباع الإرشادات أدناه لإكمال العملية

الخطوة 1) قم بتحديث فهرس الحزمة عن طريق كتابة الأمر أدناه

sudo apt update

الخطوة 2) تثبيت النقطة لـ Python 3:

sudo apt install python3-pip

يمكنك أيضًا تثبيت النقطة باستخدام easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

الآن تم تثبيت easy_install. قم بتشغيل الأمر أدناه لتثبيت النقطة

sudo easy_install pip

الخطوة 3)استخدم فولوwing أمر لتثبيت NLTK

sudo pip install -U nltk
sudo pip3 install -U nltk

تثبيت NLTK من خلال أناكوندا

الخطوة 1) الرجاء تثبيت anaconda (والذي يمكن استخدامه أيضًا لتثبيت حزم مختلفة) من خلال زيارة https://www.anaconda.com/products/individual وحدد إصدار python الذي تريد تثبيته لـ anaconda.

تثبيت NLTK من خلال أناكوندا

ملحوظة: ارجع إلى هذا البرنامج التعليمي للحصول على خطوات تفصيلية لذلك تثبيت اناكوندا

الخطوة 2)في موجه الأناكوندا،

  1. أدخل القيادة
    conda install -c anaconda nltk
  2. قم بمراجعة معلومات ترقية الحزمة، والرجوع إلى إصدار سابق، وتثبيت المعلومات، ثم أدخل نعم
  3. تم تنزيل NLTK وتثبيته

تثبيت NLTK من خلال أناكوندا

مجموعة بيانات NLTK

تحتوي وحدة NLTK على العديد من مجموعات البيانات المتاحة التي تحتاج إلى تنزيلها لاستخدامها. أكثر من الناحية الفنية يطلق عليه الإحضار. بعض الأمثلة هي كلمات التوقف, غوتنبرغ, Framenet_v15, big_grammarsوما إلى ذلك وهلم جرا.

كيفية تنزيل جميع حزم NLTK

الخطوة 1)تشغيل مترجم بايثون in Windows أو لينكس

الخطوة 2)

  1. أدخل الأوامر
import nltk
nltk.download ()
  1. يتم فتح نافذة تنزيل NLTK. انقر فوق زر التنزيل لتنزيل مجموعة البيانات. ستستغرق هذه العملية بعض الوقت، بناءً على اتصالك بالإنترنت

قم بتنزيل جميع حزم NLTK

NOTE: يمكنك تغيير موقع التنزيل بالنقر فوق ملف> تغيير دليل التنزيل

قم بتنزيل جميع حزم NLTK

الخطوة 3) لاختبار البيانات المثبتة استخدم following الكود

>>> from nltk.corpus import brown
>>>brown.words()

["ال"، "فولتون"، "المقاطعة"، "الكبرى"، "هيئة المحلفين"، "قال"، ...]

قم بتنزيل جميع حزم NLTK

تشغيل البرنامج النصي NLP

سنناقش كيفية تنفيذ البرنامج النصي NLP على جهاز الكمبيوتر المحلي الخاص بنا. هناك العديد من مكتبات معالجة اللغات الطبيعية الموجودة في السوق. لذا فإن اختيار المكتبة يعتمد على ملاءمة متطلباتك. هنا قائمة مكتبات البرمجة اللغوية العصبية.

كيفية تشغيل البرنامج النصي NLTK

الخطوة 1) في محرر الأكواد المفضل لديك، انسخ الكود واحفظ الملف باسم "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

قم بتشغيل البرنامج النصي NLTK

شرح الكود:

  1. في هذا البرنامج، كان الهدف هو إزالة جميع أنواع علامات الترقيم من نص معين. لقد قمنا باستيراد "RegexpTokenizer" وهو عبارة عن وحدة نمطية نلتك. فهو يزيل كل التعبير أو الرمز أو الحرف أو الأرقام أو أي أشياء تريدها.
  2. لقد قمت للتو بتمرير التعبير العادي إلى وحدة "RegexpTokenizer".
  3. علاوة على ذلك، قمنا بترميز الكلمة باستخدام وحدة "الترميز". يتم تخزين الإخراج في متغير "filterdText".
  4. وطبعتها باستخدام "print ()."

الخطوة 2) في موجه الأوامر

  • انتقل إلى الموقع الذي قمت بحفظ الملف فيه
  • قم بتشغيل الأمر Python NLTKsample.py

قم بتشغيل البرنامج النصي NLTK

سيظهر هذا الإخراج على النحو التالي:

["مرحبًا"، "Guru99"، "أنت"، "لديك"، "بناء"، "أ"، "جدًا"، "جيد"، "موقع"، "و"، "أنا"، "حب"، " زيارة، "الخاص بك"، "الموقع"]