วิธีดาวน์โหลดและติดตั้ง NLTK บน Windows/แมค

การติดตั้ง NLTK ใน Windows

ในส่วนนี้เราจะเรียนรู้วิธีการติดตั้ง NLTK ผ่านทางเทอร์มินัล (พรอมต์คำสั่งใน Windows)

คำแนะนำที่ให้ไว้ด้านล่างนี้เป็นไปตามสมมติฐานที่คุณไม่ได้ติดตั้ง python ขั้นตอนแรกคือการติดตั้ง python

การติดตั้ง Python in Windows

ขั้นตอน 1) ไปที่ลิงค์ https://www.python.org/downloads/, และเลือกเวอร์ชันล่าสุดสำหรับ Windows

การติดตั้ง Python in Windows

หมายเหตุ: หากคุณไม่ต้องการดาวน์โหลดเวอร์ชันล่าสุด คุณสามารถไปที่แท็บดาวน์โหลดและดูเวอร์ชันทั้งหมดได้

การติดตั้ง Python in Windows

ขั้นตอน 2) คลิกที่ไฟล์ที่ดาวน์โหลด

การติดตั้ง Python in Windows

ขั้นตอน 3)เลือกปรับแต่งการติดตั้ง

การติดตั้ง Python in Windows

ขั้นตอน 4) คลิกถัดไป

การติดตั้ง Python in Windows

ขั้นตอน 5) ในหน้าจอถัดไป

  1. เลือกตัวเลือกขั้นสูง
  2. กำหนดตำแหน่งติดตั้งแบบกำหนดเอง ในกรณีของฉัน เลือกโฟลเดอร์บนไดรฟ์ C เพื่อความสะดวกในการใช้งาน
  3. คลิกติดตั้ง

การติดตั้ง Python in Windows

ขั้นตอน 6) คลิกปุ่มปิดเมื่อการติดตั้งเสร็จสิ้น

การติดตั้ง Python in Windows

ขั้นตอน 7) คัดลอกเส้นทางของโฟลเดอร์สคริปต์ของคุณ

การติดตั้ง Python in Windows

ขั้นตอน 8) ในพรอมต์คำสั่งของ Windows

  • นำทางไปยังตำแหน่งของโฟลเดอร์ pip
  • ป้อนคำสั่งเพื่อติดตั้ง NLTK
    pip3 install nltk
  • การติดตั้งควรทำสำเร็จ

การติดตั้ง Python in Windows

หมายเหตุ: สำหรับ Python2 ใช้ commandpip2 ติดตั้ง nltk

ขั้นตอน 9) In Windows เมนูเริ่ม ค้นหาและเปิด Pythonเปลือก

การติดตั้ง Python in Windows

ขั้นตอน 10) คุณสามารถตรวจสอบว่าการติดตั้งนั้นถูกต้องหรือไม่โดยใช้คำสั่งด้านล่าง

import nltk

การติดตั้ง Python in Windows

หากคุณไม่เห็นข้อผิดพลาด แสดงว่าการติดตั้งเสร็จสมบูรณ์

การติดตั้ง NLTK ใน Mac/Linux

การติดตั้ง NLTK ใน Mac/Unix ต้องใช้ pip ตัวจัดการแพ็คเกจ python เพื่อติดตั้ง nltk หากไม่ได้ติดตั้ง pip โปรดปฏิบัติตามคำแนะนำด้านล่างเพื่อดำเนินการให้เสร็จสิ้น

ขั้นตอนที่ 1) อัพเดตดัชนีแพ็คเกจโดยพิมพ์คำสั่งด้านล่าง

sudo apt update

ขั้นตอนที่ 2) การติดตั้ง pip สำหรับ Python 3:

sudo apt install python3-pip

คุณยังสามารถติดตั้ง pip โดยใช้ easy_install

sudo apt-get install python-setuptools  python-dev build-essential

ตอนนี้ easy_install ได้รับการติดตั้งแล้ว รันคำสั่งด้านล่างเพื่อติดตั้ง pip

sudo easy_install pip

ขั้นตอนที่ 3)ใช้คำสั่งต่อไปนี้เพื่อติดตั้ง NLTK

sudo pip install -U nltk
sudo pip3 install -U nltk

การติดตั้ง NLTK ผ่าน Anaconda

ขั้นตอนที่ 1) โปรดติดตั้งอนาคอนดา (ซึ่งสามารถใช้เพื่อติดตั้งแพ็คเกจต่างๆ ได้) โดยไปที่ https://www.anaconda.com/products/individual และเลือกเวอร์ชันของ python ที่คุณต้องการติดตั้งสำหรับอนาคอนดา

การติดตั้ง NLTK ผ่าน Anaconda

หมายเหตุ: โปรดดูบทช่วยสอนนี้สำหรับขั้นตอนโดยละเอียด ติดตั้งอนาคอนด้า

ขั้นตอน 2)ในพรอมต์ของอนาคอนดา

  1. ใส่คำสั่ง
    conda install -c anaconda nltk
  2. Revดูข้อมูลการอัพเกรด ดาวน์เกรด ติดตั้งแพ็คเกจ และกดตกลง
  3. ดาวน์โหลดและติดตั้ง NLTK แล้ว

การติดตั้ง NLTK ผ่าน Anaconda

ชุดข้อมูล NLTK

โมดูล NLTK มีชุดข้อมูลมากมายที่คุณต้องดาวน์โหลดเพื่อใช้งาน ในทางเทคนิคเรียกว่า คลัง- ตัวอย่างบางส่วนก็คือ คำหยุด, กูเทนเบิร์ก, framenet_v15, large_grammarsเป็นต้น

วิธีดาวน์โหลดแพ็คเกจทั้งหมดของ NLTK

ขั้นตอน 1)เรียกใช้ Python ล่าม in Windows หรือลีนุกซ์

ขั้นตอน 2)

  1. ป้อนคำสั่ง
import nltk
nltk.download ()
  1. หน้าต่างที่ดาวน์โหลด NLTK จะเปิดขึ้น คลิกปุ่มดาวน์โหลดเพื่อดาวน์โหลดชุดข้อมูล กระบวนการนี้จะใช้เวลา ขึ้นอยู่กับการเชื่อมต่ออินเทอร์เน็ตของคุณ

ดาวน์โหลดแพ็คเกจทั้งหมดของ NLTK

หมายเหตุ: คุณสามารถเปลี่ยนตำแหน่งการดาวน์โหลดได้โดยคลิกไฟล์> เปลี่ยนไดเรกทอรีดาวน์โหลด

ดาวน์โหลดแพ็คเกจทั้งหมดของ NLTK

ขั้นตอน 3) เพื่อทดสอบข้อมูลที่ติดตั้ง ให้ใช้โค้ดดังต่อไปนี้

>>> from nltk.corpus import brown
>>>brown.words()

['เดอะ', 'ฟุลตัน', 'เคาน์ตี', 'แกรนด์', 'คณะลูกขุน', 'พูด', …]

ดาวน์โหลดแพ็คเกจทั้งหมดของ NLTK

การรันสคริปต์ NLP

เราจะหารือเกี่ยวกับวิธีดำเนินการสคริปต์ NLP บนพีซีในพื้นที่ของเรา มีห้องสมุดมากมายสำหรับการประมวลผลภาษาธรรมชาติที่มีอยู่ในตลาด ดังนั้นการเลือกห้องสมุดจึงขึ้นอยู่กับความต้องการของคุณ นี่คือรายการของ ห้องสมุด NLP.

วิธีเรียกใช้สคริปต์ NLTK

ขั้นตอนที่ 1) ในโปรแกรมแก้ไขโค้ดที่คุณชื่นชอบ ให้คัดลอกโค้ดและบันทึกไฟล์เป็น "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

เรียกใช้สคริปต์ NLTK

คำอธิบายรหัส:

  1. ในโปรแกรมนี้ มีวัตถุประสงค์เพื่อลบเครื่องหมายวรรคตอนทุกประเภทออกจากข้อความที่กำหนด เรานำเข้า “RegexpTokenizer” ซึ่งเป็นโมดูลของ เอ็นแอลทีเค- โดยจะลบนิพจน์ สัญลักษณ์ อักขระ ตัวเลข หรือสิ่งใดก็ตามที่คุณต้องการออกทั้งหมด
  2. คุณเพิ่งส่ง Expression ปกติไปยังโมดูล "RegexpTokenizer"
  3. นอกจากนี้เรายังสร้างคำโดยใช้โมดูล "tokenize" ผลลัพธ์จะถูกเก็บไว้ในตัวแปร “filterdText”
  4. และพิมพ์โดยใช้ “print()”

ขั้นตอนที่ 2) ในพรอมต์คำสั่ง

  • นำทางไปยังตำแหน่งที่คุณบันทึกไฟล์ไว้
  • เรียกใช้คำสั่ง Python NLTKsample.py

เรียกใช้สคริปต์ NLTK

สิ่งนี้จะแสดงผลลัพธ์เป็น:

['สวัสดี', 'Guru99', 'คุณ', 'มี', 'สร้าง', 'a', 'มาก', 'ดี', 'ไซต์', 'และ', 'ฉัน', 'ความรัก', ' เยี่ยมชม', 'ของคุณ', 'ไซต์']