วิธีดาวน์โหลดและติดตั้ง NLTK บน Windows/แมค
การติดตั้ง NLTK ใน Windows
ในส่วนนี้เราจะเรียนรู้วิธีการติดตั้ง NLTK ผ่านทางเทอร์มินัล (พรอมต์คำสั่งใน Windows)
คำแนะนำที่ให้ไว้ด้านล่างนี้เป็นไปตามสมมติฐานที่คุณไม่ได้ติดตั้ง python ขั้นตอนแรกคือการติดตั้ง python
การติดตั้ง Python in Windows
ขั้นตอน 1) ไปที่ลิงค์ https://www.python.org/downloads/, และเลือกเวอร์ชันล่าสุดสำหรับ Windows
หมายเหตุ: หากคุณไม่ต้องการดาวน์โหลดเวอร์ชันล่าสุด คุณสามารถไปที่แท็บดาวน์โหลดและดูเวอร์ชันทั้งหมดได้
ขั้นตอน 2) คลิกที่ไฟล์ที่ดาวน์โหลด
ขั้นตอน 3)เลือกปรับแต่งการติดตั้ง
ขั้นตอน 4) คลิกถัดไป
ขั้นตอน 5) ในหน้าจอถัดไป
- เลือกตัวเลือกขั้นสูง
- กำหนดตำแหน่งติดตั้งแบบกำหนดเอง ในกรณีของฉัน เลือกโฟลเดอร์บนไดรฟ์ C เพื่อความสะดวกในการใช้งาน
- คลิกติดตั้ง
ขั้นตอน 6) คลิกปุ่มปิดเมื่อการติดตั้งเสร็จสิ้น
ขั้นตอน 7) คัดลอกเส้นทางของโฟลเดอร์สคริปต์ของคุณ
ขั้นตอน 8) ในพรอมต์คำสั่งของ Windows
- นำทางไปยังตำแหน่งของโฟลเดอร์ pip
- ป้อนคำสั่งเพื่อติดตั้ง NLTK
pip3 install nltk
- การติดตั้งควรทำสำเร็จ
หมายเหตุ: สำหรับ Python2 ใช้ commandpip2 ติดตั้ง nltk
ขั้นตอน 9) In Windows เมนูเริ่ม ค้นหาและเปิด Pythonเปลือก
ขั้นตอน 10) คุณสามารถตรวจสอบว่าการติดตั้งนั้นถูกต้องหรือไม่โดยใช้คำสั่งด้านล่าง
import nltk
หากคุณไม่เห็นข้อผิดพลาด แสดงว่าการติดตั้งเสร็จสมบูรณ์
การติดตั้ง NLTK ใน Mac/Linux
การติดตั้ง NLTK ใน Mac/Unix ต้องใช้ pip ตัวจัดการแพ็คเกจ python เพื่อติดตั้ง nltk หากไม่ได้ติดตั้ง pip โปรดปฏิบัติตามคำแนะนำด้านล่างเพื่อดำเนินการให้เสร็จสิ้น
ขั้นตอนที่ 1) อัพเดตดัชนีแพ็คเกจโดยพิมพ์คำสั่งด้านล่าง
sudo apt update
ขั้นตอนที่ 2) การติดตั้ง pip สำหรับ Python 3:
sudo apt install python3-pip
คุณยังสามารถติดตั้ง pip โดยใช้ easy_install
sudo apt-get install python-setuptools python-dev build-essential
ตอนนี้ easy_install ได้รับการติดตั้งแล้ว รันคำสั่งด้านล่างเพื่อติดตั้ง pip
sudo easy_install pip
ขั้นตอนที่ 3)ใช้คำสั่งต่อไปนี้เพื่อติดตั้ง NLTK
sudo pip install -U nltk sudo pip3 install -U nltk
การติดตั้ง NLTK ผ่าน Anaconda
ขั้นตอนที่ 1) โปรดติดตั้งอนาคอนดา (ซึ่งสามารถใช้เพื่อติดตั้งแพ็คเกจต่างๆ ได้) โดยไปที่ https://www.anaconda.com/products/individual และเลือกเวอร์ชันของ python ที่คุณต้องการติดตั้งสำหรับอนาคอนดา
หมายเหตุ: โปรดดูบทช่วยสอนนี้สำหรับขั้นตอนโดยละเอียด ติดตั้งอนาคอนด้า
ขั้นตอน 2)ในพรอมต์ของอนาคอนดา
- ใส่คำสั่ง
conda install -c anaconda nltk
- Revดูข้อมูลการอัพเกรด ดาวน์เกรด ติดตั้งแพ็คเกจ และกดตกลง
- ดาวน์โหลดและติดตั้ง NLTK แล้ว
ชุดข้อมูล NLTK
โมดูล NLTK มีชุดข้อมูลมากมายที่คุณต้องดาวน์โหลดเพื่อใช้งาน ในทางเทคนิคเรียกว่า คลัง- ตัวอย่างบางส่วนก็คือ คำหยุด, กูเทนเบิร์ก, framenet_v15, large_grammarsเป็นต้น
วิธีดาวน์โหลดแพ็คเกจทั้งหมดของ NLTK
ขั้นตอน 1)เรียกใช้ Python ล่าม in Windows หรือลีนุกซ์
ขั้นตอน 2)
- ป้อนคำสั่ง
import nltk nltk.download ()
- หน้าต่างที่ดาวน์โหลด NLTK จะเปิดขึ้น คลิกปุ่มดาวน์โหลดเพื่อดาวน์โหลดชุดข้อมูล กระบวนการนี้จะใช้เวลา ขึ้นอยู่กับการเชื่อมต่ออินเทอร์เน็ตของคุณ
หมายเหตุ: คุณสามารถเปลี่ยนตำแหน่งการดาวน์โหลดได้โดยคลิกไฟล์> เปลี่ยนไดเรกทอรีดาวน์โหลด
ขั้นตอน 3) เพื่อทดสอบข้อมูลที่ติดตั้ง ให้ใช้โค้ดดังต่อไปนี้
>>> from nltk.corpus import brown >>>brown.words()
['เดอะ', 'ฟุลตัน', 'เคาน์ตี', 'แกรนด์', 'คณะลูกขุน', 'พูด', …]
การรันสคริปต์ NLP
เราจะหารือเกี่ยวกับวิธีดำเนินการสคริปต์ NLP บนพีซีในพื้นที่ของเรา มีห้องสมุดมากมายสำหรับการประมวลผลภาษาธรรมชาติที่มีอยู่ในตลาด ดังนั้นการเลือกห้องสมุดจึงขึ้นอยู่กับความต้องการของคุณ นี่คือรายการของ ห้องสมุด NLP.
วิธีเรียกใช้สคริปต์ NLTK
ขั้นตอนที่ 1) ในโปรแกรมแก้ไขโค้ดที่คุณชื่นชอบ ให้คัดลอกโค้ดและบันทึกไฟล์เป็น "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
คำอธิบายรหัส:
- ในโปรแกรมนี้ มีวัตถุประสงค์เพื่อลบเครื่องหมายวรรคตอนทุกประเภทออกจากข้อความที่กำหนด เรานำเข้า “RegexpTokenizer” ซึ่งเป็นโมดูลของ เอ็นแอลทีเค- โดยจะลบนิพจน์ สัญลักษณ์ อักขระ ตัวเลข หรือสิ่งใดก็ตามที่คุณต้องการออกทั้งหมด
- คุณเพิ่งส่ง Expression ปกติไปยังโมดูล "RegexpTokenizer"
- นอกจากนี้เรายังสร้างคำโดยใช้โมดูล "tokenize" ผลลัพธ์จะถูกเก็บไว้ในตัวแปร “filterdText”
- และพิมพ์โดยใช้ “print()”
ขั้นตอนที่ 2) ในพรอมต์คำสั่ง
- นำทางไปยังตำแหน่งที่คุณบันทึกไฟล์ไว้
- เรียกใช้คำสั่ง Python NLTKsample.py
สิ่งนี้จะแสดงผลลัพธ์เป็น:
['สวัสดี', 'Guru99', 'คุณ', 'มี', 'สร้าง', 'a', 'มาก', 'ดี', 'ไซต์', 'และ', 'ฉัน', 'ความรัก', ' เยี่ยมชม', 'ของคุณ', 'ไซต์']