Cara Download & Instal NLTK di Windows/Mac
Menginstal NLTK di Windows
Pada bagian ini, kita akan mempelajari cara melakukan pengaturan NLTK melalui terminal (Command prompt di Windows).
Instruksi yang diberikan di bawah ini didasarkan pada asumsi bahwa Anda belum menginstal python. Jadi, langkah pertama adalah menginstal python.
Instalasi Python in Windows
Langkah 1) Buka tautan https://www.python.org/downloads/, dan pilih versi terbaru untuk windows.
Note: Jika Anda tidak ingin mendownload versi terbaru, Anda dapat mengunjungi tab download dan melihat semua rilis.
Langkah 2) Klik pada File yang Diunduh
Langkah 3)Pilih Sesuaikan Instalasi
Langkah 4) Klik BERIKUTNYA
Langkah 5) Di layar berikutnya
- Pilih opsi lanjutan
- Berikan lokasi pemasangan khusus. Dalam kasus saya, folder di drive C dipilih untuk kemudahan pengoperasian
- Klik Install
Langkah 6) Klik tombol Tutup setelah instalasi selesai.
Langkah 7) Salin jalur folder Skrip Anda.
Langkah 8) Di command prompt windows
- Arahkan ke lokasi folder pip
- Masukkan perintah untuk menginstal NLTK
pip3 install nltk
- Instalasi harus berhasil dilakukan
CATATAN: Untuk Python2 gunakan perintah pip2 instal nltk
Langkah 9) In Windows Mulai Menu, cari dan buka PythonKulit
Langkah 10) Anda dapat memverifikasi apakah instalasi akurat dengan memberikan perintah di bawah ini
import nltk
Jika Anda tidak melihat kesalahan, Instalasi selesai.
Menginstal NLTK di Mac/Linux
Menginstal NLTK di Mac/Unix memerlukan pip manajer paket python untuk menginstal nltk. Jika pip tidak diinstal, ikuti petunjuk di bawah ini untuk menyelesaikan prosesnya
Langkah 1) Perbarui indeks paket dengan mengetikkan perintah di bawah ini
sudo apt update
Langkah 2) Menginstal pip untuk Python 3:
sudo apt install python3-pip
Anda juga dapat menginstal pip menggunakan easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Sekarang easy_install sudah terinstal. Jalankan perintah di bawah ini untuk menginstal pip
sudo easy_install pip
Langkah 3)Gunakan perintah berikut untuk menginstal NLTK
sudo pip install -U nltk sudo pip3 install -U nltk
Menginstal NLTK melalui Anaconda
Langkah 1) Silakan instal anaconda (yang juga dapat digunakan untuk menginstal paket berbeda) dengan mengunjungi https://www.anaconda.com/products/individual dan pilih versi python mana yang perlu Anda instal untuk anaconda.
Catatan: Lihat tutorial ini untuk mengetahui langkah-langkah detailnya instal anaconda
Langkah 2)Dalam perintah Anaconda,
- Masukkan perintah
conda install -c anaconda nltk
- Revlihat informasi upgrade paket, downgrade, instal dan masukkan ya
- NLTK diunduh dan diinstal
Kumpulan Data NLTK
Modul NLTK memiliki banyak kumpulan data yang perlu Anda unduh untuk digunakan. Secara lebih teknis disebut badan. Beberapa contohnya adalah kata-kata penghenti, Gutenberg, framenet_v15, tata bahasa_besardan seterusnya.
Cara Download semua paket NLTK
Langkah 1)Jalankan Python penerjemah in Windows atau Linux
Langkah 2)
- Masukkan perintahnya
import nltk nltk.download ()
- Jendela Unduhan NLTK Terbuka. Klik Tombol Unduh untuk mengunduh kumpulan data. Proses ini akan memakan waktu, berdasarkan koneksi internet Anda
CATATAN: Anda dapat mengubah lokasi pengunduhan dengan Mengklik File> Ubah Direktori Unduhan
Langkah 3) Untuk menguji data yang terinstal gunakan kode berikut
>>> from nltk.corpus import brown >>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Juri', 'berkata', …]
Menjalankan Skrip NLP
Kami akan membahas bagaimana skrip NLP akan dijalankan di PC lokal kami. Ada banyak perpustakaan untuk Pemrosesan Bahasa Alami yang ada di pasaran. Jadi memilih perpustakaan tergantung pada kebutuhan Anda. Berikut daftarnya perpustakaan NLP.
Cara Menjalankan Skrip NLTK
Langkah 1) Di editor kode favorit Anda, salin kode dan simpan file sebagai "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
Penjelasan Kode:
- Dalam program ini, tujuannya adalah untuk menghapus semua jenis tanda baca dari teks tertentu. Kami mengimpor “RegexpTokenizer” yang merupakan modul NLTK. Ini menghapus semua ekspresi, simbol, karakter, numerik atau hal apa pun yang Anda inginkan.
- Anda baru saja meneruskan Ekspresi reguler ke modul “RegexpTokenizer”.
- Selanjutnya, kami memberi token pada kata tersebut menggunakan modul “tokenize”. Outputnya disimpan dalam variabel “filterdText”.
- Dan mencetaknya menggunakan “print().”
Langkah 2) Di prompt perintah
- Arahkan ke lokasi tempat Anda menyimpan file
- Jalankan perintahnya Python NLTKsample.py
Ini akan menampilkan output sebagai:
['Halo', 'Guru99', 'Kamu', 'punya', 'membangun', 'a', 'sangat', 'bagus', 'situs', 'dan', 'saya', 'cinta', ' mengunjungi', 'Anda', 'situs']