NLTK Nasıl İndirilir ve Kurulur Windows/Mac
NLTK'yi yükleme Windows
Bu bölümde terminal (Windows'ta Komut İstemi) üzerinden NLTK kurulumunun nasıl yapılacağını öğreneceğiz.
Aşağıda verilen talimatlar, Python'un kurulu olmadığı varsayımına dayanmaktadır. Yani ilk adım python'u kurmak.
Takma Python in Windows
) 1 Adım Bağlantıya git https://www.python.org/downloads/, ve Windows için en son sürümü seçin.
not: En son sürümü indirmek istemiyorsanız indirme sekmesine giderek tüm sürümleri görebilirsiniz.
) 2 Adım İndirilen Dosyaya Tıklayın
) 3 AdımKurulumu Özelleştir'i seçin
) 4 Adım Sonrakine tıkla
) 5 Adım Sonraki ekranda
- Gelişmiş seçenekleri seçin
- Özel bir yükleme konumu verin. Benim durumumda, kullanım kolaylığı için C sürücüsündeki bir klasör seçildi
- Yükle'yi tıklayın
) 6 Adım Kurulum tamamlandıktan sonra Kapat düğmesine tıklayın.
) 7 Adım Komut Dosyaları klasörünüzün yolunu kopyalayın.
) 8 Adım Windows komut isteminde
- Pip klasörünün konumuna gidin
- NLTK'yi yüklemek için komutu girin
pip3 install nltk
- Kurulum başarıyla yapılmalı
NOT: İçin Python2 pip2 install nltk komutunu kullanın
) 9 Adım In Windows Başlat Menüsü, arayın ve açın PythonKabuk
) 10 Adım Aşağıdaki komutu vererek kurulumun doğru olup olmadığını doğrulayabilirsiniz.
import nltk
Herhangi bir hata görmüyorsanız Kurulum tamamlanmıştır.
NLTK'yi Mac/Linux'a yükleme
NLTK'yi Mac/Unix'e yüklemek, nltk'yi yüklemek için python paket yöneticisi pip'ini gerektirir. Pip kurulu değilse işlemi tamamlamak için lütfen aşağıdaki talimatları izleyin.
Adım1) Aşağıdaki komutu yazarak paket dizinini güncelleyin
sudo apt update
Adım2) için pip kurulumu Python 3:
sudo apt install python3-pip
Ayrıca easy_install kullanarak da pip kurabilirsiniz.
sudo apt-get install python-setuptools python-dev build-essential
Artık easy_install kuruldu. Pip yüklemek için aşağıdaki komutu çalıştırın
sudo easy_install pip
Adım3)NLTK'yi yüklemek için aşağıdaki komutu kullanın
sudo pip install -U nltk sudo pip3 install -U nltk
NLTK'yi Anaconda aracılığıyla yükleme
Adım1) Lütfen şu adresi ziyaret ederek anaconda'yı (farklı paketleri kurmak için de kullanılabilir) kurun. https://www.anaconda.com/products/individual ve anaconda için hangi python sürümünü kurmanız gerektiğini seçin.
Not: Ayrıntılı adımlar için bu eğitime bakın. anaconda'yı yükle
) 2 AdımAnaconda isteminde,
- Komutu girin
conda install -c anaconda nltk
- Revpaket yükseltme, düşürme, kurulum bilgilerini görüntüleyin ve evet girin
- NLTK indirildi ve kuruldu
NLTK Veri Kümesi
NLTK modülü, kullanmak için indirmeniz gereken birçok veri kümesine sahiptir. Daha teknik olarak buna denir külliyat. Örneklerden bazıları şunlardır: engellenecek kelimeler, Gutenberg, çerçeve ağı_v15, büyük_gramerlerve benzerleri.
NLTK'nin tüm paketleri nasıl indirilir
) 1 AdımÇalıştır Python çevirmen in Windows veya Linux
) 2 Adım
- Komutları girin
import nltk nltk.download ()
- NLTK İndirildi Penceresi Açılır. Veri kümesini indirmek için İndir Düğmesine tıklayın. Bu işlem internet bağlantınıza bağlı olarak zaman alacaktır
NOT: İndirme konumunu Dosya> İndirme Dizinini Değiştir'e tıklayarak değiştirebilirsiniz.
) 3 Adım Yüklenen verileri test etmek için aşağıdaki kodu kullanın
>>> from nltk.corpus import brown >>>brown.words()
['The', 'Fulton', 'İlçe', 'Büyük', 'Jüri', 'dedi', …]
NLP Komut Dosyasını Çalıştırma
NLP betiğinin yerel bilgisayarımızda nasıl yürütüleceğini tartışacağız. Piyasada Doğal Dil İşleme'ye yönelik birçok kütüphane bulunmaktadır. Dolayısıyla bir kütüphane seçmek gereksinimlerinize uymaya bağlıdır. İşte listesi NLP kütüphaneleri.
NLTK Komut Dosyası Nasıl Çalıştırılır
Adım1) Favori kod düzenleyicinizde kodu kopyalayın ve dosyayı farklı kaydedin. "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
Kod Açıklaması:
- Bu programda amaç, verilen metindeki her türlü noktalama işaretini kaldırmaktı. Bir modül olan “RegexpTokenizer”ı içe aktardık. NLTK. Tüm ifadeyi, sembolü, karakteri, rakamı veya istediğiniz her şeyi kaldırır.
- Normal İfadeyi “RegexpTokenizer” modülüne aktardınız.
- Ayrıca “tokenize” modülünü kullanarak kelimeyi tokenize ettik. Çıktı “filterdText” değişkeninde saklanır.
- Ve bunları “print()” kullanarak yazdırdık.
Adım2) Komut isteminde
- Dosyayı kaydettiğiniz konuma gidin
- Komutu çalıştır Python NLTKsample.py
Bu, çıktıyı şu şekilde gösterecektir:
['Merhaba', 'Guru99', 'Sen', 'sahipsin', 'yapı', 'bir', 'çok', 'iyi', 'site', 've', 'Ben', 'seviyorum', ' ziyaret', 'sizin', 'siteniz']