NLTKをダウンロードしてインストールする方法 Windows/マック
NLTK をインストールする Windows
この部分では、ターミナル (Windows のコマンド プロンプト) 経由で NLTK をセットアップする方法を学習します。
以下に示す手順は、Python がインストールされていないことを前提としています。 したがって、最初のステップはPythonをインストールすることです。
装着 Python in Windows
ステップ1) リンクに移動 https://www.python.org/downloads/, Windows の最新バージョンを選択します。
注意: 最新バージョンをダウンロードしたくない場合は、ダウンロード タブにアクセスしてすべてのリリースを確認できます。
ステップ2) ダウンロードしたファイルをクリックします
ステップ3)「インストールのカスタマイズ」を選択します
ステップ4) [次へ]をクリックします
ステップ5) 次の画面で
- 詳細オプションを選択します
- カスタムインストール場所を指定します。私の場合は、操作のしやすさを考慮してCドライブ上のフォルダを選択しました。
- インストールをクリックします。
ステップ6) インストールが完了したら、「閉じる」ボタンをクリックします。
ステップ7) Scripts フォルダーのパスをコピーします。
ステップ8) Windowsのコマンドプロンプトで
- pip フォルダーの場所に移動します
- コマンドを入力してNLTKをインストールします
pip3 install nltk
- インストールは正常に完了するはずです
注意: にとって Python2 コマンドpip2 install nltkを使用する
ステップ9) In Windows スタートメニュー、検索して開く Pythonシェル(Shell)
ステップ10) 以下のコマンドを実行すると、インストールが正確かどうかを確認できます。
import nltk
エラーが表示されなければ、インストールは完了です。
Mac/Linux への NLTK のインストール
Mac/Unix に NLTK をインストールするには、Python パッケージ マネージャー pip で nltk をインストールする必要があります。 pip がインストールされていない場合は、以下の手順に従ってプロセスを完了してください。
ステップ1) 以下のコマンドを入力してパッケージインデックスを更新します。
sudo apt update
ステップ2) pipのインストール Python 3:
sudo apt install python3-pip
easy_install を使用して pip をインストールすることもできます。
sudo apt-get install python-setuptools python-dev build-essential
これで easy_install がインストールされました。 以下のコマンドを実行して pip をインストールします
sudo easy_install pip
ステップ3)NLTKをインストールするには次のコマンドを使用します
sudo pip install -U nltk sudo pip3 install -U nltk
Anaconda を介した NLTK のインストール
ステップ1) にアクセスして、anaconda (別のパッケージのインストールにも使用できます) をインストールしてください。 https://www.anaconda.com/products/individual anaconda にインストールする必要がある Python のバージョンを選択します。
注: 詳細な手順については、このチュートリアルを参照してください。 アナコンダをインストールする
ステップ2)Anaconda プロンプトで、
- コマンドを入力
conda install -c anaconda nltk
- Revパッケージのアップグレード、ダウングレード、インストール情報を確認し、yesと入力します。
- NLTKがダウンロードされ、インストールされます
NLTK データセット
NLTK モジュールには、使用するためにダウンロードする必要がある利用可能なデータセットが多数あります。 より専門的にはこう呼ばれます コーパス。 いくつかの例は次のとおりです ストップワード, グーテンベルク, フレームネット_v15, 大きい文法などがあります。
NLTK のすべてのパッケージをダウンロードする方法
ステップ1)実行する Python 通訳 in Windows またはLinux
ステップ2)
- コマンドを入力してください
import nltk nltk.download ()
- NLTKのダウンロードウィンドウが開きます。 [ダウンロード] ボタンをクリックしてデータセットをダウンロードします。 インターネット接続に応じて、このプロセスには時間がかかります
注: [ファイル] > [ダウンロード ディレクトリの変更] をクリックして、ダウンロードの場所を変更できます。
ステップ3) インストールされたデータをテストするには、次のコードを使用します。
>>> from nltk.corpus import brown >>>brown.words()
[「ザ」、「フルトン」、「郡」、「グランド」、「陪審」、「言った」、…]
NLP スクリプトの実行
NLP スクリプトがローカル PC 上でどのように実行されるかについて説明します。 市場には自然言語処理用のライブラリが多数存在します。 したがって、ライブラリの選択は要件を満たすかどうかによって決まります。 ここにリストがあります NLP ライブラリ.
NLTK スクリプトを実行する方法
ステップ1) お気に入りのコード エディターでコードをコピーし、ファイルを次の名前で保存します。 「NLTKサンプル.py 「
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
コードの説明:
- このプログラムの目的は、指定されたテキストからあらゆる種類の句読点を削除することでした。 のモジュールである「RegexpTokenizer」をインポートしました。 NLTK。 式、記号、文字、数値など、必要なものすべてを削除します。
- 正規表現を「RegexpTokenizer」モジュールに渡しました。
- さらに、「tokenize」モジュールを使用して単語をトークン化しました。 出力は「filterdText」変数に保存されます。
- そして、「print()」を使用してそれらを印刷します。
ステップ2) コマンドプロンプトで
- ファイルを保存した場所に移動します
- コマンドを実行する Python NLTKサンプル.py
これにより、出力は次のように表示されます。
['こんにちは'、'Guru99'、'あなた'、'持っています'、'構築'、'a'、'とても'、'良い'、'サイト'、'そして'、'私'、'愛'、'訪問中'、'あなたの'、'サイト']