NLTKをダウンロードしてインストールする方法 Windows/マック

NLTK をインストールする Windows

この部分では、ターミナル (Windows のコマンド プロンプト) 経由で NLTK をセットアップする方法を学習します。

以下に示す手順は、Python がインストールされていないことを前提としています。 したがって、最初のステップはPythonをインストールすることです。

装着 Python in Windows

ステップ1) リンクに移動 https://www.python.org/downloads/, Windows の最新バージョンを選択します。

装着 Python in Windows

注意: 最新バージョンをダウンロードしたくない場合は、ダウンロード タブにアクセスしてすべてのリリースを確認できます。

装着 Python in Windows

ステップ2) ダウンロードしたファイルをクリックします

装着 Python in Windows

ステップ3)「インストールのカスタマイズ」を選択します

装着 Python in Windows

ステップ4) [次へ]をクリックします

装着 Python in Windows

ステップ5) 次の画面で

  1. 詳細オプションを選択します
  2. カスタムインストール場所を指定します。私の場合は、操作のしやすさを考慮してCドライブ上のフォルダを選択しました。
  3. インストールをクリックします。

装着 Python in Windows

ステップ6) インストールが完了したら、「閉じる」ボタンをクリックします。

装着 Python in Windows

ステップ7) Scripts フォルダーのパスをコピーします。

装着 Python in Windows

ステップ8) Windowsのコマンドプロンプトで

  • pip フォルダーの場所に移動します
  • コマンドを入力してNLTKをインストールします
    pip3 install nltk
  • インストールは正常に完了するはずです

装着 Python in Windows

注意: にとって Python2 コマンドpip2 install nltkを使用する

ステップ9) In Windows スタートメニュー、検索して開く Pythonシェル(Shell)

装着 Python in Windows

ステップ10) 以下のコマンドを実行すると、インストールが正確かどうかを確認できます。

import nltk

装着 Python in Windows

エラーが表示されなければ、インストールは完了です。

Mac/Linux への NLTK のインストール

Mac/Unix に NLTK をインストールするには、Python パッケージ マネージャー pip で nltk をインストールする必要があります。 pip がインストールされていない場合は、以下の手順に従ってプロセスを完了してください。

ステップ1) 以下のコマンドを入力してパッケージインデックスを更新します。

sudo apt update

ステップ2) pipのインストール Python 3:

sudo apt install python3-pip

easy_install を使用して pip をインストールすることもできます。

sudo apt-get install python-setuptools  python-dev build-essential

これで easy_install がインストールされました。 以下のコマンドを実行して pip をインストールします

sudo easy_install pip

ステップ3)NLTKをインストールするには次のコマンドを使用します

sudo pip install -U nltk
sudo pip3 install -U nltk

Anaconda を介した NLTK のインストール

ステップ1) にアクセスして、anaconda (別のパッケージのインストールにも使用できます) をインストールしてください。 https://www.anaconda.com/products/individual anaconda にインストールする必要がある Python のバージョンを選択します。

Anaconda を介した NLTK のインストール

注: 詳細な手順については、このチュートリアルを参照してください。 アナコンダをインストールする

ステップ2)Anaconda プロンプトで、

  1. コマンドを入力
    conda install -c anaconda nltk
  2. Revパッケージのアップグレード、ダウングレード、インストール情報を確認し、yesと入力します。
  3. NLTKがダウンロードされ、インストールされます

Anaconda を介した NLTK のインストール

NLTK データセット

NLTK モジュールには、使用するためにダウンロードする必要がある利用可能なデータセットが多数あります。 より専門的にはこう呼ばれます コー​​パス。 いくつかの例は次のとおりです ストップワード, グーテンベルク, フレームネット_v15, 大きい文法などがあります。

NLTK のすべてのパッケージをダウンロードする方法

ステップ1)実行する Python 通訳 in Windows またはLinux

ステップ2)

  1. コマンドを入力してください
import nltk
nltk.download ()
  1. NLTKのダウンロードウィンドウが開きます。 [ダウンロード] ボタンをクリックしてデータセットをダウンロードします。 インターネット接続に応じて、このプロセスには時間がかかります

NLTK のすべてのパッケージをダウンロード

注: [ファイル] > [ダウンロード ディレクトリの変更] をクリックして、ダウンロードの場所を変更できます。

NLTK のすべてのパッケージをダウンロード

ステップ3) インストールされたデータをテストするには、次のコードを使用します。

>>> from nltk.corpus import brown
>>>brown.words()

[「ザ」、「フルトン」、「郡」、「グランド」、「陪審」、「言った」、…]

NLTK のすべてのパッケージをダウンロード

NLP スクリプトの実行

NLP スクリプトがローカル PC 上でどのように実行されるかについて説明します。 市場には自然言語処理用のライブラリが多数存在します。 したがって、ライブラリの選択は要件を満たすかどうかによって決まります。 ここにリストがあります NLP ライブラリ.

NLTK スクリプトを実行する方法

ステップ1) お気に入りのコード エディターでコードをコピーし、ファイルを次の名前で保存します。NLTKサンプル.py

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

NLTK スクリプトを実行する

コードの説明:

  1. このプログラムの目的は、指定されたテキストからあらゆる種類の句読点を削除することでした。 のモジュールである「RegexpTokenizer」をインポートしました。 NLTK。 式、記号、文字、数値など、必要なものすべてを削除します。
  2. 正規表現を「RegexpTokenizer」モジュールに渡しました。
  3. さらに、「tokenize」モジュールを使用して単語をトークン化しました。 出力は「filterdText」変数に保存されます。
  4. そして、「print()」を使用してそれらを印刷します。

ステップ2) コマンドプロンプトで

  • ファイルを保存した場所に移動します
  • コマンドを実行する Python NLTKサンプル.py

NLTK スクリプトを実行する

これにより、出力は次のように表示されます。

['こんにちは'、'Guru99'、'あなた'、'持っています'、'構築'、'a'、'とても'、'良い'、'サイト'、'そして'、'私'、'愛'、'訪問中'、'あなたの'、'サイト']