NLTKをダウンロードしてインストールする方法 Windows/マック

NLTK をインストールする Windows

このパートでは、ターミナル (コマンド プロンプト) 経由で NLTK をセットアップする方法を学びます。 windows).

以下に示す手順は、Python がインストールされていないことを前提としています。 したがって、最初のステップはPythonをインストールすることです。

Python をインストールする Windows

ステップ1) リンクに移動 https://www.python.org/downloads/, 最新バージョンを選択します windows.

Python をインストールする Windows

Note: 最新バージョンをダウンロードしたくない場合は、ダウンロード タブにアクセスしてすべてのリリースを確認できます。

Python をインストールする Windows

ステップ2) ダウンロードしたファイルをクリックします

Python をインストールする Windows

ステップ3)「インストールのカスタマイズ」を選択します

Python をインストールする Windows

ステップ4) [次へ]をクリックします

Python をインストールする Windows

ステップ5) 次の画面で

  1. 詳細オプションを選択します
  2. カスタムのインストール場所を指定します。私の場合は、扱いやすいようにCドライブ上のフォルダーを選択しています。 opera生産
  3. インストールをクリックします。

Python をインストールする Windows

ステップ6) インストールが完了したら、「閉じる」ボタンをクリックします。

Python をインストールする Windows

ステップ7) Scripts フォルダーのパスをコピーします。

Python をインストールする Windows

ステップ8) In windows コマンドプロンプト

  • pip フォルダーの場所に移動します
  • コマンドを入力してNLTKをインストールします
    pip3 install nltk
  • インストールは正常に完了するはずです

Python をインストールする Windows

注意: Python2 の場合は、コマンドpip2 install nltkを使用します。

ステップ9) In Windows [スタート]メニューからPythonShellを検索して開きます

Python をインストールする Windows

ステップ10) 以下のコマンドを実行すると、インストールが正確かどうかを確認できます。

import nltk

Python をインストールする Windows

エラーが表示されなければ、インストールは完了です。

Mac/Linux への NLTK のインストール

Mac/Unix に NLTK をインストールするには、Python パッケージ マネージャー pip で nltk をインストールする必要があります。 pip がインストールされていない場合は、以下の手順に従ってプロセスを完了してください。

ステップ1) 以下のコマンドを入力してパッケージインデックスを更新します。

sudo apt update

ステップ2) Python 3 の pip のインストール:

sudo apt install python3-pip

easy_install を使用して pip をインストールすることもできます。

sudo apt-get install python-setuptools  python-dev build-essential

これで easy_install がインストールされました。 以下のコマンドを実行して pip をインストールします

sudo easy_install pip

ステップ3)以下を使用してくださいwing NLTKをインストールするコマンド

sudo pip install -U nltk
sudo pip3 install -U nltk

Anaconda を介した NLTK のインストール

ステップ1) にアクセスして、anaconda (別のパッケージのインストールにも使用できます) をインストールしてください。 https://www.anaconda.com/products/individual anaconda にインストールする必要がある Python のバージョンを選択します。

Anaconda を介した NLTK のインストール

注: 詳細な手順については、このチュートリアルを参照してください。 アナコンダをインストールする

ステップ2)Anaconda プロンプトで、

  1. コマンドを入力
    conda install -c anaconda nltk
  2. パッケージを確認する upgrade、ダウングレードし、情報をインストールして「yes」と入力します
  3. NLTKがダウンロードされ、インストールされます

Anaconda を介した NLTK のインストール

NLTK データセット

NLTK モジュールには、使用するためにダウンロードする必要がある利用可能なデータセットが多数あります。 より専門的にはこう呼ばれます コー​​パス。 いくつかの例は次のとおりです ストップワード, グーテンベルク, フレームネット_v15, 大きい文法などがあります。

NLTK のすべてのパッケージをダウンロードする方法

ステップ1)実行する Pythonインタプリタ in Windows またはLinux

ステップ2)

  1. コマンドを入力してください
import nltk
nltk.download ()
  1. NLTKのダウンロードウィンドウが開きます。 [ダウンロード] ボタンをクリックしてデータセットをダウンロードします。 インターネット接続に応じて、このプロセスには時間がかかります

NLTK のすべてのパッケージをダウンロード

注意: [ファイル] > [ダウンロード ディレクトリの変更] をクリックして、ダウンロードの場所を変更できます。

NLTK のすべてのパッケージをダウンロード

ステップ3) インストールされたデータをテストするには、次のコマンドを使用します。wing コード

>>> from nltk.corpus import brown
>>>brown.words()

[「ザ」、「フルトン」、「郡」、「グランド」、「陪審」、「言った」、…]

NLTK のすべてのパッケージをダウンロード

NLP スクリプトの実行

NLP スクリプトがローカル PC 上でどのように実行されるかについて説明します。 市場には自然言語処理用のライブラリが多数存在します。 したがって、ライブラリの選択は要件を満たすかどうかによって決まります。 ここにリストがあります NLP ライブラリ.

NLTK スクリプトを実行する方法

ステップ1) お気に入りのコード エディターでコードをコピーし、ファイルを次の名前で保存します。NLTKサンプル.py

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

NLTK スクリプトを実行する

コードの説明:

  1. このプログラムの目的は、指定されたテキストからあらゆる種類の句読点を削除することでした。 のモジュールである「RegexpTokenizer」をインポートしました。 NLTK。 式、記号、文字、数値など、必要なものすべてを削除します。
  2. 正規表現を「RegexpTokenizer」モジュールに渡しました。
  3. さらに、「tokenize」モジュールを使用して単語をトークン化しました。 出力は「filterdText」変数に保存されます。
  4. そして、「print()」を使用してそれらを印刷します。

ステップ2) コマンドプロンプトで

  • ファイルを保存した場所に移動します
  • コマンド Python NLTKsample.py を実行します。

NLTK スクリプトを実行する

これにより、出力は次のように表示されます。

['こんにちは'、'Guru99'、'あなた'、'持っています'、'構築'、'a'、'とても'、'良い'、'サイト'、'そして'、'私'、'愛'、'訪問中'、'あなたの'、'サイト']