Kuidas NLTK-d alla laadida ja installida Windows/Mac

NLTK installimine sisse Windows

Selles osas saame teada, kuidas seadistada NLTK terminali kaudu (akendes käsuviip).

Allpool antud juhised põhinevad eeldusel, et teil pole Pythonit installitud. Niisiis, esimene samm on pythoni installimine.

paigaldamine Python in Windows

Step 1) Mine lingile https://www.python.org/downloads/, ja valige Windowsi jaoks uusim versioon.

paigaldamine Python in Windows

märkused: kui te ei soovi uusimat versiooni alla laadida, külastage allalaadimise vahekaarti ja vaadake kõiki väljalaseid.

paigaldamine Python in Windows

Step 2) Klõpsake allalaaditud failil

paigaldamine Python in Windows

Step 3)Valige Kohanda installimist

paigaldamine Python in Windows

Step 4) Klõpsake nuppu JÄRGMINE

paigaldamine Python in Windows

Step 5) Järgmisel ekraanil

  1. Valige täpsemad valikud
  2. Määrake kohandatud installikoht. Minu puhul valitakse töö hõlbustamiseks C-draivi kaust
  3. Klõpsake nuppu Installi

paigaldamine Python in Windows

Step 6) Kui installimine on lõpetatud, klõpsake nuppu Sule.

paigaldamine Python in Windows

Step 7) Kopeerige kausta Skriptid tee.

paigaldamine Python in Windows

Step 8) Windowsi käsureal

  • Liikuge pip-kausta asukohta
  • Sisestage NLTK installimiseks käsk
    pip3 install nltk
  • Paigaldamine peaks olema edukas

paigaldamine Python in Windows

MÄRKUSED: Jaoks Python2 kasutage käsku commandpip2 install nltk

Step 9) In Windows Menüü Start, otsige ja avage PythonShell

paigaldamine Python in Windows

Step 10) Alloleva käsu abil saate kontrollida, kas installimine on õige

import nltk

paigaldamine Python in Windows

Kui te tõrget ei näe, on installimine lõppenud.

NLTK installimine Maci/Linuxisse

NLTK installimine Macis/Unixis nõuab nltk installimiseks pythoni paketihaldurit pip. Kui pip pole installitud, järgige protsessi lõpuleviimiseks allolevaid juhiseid

Samm 1) Värskendage paketiindeksit, tippides alloleva käsu

sudo apt update

Samm 2) Pipi paigaldamine jaoks Python 3:

sudo apt install python3-pip

Pipi saate installida ka kasutades easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

Nüüd on easy_install installitud. Pip installimiseks käivitage allolev käsk

sudo easy_install pip

Samm 3)Kasutage NLTK installimiseks järgmist käsku

sudo pip install -U nltk
sudo pip3 install -U nltk

NLTK installimine Anaconda kaudu

Samm 1) Palun installige anaconda (mida saab kasutada ka erinevate pakettide installimiseks) külastades https://www.anaconda.com/products/individual ja valige, millise pythoni versiooni peate anaconda jaoks installima.

NLTK installimine Anaconda kaudu

Märkus. Üksikasjalikud juhised leiate sellest õpetusest paigalda anaconda

Step 2)Anaconda viibas

  1. Sisestage käsk
    conda install -c anaconda nltk
  2. Revlugege paketi versiooniuuendust, alandage versiooni, installige teave ja sisestage jah
  3. NLTK laaditakse alla ja installitakse

NLTK installimine Anaconda kaudu

NLTK andmestik

NLTK moodulil on saadaval palju andmekogumeid, mille peate kasutamiseks alla laadima. Tehnilisemalt nimetatakse seda korpus. Mõned näited on stoppsõnad, Gutenberg, framenet_v15, suured_grammatikadja nii edasi.

Kuidas alla laadida kõiki NLTK pakette

Step 1)Käivita Python tõlk in Windows või Linux

Step 2)

  1. Sisestage käsud
import nltk
nltk.download ()
  1. Avaneb NLTK allalaaditud aken. Andmestiku allalaadimiseks klõpsake allalaadimisnuppu. See protsess võtab teie Interneti-ühenduse põhjal aega

Laadige alla kõik NLTK paketid

MÄRKUS: Allalaadimiskohta saate muuta, klõpsates valikutel Fail > Muuda allalaadimiskataloogi

Laadige alla kõik NLTK paketid

Step 3) Installitud andmete testimiseks kasutage järgmist koodi

>>> from nltk.corpus import brown
>>>brown.words()

["The", "Fulton", "County", "Grand", "žürii", "öeldi", ...]

Laadige alla kõik NLTK paketid

NLP skripti käitamine

Arutame, kuidas NLP-skripti meie kohalikus arvutis käivitatakse. Turul on palju loomuliku keele töötlemise raamatukogusid. Seega sõltub raamatukogu valimine teie vajadustest. Siin on nimekiri NLP raamatukogud.

NLTK skripti käivitamine

Samm 1) Kopeerige kood oma lemmikkoodiredaktoris ja salvestage fail nimega "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Käivitage NLTK skript

Koodi selgitus:

  1. Selle programmi eesmärk oli eemaldada etteantud tekstist igasugused kirjavahemärgid. Importisime "RegexpTokenizer", mis on moodul NLTK. See eemaldab kõik väljendid, sümbolid, märgid, numbrid või kõik asjad, mida iganes soovite.
  2. Olete just edastanud tavaavaldise moodulile „RegexpTokenizer”.
  3. Lisaks muutsime sõna tokenise mooduli abil. Väljund salvestatakse muutujas “filterdText”.
  4. Ja printis need "print ()." abil.

Samm 2) Käsureal

  • Liikuge asukohta, kuhu olete faili salvestanud
  • Käivita käsk Python NLTKsample.py

Käivitage NLTK skript

See näitab väljundit järgmiselt:

['Tere', 'Guru99', 'sina', 'oma', 'ehita', 'a', 'väga', 'hea', 'sait', 'ja', 'mina', 'armastan', ' külastamine", "teie", "sait"]