NLTK:n lataaminen ja asentaminen
โก รlykรคs yhteenveto
Lataa ja asenna NLTK laitteellesi Windows, Macilla tai Linuxilla asentamalla Python ensin ja sitten lisรครค luonnonmukaiset Language Toolkitin pipin tai Anacondan kautta ja korpusdatajoukkojen lataamisen.

NLTK:n asentaminen sisรครคn Windows
Opi mรครคrittรคmรครคn NLTK laitteella Windows komentokehotteesta. Alla olevat ohjeet olettavat Python ei ole vielรค asennettu, joten ensimmรคinen vaihe on asentaa Python.
asentaminen Python in Windows
Vaihe 1) Avaa linkki https://www.python.org/downloads/, ja valitse uusin Windows vapauta.
HuomautuksiaVanhemman version kaikki julkaisut lรถytyvรคt Lataukset-vรคlilehdeltรค.
Vaihe 2) Napsauta ladattua asennustiedostoa.
Vaihe 3) Valitse Mukauta asennusta.
Vaihe 4) Napsauta SEURAAVA.
Vaihe 5) Seuraavassa nรคytรถssรค:
- Valitse lisรคasetukset.
- Anna mukautettu asennussijainti. Tรคssรค esimerkissรค C-aseman kansio on valittu helpomman kรคytรถn takaamiseksi.
- Valitse Asenna.
Vaihe 6) Napsauta Sulje-painiketta, kun asennus on valmis.
Vaihe 7) Kopioi Skriptit-kansion polku.
Vaihe 8) In Windows komentokehote:
- Siirry pip-kansion sijaintiin.
- Kirjoita komento asentaaksesi NLTK:n:
pip3 install nltk
- Asennuksen pitรคisi valmistua onnistuneesti.
HUOMAUTUS: For Python 2, kรคytรค komentoa pip2 install nltk.
Vaihe 9) Vuodesta Windows Kรคynnistรค-valikosta etsi ja avaa Python Kuori.
Vaihe 10) Varmista asennuksen toimivuus suorittamalla alla oleva komento:
import nltk
Jos virheitรค ei tule nรคkyviin, asennus on valmis.
NLTK:n asentaminen Maciin/Linuxiin
NLTK:n asentaminen Maciin tai Linuxiin vaatii Python paketinhallinta pip. Jos pip ei ole asennettu, suorita prosessi loppuun noudattamalla alla olevia ohjeita.
Vaihe 1) Pรคivitรค paketti-indeksi ty:llรคping alla oleva komento:
sudo apt update
Vaihe 2) Asenna pip kohteelle Python 3:
sudo apt install python3-pip
Voit asentaa pipin myรถs komennolla easy_install:
sudo apt-get install python-setuptools python-dev build-essential
Kun easy_install on asennettu, asenna pip suorittamalla alla oleva komento:
sudo easy_install pip
Vaihe 3) Asenna NLTK seuraavalla komennolla:
sudo pip install -U nltk sudo pip3 install -U nltk
NLTK:n asennus Anacondan kautta
Vaihe 1) Asenna Anaconda kรคymรคllรค osoitteessa https://www.anaconda.com/products/individual ja valitsemalla Python tarvitsemasi versio.
Huomautus: Katso tรคstรค opetusohjelmasta yksityiskohtaiset vaiheet asenna Anaconda.
Vaihe 2) Anaconda-kehotteessa:
- Kirjoita komento:
conda install -c anaconda nltk
- RevKatso paketin pรคivitys-, alennettuun versioon pรคivittรคminen ja asennustiedot ja kirjoita sitten kyllรค.
- NLTK ladataan ja asennetaan.
NLTK Dataset
NLTK-moduuli sisรคltรครค useita datasettejรค, jotka sinun on ladattava ennen kรคyttรถรค. Teknisesti ottaen kutakin datasettiรค kutsutaan corpusYleisiรค esimerkkejรค ovat mm. ohitettavien sanojen, Gutenberg, framenet_v15, isot_kieliopit, ruskeaja wordnet.
Kuinka ladata kaikki NLTK-paketit
Vaihe 1) Suorita Python tulkki in Windows tai Linux.
Vaihe 2)
- Syรถtรค komennot:
import nltk nltk.download ()
- NLTK Downloader -ikkuna avautuu. Lataa tietojoukko napsauttamalla Lataa-painiketta. Tรคmรค prosessi vie aikaa internet-yhteydestรคsi riippuen.
HUOMAUTUS: Voit muuttaa lataussijaintia napsauttamalla Tiedosto > Muuta lataushakemistoa.
Vaihe 3) Testaa asennettuja tietoja kรคyttรคmรคllรค seuraavaa koodia:
>>> from nltk.corpus import brown >>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said',โฆ]
NLP-skriptin suorittaminen
Tรคssรค osiossa selitetรครคn, miten NLP-skripti suoritetaan paikallisella tietokoneella. Oikean kirjaston valinta riippuu tarpeistasi. Katso virallinen luettelo NLP-kirjastot vaihtoehtoja, kuten spaCy, gensim ja TextBlob.
Kuinka suorittaa NLTK-skripti
Vaihe 1) Kopioi koodi suosikkikoodieditorissasi ja tallenna tiedosto nimellรค NLTKsample.py:
from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)
Code Selitys:
- Tรคmรคn ohjelman tavoitteena on poistaa kaikenlaiset vรคlimerkit annetusta tekstistรค. Toimme jรคrjestelmรครคn โRegexpTokenizerโ -moduulin, joka on NLTK joka poistaa valitsemasi lausekkeen, symbolin, merkin tai numeerisen arvon.
- Sรครคnnรถllinen lauseke vรคlitetรครคn โRegexpTokenizerโ-moduulille.
- Teksti tokenisoidaan โtokenizeโ-metodilla, ja tuloste tallennetaan โfilterdTextโ-muuttujaan.
- Tulos tulostetaan kรคyttรคmรคllรค funktiota โprint():โ.
Vaihe 2) Komentokehotteessa:
- Siirry sijaintiin, johon tallensit tiedoston.
- Suorita komento
python NLTKsample.py.
Tuotos on:
['Hei', 'Guru99', 'sinรค', 'on', 'rakentaa', 'erittรคin', 'hyvรค', 'sivusto', 'ja', 'minรค', 'rakastan', 'vierailemassa', 'sinun', 'sivusto']


















