Hoe NLTK te downloaden en te installeren
โก Slimme samenvatting
Download en installeer NLTK op Windows, Mac of Linux door te installeren Python eerst, en dan de natuurlijke ingrediรซnten toevoegen. Language Toolkit installeren via pip of Anaconda en de corpusdatasets downloaden.

NLTK installeren Windows
Leer hoe je NLTK instelt op Windows vanuit de opdrachtprompt. De onderstaande instructies gaan ervan uit dat... Python is nog niet geรฏnstalleerd, dus de eerste stap is installeren Python.
Installatie van het Python in Windows
Stap 1) Open de link https://www.python.org/downloads/, en selecteer de nieuwste Windows vrij.
NoteVoor een oudere versie kunt u naar het tabblad Downloads gaan om alle releases te bekijken.
Stap 2) Klik op het gedownloade installatiebestand.
Stap 3) Selecteer 'Installatie aanpassen'.
Stap 4) Klik op VOLGENDE.
Stap 5) Op het volgende scherm:
- Selecteer de geavanceerde opties.
- Geef een aangepaste installatielocatie op. In dit voorbeeld is een map op de C-schijf gekozen voor gemakkelijke toegang.
- Klik op Installeren.
Stap 6) Klik op de knop 'Sluiten' zodra de installatie is voltooid.
Stap 7) Kopieer het pad van uw map Scripts.
Stap 8) In de Windows opdrachtprompt:
- Navigeer naar de locatie van de pip-map.
- Voer het commando in om NLTK te installeren:
pip3 install nltk
- De installatie zou succesvol moeten verlopen.
NOTITIE: Voor Python 2. Gebruik het commando pip2 install nltk.
Stap 9) Van de Windows Startmenu, zoek en open de Python Shell.
Stap 10) Controleer of de installatie werkt door de onderstaande opdracht uit te voeren:
import nltk
Als er geen foutmeldingen verschijnen, is de installatie voltooid.
NLTK installeren op Mac/Linux
Voor het installeren van NLTK op Mac of Linux is het volgende vereist: Python pakketbeheerder pip. Als pip niet is geรฏnstalleerd, volg dan de onderstaande instructies om het proces te voltooien.
Stap 1) Update de pakketindex door typing het onderstaande commando:
sudo apt update
Stap 2) Installeer pip voor Python 3:
sudo apt install python3-pip
Je kunt pip ook installeren via easy_install:
sudo apt-get install python-setuptools python-dev build-essential
Nadat easy_install is geรฏnstalleerd, voert u de onderstaande opdracht uit om pip te installeren:
sudo easy_install pip
Stap 3) Gebruik de volgende opdracht om NLTK te installeren:
sudo pip install -U nltk sudo pip3 install -U nltk
NLTK installeren via Anaconda
Stap 1) Installeer Anaconda via de volgende link: https://www.anaconda.com/products/individual en het selecteren van de Python de versie die je nodig hebt.
Opmerking: Raadpleeg deze tutorial voor gedetailleerde stappen Anaconda installeren.
Stap 2) In de Anaconda-prompt:
- Voer de opdracht in:
conda install -c anaconda nltk
- RevBekijk de informatie over het upgraden, downgraden en installeren van het pakket en klik vervolgens op 'ja'.
- NLTK wordt gedownload en geรฏnstalleerd.
NLTK-gegevensset
De NLTK-module wordt geleverd met veel datasets die u moet downloaden voordat u ze kunt gebruiken. Technisch gezien wordt elke dataset een genoemd. corpusVeelvoorkomende voorbeelden zijn: stopwoorden, gutenberg, framenet_v15, grote_grammatica's, bruinen woordnet.
Hoe alle pakketten van NLTK te downloaden
Stap 1) Voer de ... uit Python tolk in Windows of Linux.
Stap 2)
- Voer de commando's in:
import nltk nltk.download ()
- Het NLTK Downloader-venster wordt geopend. Klik op de knop Downloaden om de dataset op te halen. Dit proces kan enige tijd in beslag nemen, afhankelijk van uw internetverbinding.
NOTITIE: Je kunt de downloadlocatie wijzigen door te klikken op Bestand > Downloadmap wijzigen.
Stap 3) Om de geรฏnstalleerde gegevens te testen, gebruikt u de volgende code:
>>> from nltk.corpus import brown >>>brown.words()
['De', 'Fulton', 'County', 'Grand', 'Jury', 'zei', โฆ]
Het NLP-script uitvoeren
In dit gedeelte wordt uitgelegd hoe een NLP-script op een lokale pc werkt. De juiste bibliotheekkeuze hangt af van uw vereisten. Zie de officiรซle lijst. NLP-bibliotheken voor alternatieven zoals spaCy, gensim en TextBlob.
Hoe NLTK-script uit te voeren
Stap 1) Kopieer de code in uw favoriete code-editor en sla het bestand op als NLTKsample.py:
from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)
Code Uitleg:
- Het doel van dit programma is om alle leestekens uit een gegeven tekst te verwijderen. We hebben "RegexpTokenizer" geรฏmporteerd, een module van NLTK Daarmee verwijder je elke gewenste uitdrukking, symbool, teken of numerieke waarde.
- Een reguliere expressie wordt doorgegeven aan de module "RegexpTokenizer".
- De tekst wordt getokeniseerd met behulp van de methode "tokenize", en de uitvoer wordt opgeslagen in de variabele "filterdText".
- Het resultaat wordt afgedrukt met behulp van โprint()โ.
Stap 2) In de opdrachtprompt:
- Navigeer naar de locatie waar u het bestand hebt opgeslagen.
- Voer het commando uit
python NLTKsample.py.
De uitvoer is:
['Hallo', 'Guru99', 'Jij', 'hebt', 'een', 'heel', 'goede', 'site', 'en', 'ik', 'vind het heerlijk', 'om' 'jouw', 'site' te bezoeken]


















