Hur man laddar ner och installerar NLTK på Windows/Mac
Installerar NLTK i Windows
I den här delen kommer vi att lära oss hur man gör installationen av NLTK via terminal (kommandotolken i Windows).
Instruktionerna nedan är baserade på antagandet att du inte har python installerat. Så det första steget är att installera python.
Installera Python in Windows
Steg 1) Gå till länken https://www.python.org/downloads/, och välj den senaste versionen för Windows.
Anmärkningar: Om du inte vill ladda ner den senaste versionen kan du besöka nedladdningsfliken och se alla utgåvor.
Steg 2) Klicka på den nedladdade filen
Steg 3)Välj Anpassa installation
Steg 4) Klicka på NÄSTA
Steg 5) På nästa skärm
- Välj de avancerade alternativen
- Ange en anpassad installationsplats. I mitt fall väljs en mapp på C-enheten för att underlätta driften
- Klicka på Installera
Steg 6) Klicka på knappen Stäng när installationen är klar.
Steg 7) Kopiera sökvägen till mappen Skript.
Steg 8) I Windows kommandotolk
- Navigera till platsen för pip-mappen
- Ange kommandot för att installera NLTK
pip3 install nltk
- Installationen bör göras framgångsrikt
ANMÄRKNINGAR: För Python2 använd kommandopip2 installera nltk
Steg 9) In Windows Startmeny, sök och öppna PythonShell
Steg 10) Du kan verifiera om installationen är korrekt med kommandot nedan
import nltk
Om du inte ser något fel är installationen klar.
Installera NLTK i Mac/Linux
Att installera NLTK i Mac/Unix kräver python package manager pip för att installera nltk. Om pip inte är installerat, följ instruktionerna nedan för att slutföra processen
Steg 1) Uppdatera paketindexet genom att skriva kommandot nedan
sudo apt update
Steg 2) Installera pip för Python 3:
sudo apt install python3-pip
Du kan också installera pip med easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Nu är easy_install installerat. Kör kommandot nedan för att installera pip
sudo easy_install pip
Steg 3)Använd följande kommando för att installera NLTK
sudo pip install -U nltk sudo pip3 install -U nltk
Installerar NLTK genom Anaconda
Steg 1) Installera anaconda (som också kan användas för att installera olika paket) genom att besöka https://www.anaconda.com/products/individual och välj vilken version av python du behöver installera för anaconda.
Obs: Se denna handledning för detaljerade steg till installera anaconda
Steg 2)I Anaconda-prompten,
- Ange kommando
conda install -c anaconda nltk
- Revse paketuppgraderingen, nedgradera, installera information och ange ja
- NLTK laddas ner och installeras
NLTK Dataset
NLTK-modulen har många datauppsättningar tillgängliga som du behöver ladda ner för att kunna använda. Mer tekniskt kallas det corpus. Några av exemplen är stoppord, Gutenberg, framenet_v15, stora_grammatikoch så vidare.
Hur man laddar ner alla paket av NLTK
Steg 1)Kör Python tolk in Windows eller Linux
Steg 2)
- Ange kommandona
import nltk nltk.download ()
- NLTK-nedladdat fönster öppnas. Klicka på knappen Ladda ner för att ladda ner datasetet. Denna process kommer att ta tid, baserat på din internetanslutning
OBS: Du kan ändra nedladdningsplatsen genom att klicka på Arkiv> Ändra nedladdningskatalog
Steg 3) För att testa den installerade datan använd följande kod
>>> from nltk.corpus import brown >>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', …]
Kör NLP-skriptet
Vi kommer att diskutera hur NLP-skript kommer att köras på vår lokala PC. Det finns många bibliotek för Natural Language Processing på marknaden. Så att välja ett bibliotek beror på att det passar dina krav. Här är listan på NLP-bibliotek.
Hur man kör NLTK-skript
Steg 1) Kopiera koden i din favoritkodredigerare och spara filen som "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
Kodförklaring:
- I detta program var målet att ta bort alla typer av skiljetecken från given text. Vi importerade "RegexpTokenizer" som är en modul av Nltk. Det tar bort alla uttryck, symboler, tecken, numeriska eller vad du vill.
- Du har precis skickat det vanliga uttrycket till modulen "RegexpTokenizer".
- Vidare tokeniserade vi ordet med "tokenize"-modulen. Utdata lagras i variabeln "filterdText".
- Och skrev ut dem med "print()."
Steg 2) I kommandotolken
- Navigera till platsen där du har sparat filen
- Kör kommandot Python NLTKsample.py
Detta kommer att visa utdata som:
['Hej', 'Guru99', 'Du', 'har', 'bygga', 'a', 'mycket', 'bra', 'webbplats', 'och', 'jag', 'älskar', ' besöker', 'din', 'webbplats']