Hur man laddar ner och installerar NLTK på Windows/Mac

Installerar NLTK i Windows

I den här delen kommer vi att lära oss hur man gör installationen av NLTK via terminal (kommandotolken i Windows).

Instruktionerna nedan är baserade på antagandet att du inte har python installerat. Så det första steget är att installera python.

Installera Python in Windows

Steg 1) Gå till länken https://www.python.org/downloads/, och välj den senaste versionen för Windows.

Installera Python in Windows

Anmärkningar: Om du inte vill ladda ner den senaste versionen kan du besöka nedladdningsfliken och se alla utgåvor.

Installera Python in Windows

Steg 2) Klicka på den nedladdade filen

Installera Python in Windows

Steg 3)Välj Anpassa installation

Installera Python in Windows

Steg 4) Klicka på NÄSTA

Installera Python in Windows

Steg 5) På nästa skärm

  1. Välj de avancerade alternativen
  2. Ange en anpassad installationsplats. I mitt fall väljs en mapp på C-enheten för att underlätta driften
  3. Klicka på Installera

Installera Python in Windows

Steg 6) Klicka på knappen Stäng när installationen är klar.

Installera Python in Windows

Steg 7) Kopiera sökvägen till mappen Skript.

Installera Python in Windows

Steg 8) I Windows kommandotolk

  • Navigera till platsen för pip-mappen
  • Ange kommandot för att installera NLTK
    pip3 install nltk
  • Installationen bör göras framgångsrikt

Installera Python in Windows

ANMÄRKNINGAR: För Python2 använd kommandopip2 installera nltk

Steg 9) In Windows Startmeny, sök och öppna PythonShell

Installera Python in Windows

Steg 10) Du kan verifiera om installationen är korrekt med kommandot nedan

import nltk

Installera Python in Windows

Om du inte ser något fel är installationen klar.

Installera NLTK i Mac/Linux

Att installera NLTK i Mac/Unix kräver python package manager pip för att installera nltk. Om pip inte är installerat, följ instruktionerna nedan för att slutföra processen

Steg 1) Uppdatera paketindexet genom att skriva kommandot nedan

sudo apt update

Steg 2) Installera pip för Python 3:

sudo apt install python3-pip

Du kan också installera pip med easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

Nu är easy_install installerat. Kör kommandot nedan för att installera pip

sudo easy_install pip

Steg 3)Använd följande kommando för att installera NLTK

sudo pip install -U nltk
sudo pip3 install -U nltk

Installerar NLTK genom Anaconda

Steg 1) Installera anaconda (som också kan användas för att installera olika paket) genom att besöka https://www.anaconda.com/products/individual och välj vilken version av python du behöver installera för anaconda.

Installerar NLTK genom Anaconda

Obs: Se denna handledning för detaljerade steg till installera anaconda

Steg 2)I Anaconda-prompten,

  1. Ange kommando
    conda install -c anaconda nltk
  2. Revse paketuppgraderingen, nedgradera, installera information och ange ja
  3. NLTK laddas ner och installeras

Installerar NLTK genom Anaconda

NLTK Dataset

NLTK-modulen har många datauppsättningar tillgängliga som du behöver ladda ner för att kunna använda. Mer tekniskt kallas det corpus. Några av exemplen är stoppord, Gutenberg, framenet_v15, stora_grammatikoch så vidare.

Hur man laddar ner alla paket av NLTK

Steg 1)Kör Python tolk in Windows eller Linux

Steg 2)

  1. Ange kommandona
import nltk
nltk.download ()
  1. NLTK-nedladdat fönster öppnas. Klicka på knappen Ladda ner för att ladda ner datasetet. Denna process kommer att ta tid, baserat på din internetanslutning

Ladda ner alla paket av NLTK

OBS: Du kan ändra nedladdningsplatsen genom att klicka på Arkiv> Ändra nedladdningskatalog

Ladda ner alla paket av NLTK

Steg 3) För att testa den installerade datan använd följande kod

>>> from nltk.corpus import brown
>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', …]

Ladda ner alla paket av NLTK

Kör NLP-skriptet

Vi kommer att diskutera hur NLP-skript kommer att köras på vår lokala PC. Det finns många bibliotek för Natural Language Processing på marknaden. Så att välja ett bibliotek beror på att det passar dina krav. Här är listan på NLP-bibliotek.

Hur man kör NLTK-skript

Steg 1) Kopiera koden i din favoritkodredigerare och spara filen som "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Kör NLTK-skript

Kodförklaring:

  1. I detta program var målet att ta bort alla typer av skiljetecken från given text. Vi importerade "RegexpTokenizer" som är en modul av Nltk. Det tar bort alla uttryck, symboler, tecken, numeriska eller vad du vill.
  2. Du har precis skickat det vanliga uttrycket till modulen "RegexpTokenizer".
  3. Vidare tokeniserade vi ordet med "tokenize"-modulen. Utdata lagras i variabeln "filterdText".
  4. Och skrev ut dem med "print()."

Steg 2) I kommandotolken

  • Navigera till platsen där du har sparat filen
  • Kör kommandot Python NLTKsample.py

Kör NLTK-skript

Detta kommer att visa utdata som:

['Hej', 'Guru99', 'Du', 'har', 'bygga', 'a', 'mycket', 'bra', 'webbplats', 'och', 'jag', 'älskar', ' besöker', 'din', 'webbplats']