Hoe NLTK te downloaden en te installeren

โšก Slimme samenvatting

Download en installeer NLTK op Windows, Mac of Linux door te installeren Python eerst, en dan de natuurlijke ingrediรซnten toevoegen. Language Toolkit installeren via pip of Anaconda en de corpusdatasets downloaden.

  • โœ… Eis: Install Python voordat NLTK wordt toegevoegd.
  • โš™๏ธ Installeren: Gebruik pip, easy_install of Anaconda.
  • ๐Ÿ“š databronnen: Voer nltk.download() uit om de corpora op te halen.
  • ๐Ÿ Verifiรซren: import nltk in de Python schelp.
  • ๐Ÿค– AI-gebruik: Tokenisatie en tagging voor NLP-pipelines.

Download en installeer NLTK

NLTK installeren Windows

Leer hoe je NLTK instelt op Windows vanuit de opdrachtprompt. De onderstaande instructies gaan ervan uit dat... Python is nog niet geรฏnstalleerd, dus de eerste stap is installeren Python.

Installatie van het Python in Windows

Stap 1) Open de link https://www.python.org/downloads/, en selecteer de nieuwste Windows vrij.

Installatie van het Python in Windows

NoteVoor een oudere versie kunt u naar het tabblad Downloads gaan om alle releases te bekijken.

Installatie van het Python in Windows

Stap 2) Klik op het gedownloade installatiebestand.

Installatie van het Python in Windows

Stap 3) Selecteer 'Installatie aanpassen'.

Installatie van het Python in Windows

Stap 4) Klik op VOLGENDE.

Installatie van het Python in Windows

Stap 5) Op het volgende scherm:

  1. Selecteer de geavanceerde opties.
  2. Geef een aangepaste installatielocatie op. In dit voorbeeld is een map op de C-schijf gekozen voor gemakkelijke toegang.
  3. Klik op Installeren.

Installatie van het Python in Windows

Stap 6) Klik op de knop 'Sluiten' zodra de installatie is voltooid.

Installatie van het Python in Windows

Stap 7) Kopieer het pad van uw map Scripts.

Installatie van het Python in Windows

Stap 8) In de Windows opdrachtprompt:

  • Navigeer naar de locatie van de pip-map.
  • Voer het commando in om NLTK te installeren:
    pip3 install nltk
  • De installatie zou succesvol moeten verlopen.

Installatie van het Python in Windows

NOTITIE: Voor Python 2. Gebruik het commando pip2 install nltk.

Stap 9) Van de Windows Startmenu, zoek en open de Python Shell.

Installatie van het Python in Windows

Stap 10) Controleer of de installatie werkt door de onderstaande opdracht uit te voeren:

import nltk

Installatie van het Python in Windows

Als er geen foutmeldingen verschijnen, is de installatie voltooid.

NLTK installeren op Mac/Linux

Voor het installeren van NLTK op Mac of Linux is het volgende vereist: Python pakketbeheerder pip. Als pip niet is geรฏnstalleerd, volg dan de onderstaande instructies om het proces te voltooien.

Stap 1) Update de pakketindex door typing het onderstaande commando:

sudo apt update

Stap 2) Installeer pip voor Python 3:

sudo apt install python3-pip

Je kunt pip ook installeren via easy_install:

sudo apt-get install python-setuptools  python-dev build-essential

Nadat easy_install is geรฏnstalleerd, voert u de onderstaande opdracht uit om pip te installeren:

sudo easy_install pip

Stap 3) Gebruik de volgende opdracht om NLTK te installeren:

sudo pip install -U nltk
sudo pip3 install -U nltk

NLTK installeren via Anaconda

Stap 1) Installeer Anaconda via de volgende link: https://www.anaconda.com/products/individual en het selecteren van de Python de versie die je nodig hebt.

NLTK installeren via Anaconda

Opmerking: Raadpleeg deze tutorial voor gedetailleerde stappen Anaconda installeren.

Stap 2) In de Anaconda-prompt:

  1. Voer de opdracht in:
    conda install -c anaconda nltk
  2. RevBekijk de informatie over het upgraden, downgraden en installeren van het pakket en klik vervolgens op 'ja'.
  3. NLTK wordt gedownload en geรฏnstalleerd.

NLTK installeren via Anaconda

NLTK-gegevensset

De NLTK-module wordt geleverd met veel datasets die u moet downloaden voordat u ze kunt gebruiken. Technisch gezien wordt elke dataset een genoemd. corpusVeelvoorkomende voorbeelden zijn: stopwoorden, gutenberg, framenet_v15, grote_grammatica's, bruinen woordnet.

Hoe alle pakketten van NLTK te downloaden

Stap 1) Voer de ... uit Python tolk in Windows of Linux.

Stap 2)

  1. Voer de commando's in:
import nltk
nltk.download ()
  1. Het NLTK Downloader-venster wordt geopend. Klik op de knop Downloaden om de dataset op te halen. Dit proces kan enige tijd in beslag nemen, afhankelijk van uw internetverbinding.

Download alle pakketten van NLTK

NOTITIE: Je kunt de downloadlocatie wijzigen door te klikken op Bestand > Downloadmap wijzigen.

Download alle pakketten van NLTK

Stap 3) Om de geรฏnstalleerde gegevens te testen, gebruikt u de volgende code:

>>> from nltk.corpus import brown
>>>brown.words()

['De', 'Fulton', 'County', 'Grand', 'Jury', 'zei', โ€ฆ]

Download alle pakketten van NLTK

Het NLP-script uitvoeren

In dit gedeelte wordt uitgelegd hoe een NLP-script op een lokale pc werkt. De juiste bibliotheekkeuze hangt af van uw vereisten. Zie de officiรซle lijst. NLP-bibliotheken voor alternatieven zoals spaCy, gensim en TextBlob.

Hoe NLTK-script uit te voeren

Stap 1) Kopieer de code in uw favoriete code-editor en sla het bestand op als NLTKsample.py:

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Voer NLTK-script uit

Code Uitleg:

  1. Het doel van dit programma is om alle leestekens uit een gegeven tekst te verwijderen. We hebben "RegexpTokenizer" geรฏmporteerd, een module van NLTK Daarmee verwijder je elke gewenste uitdrukking, symbool, teken of numerieke waarde.
  2. Een reguliere expressie wordt doorgegeven aan de module "RegexpTokenizer".
  3. De tekst wordt getokeniseerd met behulp van de methode "tokenize", en de uitvoer wordt opgeslagen in de variabele "filterdText".
  4. Het resultaat wordt afgedrukt met behulp van โ€œprint()โ€.

Stap 2) In de opdrachtprompt:

  • Navigeer naar de locatie waar u het bestand hebt opgeslagen.
  • Voer het commando uit python NLTKsample.py.

Voer NLTK-script uit

De uitvoer is:

['Hallo', 'Guru99', 'Jij', 'hebt', 'een', 'heel', 'goede', 'site', 'en', 'ik', 'vind het heerlijk', 'om' 'jouw', 'site' te bezoeken]

Veelgestelde vragen

Het pip-commando installeert de bibliotheek zelf, terwijl nltk.download() corpora en getrainde modellen zoals stopwords, punkt en wordnet ophaalt. Beide stappen zijn nodig voordat tekst getokeniseerd of getagd kan worden.

Ja. NLTK blijft populair voor het voorbewerken van tekst die gebruikt wordt in taalleermodellen, waaronder tokenisatie, het verwijderen van stopwoorden, stemming en het toevoegen van woordsoorten. Het wordt ook veel gebruikt in het onderwijs en onderzoek dankzij de duidelijke API en de klassieke corpora.

NLTK is het meest geschikt voor het leren van de basisprincipes van NLP. spaCy is sneller voor productie, terwijl Face Transformers knuffelen biedt vooraf getrainde deep-learningmodellen aan. Veel AI-projecten combineren NLTK-voorverwerking met transformer-inferentie.

Vat dit bericht samen met: