So laden Sie NLTK herunter und installieren es auf Windows/ Mac

NLTK installieren in Windows

In diesem Teil erfahren wir, wie man NLTK über das Terminal (Eingabeaufforderung in Windows) einrichtet.

Die folgenden Anweisungen basieren auf der Annahme, dass Sie Python nicht installiert haben. Der erste Schritt besteht also darin, Python zu installieren.

Montage von Python in Windows

Schritt 1) Gehe zum Link https://www.python.org/downloads/, und wählen Sie die neueste Version für Windows aus.

Montage von Python in Windows

Note: Wenn Sie nicht die neueste Version herunterladen möchten, können Sie den Download-Tab besuchen und alle Versionen sehen.

Montage von Python in Windows

Schritt 2) Klicken Sie auf die heruntergeladene Datei

Montage von Python in Windows

Schritt 3)Wählen Sie „Installation anpassen“.

Montage von Python in Windows

Schritt 4) Weiter klicken

Montage von Python in Windows

Schritt 5) Im nächsten Bildschirm

  1. Wählen Sie die erweiterten Optionen
  2. Geben Sie einen benutzerdefinierten Installationsort an. In meinem Fall wurde aus Gründen der Benutzerfreundlichkeit ein Ordner auf Laufwerk C gewählt.
  3. Klicken Sie auf Installieren

Montage von Python in Windows

Schritt 6) Klicken Sie nach Abschluss der Installation auf die Schaltfläche „Schließen“.

Montage von Python in Windows

Schritt 7) Kopieren Sie den Pfad Ihres Skriptordners.

Montage von Python in Windows

Schritt 8) In der Windows-Eingabeaufforderung

  • Navigieren Sie zum Speicherort des Pip-Ordners
  • Geben Sie den Befehl ein, um NLTK zu installieren
    pip3 install nltk
  • Die Installation sollte erfolgreich durchgeführt werden

Montage von Python in Windows

HINWEIS: Zum Python2 verwenden Sie den Befehlpip2 install nltk

Schritt 9) In Windows Startmenü, suchen und öffnen PythonSchale

Montage von Python in Windows

Schritt 10) Sie können überprüfen, ob die Installation korrekt ist, indem Sie den folgenden Befehl eingeben

import nltk

Montage von Python in Windows

Wenn kein Fehler angezeigt wird, ist die Installation abgeschlossen.

NLTK unter Mac/Linux installieren

Für die Installation von NLTK unter Mac/Unix ist der Python-Paketmanager pip erforderlich, um nltk zu installieren. Wenn pip nicht installiert ist, befolgen Sie bitte die folgenden Anweisungen, um den Vorgang abzuschließen

Schritt 1) Aktualisieren Sie den Paketindex, indem Sie den folgenden Befehl eingeben

sudo apt update

Schritt 2) Installieren von pip für Python 3:

sudo apt install python3-pip

Sie können pip auch mit easy_install installieren.

sudo apt-get install python-setuptools  python-dev build-essential

Jetzt ist easy_install installiert. Führen Sie den folgenden Befehl aus, um pip zu installieren

sudo easy_install pip

Schritt 3)Verwenden Sie den folgenden Befehl, um NLTK zu installieren

sudo pip install -U nltk
sudo pip3 install -U nltk

NLTK über Anaconda installieren

Schritt 1) Bitte installieren Sie Anaconda (das auch zur Installation verschiedener Pakete verwendet werden kann) unter https://www.anaconda.com/products/individual und wählen Sie aus, welche Python-Version Sie für Anaconda installieren müssen.

NLTK über Anaconda installieren

Hinweis: Detaillierte Schritte dazu finden Sie in diesem Tutorial Anakonda installieren

Schritt 2)In der Anaconda-Eingabeaufforderung:

  1. Befehl eingeben
    conda install -c anaconda nltk
  2. RevSehen Sie sich die Informationen zum Paket-Upgrade, Downgrade und zur Installation an und geben Sie „Ja“ ein.
  3. NLTK wird heruntergeladen und installiert

NLTK über Anaconda installieren

NLTK-Datensatz

Das NLTK-Modul verfügt über viele Datensätze, die Sie zur Verwendung herunterladen müssen. Technisch gesehen heißt es Korpus. Einige der Beispiele sind Stoppwörter, Gutenberg, Framenet_v15, große_grammatikenund so weiter.

So laden Sie alle NLTK-Pakete herunter

Schritt 1)Führen Sie die Python Dolmetscher in Windows oder Linux

Schritt 2)

  1. Geben Sie die Befehle ein
import nltk
nltk.download ()
  1. Das Fenster „NLTK heruntergeladen“ wird geöffnet. Klicken Sie auf die Schaltfläche „Herunterladen“, um den Datensatz herunterzuladen. Dieser Vorgang kann je nach Internetverbindung einige Zeit in Anspruch nehmen

Laden Sie alle Pakete von NLTK herunter

Anmerkungen: Sie können den Download-Speicherort ändern, indem Sie auf Datei > Download-Verzeichnis ändern klicken

Laden Sie alle Pakete von NLTK herunter

Schritt 3) Um die installierten Daten zu testen, verwenden Sie den folgenden Code

>>> from nltk.corpus import brown
>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', …]

Laden Sie alle Pakete von NLTK herunter

Ausführen des NLP-Skripts

Wir werden besprechen, wie das NLP-Skript auf unserem lokalen PC ausgeführt wird. Es gibt viele Bibliotheken für die Verarbeitung natürlicher Sprache auf dem Markt. Die Auswahl einer Bibliothek hängt also davon ab, ob sie Ihren Anforderungen entspricht. Hier ist die Liste von NLP-Bibliotheken.

So führen Sie ein NLTK-Skript aus

Schritt 1) Kopieren Sie den Code in Ihrem bevorzugten Code-Editor und speichern Sie die Datei unter "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Führen Sie das NLTK-Skript aus

Code-Erklärung:

  1. Das Ziel dieses Programms bestand darin, alle Arten von Satzzeichen aus einem bestimmten Text zu entfernen. Wir haben „RegexpTokenizer“ importiert, ein Modul von NLTK. Es entfernt alle Ausdrücke, Symbole, Zeichen, Zahlen oder andere Dinge, die Sie möchten.
  2. Sie haben gerade den regulären Ausdruck an das Modul „RegexpTokenizer“ übergeben.
  3. Darüber hinaus haben wir das Wort mit dem Modul „tokenize“ tokenisiert. Die Ausgabe wird in der Variablen „filterdText“ gespeichert.
  4. Und druckte sie mit „print()“ aus.

Schritt 2) In der Eingabeaufforderung

  • Navigieren Sie zu dem Speicherort, an dem Sie die Datei gespeichert haben
  • Führen Sie den Befehl aus Python NLTKsample.py

Führen Sie das NLTK-Skript aus

Dies wird die Ausgabe wie folgt anzeigen:

['Hallo', 'Guru99', 'Du', 'habe', 'baue', 'ein', 'sehr', 'gut', 'Seite', 'und', 'Ich', 'liebe', ' „Besuchen“, „Ihre“, „Website“]