So laden Sie NLTK herunter und installieren es auf Windows/ Mac

NLTK installieren in Windows

In diesem Teil erfahren Sie, wie Sie NLTK über das Terminal (Eingabeaufforderung in) einrichten windows).

Die folgenden Anweisungen basieren auf der Annahme, dass Sie Python nicht installiert haben. Der erste Schritt besteht also darin, Python zu installieren.

Python installieren in Windows

Schritt 1) Gehe zum Link https://www.python.org/downloads/, und wählen Sie die neueste Version für aus windows.

Python installieren in Windows

Note: Wenn Sie nicht die neueste Version herunterladen möchten, können Sie den Download-Tab besuchen und alle Versionen sehen.

Python installieren in Windows

Schritt 2) Klicken Sie auf die heruntergeladene Datei

Python installieren in Windows

Schritt 3)Wählen Sie „Installation anpassen“.

Python installieren in Windows

Schritt 4) Weiter klicken

Python installieren in Windows

Schritt 5) Im nächsten Bildschirm

  1. Wählen Sie die erweiterten Optionen
  2. Geben Sie einen benutzerdefinierten Installationsort an. In meinem Fall wurde aus Gründen der einfacheren Bedienung ein Ordner auf Laufwerk C gewählt
  3. Klicken Sie auf Installieren

Python installieren in Windows

Schritt 6) Klicken Sie nach Abschluss der Installation auf die Schaltfläche „Schließen“.

Python installieren in Windows

Schritt 7) Kopieren Sie den Pfad Ihres Skriptordners.

Python installieren in Windows

Schritt 8) In windows Eingabeaufforderung

  • Navigieren Sie zum Speicherort des Pip-Ordners
  • Geben Sie den Befehl ein, um NLTK zu installieren
    pip3 install nltk
  • Die Installation sollte erfolgreich durchgeführt werden

Python installieren in Windows

HINWEIS: Für Python2 verwenden Sie den Befehl pip2 install nltk

Schritt 9) In Windows Startmenü, suchen und öffnen Sie PythonShell

Python installieren in Windows

Schritt 10) Sie können überprüfen, ob die Installation korrekt ist, indem Sie den folgenden Befehl eingeben

import nltk

Python installieren in Windows

Wenn kein Fehler angezeigt wird, ist die Installation abgeschlossen.

NLTK unter Mac/Linux installieren

Für die Installation von NLTK unter Mac/Unix ist der Python-Paketmanager pip erforderlich, um nltk zu installieren. Wenn pip nicht installiert ist, befolgen Sie bitte die folgenden Anweisungen, um den Vorgang abzuschließen

Schritt 1) Aktualisieren Sie den Paketindex, indem Sie den folgenden Befehl eingeben

sudo apt update

Schritt 2) Pip für Python 3 installieren:

sudo apt install python3-pip

Sie können pip auch mit easy_install installieren.

sudo apt-get install python-setuptools  python-dev build-essential

Jetzt ist easy_install installiert. Führen Sie den folgenden Befehl aus, um pip zu installieren

sudo easy_install pip

Schritt 3)Benutze following Befehl zum Installieren von NLTK

sudo pip install -U nltk
sudo pip3 install -U nltk

NLTK über Anaconda installieren

Schritt 1) Bitte installieren Sie Anaconda (das auch zur Installation verschiedener Pakete verwendet werden kann) unter https://www.anaconda.com/products/individual und wählen Sie aus, welche Python-Version Sie für Anaconda installieren müssen.

NLTK über Anaconda installieren

Hinweis: Detaillierte Schritte dazu finden Sie in diesem Tutorial Anakonda installieren

Schritt 2)In der Anaconda-Eingabeaufforderung:

  1. Befehl eingeben
    conda install -c anaconda nltk
  2. Überprüfen Sie die Paket-Upgrade-, Downgrade- und Installationsinformationen und geben Sie „Ja“ ein
  3. NLTK wird heruntergeladen und installiert

NLTK über Anaconda installieren

NLTK-Datensatz

Das NLTK-Modul verfügt über viele Datensätze, die Sie zur Verwendung herunterladen müssen. Technisch gesehen heißt es Korpus. Einige der Beispiele sind Stoppwörter, Gutenberg, Framenet_v15, große_grammatikenund so weiter.

So laden Sie alle NLTK-Pakete herunter

Schritt 1)Führen Sie die Python-Interpreter in Windows oder Linux

Schritt 2)

  1. Geben Sie die Befehle ein
import nltk
nltk.download ()
  1. Das Fenster „NLTK heruntergeladen“ wird geöffnet. Klicken Sie auf die Schaltfläche „Herunterladen“, um den Datensatz herunterzuladen. Dieser Vorgang kann je nach Internetverbindung einige Zeit in Anspruch nehmen

Laden Sie alle Pakete von NLTK herunter

Anmerkungen: Sie können den Download-Speicherort ändern, indem Sie auf Datei > Download-Verzeichnis ändern klicken

Laden Sie alle Pakete von NLTK herunter

Schritt 3) Um die installierten Daten zu testen, verwenden Sie Folgendeswing Code

>>> from nltk.corpus import brown
>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', …]

Laden Sie alle Pakete von NLTK herunter

Ausführen des NLP-Skripts

Wir werden besprechen, wie das NLP-Skript auf unserem lokalen PC ausgeführt wird. Es gibt viele Bibliotheken für die Verarbeitung natürlicher Sprache auf dem Markt. Die Auswahl einer Bibliothek hängt also davon ab, ob sie Ihren Anforderungen entspricht. Hier ist die Liste von NLP-Bibliotheken.

So führen Sie ein NLTK-Skript aus

Schritt 1) Kopieren Sie den Code in Ihrem bevorzugten Code-Editor und speichern Sie die Datei unter "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Führen Sie das NLTK-Skript aus

Code-Erklärung:

  1. Das Ziel dieses Programms bestand darin, alle Arten von Satzzeichen aus einem bestimmten Text zu entfernen. Wir haben „RegexpTokenizer“ importiert, ein Modul von NLTK. Es entfernt alle Ausdrücke, Symbole, Zeichen, Zahlen oder andere Dinge, die Sie möchten.
  2. Sie haben gerade den regulären Ausdruck an das Modul „RegexpTokenizer“ übergeben.
  3. Darüber hinaus haben wir das Wort mit dem Modul „tokenize“ tokenisiert. Die Ausgabe wird in der Variablen „filterdText“ gespeichert.
  4. Und druckte sie mit „print()“ aus.

Schritt 2) In der Eingabeaufforderung

  • Navigieren Sie zu dem Speicherort, an dem Sie die Datei gespeichert haben
  • Führen Sie den Befehl Python NLTKsample.py aus

Führen Sie das NLTK-Skript aus

Dies wird die Ausgabe wie folgt anzeigen:

['Hallo', 'Guru99', 'Du', 'habe', 'baue', 'ein', 'sehr', 'gut', 'Seite', 'und', 'Ich', 'liebe', ' „Besuchen“, „Ihre“, „Website“]