So laden Sie NLTK herunter und installieren es auf Windows/ Mac
NLTK installieren in Windows
In diesem Teil erfahren wir, wie man NLTK über das Terminal (Eingabeaufforderung in Windows) einrichtet.
Die folgenden Anweisungen basieren auf der Annahme, dass Sie Python nicht installiert haben. Der erste Schritt besteht also darin, Python zu installieren.
Montage von Python in Windows
Schritt 1) Gehe zum Link https://www.python.org/downloads/, und wählen Sie die neueste Version für Windows aus.
Note: Wenn Sie nicht die neueste Version herunterladen möchten, können Sie den Download-Tab besuchen und alle Versionen sehen.
Schritt 2) Klicken Sie auf die heruntergeladene Datei
Schritt 3)Wählen Sie „Installation anpassen“.
Schritt 4) Weiter klicken
Schritt 5) Im nächsten Bildschirm
- Wählen Sie die erweiterten Optionen
- Geben Sie einen benutzerdefinierten Installationsort an. In meinem Fall wurde aus Gründen der Benutzerfreundlichkeit ein Ordner auf Laufwerk C gewählt.
- Klicken Sie auf Installieren
Schritt 6) Klicken Sie nach Abschluss der Installation auf die Schaltfläche „Schließen“.
Schritt 7) Kopieren Sie den Pfad Ihres Skriptordners.
Schritt 8) In der Windows-Eingabeaufforderung
- Navigieren Sie zum Speicherort des Pip-Ordners
- Geben Sie den Befehl ein, um NLTK zu installieren
pip3 install nltk
- Die Installation sollte erfolgreich durchgeführt werden
HINWEIS: Zum Python2 verwenden Sie den Befehlpip2 install nltk
Schritt 9) In Windows Startmenü, suchen und öffnen PythonSchale
Schritt 10) Sie können überprüfen, ob die Installation korrekt ist, indem Sie den folgenden Befehl eingeben
import nltk
Wenn kein Fehler angezeigt wird, ist die Installation abgeschlossen.
NLTK unter Mac/Linux installieren
Für die Installation von NLTK unter Mac/Unix ist der Python-Paketmanager pip erforderlich, um nltk zu installieren. Wenn pip nicht installiert ist, befolgen Sie bitte die folgenden Anweisungen, um den Vorgang abzuschließen
Schritt 1) Aktualisieren Sie den Paketindex, indem Sie den folgenden Befehl eingeben
sudo apt update
Schritt 2) Installieren von pip für Python 3:
sudo apt install python3-pip
Sie können pip auch mit easy_install installieren.
sudo apt-get install python-setuptools python-dev build-essential
Jetzt ist easy_install installiert. Führen Sie den folgenden Befehl aus, um pip zu installieren
sudo easy_install pip
Schritt 3)Verwenden Sie den folgenden Befehl, um NLTK zu installieren
sudo pip install -U nltk sudo pip3 install -U nltk
NLTK über Anaconda installieren
Schritt 1) Bitte installieren Sie Anaconda (das auch zur Installation verschiedener Pakete verwendet werden kann) unter https://www.anaconda.com/products/individual und wählen Sie aus, welche Python-Version Sie für Anaconda installieren müssen.
Hinweis: Detaillierte Schritte dazu finden Sie in diesem Tutorial Anakonda installieren
Schritt 2)In der Anaconda-Eingabeaufforderung:
- Befehl eingeben
conda install -c anaconda nltk
- RevSehen Sie sich die Informationen zum Paket-Upgrade, Downgrade und zur Installation an und geben Sie „Ja“ ein.
- NLTK wird heruntergeladen und installiert
NLTK-Datensatz
Das NLTK-Modul verfügt über viele Datensätze, die Sie zur Verwendung herunterladen müssen. Technisch gesehen heißt es Korpus. Einige der Beispiele sind Stoppwörter, Gutenberg, Framenet_v15, große_grammatikenund so weiter.
So laden Sie alle NLTK-Pakete herunter
Schritt 1)Führen Sie die Python Dolmetscher in Windows oder Linux
Schritt 2)
- Geben Sie die Befehle ein
import nltk nltk.download ()
- Das Fenster „NLTK heruntergeladen“ wird geöffnet. Klicken Sie auf die Schaltfläche „Herunterladen“, um den Datensatz herunterzuladen. Dieser Vorgang kann je nach Internetverbindung einige Zeit in Anspruch nehmen
Anmerkungen: Sie können den Download-Speicherort ändern, indem Sie auf Datei > Download-Verzeichnis ändern klicken
Schritt 3) Um die installierten Daten zu testen, verwenden Sie den folgenden Code
>>> from nltk.corpus import brown >>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', …]
Ausführen des NLP-Skripts
Wir werden besprechen, wie das NLP-Skript auf unserem lokalen PC ausgeführt wird. Es gibt viele Bibliotheken für die Verarbeitung natürlicher Sprache auf dem Markt. Die Auswahl einer Bibliothek hängt also davon ab, ob sie Ihren Anforderungen entspricht. Hier ist die Liste von NLP-Bibliotheken.
So führen Sie ein NLTK-Skript aus
Schritt 1) Kopieren Sie den Code in Ihrem bevorzugten Code-Editor und speichern Sie die Datei unter "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
Code-Erklärung:
- Das Ziel dieses Programms bestand darin, alle Arten von Satzzeichen aus einem bestimmten Text zu entfernen. Wir haben „RegexpTokenizer“ importiert, ein Modul von NLTK. Es entfernt alle Ausdrücke, Symbole, Zeichen, Zahlen oder andere Dinge, die Sie möchten.
- Sie haben gerade den regulären Ausdruck an das Modul „RegexpTokenizer“ übergeben.
- Darüber hinaus haben wir das Wort mit dem Modul „tokenize“ tokenisiert. Die Ausgabe wird in der Variablen „filterdText“ gespeichert.
- Und druckte sie mit „print()“ aus.
Schritt 2) In der Eingabeaufforderung
- Navigieren Sie zu dem Speicherort, an dem Sie die Datei gespeichert haben
- Führen Sie den Befehl aus Python NLTKsample.py
Dies wird die Ausgabe wie folgt anzeigen:
['Hallo', 'Guru99', 'Du', 'habe', 'baue', 'ein', 'sehr', 'gut', 'Seite', 'und', 'Ich', 'liebe', ' „Besuchen“, „Ihre“, „Website“]