Πώς να κατεβάσετε και να εγκαταστήσετε το NLTK σε Windows/Μακ

Εγκατάσταση του NLTK στο Windows

Σε αυτό το μέρος, θα μάθουμε πώς να ρυθμίσετε το NLTK μέσω τερματικού (Γραμμή εντολών στα Windows).

Οι οδηγίες που δίνονται παρακάτω βασίζονται στην υπόθεση ότι δεν έχετε εγκαταστήσει το python. Έτσι, το πρώτο βήμα είναι να εγκαταστήσετε την python.

εγκατάσταση Python in Windows

Βήμα 1) Μεταβείτε στο σύνδεσμο https://www.python.org/downloads/, και επιλέξτε την πιο πρόσφατη έκδοση για windows.

εγκατάσταση Python in Windows

Σημείωση: Εάν δεν θέλετε να κάνετε λήψη της πιο πρόσφατης έκδοσης, μπορείτε να επισκεφτείτε την καρτέλα λήψης και να δείτε όλες τις εκδόσεις.

εγκατάσταση Python in Windows

Βήμα 2) Κάντε κλικ στο Λήψη αρχείου

εγκατάσταση Python in Windows

Βήμα 3)Επιλέξτε Προσαρμογή εγκατάστασης

εγκατάσταση Python in Windows

Βήμα 4) Κάντε κλικ ΕΠΟΜΕΝΟ

εγκατάσταση Python in Windows

Βήμα 5) Στην επόμενη οθόνη

  1. Επιλέξτε τις σύνθετες επιλογές
  2. Δώστε μια προσαρμοσμένη τοποθεσία εγκατάστασης. Στην περίπτωσή μου, επιλέγεται ένας φάκελος στη μονάδα δίσκου C για ευκολία στη λειτουργία
  3. Κάντε κλικ στο κουμπί Εγκατάσταση

εγκατάσταση Python in Windows

Βήμα 6) Κάντε κλικ στο κουμπί Κλείσιμο μόλις ολοκληρωθεί η εγκατάσταση.

εγκατάσταση Python in Windows

Βήμα 7) Αντιγράψτε τη διαδρομή του φακέλου Scripts.

εγκατάσταση Python in Windows

Βήμα 8) Στη γραμμή εντολών των Windows

  • Μεταβείτε στη θέση του φακέλου pip
  • Εισαγάγετε την εντολή για εγκατάσταση του NLTK
    pip3 install nltk
  • Η εγκατάσταση πρέπει να γίνει με επιτυχία

εγκατάσταση Python in Windows

ΣΗΜΕΊΩΣΗ: Για Python2 χρησιμοποιήστε την εντολήpip2 install nltk

Βήμα 9) In Windows Μενού Έναρξη, αναζήτηση και άνοιγμα Pythonκέλυφος

εγκατάσταση Python in Windows

Βήμα 10) Μπορείτε να επαληθεύσετε εάν η εγκατάσταση είναι ακριβής παρέχοντας την παρακάτω εντολή

import nltk

εγκατάσταση Python in Windows

Εάν δεν βλέπετε κανένα σφάλμα, η εγκατάσταση έχει ολοκληρωθεί.

Εγκατάσταση του NLTK σε Mac/Linux

Η εγκατάσταση του NLTK σε Mac/Unix απαιτεί pip διαχείρισης πακέτων python για να εγκαταστήσει το nltk. Εάν το pip δεν έχει εγκατασταθεί, ακολουθήστε τις παρακάτω οδηγίες για να ολοκληρώσετε τη διαδικασία

Βήμα 1) Ενημερώστε το ευρετήριο πακέτου πληκτρολογώντας την παρακάτω εντολή

sudo apt update

Βήμα 2) Εγκατάσταση pip για Python 3:

sudo apt install python3-pip

Μπορείτε επίσης να εγκαταστήσετε το pip χρησιμοποιώντας το easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

Τώρα το easy_install είναι εγκατεστημένο. Εκτελέστε την παρακάτω εντολή για να εγκαταστήσετε το pip

sudo easy_install pip

Βήμα 3)Χρησιμοποιήστε την παρακάτω εντολή για να εγκαταστήσετε το NLTK

sudo pip install -U nltk
sudo pip3 install -U nltk

Εγκατάσταση NLTK μέσω Anaconda

Βήμα 1) Εγκαταστήστε το anaconda (το οποίο μπορεί επίσης να χρησιμοποιηθεί για την εγκατάσταση διαφορετικών πακέτων) με μια επίσκεψη https://www.anaconda.com/products/individual και επιλέξτε ποια έκδοση του python πρέπει να εγκαταστήσετε για το anaconda.

Εγκατάσταση NLTK μέσω Anaconda

Σημείωση: Ανατρέξτε σε αυτό το σεμινάριο για λεπτομερή βήματα εγκαταστήστε το anaconda

Βήμα 2)Στην προτροπή Anaconda,

  1. Εισαγάγετε την εντολή
    conda install -c anaconda nltk
  2. Revδείτε το πακέτο αναβάθμιση, υποβάθμιση, πληροφορίες εγκατάστασης και πληκτρολογήστε ναι
  3. Γίνεται λήψη και εγκατάσταση του NLTK

Εγκατάσταση NLTK μέσω Anaconda

Σύνολο δεδομένων NLTK

Η ενότητα NLTK έχει πολλά διαθέσιμα σύνολα δεδομένων που πρέπει να κατεβάσετε για να τα χρησιμοποιήσετε. Πιο τεχνικά λέγεται σώμα. Μερικά από τα παραδείγματα είναι λέξεις-κλειδιά, Gutenberg, framenet_v15, μεγάλες_γραμματικέςκαι ούτω καθεξής.

Πώς να κατεβάσετε όλα τα πακέτα του NLTK

Βήμα 1)Εκτελέστε το Python διερμηνέας in Windows ή Linux

Βήμα 2)

  1. Εισαγάγετε τις εντολές
import nltk
nltk.download ()
  1. Ανοίγει το παράθυρο λήψης NLTK. Κάντε κλικ στο κουμπί Λήψη για λήψη του συνόλου δεδομένων. Αυτή η διαδικασία θα πάρει χρόνο, με βάση τη σύνδεσή σας στο Διαδίκτυο

Κατεβάστε όλα τα πακέτα του NLTK

ΣΗΜΕΊΩΣΗ: Μπορείτε να αλλάξετε τη θέση λήψης κάνοντας κλικ στο Αρχείο> Αλλαγή καταλόγου λήψης

Κατεβάστε όλα τα πακέτα του NLTK

Βήμα 3) Για να ελέγξετε τα εγκατεστημένα δεδομένα χρησιμοποιήστε τον ακόλουθο κώδικα

>>> from nltk.corpus import brown
>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'sid', ...]

Κατεβάστε όλα τα πακέτα του NLTK

Εκτέλεση του σεναρίου NLP

Θα συζητήσουμε πώς θα εκτελεστεί το σενάριο NLP στον τοπικό μας υπολογιστή. Υπάρχουν πολλές βιβλιοθήκες για την Επεξεργασία Φυσικής Γλώσσας που υπάρχουν στην αγορά. Επομένως, η επιλογή μιας βιβλιοθήκης εξαρτάται από τις απαιτήσεις σας. Εδώ είναι η λίστα των Βιβλιοθήκες NLP.

Πώς να εκτελέσετε το σενάριο NLTK

Βήμα 1) Στον αγαπημένο σας επεξεργαστή κώδικα, αντιγράψτε τον κώδικα και αποθηκεύστε το αρχείο ως "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Εκτελέστε το σενάριο NLTK

Επεξήγηση κώδικα:

  1. Σε αυτό το πρόγραμμα, ο στόχος ήταν να αφαιρεθούν όλα τα είδη στίξης από το δεδομένο κείμενο. Εισαγάγαμε το "RegexpTokenizer" που είναι μια ενότητα του NLTK. Αφαιρεί όλη την έκφραση, σύμβολο, χαρακτήρα, αριθμητικό ή οτιδήποτε άλλο θέλετε.
  2. Μόλις περάσατε την κανονική Έκφραση στη λειτουργική μονάδα "RegexpTokenizer".
  3. Περαιτέρω, διαμορφώσαμε τη λέξη χρησιμοποιώντας την ενότητα "tokenize". Η έξοδος αποθηκεύεται στη μεταβλητή "filterdText".
  4. Και τα εκτύπωσε χρησιμοποιώντας το "print()."

Βήμα 2) Στη γραμμή εντολών

  • Μεταβείτε στη θέση όπου έχετε αποθηκεύσει το αρχείο
  • Εκτελέστε την εντολή Python NLTKsample.py

Εκτελέστε το σενάριο NLTK

Αυτό θα εμφανίσει την έξοδο ως:

['Γεια', 'Guru99', 'Εσείς', 'έχετε', 'χτίζω', 'α', 'πολύ', 'καλό', 'site', 'και', 'I', 'Love', ' επίσκεψη", "δικός σας", "ιστότοπος"]