Πώς να κατεβάσετε και να εγκαταστήσετε το NLTK σε Windows/Μακ
Εγκατάσταση του NLTK στο Windows
Σε αυτό το μέρος, θα μάθουμε πώς να ρυθμίσετε το NLTK μέσω τερματικού (Γραμμή εντολών στα Windows).
Οι οδηγίες που δίνονται παρακάτω βασίζονται στην υπόθεση ότι δεν έχετε εγκαταστήσει το python. Έτσι, το πρώτο βήμα είναι να εγκαταστήσετε την python.
εγκατάσταση Python in Windows
Βήμα 1) Μεταβείτε στο σύνδεσμο https://www.python.org/downloads/, και επιλέξτε την πιο πρόσφατη έκδοση για windows.
Σημείωση: Εάν δεν θέλετε να κάνετε λήψη της πιο πρόσφατης έκδοσης, μπορείτε να επισκεφτείτε την καρτέλα λήψης και να δείτε όλες τις εκδόσεις.
Βήμα 2) Κάντε κλικ στο Λήψη αρχείου
Βήμα 3)Επιλέξτε Προσαρμογή εγκατάστασης
Βήμα 4) Κάντε κλικ ΕΠΟΜΕΝΟ
Βήμα 5) Στην επόμενη οθόνη
- Επιλέξτε τις σύνθετες επιλογές
- Δώστε μια προσαρμοσμένη τοποθεσία εγκατάστασης. Στην περίπτωσή μου, επιλέγεται ένας φάκελος στη μονάδα δίσκου C για ευκολία στη λειτουργία
- Κάντε κλικ στο κουμπί Εγκατάσταση
Βήμα 6) Κάντε κλικ στο κουμπί Κλείσιμο μόλις ολοκληρωθεί η εγκατάσταση.
Βήμα 7) Αντιγράψτε τη διαδρομή του φακέλου Scripts.
Βήμα 8) Στη γραμμή εντολών των Windows
- Μεταβείτε στη θέση του φακέλου pip
- Εισαγάγετε την εντολή για εγκατάσταση του NLTK
pip3 install nltk
- Η εγκατάσταση πρέπει να γίνει με επιτυχία
ΣΗΜΕΊΩΣΗ: Για Python2 χρησιμοποιήστε την εντολήpip2 install nltk
Βήμα 9) In Windows Μενού Έναρξη, αναζήτηση και άνοιγμα Pythonκέλυφος
Βήμα 10) Μπορείτε να επαληθεύσετε εάν η εγκατάσταση είναι ακριβής παρέχοντας την παρακάτω εντολή
import nltk
Εάν δεν βλέπετε κανένα σφάλμα, η εγκατάσταση έχει ολοκληρωθεί.
Εγκατάσταση του NLTK σε Mac/Linux
Η εγκατάσταση του NLTK σε Mac/Unix απαιτεί pip διαχείρισης πακέτων python για να εγκαταστήσει το nltk. Εάν το pip δεν έχει εγκατασταθεί, ακολουθήστε τις παρακάτω οδηγίες για να ολοκληρώσετε τη διαδικασία
Βήμα 1) Ενημερώστε το ευρετήριο πακέτου πληκτρολογώντας την παρακάτω εντολή
sudo apt update
Βήμα 2) Εγκατάσταση pip για Python 3:
sudo apt install python3-pip
Μπορείτε επίσης να εγκαταστήσετε το pip χρησιμοποιώντας το easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Τώρα το easy_install είναι εγκατεστημένο. Εκτελέστε την παρακάτω εντολή για να εγκαταστήσετε το pip
sudo easy_install pip
Βήμα 3)Χρησιμοποιήστε την παρακάτω εντολή για να εγκαταστήσετε το NLTK
sudo pip install -U nltk sudo pip3 install -U nltk
Εγκατάσταση NLTK μέσω Anaconda
Βήμα 1) Εγκαταστήστε το anaconda (το οποίο μπορεί επίσης να χρησιμοποιηθεί για την εγκατάσταση διαφορετικών πακέτων) με μια επίσκεψη https://www.anaconda.com/products/individual και επιλέξτε ποια έκδοση του python πρέπει να εγκαταστήσετε για το anaconda.
Σημείωση: Ανατρέξτε σε αυτό το σεμινάριο για λεπτομερή βήματα εγκαταστήστε το anaconda
Βήμα 2)Στην προτροπή Anaconda,
- Εισαγάγετε την εντολή
conda install -c anaconda nltk
- Revδείτε το πακέτο αναβάθμιση, υποβάθμιση, πληροφορίες εγκατάστασης και πληκτρολογήστε ναι
- Γίνεται λήψη και εγκατάσταση του NLTK
Σύνολο δεδομένων NLTK
Η ενότητα NLTK έχει πολλά διαθέσιμα σύνολα δεδομένων που πρέπει να κατεβάσετε για να τα χρησιμοποιήσετε. Πιο τεχνικά λέγεται σώμα. Μερικά από τα παραδείγματα είναι λέξεις-κλειδιά, Gutenberg, framenet_v15, μεγάλες_γραμματικέςκαι ούτω καθεξής.
Πώς να κατεβάσετε όλα τα πακέτα του NLTK
Βήμα 1)Εκτελέστε το Python διερμηνέας in Windows ή Linux
Βήμα 2)
- Εισαγάγετε τις εντολές
import nltk nltk.download ()
- Ανοίγει το παράθυρο λήψης NLTK. Κάντε κλικ στο κουμπί Λήψη για λήψη του συνόλου δεδομένων. Αυτή η διαδικασία θα πάρει χρόνο, με βάση τη σύνδεσή σας στο Διαδίκτυο
ΣΗΜΕΊΩΣΗ: Μπορείτε να αλλάξετε τη θέση λήψης κάνοντας κλικ στο Αρχείο> Αλλαγή καταλόγου λήψης
Βήμα 3) Για να ελέγξετε τα εγκατεστημένα δεδομένα χρησιμοποιήστε τον ακόλουθο κώδικα
>>> from nltk.corpus import brown >>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'sid', ...]
Εκτέλεση του σεναρίου NLP
Θα συζητήσουμε πώς θα εκτελεστεί το σενάριο NLP στον τοπικό μας υπολογιστή. Υπάρχουν πολλές βιβλιοθήκες για την Επεξεργασία Φυσικής Γλώσσας που υπάρχουν στην αγορά. Επομένως, η επιλογή μιας βιβλιοθήκης εξαρτάται από τις απαιτήσεις σας. Εδώ είναι η λίστα των Βιβλιοθήκες NLP.
Πώς να εκτελέσετε το σενάριο NLTK
Βήμα 1) Στον αγαπημένο σας επεξεργαστή κώδικα, αντιγράψτε τον κώδικα και αποθηκεύστε το αρχείο ως "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
Επεξήγηση κώδικα:
- Σε αυτό το πρόγραμμα, ο στόχος ήταν να αφαιρεθούν όλα τα είδη στίξης από το δεδομένο κείμενο. Εισαγάγαμε το "RegexpTokenizer" που είναι μια ενότητα του NLTK. Αφαιρεί όλη την έκφραση, σύμβολο, χαρακτήρα, αριθμητικό ή οτιδήποτε άλλο θέλετε.
- Μόλις περάσατε την κανονική Έκφραση στη λειτουργική μονάδα "RegexpTokenizer".
- Περαιτέρω, διαμορφώσαμε τη λέξη χρησιμοποιώντας την ενότητα "tokenize". Η έξοδος αποθηκεύεται στη μεταβλητή "filterdText".
- Και τα εκτύπωσε χρησιμοποιώντας το "print()."
Βήμα 2) Στη γραμμή εντολών
- Μεταβείτε στη θέση όπου έχετε αποθηκεύσει το αρχείο
- Εκτελέστε την εντολή Python NLTKsample.py
Αυτό θα εμφανίσει την έξοδο ως:
['Γεια', 'Guru99', 'Εσείς', 'έχετε', 'χτίζω', 'α', 'πολύ', 'καλό', 'site', 'και', 'I', 'Love', ' επίσκεψη", "δικός σας", "ιστότοπος"]