Come scaricare e installare NLTK su Windows/Mac
Installazione di NLTK in Windows
In questa parte impareremo come configurare NLTK tramite terminale (prompt dei comandi in Windows).
Le istruzioni fornite di seguito si basano sul presupposto che non sia installato Python. Quindi, il primo passo è installare Python.
Installazione Python in Windows
Passo 1) Vai al collegamento https://www.python.org/downloads/, e seleziona la versione più recente per Windows.
Note:: Se non desideri scaricare la versione più recente, puoi visitare la scheda download e vedere tutte le versioni.
Passo 2) Fare clic sul file scaricato
Passo 3)Seleziona Personalizza installazione
Passo 4) Fai clic su AVANTI
Passo 5) Nella schermata successiva
- Seleziona le opzioni avanzate
- Fornisci un percorso di installazione personalizzato. Nel mio caso, viene scelta una cartella sull'unità C per facilità d'uso
- Fare clic su Installa
Passo 6) Fare clic sul pulsante Chiudi una volta completata l'installazione.
Passo 7) Copia il percorso della cartella Scripts.
Passo 8) Nel prompt dei comandi di Windows
- Passare alla posizione della cartella pip
- Immettere il comando per installare NLTK
pip3 install nltk
- L'installazione dovrebbe essere eseguita correttamente
NOTA: Per Python2 utilizzare il comando pip2 install nltk
Passo 9) In Windows Menu Start, cerca e apri PythonConchiglia
Passo 10) Puoi verificare se l'installazione è corretta fornendo il comando seguente
import nltk
Se non viene visualizzato alcun errore, l'installazione è completata.
Installazione di NLTK su Mac/Linux
L'installazione di NLTK in Mac/Unix richiede il gestore pacchetti Python pip per installare nltk. Se pip non è installato, seguire le istruzioni seguenti per completare il processo
Passo 1) Aggiorna l'indice del pacchetto digitando il comando seguente
sudo apt update
Passo 2) Installazione di pip per Python 3:
sudo apt install python3-pip
Puoi anche installare pip usando easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Ora easy_install è installato. Esegui il comando seguente per installare pip
sudo easy_install pip
Passo 3)Utilizzare il seguente comando per installare NLTK
sudo pip install -U nltk sudo pip3 install -U nltk
Installazione di NLTK tramite Anaconda
Passo 1) Installa anaconda (che può essere utilizzato anche per installare pacchetti diversi) visitando https://www.anaconda.com/products/individual e seleziona quale versione di Python devi installare per anaconda.
Nota: fare riferimento a questo tutorial per i passaggi dettagliati su installa anaconda
Passo 2)Nel prompt di Anaconda,
- Inserisci il comando
conda install -c anaconda nltk
- Revvisualizza l'aggiornamento del pacchetto, il downgrade, le informazioni di installazione e inserisci sì
- NLTK viene scaricato e installato
Set di dati NLTK
Il modulo NLTK ha molti set di dati disponibili che devi scaricare per utilizzare. Più tecnicamente si chiama corpo. Alcuni degli esempi sono parole d'ordine, Gutenberg, framenet_v15, large_grammarse così via.
Come scaricare tutti i pacchetti di NLTK
Passo 1)Corri il Python interprete in Windows o Linux
Passo 2)
- Inserisci i comandi
import nltk nltk.download ()
- Si apre la finestra NLTK scaricata. Fare clic sul pulsante Scarica per scaricare il set di dati. Questo processo richiederà tempo, in base alla tua connessione Internet
NOTA: È possibile modificare il percorso di download facendo clic su File> Cambia directory di download
Passo 3) Per testare i dati installati utilizzare il seguente codice
>>> from nltk.corpus import brown >>>brown.words()
['Il', 'Fulton', 'County', 'Grand', 'Jury', 'ha detto', …]
Esecuzione dello script PNL
Discuteremo come verrà eseguito lo script NLP sul nostro PC locale. Sono numerose le librerie per l'elaborazione del linguaggio naturale presenti sul mercato. Quindi la scelta di una libreria dipende dalla capacità di soddisfare le tue esigenze. Ecco l'elenco dei Librerie di PNL.
Come eseguire lo script NLTK
Passo 1) Nel tuo editor di codice preferito, copia il codice e salva il file con nome "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
Spiegazione del codice:
- In questo programma, l'obiettivo era rimuovere tutti i tipi di punteggiatura dal testo. Abbiamo importato "RegexpTokenizer" che è un modulo di NLTK. Rimuove tutte le espressioni, i simboli, i caratteri, i numeri o qualsiasi cosa tu voglia.
- Hai appena passato l'espressione regolare al modulo "RegexpTokenizer".
- Inoltre, abbiamo tokenizzato la parola utilizzando il modulo “tokenize”. L'output viene memorizzato nella variabile "filterdText".
- E li ho stampati usando "print()".
Passo 2) Nel prompt dei comandi
- Passare alla posizione in cui hai salvato il file
- Esegui il comando Python NLTKsample.py
Questo mostrerà l'output come:
['Ciao', 'Guru99', 'Tu', 'hai', 'costruisci', 'a', 'molto', 'buono', 'sito', 'e', 'io', 'amore', ' visitando', 'tuo', 'sito']