Come scaricare e installare NLTK
โก Riepilogo intelligente
Scarica e installa NLTK su Windows, Mac o Linux installando Python prima, poi aggiungendo il Naturale Language Toolkit tramite pip o Anaconda e scaricando i dataset del corpus.

Installazione di NLTK in Windows
Scopri come configurare NLTK su Windows dal prompt dei comandi. Le istruzioni seguenti presuppongono Python non รจ ancora installato, quindi il primo passo รจ installarlo Python.
Installazione Python in Windows
Passo 1) Apri il link https://www.python.org/downloads/, e selezionare l'ultimo Windows rilasciare.
Note:Per le versioni precedenti, visita la scheda Download per visualizzare tutte le versioni.
Passo 2) Fai clic sul file di installazione scaricato.
Passo 3) Seleziona "Personalizza installazione".
Passo 4) Fai clic su AVANTI.
Passo 5) Nella schermata successiva:
- Seleziona le opzioni avanzate.
- Specificare una posizione di installazione personalizzata. In questo esempio, viene scelta una cartella sull'unitร C per un accesso piรน semplice.
- Fare clic su Installa.
Passo 6) Al termine dell'installazione, fai clic sul pulsante Chiudi.
Passo 7) Copia il percorso della cartella Scripts.
Passo 8) Nel Windows prompt dei comandi:
- Accedere alla cartella in cui si trova pip.
- Inserisci il comando per installare NLTK:
pip3 install nltk
- L'installazione dovrebbe concludersi con successo.
NOTA: Per Python 2, usa il comando pip2 install nltk.
Passo 9) Dal Windows Menu Start, cerca e apri il Python Conchiglia.
Passo 10) Verifica che l'installazione funzioni eseguendo il comando seguente:
import nltk
Se non si verifica alcun errore, l'installazione รจ completa.
Installazione di NLTK su Mac/Linux
L'installazione di NLTK su Mac o Linux richiede Python gestore di pacchetti pip. Se pip non รจ installato, segui le istruzioni riportate di seguito per completare la procedura.
Passo 1) Aggiorna l'indice del pacchetto tramite typing il comando seguente:
sudo apt update
Passo 2) Installa pip per Python 3:
sudo apt install python3-pip
ร possibile installare pip anche tramite easy_install:
sudo apt-get install python-setuptools python-dev build-essential
Una volta installato easy_install, esegui il comando seguente per installare pip:
sudo easy_install pip
Passo 3) Utilizzare il seguente comando per installare NLTK:
sudo pip install -U nltk sudo pip3 install -U nltk
Installazione di NLTK tramite Anaconda
Passo 1) Installa Anaconda visitando https://www.anaconda.com/products/individual e selezionando il Python versione di cui hai bisogno.
Nota: fare riferimento a questo tutorial per i passaggi dettagliati su installare Anaconda.
Passo 2) Nel prompt di Anaconda:
- Inserisci il comando:
conda install -c anaconda nltk
- RevVisualizza le informazioni sull'aggiornamento, il downgrade e l'installazione del pacchetto, quindi digita sรฌ.
- NLTK รจ stato scaricato e installato.
Set di dati NLTK
Il modulo NLTK viene fornito con molti dataset che รจ necessario scaricare prima dell'uso. Tecnicamente, ogni dataset รจ chiamato un corpoEsempi comuni includono parole d'ordine, Gutenberg, framenet_v15, large_grammars, pellee wordnet.
Come scaricare tutti i pacchetti di NLTK
Passo 1) Corri il Python interprete in Windows o Linux.
Passo 2)
- Inserisci i comandi:
import nltk nltk.download ()
- Si aprirร la finestra di NLTK Downloader. Fai clic sul pulsante Download per scaricare il dataset. Questa operazione richiederร del tempo, a seconda della velocitร della tua connessione Internet.
NOTA: ร possibile modificare la posizione di download facendo clic su File > Cambia directory di download.
Passo 3) Per testare i dati installati, utilizzare il seguente codice:
>>> from nltk.corpus import brown >>>brown.words()
['Il', 'Fulton', 'County', 'Grand', 'Jury', 'ha detto', โฆ]
Esecuzione dello script PNL
Questa sezione spiega come viene eseguito uno script NLP su un PC locale. La scelta della libreria giusta dipende dalle tue esigenze. Consulta l'elenco ufficiale di Librerie di PNL per alternative come spaCy, gensim e TextBlob.
Come eseguire lo script NLTK
Passo 1) Nel tuo editor di codice preferito, copia il codice e salva il file con nome NLTKsample.py:
from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)
Code Spiegazione:
- L'obiettivo di questo programma รจ rimuovere ogni tipo di punteggiatura da un dato testo. Abbiamo importato "RegexpTokenizer", un modulo di NLTK che rimuove qualsiasi espressione, simbolo, carattere o valore numerico tu scelga.
- Un'espressione regolare viene passata al modulo "RegexpTokenizer".
- Il testo viene tokenizzato utilizzando il metodo โtokenizeโ e lโoutput viene memorizzato nella variabile โfilterdTextโ.
- Il risultato viene stampato utilizzando la funzione โprint()โ.
Passo 2) Nel prompt dei comandi:
- Accedi alla cartella in cui hai salvato il file.
- Esegui il comando
python NLTKsample.py.
L'output รจ:
['Ciao', 'Guru99', 'Tu', 'hai', 'costruito', 'un', 'ottimo', 'sito', 'e', โโ'io', 'adoro', 'visitare', 'il tuo', 'sito']


















