Come scaricare e installare NLTK

โšก Riepilogo intelligente

Scarica e installa NLTK su Windows, Mac o Linux installando Python prima, poi aggiungendo il Naturale Language Toolkit tramite pip o Anaconda e scaricando i dataset del corpus.

  • โœ… Requisito: Installazione Python prima di aggiungere NLTK.
  • โš™๏ธ Installare: Utilizza pip, easy_install o Anaconda.
  • ๐Ÿ“š Dataset: Esegui nltk.download() per scaricare i corpus.
  • ๐Ÿ Verificare: importare NLTK nel Python conchiglia.
  • ๐Ÿค– Utilizzo dell'IA: Tokenizzazione e tagging per pipeline di elaborazione del linguaggio naturale (NLP).

Scarica e installa NLTK

Installazione di NLTK in Windows

Scopri come configurare NLTK su Windows dal prompt dei comandi. Le istruzioni seguenti presuppongono Python non รจ ancora installato, quindi il primo passo รจ installarlo Python.

Installazione Python in Windows

Passo 1) Apri il link https://www.python.org/downloads/, e selezionare l'ultimo Windows rilasciare.

Installazione Python in Windows

Note:Per le versioni precedenti, visita la scheda Download per visualizzare tutte le versioni.

Installazione Python in Windows

Passo 2) Fai clic sul file di installazione scaricato.

Installazione Python in Windows

Passo 3) Seleziona "Personalizza installazione".

Installazione Python in Windows

Passo 4) Fai clic su AVANTI.

Installazione Python in Windows

Passo 5) Nella schermata successiva:

  1. Seleziona le opzioni avanzate.
  2. Specificare una posizione di installazione personalizzata. In questo esempio, viene scelta una cartella sull'unitร  C per un accesso piรน semplice.
  3. Fare clic su Installa.

Installazione Python in Windows

Passo 6) Al termine dell'installazione, fai clic sul pulsante Chiudi.

Installazione Python in Windows

Passo 7) Copia il percorso della cartella Scripts.

Installazione Python in Windows

Passo 8) Nel Windows prompt dei comandi:

  • Accedere alla cartella in cui si trova pip.
  • Inserisci il comando per installare NLTK:
    pip3 install nltk
  • L'installazione dovrebbe concludersi con successo.

Installazione Python in Windows

NOTA: Per Python 2, usa il comando pip2 install nltk.

Passo 9) Dal Windows Menu Start, cerca e apri il Python Conchiglia.

Installazione Python in Windows

Passo 10) Verifica che l'installazione funzioni eseguendo il comando seguente:

import nltk

Installazione Python in Windows

Se non si verifica alcun errore, l'installazione รจ completa.

Installazione di NLTK su Mac/Linux

L'installazione di NLTK su Mac o Linux richiede Python gestore di pacchetti pip. Se pip non รจ installato, segui le istruzioni riportate di seguito per completare la procedura.

Passo 1) Aggiorna l'indice del pacchetto tramite typing il comando seguente:

sudo apt update

Passo 2) Installa pip per Python 3:

sudo apt install python3-pip

รˆ possibile installare pip anche tramite easy_install:

sudo apt-get install python-setuptools  python-dev build-essential

Una volta installato easy_install, esegui il comando seguente per installare pip:

sudo easy_install pip

Passo 3) Utilizzare il seguente comando per installare NLTK:

sudo pip install -U nltk
sudo pip3 install -U nltk

Installazione di NLTK tramite Anaconda

Passo 1) Installa Anaconda visitando https://www.anaconda.com/products/individual e selezionando il Python versione di cui hai bisogno.

Installazione di NLTK tramite Anaconda

Nota: fare riferimento a questo tutorial per i passaggi dettagliati su installare Anaconda.

Passo 2) Nel prompt di Anaconda:

  1. Inserisci il comando:
    conda install -c anaconda nltk
  2. RevVisualizza le informazioni sull'aggiornamento, il downgrade e l'installazione del pacchetto, quindi digita sรฌ.
  3. NLTK รจ stato scaricato e installato.

Installazione di NLTK tramite Anaconda

Set di dati NLTK

Il modulo NLTK viene fornito con molti dataset che รจ necessario scaricare prima dell'uso. Tecnicamente, ogni dataset รจ chiamato un corpoEsempi comuni includono parole d'ordine, Gutenberg, framenet_v15, large_grammars, pellee wordnet.

Come scaricare tutti i pacchetti di NLTK

Passo 1) Corri il Python interprete in Windows o Linux.

Passo 2)

  1. Inserisci i comandi:
import nltk
nltk.download ()
  1. Si aprirร  la finestra di NLTK Downloader. Fai clic sul pulsante Download per scaricare il dataset. Questa operazione richiederร  del tempo, a seconda della velocitร  della tua connessione Internet.

Scarica tutti i pacchetti di NLTK

NOTA: รˆ possibile modificare la posizione di download facendo clic su File > Cambia directory di download.

Scarica tutti i pacchetti di NLTK

Passo 3) Per testare i dati installati, utilizzare il seguente codice:

>>> from nltk.corpus import brown
>>>brown.words()

['Il', 'Fulton', 'County', 'Grand', 'Jury', 'ha detto', โ€ฆ]

Scarica tutti i pacchetti di NLTK

Esecuzione dello script PNL

Questa sezione spiega come viene eseguito uno script NLP su un PC locale. La scelta della libreria giusta dipende dalle tue esigenze. Consulta l'elenco ufficiale di Librerie di PNL per alternative come spaCy, gensim e TextBlob.

Come eseguire lo script NLTK

Passo 1) Nel tuo editor di codice preferito, copia il codice e salva il file con nome NLTKsample.py:

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Esegui lo script NLTK

Code Spiegazione:

  1. L'obiettivo di questo programma รจ rimuovere ogni tipo di punteggiatura da un dato testo. Abbiamo importato "RegexpTokenizer", un modulo di NLTK che rimuove qualsiasi espressione, simbolo, carattere o valore numerico tu scelga.
  2. Un'espressione regolare viene passata al modulo "RegexpTokenizer".
  3. Il testo viene tokenizzato utilizzando il metodo โ€œtokenizeโ€ e lโ€™output viene memorizzato nella variabile โ€œfilterdTextโ€.
  4. Il risultato viene stampato utilizzando la funzione โ€œprint()โ€.

Passo 2) Nel prompt dei comandi:

  • Accedi alla cartella in cui hai salvato il file.
  • Esegui il comando python NLTKsample.py.

Esegui lo script NLTK

L'output รจ:

['Ciao', 'Guru99', 'Tu', 'hai', 'costruito', 'un', 'ottimo', 'sito', 'e', โ€‹โ€‹'io', 'adoro', 'visitare', 'il tuo', 'sito']

Domande Frequenti

Il comando pip installa la libreria stessa, mentre nltk.download() scarica i corpus e i modelli addestrati come stopwords, PunkT e WordNet. Entrambi i passaggi sono necessari prima di tokenizzare o etichettare il testo.

Sรฌ. NLTK rimane popolare per la preelaborazione del testo che alimenta i modelli linguistici basati su linguaggio naturale (LLM), tra cui tokenizzazione, rimozione delle stop-word, stemming e etichettatura POS. รˆ inoltre ampiamente utilizzato nell'insegnamento e nella ricerca grazie alla sua API chiara e ai corpus classici.

NLTK รจ il migliore per imparare i fondamenti dell'NLP. spaCy รจ piรน veloce per la produzione, mentre Abbracciare i trasformatori del viso offre modelli di deep learning pre-addestrati. Molti progetti di intelligenza artificiale combinano la preelaborazione NLTK con l'inferenza transformer.

Riassumi questo post con: