Come scaricare e installare NLTK su Windows/Mac

Installazione di NLTK in Windows

In questa parte impareremo come configurare NLTK tramite terminale (prompt dei comandi in Windows).

Le istruzioni fornite di seguito si basano sul presupposto che non sia installato Python. Quindi, il primo passo è installare Python.

Installazione Python in Windows

Passo 1) Vai al collegamento https://www.python.org/downloads/, e seleziona la versione più recente per Windows.

Installazione Python in Windows

Note:: Se non desideri scaricare la versione più recente, puoi visitare la scheda download e vedere tutte le versioni.

Installazione Python in Windows

Passo 2) Fare clic sul file scaricato

Installazione Python in Windows

Passo 3)Seleziona Personalizza installazione

Installazione Python in Windows

Passo 4) Fai clic su AVANTI

Installazione Python in Windows

Passo 5) Nella schermata successiva

  1. Seleziona le opzioni avanzate
  2. Fornisci un percorso di installazione personalizzato. Nel mio caso, viene scelta una cartella sull'unità C per facilità d'uso
  3. Fare clic su Installa

Installazione Python in Windows

Passo 6) Fare clic sul pulsante Chiudi una volta completata l'installazione.

Installazione Python in Windows

Passo 7) Copia il percorso della cartella Scripts.

Installazione Python in Windows

Passo 8) Nel prompt dei comandi di Windows

  • Passare alla posizione della cartella pip
  • Immettere il comando per installare NLTK
    pip3 install nltk
  • L'installazione dovrebbe essere eseguita correttamente

Installazione Python in Windows

NOTA: Per Python2 utilizzare il comando pip2 install nltk

Passo 9) In Windows Menu Start, cerca e apri PythonConchiglia

Installazione Python in Windows

Passo 10) Puoi verificare se l'installazione è corretta fornendo il comando seguente

import nltk

Installazione Python in Windows

Se non viene visualizzato alcun errore, l'installazione è completata.

Installazione di NLTK su Mac/Linux

L'installazione di NLTK in Mac/Unix richiede il gestore pacchetti Python pip per installare nltk. Se pip non è installato, seguire le istruzioni seguenti per completare il processo

Passo 1) Aggiorna l'indice del pacchetto digitando il comando seguente

sudo apt update

Passo 2) Installazione di pip per Python 3:

sudo apt install python3-pip

Puoi anche installare pip usando easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

Ora easy_install è installato. Esegui il comando seguente per installare pip

sudo easy_install pip

Passo 3)Utilizzare il seguente comando per installare NLTK

sudo pip install -U nltk
sudo pip3 install -U nltk

Installazione di NLTK tramite Anaconda

Passo 1) Installa anaconda (che può essere utilizzato anche per installare pacchetti diversi) visitando https://www.anaconda.com/products/individual e seleziona quale versione di Python devi installare per anaconda.

Installazione di NLTK tramite Anaconda

Nota: fare riferimento a questo tutorial per i passaggi dettagliati su installa anaconda

Passo 2)Nel prompt di Anaconda,

  1. Inserisci il comando
    conda install -c anaconda nltk
  2. Revvisualizza l'aggiornamento del pacchetto, il downgrade, le informazioni di installazione e inserisci sì
  3. NLTK viene scaricato e installato

Installazione di NLTK tramite Anaconda

Set di dati NLTK

Il modulo NLTK ha molti set di dati disponibili che devi scaricare per utilizzare. Più tecnicamente si chiama corpo. Alcuni degli esempi sono parole d'ordine, Gutenberg, framenet_v15, large_grammarse così via.

Come scaricare tutti i pacchetti di NLTK

Passo 1)Corri il Python interprete in Windows o Linux

Passo 2)

  1. Inserisci i comandi
import nltk
nltk.download ()
  1. Si apre la finestra NLTK scaricata. Fare clic sul pulsante Scarica per scaricare il set di dati. Questo processo richiederà tempo, in base alla tua connessione Internet

Scarica tutti i pacchetti di NLTK

NOTA: È possibile modificare il percorso di download facendo clic su File> Cambia directory di download

Scarica tutti i pacchetti di NLTK

Passo 3) Per testare i dati installati utilizzare il seguente codice

>>> from nltk.corpus import brown
>>>brown.words()

['Il', 'Fulton', 'County', 'Grand', 'Jury', 'ha detto', …]

Scarica tutti i pacchetti di NLTK

Esecuzione dello script PNL

Discuteremo come verrà eseguito lo script NLP sul nostro PC locale. Sono numerose le librerie per l'elaborazione del linguaggio naturale presenti sul mercato. Quindi la scelta di una libreria dipende dalla capacità di soddisfare le tue esigenze. Ecco l'elenco dei Librerie di PNL.

Come eseguire lo script NLTK

Passo 1) Nel tuo editor di codice preferito, copia il codice e salva il file con nome "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Esegui lo script NLTK

Spiegazione del codice:

  1. In questo programma, l'obiettivo era rimuovere tutti i tipi di punteggiatura dal testo. Abbiamo importato "RegexpTokenizer" che è un modulo di NLTK. Rimuove tutte le espressioni, i simboli, i caratteri, i numeri o qualsiasi cosa tu voglia.
  2. Hai appena passato l'espressione regolare al modulo "RegexpTokenizer".
  3. Inoltre, abbiamo tokenizzato la parola utilizzando il modulo “tokenize”. L'output viene memorizzato nella variabile "filterdText".
  4. E li ho stampati usando "print()".

Passo 2) Nel prompt dei comandi

  • Passare alla posizione in cui hai salvato il file
  • Esegui il comando Python NLTKsample.py

Esegui lo script NLTK

Questo mostrerà l'output come:

['Ciao', 'Guru99', 'Tu', 'hai', 'costruisci', 'a', 'molto', 'buono', 'sito', 'e', ​​'io', 'amore', ' visitando', 'tuo', 'sito']