Cómo descargar e instalar NLTK en Windows/Mac

Instalación de NLTK en Windows

En esta parte, aprenderemos cómo configurar NLTK a través de la terminal (símbolo del sistema en Windows).

Las instrucciones que se proporcionan a continuación se basan en el supuesto de que no tiene Python instalado. Entonces, el primer paso es instalar Python.

La instalación de Python in Windows

Paso 1) Ir al enlace https://www.python.org/downloads/, y seleccione la última versión para Windows.

La instalación de Python in Windows

Nota: : Si no desea descargar la última versión, puede visitar la pestaña de descarga y ver todas las versiones.

La instalación de Python in Windows

Paso 2) Haga clic en el archivo descargado

La instalación de Python in Windows

Paso 3)Seleccione Personalizar instalación

La instalación de Python in Windows

Paso 4) Haga clic en Siguiente

La instalación de Python in Windows

Paso 5) En la siguiente pantalla

  1. Selecciona las opciones avanzadas
  2. Proporcione una ubicación de instalación personalizada. En mi caso, se eligió una carpeta en la unidad C para facilitar su funcionamiento.
  3. Haga clic en Instalar

La instalación de Python in Windows

Paso 6) Haga clic en el botón Cerrar una vez finalizada la instalación.

La instalación de Python in Windows

Paso 7) Copie la ruta de su carpeta Scripts.

La instalación de Python in Windows

Paso 8) En el símbolo del sistema de Windows

  • Navegue hasta la ubicación de la carpeta pip
  • Ingrese el comando para instalar NLTK
    pip3 install nltk
  • La instalación debe realizarse con éxito.

La instalación de Python in Windows

NOTA: Por Python2 use el comandopip2 instale nltk

Paso 9) In Windows Menú Inicio, buscar y abrir PythonCáscara

La instalación de Python in Windows

Paso 10) Puede verificar si la instalación es precisa suministrando el siguiente comando

import nltk

La instalación de Python in Windows

Si no ve ningún error, la instalación está completa.

Instalación de NLTK en Mac/Linux

La instalación de NLTK en Mac/Unix requiere pip del administrador de paquetes de Python para instalar nltk. Si pip no está instalado, siga las instrucciones a continuación para completar el proceso

Paso 1) Actualice el índice del paquete escribiendo el siguiente comando

sudo apt update

Paso 2) Instalación de tubería para Python 3:

sudo apt install python3-pip

También puedes instalar pip usando easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

Ahora está instalado easy_install. Ejecute el siguiente comando para instalar pip

sudo easy_install pip

Paso 3)Utilice el siguiente comando para instalar NLTK

sudo pip install -U nltk
sudo pip3 install -U nltk

Instalación de NLTK a través de Anaconda

Paso 1) Instale anaconda (que también se puede utilizar para instalar diferentes paquetes) visitando https://www.anaconda.com/products/individual y seleccione qué versión de Python necesita instalar para anaconda.

Instalación de NLTK a través de Anaconda

Nota: Consulte este tutorial para conocer los pasos detallados para instalar anaconda

Paso 2)En el mensaje de Anaconda,

  1. Ingrese el comando
    conda install -c anaconda nltk
  2. RevVea la información de actualización, degradación e instalación del paquete e ingrese sí
  3. NLTK está descargado e instalado

Instalación de NLTK a través de Anaconda

Conjunto de datos NLTK

El módulo NLTK tiene muchos conjuntos de datos disponibles que debe descargar para usarlos. Más técnicamente se llama cuerpo. Algunos de los ejemplos son Para las palabras, Gutenberg, framenet_v15, gramáticas_grandesy así sucesivamente.

Cómo descargar todos los paquetes de NLTK

Paso 1)Ejecute el Python Interprete in Windows o Linux

Paso 2)

  1. Introduce los comandos
import nltk
nltk.download ()
  1. Se abre la ventana descargada de NLTK. Haga clic en el botón Descargar para descargar el conjunto de datos. Este proceso llevará tiempo, según su conexión a Internet.

Descargue todos los paquetes de NLTK

NOTA: Puede cambiar la ubicación de descarga haciendo clic en Archivo> Cambiar directorio de descarga

Descargue todos los paquetes de NLTK

Paso 3) Para probar los datos instalados utilice el siguiente código

>>> from nltk.corpus import brown
>>>brown.words()

['El', 'Fulton', 'Condado', 'Grand', 'Jurado', 'dijo',...]

Descargue todos los paquetes de NLTK

Ejecutando el script de PNL

Vamos a discutir cómo se ejecutará el script NLP en nuestra PC local. Existen muchas bibliotecas para el procesamiento del lenguaje natural presentes en el mercado. Por lo tanto, elegir una biblioteca depende de que se ajuste a sus necesidades. Aquí está la lista de bibliotecas de PNL.

Cómo ejecutar el script NLTK

Paso 1) En su editor de código favorito, copie el código y guarde el archivo como "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Ejecutar secuencia de comandos NLTK

Explicación del código:

  1. En este programa, el objetivo era eliminar todo tipo de puntuación del texto dado. Importamos “RegexpTokenizer”, que es un módulo de NLTK. Elimina todas las expresiones, símbolos, caracteres, números o cualquier cosa que desee.
  2. Acaba de pasar la expresión normal al módulo "RegexpTokenizer".
  3. Además, tokenizamos la palabra usando el módulo "tokenizar". La salida se almacena en la variable "filterdText".
  4. Y los imprimimos usando "print()".

Paso 2) En el símbolo del sistema

  • Navegue hasta la ubicación donde guardó el archivo.
  • Ejecuta el comando Python NLTKsample.py

Ejecutar secuencia de comandos NLTK

Esto mostrará el resultado como:

['Hola', 'Guru99', 'Tú', 'tener', 'construir', 'un', 'muy', 'bueno', 'sitio', 'y', 'yo', 'amor', ' visitando', 'tu', 'sitio']