Cómo descargar e instalar NLTK
⚡ Resumen inteligente
Descarga e instala NLTK en Windows, Mac o Linux instalando Python primero, luego agregando el Natural Language Toolkit a través de pip o Anaconda y descarga de los conjuntos de datos del corpus.

Instalación de NLTK en Windows
Aprenda cómo configurar NLTK en Windows desde la línea de comandos. Las instrucciones a continuación asumen Python aún no está instalado, por lo que el primer paso es instalarlo. Python.
La instalación de Python in Windows
Paso 1) Abre el enlace https://www.python.org/downloads/, y seleccione lo último Windows en libertad.
Nota: Para obtener una versión anterior, visite la pestaña Descargas para ver todas las versiones.
Paso 2) Haz clic en el archivo de instalación descargado.
Paso 3) Seleccione Personalizar instalación.
Paso 4) Haga clic en Siguiente.
Paso 5) En la siguiente pantalla:
- Seleccione las opciones avanzadas.
- Proporcione una ubicación de instalación personalizada. En este ejemplo, se elige una carpeta en la unidad C para facilitar el acceso.
- Haga clic en Instalar.
Paso 6) Haz clic en el botón Cerrar una vez que finalice la instalación.
Paso 7) Copie la ruta de su carpeta Scripts.
Paso 8) En la sección Windows símbolo del sistema:
- Navegue hasta la ubicación de la carpeta pip.
- Introduzca el comando para instalar NLTK:
pip3 install nltk
- La instalación debería completarse con éxito.
NOTA: Por Python 2. Utilice el comando pip2 install nltk.
Paso 9) En el campo Windows Menú Inicio, busque y abra el Python Cáscara.
Paso 10) Verifique que la instalación funcione ejecutando el siguiente comando:
import nltk
Si no aparece ningún error, la instalación se ha completado.
Instalación de NLTK en Mac/Linux
La instalación de NLTK en Mac o Linux requiere lo siguiente: Python Gestor de paquetes pip. Si pip no está instalado, siga las instrucciones a continuación para completar el proceso.
Paso 1) Actualizar el índice del paquete por typing El comando a continuación:
sudo apt update
Paso 2) Instalar pip para Python 3:
sudo apt install python3-pip
También puedes instalar pip a través de easy_install:
sudo apt-get install python-setuptools python-dev build-essential
Una vez instalado easy_install, ejecute el siguiente comando para instalar pip:
sudo easy_install pip
Paso 3) Utilice el siguiente comando para instalar NLTK:
sudo pip install -U nltk sudo pip3 install -U nltk
Instalación de NLTK a través de Anaconda
Paso 1) Instale Anaconda visitando https://www.anaconda.com/products/individual y seleccionando el Python versión que necesitas.
Nota: Consulte este tutorial para conocer los pasos detallados para instalar Anaconda.
Paso 2) En la indicación de Anaconda:
- Ingrese el comando:
conda install -c anaconda nltk
- RevVea la información sobre la actualización, degradación e instalación del paquete y, a continuación, escriba "sí".
- NLTK se ha descargado e instalado.
Conjunto de datos NLTK
El módulo NLTK incluye muchos conjuntos de datos que debe descargar antes de usarlo. Técnicamente, cada conjunto de datos se llama cuerpo. Los ejemplos comunes incluyen Para las palabras, Gutenberg, framenet_v15, gramáticas_grandes, marrón, el red de palabras.
Cómo descargar todos los paquetes de NLTK
Paso 1) Ejecute el Python Interprete in Windows o Linux.
Paso 2)
- Introduzca los comandos:
import nltk nltk.download ()
- Se abrirá la ventana del descargador de NLTK. Haga clic en el botón Descargar para obtener el conjunto de datos. Este proceso puede tardar un tiempo, dependiendo de su conexión a internet.
NOTA: Puedes cambiar la ubicación de descarga haciendo clic en Archivo > Cambiar directorio de descarga.
Paso 3) Para probar los datos instalados, utilice el siguiente código:
>>> from nltk.corpus import brown >>>brown.words()
['El', 'Fulton', 'Condado', 'Grand', 'Jurado', 'dijo',...]
Ejecutando el script de PNL
Esta sección explica cómo se ejecuta un script de PNL en un PC local. La elección de la biblioteca adecuada depende de sus requisitos. Consulte la lista oficial de bibliotecas de PNL para alternativas como spaCy, gensim y TextBlob.
Cómo ejecutar el script NLTK
Paso 1) En su editor de código favorito, copie el código y guarde el archivo como NLTKsample.py:
from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)
Code Explicación:
- El objetivo de este programa es eliminar todo tipo de puntuación de un texto dado. Importamos “RegexpTokenizer”, un módulo de NLTK que elimina cualquier expresión, símbolo, carácter o valor numérico que elijas.
- Se pasa una expresión regular al módulo “RegexpTokenizer”.
- El texto se tokeniza utilizando el método “tokenize”, y el resultado se almacena en la variable “filterdText”.
- El resultado se imprime usando “print()”.
Paso 2) En el símbolo del sistema:
- Navegue hasta la ubicación donde guardó el archivo.
- Ejecuta el comando
python NLTKsample.py.
El resultado es:
['Hola', 'Guru99', 'Tú', 'has', 'construido', 'un', 'sitio', 'muy', 'bueno', 'y', 'me encanta', 'visitar', 'tu', 'sitio']


















