Como baixar e instalar o NLTK
โก Resumo Inteligente
Baixe e instale o NLTK em Windows, Mac ou Linux, instalando Python primeiro, depois adicionando o Natural Language ToolInstale o kit atravรฉs do pip ou Anaconda e baixe os conjuntos de dados do corpus.

Instalando o NLTK em Windows
Aprenda como configurar o NLTK em Windows a partir da linha de comando. As instruรงรตes abaixo pressupรตem Python Ainda nรฃo estรก instalado, entรฃo o primeiro passo รฉ instalar. Python.
Instalando Python in Windows
Passo 1) Abra o link https://www.python.org/downloads/, e selecione a mais recente Windows liberar.
ObservaรงรฃoPara versรตes anteriores, visite a aba Downloads para ver todas as versรตes lanรงadas.
Passo 2) Clique no arquivo de instalaรงรฃo que vocรช baixou.
Passo 3) Selecione "Personalizar instalaรงรฃo".
Passo 4) Clique em PRรXIMO.
Passo 5) Na prรณxima tela:
- Selecione as opรงรตes avanรงadas.
- Forneรงa um local de instalaรงรฃo personalizado. Neste exemplo, uma pasta na unidade C foi escolhida para facilitar o acesso.
- Clique em Instalar.
Passo 6) Clique no botรฃo Fechar assim que a instalaรงรฃo terminar.
Passo 7) Copie o caminho da sua pasta Scripts.
Passo 8) De acordo com o relatรณrio Windows linha de comando:
- Navegue atรฉ a localizaรงรฃo da pasta pip.
- Digite o comando para instalar o NLTK:
pip3 install nltk
- A instalaรงรฃo deverรก ser concluรญda com sucesso.
NOTA: Para Python 2, use o comando pip2 install nltk.
Passo 9) De Windows Menu Iniciar, pesquise e abra o Python Concha.
Passo 10) Verifique se a instalaรงรฃo funciona executando o comando abaixo:
import nltk
Se nenhum erro for exibido, a instalaรงรฃo estรก concluรญda.
Instalando NLTK no Mac/Linux
A instalaรงรฃo do NLTK no Mac ou Linux requer o seguinte: Python gerenciador de pacotes pip. Se o pip nรฃo estiver instalado, siga as instruรงรตes abaixo para concluir o processo.
Passo 1) Atualize o รญndice de pacotes por typing O comando abaixo:
sudo apt update
Passo 2) Instale o pip para Python 3:
sudo apt install python3-pip
Vocรช tambรฉm pode instalar o pip atravรฉs do easy_install:
sudo apt-get install python-setuptools python-dev build-essential
Apรณs instalar o easy_install, execute o comando abaixo para instalar o pip:
sudo easy_install pip
Passo 3) Utilize o seguinte comando para instalar o NLTK:
sudo pip install -U nltk sudo pip3 install -U nltk
Instalando NLTK atravรฉs do Anaconda
Passo 1) Instale o Anaconda visitando https://www.anaconda.com/products/individual e selecionando o Python versรฃo que vocรช precisa.
Nota: Consulte este tutorial para obter etapas detalhadas para Instalar Anaconda.
Passo 2) No prompt do Anaconda:
- Digite o comando:
conda install -c anaconda nltk
- RevVeja as informaรงรตes sobre atualizaรงรฃo, downgrade e instalaรงรฃo do pacote e, em seguida, digite "sim".
- O NLTK foi baixado e instalado.
Conjunto de dados NLTK
O mรณdulo NLTK รฉ fornecido com vรกrios conjuntos de dados que vocรช precisa baixar antes de usar. Tecnicamente, cada conjunto de dados รฉ chamado de... corpus. Exemplos comuns incluem palavras irrelevantes, Gutenberg, framenet_v15, gramรกticas_grandes, marrom e rede de palavras.
Como baixar todos os pacotes do NLTK
Passo 1) execute o Python intรฉrprete in Windows ou Linux.
Passo 2)
- Digite os comandos:
import nltk nltk.download ()
- A janela do NLTK Downloader serรก aberta. Clique no botรฃo Download para obter o conjunto de dados. Esse processo pode demorar dependendo da sua conexรฃo com a internet.
OBSERVAรรO: Vocรช pode alterar o local de download clicando em Arquivo > Alterar diretรณrio de download.
Passo 3) Para testar os dados instalados, utilize o seguinte cรณdigo:
>>> from nltk.corpus import brown >>>brown.words()
['O', 'Fulton', 'Condado', 'Grande', 'Jรบri', 'disse',โฆ]
Executando o script de PNL
Esta seรงรฃo explica como um script de PNL (Processamento de Linguagem Natural) รฉ executado em um computador local. A escolha da biblioteca adequada depende das suas necessidades. Consulte a lista oficial de bibliotecas. Bibliotecas de PNL para alternativas como spaCy, gensim e TextBlob.
Como executar o script NLTK
Passo 1) No seu editor de cรณdigo favorito, copie o cรณdigo e salve o arquivo como NLTKsample.py:
from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)
Code Explicaรงรฃo:
- O objetivo deste programa รฉ remover todos os tipos de pontuaรงรฃo de um texto. Importamos o mรณdulo โRegexpTokenizerโ da biblioteca padrรฃo. NLTK que remove qualquer expressรฃo, sรญmbolo, caractere ou valor numรฉrico que vocรช escolher.
- Uma expressรฃo regular รฉ passada para o mรณdulo โRegexpTokenizerโ.
- O texto รฉ tokenizado usando o mรฉtodo โtokenizeโ, e o resultado รฉ armazenado na variรกvel โfilterdTextโ.
- O resultado รฉ impresso usando โprint()โ.
Passo 2) Na linha de comando:
- Navegue atรฉ o local onde vocรช salvou o arquivo.
- Execute o comando
python NLTKsample.py.
A saรญda รฉ:
['Olรก', 'Guru99', 'Vocรช', 'construiu', 'um', 'muito', 'bom', 'site', 'e', โโ'eu', 'adoro', 'visitar', 'seu', 'site']


















