Como baixar e instalar o NLTK no Windows/Mac

Instalando NLTK no Windows

Nesta parte aprenderemos como fazer a configuração do NLTK via terminal (prompt de comando no windows).

As instruções fornecidas abaixo são baseadas na suposição de que você não possui o python instalado. Então, o primeiro passo é instalar o python.

Instalando Python no Windows

Passo 1) Ir para o link https://www.python.org/downloads/, e selecione a versão mais recente para Windows.

Instalando Python no Windows

Note: Se não quiser baixar a versão mais recente, você pode visitar a aba de download e ver todos os lançamentos.

Instalando Python no Windows

Passo 2) Clique no arquivo baixado

Instalando Python no Windows

Passo 3)Selecione Personalizar instalação

Instalando Python no Windows

Passo 4) Clique em NEXT

Instalando Python no Windows

Passo 5) Na próxima tela

  1. Selecione as opções avançadas
  2. Forneça um local de instalação personalizado. No meu caso, uma pasta na unidade C é escolhida para facilitar a operação
  3. Clique em Instalar

Instalando Python no Windows

Passo 6) Clique no botão Fechar quando a instalação for concluída.

Instalando Python no Windows

Passo 7) Copie o caminho da sua pasta Scripts.

Instalando Python no Windows

Passo 8) No prompt de comando do Windows

  • Navegue até o local da pasta pip
  • Digite o comando para instalar o NLTK
    pip3 install nltk
  • A instalação deve ser feita com sucesso

Instalando Python no Windows

NOTA: Para Python2 use o comandopip2 install nltk

Passo 9) No menu Iniciar do Windows, pesquise e abra PythonShell

Instalando Python no Windows

Passo 10) Você pode verificar se a instalação está correta fornecendo o comando abaixo

import nltk

Instalando Python no Windows

Se você não encontrar nenhum erro, a instalação estará concluída.

Instalando NLTK no Mac/Linux

A instalação do NLTK no Mac/Unix requer o gerenciador de pacotes python pip para instalar o nltk. Se o pip não estiver instalado, siga as instruções abaixo para concluir o processo

Passo 1) Atualize o índice do pacote digitando o comando abaixo

sudo apt update

Passo 2) Instalando o pip para Python 3:

sudo apt install python3-pip

Você também pode instalar o pip usando easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

Agora easy_install está instalado. Execute o comando abaixo para instalar o pip

sudo easy_install pip

Passo 3)Use o seguintewing comando para instalar o NLTK

sudo pip install -U nltk
sudo pip3 install -U nltk

Instalando NLTK através do Anaconda

Passo 1) Por favor instale o anaconda (que também pode ser usado para instalar pacotes diferentes) visitando https://www.anaconda.com/products/individual e selecione qual versão do python você precisa instalar para o anaconda.

Instalando NLTK através do Anaconda

Nota: Consulte este tutorial para obter etapas detalhadas para instalar anaconda

Passo 2)No prompt do Anaconda,

  1. Digite o comando
    conda install -c anaconda nltk
  2. Revise as informações de atualização, downgrade e instalação do pacote e digite sim
  3. NLTK é baixado e instalado

Instalando NLTK através do Anaconda

Conjunto de dados NLTK

O módulo NLTK tem muitos conjuntos de dados disponíveis que você precisa baixar para usar. Mais tecnicamente é chamado corpus. Alguns dos exemplos são palavras irrelevantes, Gutenberg, framenet_v15, gramáticas_grandese assim por diante.

Como baixar todos os pacotes do NLTK

Passo 1)execute o Intérprete Python em Windows ou Linux

Passo 2)

  1. Digite os comandos
import nltk
nltk.download ()
  1. A janela baixada do NLTK é aberta. Clique no botão Download para baixar o conjunto de dados. Este processo levará algum tempo, dependendo da sua conexão com a Internet

Baixe todos os pacotes do NLTK

NOTA: Você pode alterar o local de download clicando em Arquivo> Alterar diretório de download

Baixe todos os pacotes do NLTK

Passo 3) Para testar os dados instalados use o seguintewing código

>>> from nltk.corpus import brown
>>>brown.words()

['O', 'Fulton', 'Condado', 'Grande', 'Júri', 'disse',…]

Baixe todos os pacotes do NLTK

Executando o script de PNL

Discutiremos como o script de PNL será executado em nosso PC local. Existem muitas bibliotecas para Processamento de Linguagem Natural presentes no mercado. Portanto, a escolha de uma biblioteca depende de atender às suas necessidades. Aqui está a lista de Bibliotecas de PNL.

Como executar o script NLTK

Passo 1) No seu editor de código favorito, copie o código e salve o arquivo como "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Execute o script NLTK

Explicação do código:

  1. Neste programa, o objetivo era remover todo tipo de pontuação de um determinado texto. Importamos “RegexpTokenizer” que é um módulo de NLTK. Remove todas as expressões, símbolos, caracteres, numéricos ou qualquer coisa que você desejar.
  2. Você acabou de passar a expressão regular para o módulo “RegexpTokenizer”.
  3. Além disso, tokenizamos a palavra usando o módulo “tokenize”. A saída é armazenada na variável “filterdText”.
  4. E imprimi-los usando “print().”

Passo 2) No prompt de comando

  • Navegue até o local onde você salvou o arquivo
  • Execute o comando Python NLTKsample.py

Execute o script NLTK

Isso mostrará a saída como:

['Olá', 'Guru99', 'Você', 'tem', 'construir', 'a', 'muito', 'bom', 'site', 'e', ​​'Eu', 'amo', ' visitando', 'seu', 'site']