Como baixar e instalar o NLTK

โšก Resumo Inteligente

Baixe e instale o NLTK em Windows, Mac ou Linux, instalando Python primeiro, depois adicionando o Natural Language ToolInstale o kit atravรฉs do pip ou Anaconda e baixe os conjuntos de dados do corpus.

  • โœ… Requisito: Instale Python antes de adicionar o NLTK.
  • โš™๏ธ Instalar: Use o pip, easy_install ou Anaconda.
  • ๐Ÿ“š Conjuntos de dados: Execute nltk.download() para obter os corpora.
  • ๐Ÿ Verificar: importar nltk no Python Concha.
  • ๐Ÿค– Uso da IA: Tokenizaรงรฃo e etiquetagem para fluxos de trabalho de PNL (Processamento de Linguagem Natural).

Baixe e instale o NLTK.

Instalando o NLTK em Windows

Aprenda como configurar o NLTK em Windows a partir da linha de comando. As instruรงรตes abaixo pressupรตem Python Ainda nรฃo estรก instalado, entรฃo o primeiro passo รฉ instalar. Python.

Instalando Python in Windows

Passo 1) Abra o link https://www.python.org/downloads/, e selecione a mais recente Windows liberar.

Instalando Python in Windows

ObservaรงรฃoPara versรตes anteriores, visite a aba Downloads para ver todas as versรตes lanรงadas.

Instalando Python in Windows

Passo 2) Clique no arquivo de instalaรงรฃo que vocรช baixou.

Instalando Python in Windows

Passo 3) Selecione "Personalizar instalaรงรฃo".

Instalando Python in Windows

Passo 4) Clique em PRร“XIMO.

Instalando Python in Windows

Passo 5) Na prรณxima tela:

  1. Selecione as opรงรตes avanรงadas.
  2. Forneรงa um local de instalaรงรฃo personalizado. Neste exemplo, uma pasta na unidade C foi escolhida para facilitar o acesso.
  3. Clique em Instalar.

Instalando Python in Windows

Passo 6) Clique no botรฃo Fechar assim que a instalaรงรฃo terminar.

Instalando Python in Windows

Passo 7) Copie o caminho da sua pasta Scripts.

Instalando Python in Windows

Passo 8) De acordo com o relatรณrio Windows linha de comando:

  • Navegue atรฉ a localizaรงรฃo da pasta pip.
  • Digite o comando para instalar o NLTK:
    pip3 install nltk
  • A instalaรงรฃo deverรก ser concluรญda com sucesso.

Instalando Python in Windows

NOTA: Para Python 2, use o comando pip2 install nltk.

Passo 9) De Windows Menu Iniciar, pesquise e abra o Python Concha.

Instalando Python in Windows

Passo 10) Verifique se a instalaรงรฃo funciona executando o comando abaixo:

import nltk

Instalando Python in Windows

Se nenhum erro for exibido, a instalaรงรฃo estรก concluรญda.

Instalando NLTK no Mac/Linux

A instalaรงรฃo do NLTK no Mac ou Linux requer o seguinte: Python gerenciador de pacotes pip. Se o pip nรฃo estiver instalado, siga as instruรงรตes abaixo para concluir o processo.

Passo 1) Atualize o รญndice de pacotes por typing O comando abaixo:

sudo apt update

Passo 2) Instale o pip para Python 3:

sudo apt install python3-pip

Vocรช tambรฉm pode instalar o pip atravรฉs do easy_install:

sudo apt-get install python-setuptools  python-dev build-essential

Apรณs instalar o easy_install, execute o comando abaixo para instalar o pip:

sudo easy_install pip

Passo 3) Utilize o seguinte comando para instalar o NLTK:

sudo pip install -U nltk
sudo pip3 install -U nltk

Instalando NLTK atravรฉs do Anaconda

Passo 1) Instale o Anaconda visitando https://www.anaconda.com/products/individual e selecionando o Python versรฃo que vocรช precisa.

Instalando NLTK atravรฉs do Anaconda

Nota: Consulte este tutorial para obter etapas detalhadas para Instalar Anaconda.

Passo 2) No prompt do Anaconda:

  1. Digite o comando:
    conda install -c anaconda nltk
  2. RevVeja as informaรงรตes sobre atualizaรงรฃo, downgrade e instalaรงรฃo do pacote e, em seguida, digite "sim".
  3. O NLTK foi baixado e instalado.

Instalando NLTK atravรฉs do Anaconda

Conjunto de dados NLTK

O mรณdulo NLTK รฉ fornecido com vรกrios conjuntos de dados que vocรช precisa baixar antes de usar. Tecnicamente, cada conjunto de dados รฉ chamado de... corpus. Exemplos comuns incluem palavras irrelevantes, Gutenberg, framenet_v15, gramรกticas_grandes, marrom e rede de palavras.

Como baixar todos os pacotes do NLTK

Passo 1) execute o Python intรฉrprete in Windows ou Linux.

Passo 2)

  1. Digite os comandos:
import nltk
nltk.download ()
  1. A janela do NLTK Downloader serรก aberta. Clique no botรฃo Download para obter o conjunto de dados. Esse processo pode demorar dependendo da sua conexรฃo com a internet.

Baixe todos os pacotes do NLTK

OBSERVAร‡รƒO: Vocรช pode alterar o local de download clicando em Arquivo > Alterar diretรณrio de download.

Baixe todos os pacotes do NLTK

Passo 3) Para testar os dados instalados, utilize o seguinte cรณdigo:

>>> from nltk.corpus import brown
>>>brown.words()

['O', 'Fulton', 'Condado', 'Grande', 'Jรบri', 'disse',โ€ฆ]

Baixe todos os pacotes do NLTK

Executando o script de PNL

Esta seรงรฃo explica como um script de PNL (Processamento de Linguagem Natural) รฉ executado em um computador local. A escolha da biblioteca adequada depende das suas necessidades. Consulte a lista oficial de bibliotecas. Bibliotecas de PNL para alternativas como spaCy, gensim e TextBlob.

Como executar o script NLTK

Passo 1) No seu editor de cรณdigo favorito, copie o cรณdigo e salve o arquivo como NLTKsample.py:

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Execute o script NLTK

Code Explicaรงรฃo:

  1. O objetivo deste programa รฉ remover todos os tipos de pontuaรงรฃo de um texto. Importamos o mรณdulo โ€œRegexpTokenizerโ€ da biblioteca padrรฃo. NLTK que remove qualquer expressรฃo, sรญmbolo, caractere ou valor numรฉrico que vocรช escolher.
  2. Uma expressรฃo regular รฉ passada para o mรณdulo โ€œRegexpTokenizerโ€.
  3. O texto รฉ tokenizado usando o mรฉtodo โ€œtokenizeโ€, e o resultado รฉ armazenado na variรกvel โ€œfilterdTextโ€.
  4. O resultado รฉ impresso usando โ€œprint()โ€.

Passo 2) Na linha de comando:

  • Navegue atรฉ o local onde vocรช salvou o arquivo.
  • Execute o comando python NLTKsample.py.

Execute o script NLTK

A saรญda รฉ:

['Olรก', 'Guru99', 'Vocรช', 'construiu', 'um', 'muito', 'bom', 'site', 'e', โ€‹โ€‹'eu', 'adoro', 'visitar', 'seu', 'site']

Perguntas Frequentes

O comando pip instala a biblioteca em si, enquanto nltk.download() baixa corpora e modelos treinados, como stopwords, punkt e wordnet. Ambas as etapas sรฃo necessรกrias antes de tokenizar ou etiquetar o texto.

Sim. O NLTK continua popular para o prรฉ-processamento de textos que alimentam modelos de linguagem linguรญstica (LLMs), incluindo tokenizaรงรฃo, remoรงรฃo de palavras irrelevantes (stop words), stemming e etiquetagem POS. Ele tambรฉm รฉ amplamente utilizado no ensino e na pesquisa graรงas ร  sua API clara e aos seus corpora clรกssicos.

NLTK รฉ a melhor opรงรฃo para aprender os fundamentos de PNL. O spaCy รฉ mais rรกpido para produรงรฃo, enquanto Transformadores de rosto abraรงando Oferece modelos de aprendizado profundo prรฉ-treinados. Muitos projetos de IA combinam o prรฉ-processamento do NLTK com a inferรชncia de transformadores.

Resuma esta postagem com: