NLTK를 다운로드하고 설치하는 방법 Windows/맥

NLTK 설치 Windows

이 부분에서는 터미널(Windows의 명령 프롬프트)을 통해 NLTK를 설정하는 방법을 알아보겠습니다.

아래 지침은 Python이 설치되어 있지 않다는 가정을 기반으로 합니다. 따라서 첫 번째 단계는 Python을 설치하는 것입니다.

설치 Python in Windows

단계 1) 링크로 이동 https://www.python.org/downloads/, Windows의 최신 버전을 선택하세요.

설치 Python in Windows

주의 사항: 최신 버전을 다운로드하고 싶지 않은 경우 다운로드 탭을 방문하여 모든 릴리스를 확인할 수 있습니다.

설치 Python in Windows

단계 2) 다운로드한 파일을 클릭하세요

설치 Python in Windows

단계 3)설치 사용자 정의를 선택하세요.

설치 Python in Windows

단계 4) 다음을 클릭하십시오.

설치 Python in Windows

단계 5) 다음 화면에서

  1. 고급 옵션을 선택하세요
  2. 사용자 지정 설치 위치를 지정합니다. 제 경우에는 작동이 편리하도록 C 드라이브의 폴더를 선택합니다.
  3. 설치를 클릭하십시오.

설치 Python in Windows

단계 6) 설치가 완료되면 닫기 버튼을 클릭하세요.

설치 Python in Windows

단계 7) Scripts 폴더의 경로를 복사하세요.

설치 Python in Windows

단계 8) Windows 명령 프롬프트에서

  • pip 폴더 위치로 이동
  • NLTK를 설치하려면 명령을 입력하세요.
    pip3 install nltk
  • 설치가 성공적으로 완료되어야 합니다.

설치 Python in Windows

주의사항: Python2 pip2 install nltk 명령을 사용하십시오.

단계 9) In Windows 시작 메뉴, 검색 및 열기 Python껍질

설치 Python in Windows

단계 10) 아래 명령을 제공하면 설치가 정확한지 확인할 수 있습니다.

import nltk

설치 Python in Windows

오류가 없으면 설치가 완료된 것입니다.

Mac/Linux에 NLTK 설치

Mac/Unix에 NLTK를 설치하려면 nltk를 설치하려면 Python 패키지 관리자 pip가 필요합니다. pip가 설치되지 않은 경우 아래 지침에 따라 프로세스를 완료하십시오.

1단계) 아래 명령을 입력하여 패키지 색인을 업데이트하십시오.

sudo apt update

2단계) pip 설치 Python 3:

sudo apt install python3-pip

easy_install을 사용하여 pip를 설치할 수도 있습니다.

sudo apt-get install python-setuptools  python-dev build-essential

이제 easy_install이 설치되었습니다. 아래 명령을 실행하여 pip를 설치하세요.

sudo easy_install pip

3단계)다음 명령을 사용하여 NLTK를 설치하세요.

sudo pip install -U nltk
sudo pip3 install -U nltk

Anaconda를 통해 NLTK 설치

1단계) 다음 사이트를 방문하여 아나콘다(다른 패키지를 설치하는 데에도 사용할 수 있음)를 설치하십시오. https://www.anaconda.com/products/individual 아나콘다에 설치해야 하는 Python 버전을 선택하세요.

Anaconda를 통해 NLTK 설치

참고: 자세한 단계는 이 튜토리얼을 참조하세요. 아나콘다 설치

단계 2)Anaconda 프롬프트에서,

  1. 명령 입력
    conda install -c anaconda nltk
  2. Rev패키지 업그레이드, 다운그레이드, 설치 정보를 보고 yes를 입력합니다.
  3. NLTK가 다운로드되어 설치되었습니다.

Anaconda를 통해 NLTK 설치

NLTK 데이터세트

NLTK 모듈에는 사용하기 위해 다운로드해야 하는 많은 데이터 세트가 있습니다. 보다 기술적으로는 다음과 같이 불립니다. 원금. 일부 예는 다음과 같습니다. 스톱 워드, 구텐베르그, 프레임넷_v15, 큰 문법등등.

NLTK의 모든 패키지를 다운로드하는 방법

단계 1)실행 Python 통역사 in Windows 또는 리눅스

단계 2)

  1. 명령을 입력하세요
import nltk
nltk.download ()
  1. NLTK 다운로드 창이 열립니다. 다운로드 버튼을 클릭하면 데이터 세트를 다운로드할 수 있습니다. 이 프로세스는 인터넷 연결 상태에 따라 시간이 걸립니다.

NLTK의 모든 패키지 다운로드

알림: 파일 > 다운로드 디렉터리 변경을 클릭하여 다운로드 위치를 변경할 수 있습니다.

NLTK의 모든 패키지 다운로드

단계 3) 설치된 데이터를 테스트하려면 다음 코드를 사용하십시오.

>>> from nltk.corpus import brown
>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', …]

NLTK의 모든 패키지 다운로드

NLP 스크립트 실행

우리는 로컬 PC에서 NLP 스크립트가 어떻게 실행되는지 논의할 것입니다. 시중에는 자연어 처리를 위한 라이브러리가 많이 있습니다. 따라서 라이브러리를 선택하는 것은 요구 사항에 맞는지에 따라 달라집니다. 다음은 목록입니다. NLP 라이브러리.

NLTK 스크립트를 실행하는 방법

1단계) 즐겨 사용하는 코드 편집기에서 코드를 복사하고 파일을 다음과 같이 저장하세요. "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

NLTK 스크립트 실행

코드 설명 :

  1. 이 프로그램의 목표는 주어진 텍스트에서 모든 유형의 구두점을 제거하는 것이었습니다. 우리는 모듈인 "RegexpTokenizer"를 가져왔습니다. NLTK. 표현식, 기호, 문자, 숫자 또는 원하는 모든 것을 제거합니다.
  2. 방금 정규 표현식을 "RegexpTokenizer" 모듈에 전달했습니다.
  3. 또한 "tokenize" 모듈을 사용하여 단어를 토큰화했습니다. 출력은 "filterdText" 변수에 저장됩니다.
  4. 그리고 "print()"를 사용하여 인쇄했습니다.

2단계) 명령 프롬프트에서

  • 파일을 저장한 위치로 이동합니다.
  • 명령을 실행하십시오. Python NLTKsample.py

NLTK 스크립트 실행

출력은 다음과 같이 표시됩니다.

['안녕하세요', 'Guru99', '당신', '갖고', '빌드', 'a', '매우', '좋다', '사이트', '그리고', '나', '사랑해요', ' 방문', '귀하의', '사이트']