NLTK를 다운로드하고 설치하는 방법 Windows/맥
NLTK 설치 Windows
이 부분에서는 터미널(Windows의 명령 프롬프트)을 통해 NLTK를 설정하는 방법을 알아보겠습니다.
아래 지침은 Python이 설치되어 있지 않다는 가정을 기반으로 합니다. 따라서 첫 번째 단계는 Python을 설치하는 것입니다.
설치 Python in Windows
단계 1) 링크로 이동 https://www.python.org/downloads/, Windows의 최신 버전을 선택하세요.
주의 사항: 최신 버전을 다운로드하고 싶지 않은 경우 다운로드 탭을 방문하여 모든 릴리스를 확인할 수 있습니다.
단계 2) 다운로드한 파일을 클릭하세요
단계 3)설치 사용자 정의를 선택하세요.
단계 4) 다음을 클릭하십시오.
단계 5) 다음 화면에서
- 고급 옵션을 선택하세요
- 사용자 지정 설치 위치를 지정합니다. 제 경우에는 작동이 편리하도록 C 드라이브의 폴더를 선택합니다.
- 설치를 클릭하십시오.
단계 6) 설치가 완료되면 닫기 버튼을 클릭하세요.
단계 7) Scripts 폴더의 경로를 복사하세요.
단계 8) Windows 명령 프롬프트에서
- pip 폴더 위치로 이동
- NLTK를 설치하려면 명령을 입력하세요.
pip3 install nltk
- 설치가 성공적으로 완료되어야 합니다.
주의사항: Python2 pip2 install nltk 명령을 사용하십시오.
단계 9) In Windows 시작 메뉴, 검색 및 열기 Python껍질
단계 10) 아래 명령을 제공하면 설치가 정확한지 확인할 수 있습니다.
import nltk
오류가 없으면 설치가 완료된 것입니다.
Mac/Linux에 NLTK 설치
Mac/Unix에 NLTK를 설치하려면 nltk를 설치하려면 Python 패키지 관리자 pip가 필요합니다. pip가 설치되지 않은 경우 아래 지침에 따라 프로세스를 완료하십시오.
1단계) 아래 명령을 입력하여 패키지 색인을 업데이트하십시오.
sudo apt update
2단계) pip 설치 Python 3:
sudo apt install python3-pip
easy_install을 사용하여 pip를 설치할 수도 있습니다.
sudo apt-get install python-setuptools python-dev build-essential
이제 easy_install이 설치되었습니다. 아래 명령을 실행하여 pip를 설치하세요.
sudo easy_install pip
3단계)다음 명령을 사용하여 NLTK를 설치하세요.
sudo pip install -U nltk sudo pip3 install -U nltk
Anaconda를 통해 NLTK 설치
1단계) 다음 사이트를 방문하여 아나콘다(다른 패키지를 설치하는 데에도 사용할 수 있음)를 설치하십시오. https://www.anaconda.com/products/individual 아나콘다에 설치해야 하는 Python 버전을 선택하세요.
참고: 자세한 단계는 이 튜토리얼을 참조하세요. 아나콘다 설치
단계 2)Anaconda 프롬프트에서,
- 명령 입력
conda install -c anaconda nltk
- Rev패키지 업그레이드, 다운그레이드, 설치 정보를 보고 yes를 입력합니다.
- NLTK가 다운로드되어 설치되었습니다.
NLTK 데이터세트
NLTK 모듈에는 사용하기 위해 다운로드해야 하는 많은 데이터 세트가 있습니다. 보다 기술적으로는 다음과 같이 불립니다. 원금. 일부 예는 다음과 같습니다. 스톱 워드, 구텐베르그, 프레임넷_v15, 큰 문법등등.
NLTK의 모든 패키지를 다운로드하는 방법
단계 1)실행 Python 통역사 in Windows 또는 리눅스
단계 2)
- 명령을 입력하세요
import nltk nltk.download ()
- NLTK 다운로드 창이 열립니다. 다운로드 버튼을 클릭하면 데이터 세트를 다운로드할 수 있습니다. 이 프로세스는 인터넷 연결 상태에 따라 시간이 걸립니다.
알림: 파일 > 다운로드 디렉터리 변경을 클릭하여 다운로드 위치를 변경할 수 있습니다.
단계 3) 설치된 데이터를 테스트하려면 다음 코드를 사용하십시오.
>>> from nltk.corpus import brown >>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', …]
NLP 스크립트 실행
우리는 로컬 PC에서 NLP 스크립트가 어떻게 실행되는지 논의할 것입니다. 시중에는 자연어 처리를 위한 라이브러리가 많이 있습니다. 따라서 라이브러리를 선택하는 것은 요구 사항에 맞는지에 따라 달라집니다. 다음은 목록입니다. NLP 라이브러리.
NLTK 스크립트를 실행하는 방법
1단계) 즐겨 사용하는 코드 편집기에서 코드를 복사하고 파일을 다음과 같이 저장하세요. "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer tokenizer = RegexpTokenizer(r'\w+') filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.') print(filterdText)
코드 설명 :
- 이 프로그램의 목표는 주어진 텍스트에서 모든 유형의 구두점을 제거하는 것이었습니다. 우리는 모듈인 "RegexpTokenizer"를 가져왔습니다. NLTK. 표현식, 기호, 문자, 숫자 또는 원하는 모든 것을 제거합니다.
- 방금 정규 표현식을 "RegexpTokenizer" 모듈에 전달했습니다.
- 또한 "tokenize" 모듈을 사용하여 단어를 토큰화했습니다. 출력은 "filterdText" 변수에 저장됩니다.
- 그리고 "print()"를 사용하여 인쇄했습니다.
2단계) 명령 프롬프트에서
- 파일을 저장한 위치로 이동합니다.
- 명령을 실행하십시오. Python NLTKsample.py
출력은 다음과 같이 표시됩니다.
['안녕하세요', 'Guru99', '당신', '갖고', '빌드', 'a', '매우', '좋다', '사이트', '그리고', '나', '사랑해요', ' 방문', '귀하의', '사이트']