Python Urllib.Request 및 urlopen()을 사용한 인터넷 액세스
Urlib 란 무엇입니까?
urllib는 Python URL을 여는 데 사용할 수 있는 모듈입니다. URL 작업에 도움이 되는 함수와 클래스를 정의합니다.
와 Python XML, HTML, JSON 등과 같은 데이터를 인터넷에서 액세스하고 검색할 수도 있습니다. Python 이 데이터를 직접 사용하여 작업합니다. 이번 튜토리얼에서는 웹에서 데이터를 검색하는 방법을 살펴보겠습니다. 예를 들어 여기서는 guru99 비디오 URL을 사용했으며 다음을 사용하여 이 비디오 URL에 액세스하겠습니다. Python 이 URL의 HTML 파일을 인쇄할 수도 있습니다.
Urllib을 사용하여 URL을 여는 방법
인터넷 데이터에 연결하는 코드를 실행하기 전에 URL 라이브러리 모듈 또는 "urllib"에 대한 명령문을 가져와야 합니다.
- urllib 가져오기
- 주요 기능 정의
- webUrl 변수 선언
- 그런 다음 URL lib 라이브러리에서 urlopen 함수를 호출합니다.
- 우리가 여는 URL은 유튜브의 guru99 튜토리얼입니다
- 다음으로 결과 코드를 인쇄하겠습니다.
- 결과 코드는 우리가 생성한 webUrl 변수에 대해 getcode 함수를 호출하여 검색됩니다.
- 이를 문자열로 변환하여 "결과 코드"라는 문자열과 연결할 수 있습니다.
- 이는 http 요청이 성공적으로 처리되었음을 나타내는 일반 HTTP 코드 "200"입니다.
HTML 파일 형식 URL을 얻는 방법 Python
의 "읽기 기능"을 사용하여 HTML 파일을 읽을 수도 있습니다. Python, 코드를 실행하면 HTML 파일이 콘솔에 나타납니다.
- webURL 변수에 대한 읽기 함수를 호출합니다.
- 읽기 변수를 사용하면 데이터 파일의 내용을 읽을 수 있습니다.
- URL의 전체 내용을 data라는 변수로 읽어옵니다.
- 코드 실행 - 데이터가 HTML 형식으로 인쇄됩니다.
다음은 완전한 코드입니다.
Python 2 예
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 예
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)