Python Urllib.Request と urlopen() を使用したインターネット アクセス
URLlibとは何ですか?
urllibは Python URL を開くために使用できるモジュール。URL アクションを支援する関数とクラスを定義します。
自律的AI Python XML、HTML、JSONなどのインターネットからデータにアクセスして取得することもできます。 Python このデータを直接操作するには、このチュートリアルでは、Webからデータを取得する方法を見ていきます。たとえば、ここではguru99のビデオURLを使用し、このビデオURLにアクセスします。 Python この URL の HTML ファイルを印刷することもできます。
Urllibを使用してURLを開く方法
インターネット データに接続するコードを実行する前に、URL ライブラリ モジュールまたは「urllib」のステートメントをインポートする必要があります。
- URLlibをインポートする
- メイン関数を定義する
- 変数 webUrl を宣言します
- 次に、URL lib ライブラリで urlopen 関数を呼び出します。
- 開くURLはYouTubeのguru99チュートリアルです
- 次に、結果コードを出力します。
- 結果コードは、作成した webUrl 変数で getcode 関数を呼び出すことによって取得されます。
- これを文字列に変換して、文字列「結果コード」と連結できるようにします。
- これは通常の HTTP コード「200」で、http リクエストが正常に処理されたことを示します。
URLからHTMLファイルを取得する方法 Python
HTMLファイルは、 Pythonコードを実行すると、コンソールに HTML ファイルが表示されます。
- webURL変数でread関数を呼び出します。
- 変数の読み取りにより、データ ファイルの内容を読み取ることができます
- URL のコンテンツ全体を data という変数に読み込みます。
- コードを実行します。データが HTML 形式で出力されます。
これが完全なコードです
Python 2例
#
# read the data from the URL and print it
#
import urllib2
def main():
# open a connection to a URL using urllib2
webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#get the result code and print it
print "result code: " + str(webUrl.getcode())
# read the data from the URL and print it
data = webUrl.read()
print data
if __name__ == "__main__":
main()
Python 3例
#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')
#get the result code and print it
print ("result code: " + str(webUrl.getcode()))
# read the data from the URL and print it
data = webUrl.read()
print (data)


