Python Urllib.Request と urlopen() を使用したインターネット アクセス
URLlibとは何ですか?
urllibは Python URL を開くために使用できるモジュール。URL アクションを支援する関数とクラスを定義します。
自律的AI Python XML、HTML、JSONなどのインターネットからデータにアクセスして取得することもできます。 Python このデータを直接操作するには、このチュートリアルでは、Webからデータを取得する方法を見ていきます。たとえば、ここではguru99のビデオURLを使用し、このビデオURLにアクセスします。 Python この URL の HTML ファイルを印刷することもできます。
Urllibを使用してURLを開く方法
インターネット データに接続するコードを実行する前に、URL ライブラリ モジュールまたは「urllib」のステートメントをインポートする必要があります。
- URLlibをインポートする
- メイン関数を定義する
- 変数 webUrl を宣言します
- 次に、URL lib ライブラリで urlopen 関数を呼び出します。
- 開くURLはYouTubeのguru99チュートリアルです
- 次に、結果コードを出力します。
- 結果コードは、作成した webUrl 変数で getcode 関数を呼び出すことによって取得されます。
- これを文字列に変換して、文字列「結果コード」と連結できるようにします。
- これは通常の HTTP コード「200」で、http リクエストが正常に処理されたことを示します。
URLからHTMLファイルを取得する方法 Python
HTMLファイルは、 Pythonコードを実行すると、コンソールに HTML ファイルが表示されます。
- webURL変数でread関数を呼び出します。
- 変数の読み取りにより、データ ファイルの内容を読み取ることができます
- URL のコンテンツ全体を data という変数に読み込みます。
- コードを実行します。データが HTML 形式で出力されます。
これが完全なコードです
Python 2例
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3例
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)