Python Urllib.Request と urlopen() を使用したインターネット アクセス

URLlibとは何ですか?

urllibは Python URL を開くために使用できるモジュール。URL アクションを支援する関数とクラスを定義します。

自律的AI Python XML、HTML、JSONなどのインターネットからデータにアクセスして取得することもできます。 Python このデータを直接操作するには、このチュートリアルでは、Webからデータを取得する方法を見ていきます。たとえば、ここではguru99のビデオURLを使用し、このビデオURLにアクセスします。 Python この URL の HTML ファイルを印刷することもできます。

Urllibを使用してURLを開く方法

インターネット データに接続するコードを実行する前に、URL ライブラリ モジュールまたは「urllib」のステートメントをインポートする必要があります。

Urllib を使用して URL を開く

  • URLlibをインポートする
  • メイン関数を定義する
  • 変数 webUrl を宣言します
  • 次に、URL lib ライブラリで urlopen 関数を呼び出します。
  • 開くURLはYouTubeのguru99チュートリアルです
  • 次に、結果コードを出力します。
  • 結果コードは、作成した webUrl 変数で getcode 関数を呼び出すことによって取得されます。
  • これを文字列に変換して、文字列「結果コード」と連結できるようにします。
  • これは通常の HTTP コード「200」で、http リクエストが正常に処理されたことを示します。

URLからHTMLファイルを取得する方法 Python

HTMLファイルは、 Pythonコードを実行すると、コンソールに HTML ファイルが表示されます。

HTMLファイル形式のURL Python

  • webURL変数でread関数を呼び出します。
  • 変数の読み取りにより、データ ファイルの内容を読み取ることができます
  • URL のコンテンツ全体を data という変数に読み込みます。
  • コードを実行します。データが HTML 形式で出力されます。

これが完全なコードです

Python 2例

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3例

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)