Python Доступ в Интернет с использованием Urllib.Request и urlopen()

Что такое урллиб?

urllib - это Python модуль, который можно использовать для открытия URL-адресов. Он определяет функции и классы, помогающие выполнять действия с URL-адресами.

Для пользователя Python вы также можете получить доступ и получить данные из Интернета, такие как XML, HTML, JSON и т. д. Вы также можете использовать Python работать с этими данными напрямую. В этом уроке мы увидим, как можно получить данные из Интернета. Например, здесь мы использовали URL-адрес видео guru99 и собираемся получить доступ к этому URL-адресу видео, используя Python а также распечатать HTML-файл этого URL-адреса.

Как открыть URL-адрес с помощью Urllib

Прежде чем запустить код для подключения к данным Интернета, нам необходимо импортировать оператор для модуля библиотеки URL-адресов или «urllib».

Открыть URL-адрес с помощью Urllib

  • Импортировать urllib
  • Определите свою основную функцию
  • Объявите переменную webUrl
  • Затем вызовите функцию urlopen в библиотеке URL-библиотеки.
  • URL-адрес, который мы открываем, — это учебник guru99 на YouTube.
  • Далее мы распечатаем код результата
  • Код результата получается путем вызова функции getcode для созданной нами переменной webUrl.
  • Мы собираемся преобразовать это в строку, чтобы ее можно было объединить с нашей строкой «код результата».
  • Это будет обычный HTTP-код «200», указывающий, что HTTP-запрос успешно обработан.

Как получить URL-адрес формы файла HTML в Python

Вы также можете прочитать HTML-файл, используя «функцию чтения» в Python, и когда вы запустите код, HTML-файл появится в консоли.

URL-адрес формы HTML-файла в Python

  • Вызовите функцию чтения переменной webURL.
  • Переменная чтения позволяет читать содержимое файлов данных.
  • Считайте все содержимое URL-адреса в переменную с именем data.
  • Запустите код. Он распечатает данные в формате HTML.

Вот полный код

Python 2 Пример

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Пример

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)

Подведем итог этой публикации следующим образом: