Python Доступ в Интернет с использованием Urllib.Request и urlopen()
Что такое урллиб?
urllib - это Python модуль, который можно использовать для открытия URL-адресов. Он определяет функции и классы, помогающие выполнять действия с URL-адресами.
Для пользователя Python вы также можете получить доступ и получить данные из Интернета, такие как XML, HTML, JSON и т. д. Вы также можете использовать Python работать с этими данными напрямую. В этом уроке мы увидим, как можно получить данные из Интернета. Например, здесь мы использовали URL-адрес видео guru99 и собираемся получить доступ к этому URL-адресу видео, используя Python а также распечатать HTML-файл этого URL-адреса.
Как открыть URL-адрес с помощью Urllib
Прежде чем запустить код для подключения к данным Интернета, нам необходимо импортировать оператор для модуля библиотеки URL-адресов или «urllib».
- Импортировать urllib
- Определите свою основную функцию
- Объявите переменную webUrl
- Затем вызовите функцию urlopen в библиотеке URL-библиотеки.
- URL-адрес, который мы открываем, — это учебник guru99 на YouTube.
- Далее мы распечатаем код результата
- Код результата получается путем вызова функции getcode для созданной нами переменной webUrl.
- Мы собираемся преобразовать это в строку, чтобы ее можно было объединить с нашей строкой «код результата».
- Это будет обычный HTTP-код «200», указывающий, что HTTP-запрос успешно обработан.
Как получить URL-адрес формы файла HTML в Python
Вы также можете прочитать HTML-файл, используя «функцию чтения» в Python, и когда вы запустите код, HTML-файл появится в консоли.
- Вызовите функцию чтения переменной webURL.
- Переменная чтения позволяет читать содержимое файлов данных.
- Считайте все содержимое URL-адреса в переменную с именем data.
- Запустите код. Он распечатает данные в формате HTML.
Вот полный код
Python 2 Пример
#
# read the data from the URL and print it
#
import urllib2
def main():
# open a connection to a URL using urllib2
webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#get the result code and print it
print "result code: " + str(webUrl.getcode())
# read the data from the URL and print it
data = webUrl.read()
print data
if __name__ == "__main__":
main()
Python 3 Пример
#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')
#get the result code and print it
print ("result code: " + str(webUrl.getcode()))
# read the data from the URL and print it
data = webUrl.read()
print (data)


