Python Acesso à Internet usando Urllib.Request e urlopen()

O que é urllib?

urllib é um Python módulo que pode ser usado para abrir URLs. Define funções e classes para auxiliar nas ações de URL.

Com Python você também pode acessar e recuperar dados da Internet como XML, HTML, JSON, etc. Python para trabalhar com esses dados diretamente. Neste tutorial veremos como podemos recuperar dados da web. Por exemplo, aqui usamos um URL de vídeo guru99 e vamos acessar esse URL de vídeo usando Python bem como imprimir o arquivo HTML deste URL.

Como abrir URL usando Urllib

Antes de executarmos o código para conectar-se aos dados da Internet, precisamos importar a instrução para o módulo de biblioteca de URL ou “urllib”.

Abrir URL usando Urllib

  • Importar URLlib
  • Defina sua função principal
  • Declare a variável webUrl
  • Em seguida, chame a função urlopen na biblioteca URL lib
  • A URL que estamos abrindo é o tutorial do guru99 no youtube
  • A seguir, vamos imprimir o código de resultado
  • O código de resultado é recuperado chamando a função getcode na variável webUrl que criamos
  • Vamos converter isso em uma string, para que possa ser concatenado com nossa string “código de resultado”
  • Este será um código HTTP normal “200”, indicando que a solicitação http foi processada com sucesso

Como obter o URL do formulário do arquivo HTML em Python

Você também pode ler o arquivo HTML usando a “função de leitura” em Pythone quando você executar o código, o arquivo HTML aparecerá no console.

URL do formulário do arquivo HTML em Python

  • Chame a função de leitura na variável webURL
  • A variável de leitura permite ler o conteúdo dos arquivos de dados
  • Leia todo o conteúdo do URL em uma variável chamada data
  • Execute o código - ele imprimirá os dados no formato HTML

Aqui está o código completo

Python 2 Exemplo

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Exemplo

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)