Python Acceso a Internet mediante Urllib.Request y urlopen()

¿Qué es urllib?

urllib es un Python módulo que se puede utilizar para abrir URL. Define funciones y clases para ayudar en las acciones de URL.

En nuestro Python También puede acceder y recuperar datos de Internet como XML, HTML, JSON, etc. También puede utilizar Python para trabajar con estos datos directamente. En este tutorial vamos a ver cómo podemos recuperar datos de la web. Por ejemplo, aquí usamos una URL de video de guru99 y vamos a acceder a esta URL de video usando Python así como imprimir el archivo HTML de esta URL.

Cómo abrir una URL usando Urllib

Antes de ejecutar el código para conectarnos a los datos de Internet, necesitamos importar la declaración para el módulo de biblioteca de URL o "urllib".

Abrir URL usando Urllib

  • Importar URLlib
  • Define tu función principal
  • Declarar la variable webUrl
  • Luego llame a la función urlopen en la biblioteca URL lib
  • La URL que estamos abriendo es tutorial de guru99 en youtube
  • A continuación, vamos a imprimir el código de resultado.
  • El código de resultado se recupera llamando a la función getcode en la variable webUrl que hemos creado.
  • Vamos a convertir eso en una cadena, para que pueda concatenarse con nuestra cadena "código de resultado".
  • Este será un código HTTP normal "200", que indica que la solicitud http se procesó correctamente

Cómo obtener la URL del formulario de un archivo HTML en Python

También puede leer el archivo HTML utilizando la “función de lectura” en Python, y cuando ejecute el código, el archivo HTML aparecerá en la consola.

URL del formulario del archivo HTML en Python

  • Llame a la función de lectura en la variable webURL
  • La variable de lectura permite leer el contenido de los archivos de datos.
  • Leer todo el contenido de la URL en una variable llamada datos
  • Ejecute el código: imprimirá los datos en formato HTML.

Aquí está el código completo

Python 2 Ejemplo

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Ejemplo

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)