Python Acceso a Internet mediante Urllib.Request y urlopen()
¿Qué es urllib?
urllib es un Python módulo que se puede utilizar para abrir URL. Define funciones y clases para ayudar en las acciones de URL.
En nuestro Python También puede acceder y recuperar datos de Internet como XML, HTML, JSON, etc. También puede utilizar Python para trabajar con estos datos directamente. En este tutorial vamos a ver cómo podemos recuperar datos de la web. Por ejemplo, aquí usamos una URL de video de guru99 y vamos a acceder a esta URL de video usando Python así como imprimir el archivo HTML de esta URL.
Cómo abrir una URL usando Urllib
Antes de ejecutar el código para conectarnos a los datos de Internet, necesitamos importar la declaración para el módulo de biblioteca de URL o "urllib".
- Importar URLlib
- Define tu función principal
- Declarar la variable webUrl
- Luego llame a la función urlopen en la biblioteca URL lib
- La URL que estamos abriendo es tutorial de guru99 en youtube
- A continuación, vamos a imprimir el código de resultado.
- El código de resultado se recupera llamando a la función getcode en la variable webUrl que hemos creado.
- Vamos a convertir eso en una cadena, para que pueda concatenarse con nuestra cadena "código de resultado".
- Este será un código HTTP normal "200", que indica que la solicitud http se procesó correctamente
Cómo obtener la URL del formulario de un archivo HTML en Python
También puede leer el archivo HTML utilizando la “función de lectura” en Python, y cuando ejecute el código, el archivo HTML aparecerá en la consola.
- Llame a la función de lectura en la variable webURL
- La variable de lectura permite leer el contenido de los archivos de datos.
- Leer todo el contenido de la URL en una variable llamada datos
- Ejecute el código: imprimirá los datos en formato HTML.
Aquí está el código completo
Python 2 Ejemplo
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 Ejemplo
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)