Python Accesso a Internet utilizzando Urllib.Request e urlopen()

Cos'è l'urllib?

urllib è un Python modulo che può essere utilizzato per aprire URL. Definisce funzioni e classi per aiutare nelle azioni degli URL.

Con Python puoi anche accedere e recuperare dati da Internet come XML, HTML, JSON, ecc. Puoi anche utilizzare Python per lavorare direttamente con questi dati. In questo tutorial vedremo come possiamo recuperare dati dal web. Ad esempio, qui abbiamo utilizzato un URL video guru99 e accederemo a questo URL video utilizzando Python nonché stampare il file HTML di questo URL.

Come aprire l'URL utilizzando Urllib

Prima di eseguire il codice per connettersi ai dati Internet, dobbiamo importare l'istruzione per il modulo della libreria URL o "urllib".

Apri l'URL utilizzando Urllib

  • Importa urllib
  • Definisci la tua funzione principale
  • Dichiarare la variabile webUrl
  • Quindi chiama la funzione urlopen sulla libreria URL lib
  • L'URL che stiamo aprendo è il tutorial di guru99 su youtube
  • Successivamente, stamperemo il codice del risultato
  • Il codice risultato viene recuperato chiamando la funzione getcode sulla variabile webUrl che abbiamo creato
  • Lo convertiremo in una stringa, in modo che possa essere concatenato con la nostra stringa "codice risultato"
  • Questo sarà un normale codice HTTP “200”, che indica che la richiesta http è stata elaborata correttamente

Come ottenere l'URL del modulo di file HTML Python

Puoi anche leggere il file HTML utilizzando la "funzione di lettura" in Pythone quando esegui il codice, il file HTML verrà visualizzato nella console.

URL del modulo file HTML in Python

  • Chiama la funzione di lettura sulla variabile webURL
  • La variabile di lettura consente di leggere il contenuto dei file di dati
  • Leggi l'intero contenuto dell'URL in una variabile chiamata data
  • Esegui il codice: stamperà i dati in formato HTML

Ecco il codice completo

Python 2 Esempio

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Esempio

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)