Python Accesso a Internet utilizzando Urllib.Request e urlopen()
Cos'è l'urllib?
urllib è un Python modulo che può essere utilizzato per aprire URL. Definisce funzioni e classi per aiutare nelle azioni degli URL.
Con Python puoi anche accedere e recuperare dati da Internet come XML, HTML, JSON, ecc. Puoi anche utilizzare Python per lavorare direttamente con questi dati. In questo tutorial vedremo come possiamo recuperare dati dal web. Ad esempio, qui abbiamo utilizzato un URL video guru99 e accederemo a questo URL video utilizzando Python nonché stampare il file HTML di questo URL.
Come aprire l'URL utilizzando Urllib
Prima di eseguire il codice per connettersi ai dati Internet, dobbiamo importare l'istruzione per il modulo della libreria URL o "urllib".
- Importa urllib
- Definisci la tua funzione principale
- Dichiarare la variabile webUrl
- Quindi chiama la funzione urlopen sulla libreria URL lib
- L'URL che stiamo aprendo è il tutorial di guru99 su youtube
- Successivamente, stamperemo il codice del risultato
- Il codice risultato viene recuperato chiamando la funzione getcode sulla variabile webUrl che abbiamo creato
- Lo convertiremo in una stringa, in modo che possa essere concatenato con la nostra stringa "codice risultato"
- Questo sarà un normale codice HTTP “200”, che indica che la richiesta http è stata elaborata correttamente
Come ottenere l'URL del modulo di file HTML Python
Puoi anche leggere il file HTML utilizzando la "funzione di lettura" in Pythone quando esegui il codice, il file HTML verrà visualizzato nella console.
- Chiama la funzione di lettura sulla variabile webURL
- La variabile di lettura consente di leggere il contenuto dei file di dati
- Leggi l'intero contenuto dell'URL in una variabile chiamata data
- Esegui il codice: stamperà i dati in formato HTML
Ecco il codice completo
Python 2 Esempio
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 Esempio
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)