Python Internetåtkomst med Urllib.Request och urlopen()
Vad är urllib?
urllib är en Python modul som kan användas för att öppna URLs. Den definierar funktioner och klasser för att hjälpa till med URL åtgärder.
Med Python du kan också komma åt och hämta data från internet som XML, HTML, JSON, etc. Du kan också använda Python att arbeta direkt med dessa data. I den här handledningen ska vi se hur vi kan hämta data från webben. Till exempel använde vi här en guru99-video URL, och vi kommer att få tillgång till den här videon URL med hjälp av Python samt skriva ut HTML-filen av detta URL.
Hur man öppnar URL använder Urllib
Innan vi kör koden för att ansluta till internetdata måste vi importera ett uttalande för URL biblioteksmodulen eller ”urllib”.
- Importera urllib
- Definiera din huvudfunktion
- Deklarera variabeln webUrl
- Anropa sedan urlopen-funktionen på URL lib-bibliotek
- Ocuco-landskapet URL Vi öppnar är guru99 handledning på youtube
- Därefter ska vi skriva ut resultatkoden
- Resultatkoden hämtas genom att anropa getcode-funktionen på webUrl-variabeln vi har skapat
- Vi kommer att konvertera det till en sträng, så att det kan sammanfogas med vår sträng "resultatkod"
- Detta kommer att vara en vanlig HTTP-kod "200", vilket indikerar att http-begäran har bearbetats framgångsrikt
Hur man får HTML-filformulär URL in Python
Du kan också läsa HTML-filen genom att använda "läsfunktionen" i Python, och när du kör koden visas HTML-filen i konsolen.
- Anropa läsfunktionen på webbenURL variabel
- Läsvariabel gör det möjligt att läsa innehållet i datafiler
- Läs hela innehållet i URL till en variabel som heter data
- Kör koden - Det kommer att skriva ut data i HTML-format
Här är den fullständiga koden
Python 2 Exempel
#
# read the data from the URL and print it
#
import urllib2
def main():
# open a connection to a URL using urllib2
webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#get the result code and print it
print "result code: " + str(webUrl.getcode())
# read the data from the URL and print it
data = webUrl.read()
print data
if __name__ == "__main__":
main()
Python 3 Exempel
#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')
#get the result code and print it
print ("result code: " + str(webUrl.getcode()))
# read the data from the URL and print it
data = webUrl.read()
print (data)


