Python Internettoegang met Urllib.Request en urlopen()
Wat is urllib?
urllib is een Python module die kan worden gebruikt voor het openen van URL's. Het definieert functies en klassen om te helpen bij URL-acties.
met Python u kunt ook gegevens van internet openen en ophalen, zoals XML, HTML, JSON, enz. U kunt ook gebruiken Python om direct met deze gegevens te werken. In deze tutorial gaan we zien hoe we gegevens van internet kunnen ophalen. Hier hebben we bijvoorbeeld een video-URL van guru99 gebruikt, en we gaan toegang krijgen tot deze video-URL met behulp van Python evenals een HTML-bestand van deze URL afdrukken.
Hoe een URL te openen met Urllib
Voordat we de code uitvoeren om verbinding te maken met internetgegevens, moeten we de instructie voor de URL-bibliotheekmodule of "urllib" importeren.
- URLlib importeren
- Definieer uw hoofdfunctie
- Declareer de variabele webUrl
- Roep vervolgens de urlopen-functie aan in de URL-lib-bibliotheek
- De URL die we openen is guru99 tutorial op youtube
- Vervolgens gaan we de resultaatcode afdrukken
- Resultaatcode wordt opgehaald door de getcode-functie aan te roepen op de webUrl-variabele die we hebben gemaakt
- We gaan dat omzetten naar een string, zodat deze kan worden samengevoegd met onze string “resultaatcode”
- Dit zal een normale HTTP-code “200” zijn, wat aangeeft dat het http-verzoek met succes is verwerkt
Hoe u de URL van het HTML-bestandsformulier kunt binnenhalen Python
U kunt het HTML-bestand ook lezen door de “leesfunctie” in te gebruiken Pythonen wanneer u de code uitvoert, verschijnt het HTML-bestand in de console.
- Roep de leesfunctie op de webURL-variabele aan
- Variabele lezen maakt het mogelijk om de inhoud van gegevensbestanden te lezen
- Lees de volledige inhoud van de URL in een variabele genaamd data
- Voer de code uit. De gegevens worden in HTML-formaat afgedrukt
Hier is de volledige code
Python 2 Voorbeeld
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 Voorbeeld
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)