Python Internettoegang met Urllib.Request en urlopen()

Wat is urllib?

urllib is een Python module die kan worden gebruikt voor het openen van URL's. Het definieert functies en klassen om te helpen bij URL-acties.

met Python u kunt ook gegevens van internet openen en ophalen, zoals XML, HTML, JSON, enz. U kunt ook gebruiken Python om direct met deze gegevens te werken. In deze tutorial gaan we zien hoe we gegevens van internet kunnen ophalen. Hier hebben we bijvoorbeeld een video-URL van guru99 gebruikt, en we gaan toegang krijgen tot deze video-URL met behulp van Python evenals een HTML-bestand van deze URL afdrukken.

Hoe een URL te openen met Urllib

Voordat we de code uitvoeren om verbinding te maken met internetgegevens, moeten we de instructie voor de URL-bibliotheekmodule of "urllib" importeren.

Open de URL met Urllib

  • URLlib importeren
  • Definieer uw hoofdfunctie
  • Declareer de variabele webUrl
  • Roep vervolgens de urlopen-functie aan in de URL-lib-bibliotheek
  • De URL die we openen is guru99 tutorial op youtube
  • Vervolgens gaan we de resultaatcode afdrukken
  • Resultaatcode wordt opgehaald door de getcode-functie aan te roepen op de webUrl-variabele die we hebben gemaakt
  • We gaan dat omzetten naar een string, zodat deze kan worden samengevoegd met onze string “resultaatcode”
  • Dit zal een normale HTTP-code “200” zijn, wat aangeeft dat het http-verzoek met succes is verwerkt

Hoe u de URL van het HTML-bestandsformulier kunt binnenhalen Python

U kunt het HTML-bestand ook lezen door de “leesfunctie” in te gebruiken Pythonen wanneer u de code uitvoert, verschijnt het HTML-bestand in de console.

HTML-bestandsvorm URL in Python

  • Roep de leesfunctie op de webURL-variabele aan
  • Variabele lezen maakt het mogelijk om de inhoud van gegevensbestanden te lezen
  • Lees de volledige inhoud van de URL in een variabele genaamd data
  • Voer de code uit. De gegevens worden in HTML-formaat afgedrukt

Hier is de volledige code

Python 2 Voorbeeld

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Voorbeeld

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)