Python-Internetzugang mit Urllib.Request und urlopen()

Was ist URLlib?

urllib ist ein Python-Modul, das zum Öffnen von URLs verwendet werden kann. Es definiert Funktionen und Klassen, die bei URL-Aktionen helfen.

Mit Python können Sie auch auf Daten aus dem Internet wie XML, HTML, JSON usw. zugreifen und diese abrufen. Sie können Python auch verwenden, um direkt mit diesen Daten zu arbeiten. In diesem Tutorial werden wir sehen, wie wir Daten aus dem Internet abrufen können. Hier haben wir beispielsweise eine Guru99-Video-URL verwendet und werden mit Python auf diese Video-URL zugreifen und eine HTML-Datei dieser URL drucken.

So öffnen Sie eine URL mit Urllib

Bevor wir den Code ausführen, um eine Verbindung zu Internetdaten herzustellen, müssen wir die Anweisung für das URL-Bibliotheksmodul oder „urllib“ importieren.

Öffnen Sie die URL mit Urllib

  • URLlib importieren
  • Definieren Sie Ihre Hauptfunktion
  • Deklarieren Sie die Variable webUrl
  • Rufen Sie dann die Funktion urlopen für die URL-Bibliothek auf
  • Die URL, die wir öffnen, ist das Guru99-Tutorial youtube
  • Als nächstes drucken wir den Ergebniscode aus
  • Der Ergebniscode wird durch Aufrufen der getcode-Funktion für die von uns erstellte webUrl-Variable abgerufen
  • Wir werden das in einen String umwandeln, damit er mit unserem String „Ergebniscode“ verkettet werden kann.
  • Dies ist ein regulärer HTTP-Code „200“, der angibt, dass die HTTP-Anfrage erfolgreich verarbeitet wurde

So erhalten Sie die URL einer HTML-Datei in Python

Sie können die HTML-Datei auch lesen, indem Sie die „Lesefunktion“ in Python verwenden. Wenn Sie den Code ausführen, wird die HTML-Datei in der Konsole angezeigt.

HTML-Dateiformular-URL in Python

  • Rufen Sie die Lesefunktion für die webURL-Variable auf
  • Lesevariable ermöglicht das Lesen des Inhalts von Datendateien
  • Lesen Sie den gesamten Inhalt der URL in eine Variable namens data ein
  • Führen Sie den Code aus. Er druckt die Daten im HTML-Format

Hier ist der vollständige Code

Python 2-Beispiel

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3-Beispiel

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)