Python Internetzugriff mit Urllib.Request und urlopen()
Was ist URLlib?
urllib ist ein Python Modul, das zum Öffnen von URLs verwendet werden kann. Es definiert Funktionen und Klassen, die bei URL-Aktionen helfen.
Mit Python Sie können auch auf Daten aus dem Internet zugreifen und diese abrufen, wie XML, HTML, JSON usw. Sie können auch verwenden Python um direkt mit diesen Daten zu arbeiten. In diesem Tutorial werden wir sehen, wie wir Daten aus dem Web abrufen können. Hier haben wir beispielsweise eine Guru99-Video-URL verwendet und werden auf diese Video-URL zugreifen mit Python sowie die HTML-Datei dieser URL ausdrucken.
So öffnen Sie eine URL mit Urllib
Bevor wir den Code ausführen, um eine Verbindung zu Internetdaten herzustellen, müssen wir die Anweisung für das URL-Bibliotheksmodul oder „urllib“ importieren.
- URLlib importieren
- Definieren Sie Ihre Hauptfunktion
- Deklarieren Sie die Variable webUrl
- Rufen Sie dann die Funktion urlopen für die URL-Bibliothek auf
- Die URL, die wir öffnen, ist Guru99 Tutorial auf YouTube
- Als nächstes drucken wir den Ergebniscode aus
- Der Ergebniscode wird durch Aufrufen der getcode-Funktion für die von uns erstellte webUrl-Variable abgerufen
- Wir werden das in einen String umwandeln, damit er mit unserem String „Ergebniscode“ verkettet werden kann.
- Dies ist ein regulärer HTTP-Code „200“, der angibt, dass die HTTP-Anfrage erfolgreich verarbeitet wurde
So erhalten Sie die URL eines HTML-Dateiformulars in Python
Sie können die HTML-Datei auch lesen, indem Sie die „Lesefunktion“ in Python, und wenn Sie den Code ausführen, wird die HTML-Datei in der Konsole angezeigt.
- Rufen Sie die Lesefunktion für die webURL-Variable auf
- Lesevariable ermöglicht das Lesen des Inhalts von Datendateien
- Lesen Sie den gesamten Inhalt der URL in eine Variable namens data ein
- Führen Sie den Code aus. Er druckt die Daten im HTML-Format
Hier ist der vollständige Code
Python 2 Beispiel
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 Beispiel
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)