Python Acces la Internet folosind Urllib.Request și urlopen()
Ce este urllib?
urllib este o Python modul care poate fi folosit pentru deschiderea URL-urilor. Definește funcții și clase pentru a ajuta la acțiunile URL.
cu Python De asemenea, puteți accesa și prelua date de pe internet, cum ar fi XML, HTML, JSON etc. Puteți, de asemenea, să utilizați Python pentru a lucra direct cu aceste date. În acest tutorial vom vedea cum putem prelua date de pe web. De exemplu, aici am folosit o adresă URL a videoclipului guru99 și vom accesa această adresă URL a videoclipului folosind Python precum și tipăriți fișierul HTML al acestei adrese URL.
Cum se deschide URL-ul folosind Urllib
Înainte de a rula codul pentru a vă conecta la datele de pe Internet, trebuie să importam instrucțiunea pentru modulul bibliotecii URL sau „urllib”.
- Import urllib
- Definiți funcția principală
- Declarați variabila webUrl
- Apoi apelați funcția urlopen din biblioteca URL lib
- Adresa URL pe care o deschidem este tutorialul guru99 pe youtube
- În continuare, vom tipări codul rezultat
- Codul rezultat este preluat prin apelarea funcției getcode din variabila webUrl pe care am creat-o
- Vom converti asta într-un șir, astfel încât să poată fi concatenat cu șirul nostru „codul rezultat”
- Acesta va fi un cod HTTP obișnuit „200”, indicând că solicitarea http a fost procesată cu succes
Cum să introduceți adresa URL a formularului fișierului HTML Python
De asemenea, puteți citi fișierul HTML utilizând „funcția de citire” în Python, iar când rulați codul, fișierul HTML va apărea în consolă.
- Apelați funcția de citire din variabila webURL
- Variabila de citire permite citirea conținutului fișierelor de date
- Citiți întregul conținut al adresei URL într-o variabilă numită date
- Rulați codul - Va imprima datele în format HTML
Aici este codul complet
Python 2 Exemplu
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 Exemplu
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)