Python Acces la Internet folosind Urllib.Request și urlopen()

Ce este urllib?

urllib este o Python modul care poate fi folosit pentru deschiderea URL-urilor. Definește funcții și clase pentru a ajuta la acțiunile URL.

cu Python De asemenea, puteți accesa și prelua date de pe internet, cum ar fi XML, HTML, JSON etc. Puteți, de asemenea, să utilizați Python pentru a lucra direct cu aceste date. În acest tutorial vom vedea cum putem prelua date de pe web. De exemplu, aici am folosit o adresă URL a videoclipului guru99 și vom accesa această adresă URL a videoclipului folosind Python precum și tipăriți fișierul HTML al acestei adrese URL.

Cum se deschide URL-ul folosind Urllib

Înainte de a rula codul pentru a vă conecta la datele de pe Internet, trebuie să importam instrucțiunea pentru modulul bibliotecii URL sau „urllib”.

Deschideți adresa URL folosind Urllib

  • Import urllib
  • Definiți funcția principală
  • Declarați variabila webUrl
  • Apoi apelați funcția urlopen din biblioteca URL lib
  • Adresa URL pe care o deschidem este tutorialul guru99 pe youtube
  • În continuare, vom tipări codul rezultat
  • Codul rezultat este preluat prin apelarea funcției getcode din variabila webUrl pe care am creat-o
  • Vom converti asta într-un șir, astfel încât să poată fi concatenat cu șirul nostru „codul rezultat”
  • Acesta va fi un cod HTTP obișnuit „200”, indicând că solicitarea http a fost procesată cu succes

Cum să introduceți adresa URL a formularului fișierului HTML Python

De asemenea, puteți citi fișierul HTML utilizând „funcția de citire” în Python, iar când rulați codul, fișierul HTML va apărea în consolă.

Adresa URL a formularului fișierului HTML în Python

  • Apelați funcția de citire din variabila webURL
  • Variabila de citire permite citirea conținutului fișierelor de date
  • Citiți întregul conținut al adresei URL într-o variabilă numită date
  • Rulați codul - Va imprima datele în format HTML

Aici este codul complet

Python 2 Exemplu

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Exemplu

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)