Python Přístup k internetu pomocí Urllib.Request a urlopen()
Co je urllib?
urllib je a Python modul, který lze použít pro otevírání adres URL. Definuje funkce a třídy, které pomáhají při akcích URL.
S Python můžete také přistupovat a získávat data z internetu, jako je XML, HTML, JSON atd. Můžete také použít Python pracovat s těmito daty přímo. V tomto tutoriálu se podíváme na to, jak můžeme získat data z webu. Například zde jsme použili adresu URL videa guru99 a k této adrese URL videa budeme přistupovat pomocí Python stejně jako tisk HTML souboru této URL.
Jak otevřít URL pomocí Urllib
Než spustíme kód pro připojení k internetovým datům, musíme importovat příkaz pro modul knihovny URL nebo „urllib“.
- Importovat urllib
- Definujte svou hlavní funkci
- Deklarujte proměnnou webUrl
- Poté zavolejte funkci urlopen v knihovně URL lib
- Adresa URL, kterou otevíráme, je výukový program guru99 na youtube
- Dále vytiskneme výsledný kód
- Výsledný kód se získá voláním funkce getcode v proměnné webUrl, kterou jsme vytvořili
- Převedeme to na řetězec, aby mohl být zřetězen s naším řetězcem „kód výsledku“
- Bude to běžný HTTP kód „200“, což znamená, že požadavek http byl úspěšně zpracován
Jak získat adresu URL formuláře souboru HTML Python
Soubor HTML můžete také číst pomocí funkce „čtení“ v Pythona když kód spustíte, soubor HTML se objeví v konzole.
- Zavolejte funkci čtení v proměnné webURL
- Číst proměnná umožňuje číst obsah datových souborů
- Přečtěte si celý obsah adresy URL do proměnné s názvem data
- Spusťte kód - vytiskne data do formátu HTML
Zde je úplný kód
Python 2 Příklad
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 Příklad
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)