Python Accès Internet en utilisant Urllib.Request et urlopen()

Qu’est-ce que l’urllib ?

urllib est un Python module qui peut être utilisé pour ouvrir des URL. Il définit des fonctions et des classes pour faciliter les actions d'URL.

et Python vous pouvez également accéder et récupérer des données sur Internet telles que XML, HTML, JSON, etc. Vous pouvez également utiliser Python pour travailler directement avec ces données. Dans ce tutoriel, nous allons voir comment récupérer des données sur le Web. Par exemple, nous avons utilisé ici une URL de vidéo guru99, et nous allons accéder à cette URL de vidéo en utilisant Python ainsi que d'imprimer le fichier HTML de cette URL.

Comment ouvrir une URL à l'aide d'Urllib

Avant d'exécuter le code pour nous connecter aux données Internet, nous devons importer l'instruction pour le module de bibliothèque d'URL ou « urllib ».

Ouvrir l'URL à l'aide d'Urllib

  • Importer l'URLlib
  • Définissez votre fonction principale
  • Déclarez la variable webUrl
  • Appelez ensuite la fonction urlopen sur la bibliothèque URL lib
  • L'URL que nous ouvrons est le tutoriel guru99 sur YouTube
  • Ensuite, nous allons imprimer le code résultat
  • Le code résultat est récupéré en appelant la fonction getcode sur la variable webUrl que nous avons créée
  • Nous allons convertir cela en chaîne, afin qu'il puisse être concaténé avec notre chaîne « code résultat »
  • Il s'agira d'un code HTTP standard « 200 », indiquant que la requête http a été traitée avec succès.

Comment obtenir l'URL du formulaire de fichier HTML dans Python

Vous pouvez également lire le fichier HTML en utilisant la « fonction de lecture » dans Python, et lorsque vous exécutez le code, le fichier HTML apparaîtra dans la console.

URL du formulaire de fichier HTML dans Python

  • Appelez la fonction read sur la variable webURL
  • La variable Read permet de lire le contenu des fichiers de données
  • Lisez l'intégralité du contenu de l'URL dans une variable appelée data
  • Exécutez le code - Il imprimera les données au format HTML

Voici le code complet

Python 2 Exemple

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Exemple

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)