Python Accès Internet en utilisant Urllib.Request et urlopen()
Qu’est-ce que l’urllib ?
urllib est un Python module qui peut être utilisé pour ouvrir des URL. Il définit des fonctions et des classes pour faciliter les actions d'URL.
et Python vous pouvez également accéder et récupérer des données sur Internet telles que XML, HTML, JSON, etc. Vous pouvez également utiliser Python pour travailler directement avec ces données. Dans ce tutoriel, nous allons voir comment récupérer des données sur le Web. Par exemple, nous avons utilisé ici une URL de vidéo guru99, et nous allons accéder à cette URL de vidéo en utilisant Python ainsi que d'imprimer le fichier HTML de cette URL.
Comment ouvrir une URL à l'aide d'Urllib
Avant d'exécuter le code pour nous connecter aux données Internet, nous devons importer l'instruction pour le module de bibliothèque d'URL ou « urllib ».
- Importer l'URLlib
- Définissez votre fonction principale
- Déclarez la variable webUrl
- Appelez ensuite la fonction urlopen sur la bibliothèque URL lib
- L'URL que nous ouvrons est le tutoriel guru99 sur YouTube
- Ensuite, nous allons imprimer le code résultat
- Le code résultat est récupéré en appelant la fonction getcode sur la variable webUrl que nous avons créée
- Nous allons convertir cela en chaîne, afin qu'il puisse être concaténé avec notre chaîne « code résultat »
- Il s'agira d'un code HTTP standard « 200 », indiquant que la requête http a été traitée avec succès.
Comment obtenir l'URL du formulaire de fichier HTML dans Python
Vous pouvez également lire le fichier HTML en utilisant la « fonction de lecture » dans Python, et lorsque vous exécutez le code, le fichier HTML apparaîtra dans la console.
- Appelez la fonction read sur la variable webURL
- La variable Read permet de lire le contenu des fichiers de données
- Lisez l'intégralité du contenu de l'URL dans une variable appelée data
- Exécutez le code - Il imprimera les données au format HTML
Voici le code complet
Python 2 Exemple
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 Exemple
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)