Python Πρόσβαση στο Διαδίκτυο χρησιμοποιώντας Urllib.Request και urlopen()

Τι είναι το urllib;

urllib είναι α Python μονάδα που μπορεί να χρησιμοποιηθεί για το άνοιγμα διευθύνσεων URL. Ορίζει συναρτήσεις και κλάσεις που βοηθούν στις ενέργειες URL.

Με Python μπορείτε επίσης να αποκτήσετε πρόσβαση και να ανακτήσετε δεδομένα από το διαδίκτυο όπως XML, HTML, JSON κ.λπ. Μπορείτε επίσης να χρησιμοποιήσετε Python για να εργαστείτε απευθείας με αυτά τα δεδομένα. Σε αυτό το σεμινάριο θα δούμε πώς μπορούμε να ανακτήσουμε δεδομένα από τον Ιστό. Για παράδειγμα, εδώ χρησιμοποιήσαμε μια διεύθυνση URL βίντεο guru99 και θα έχουμε πρόσβαση σε αυτήν τη διεύθυνση URL βίντεο χρησιμοποιώντας Python καθώς και εκτύπωση αρχείου HTML αυτής της διεύθυνσης URL.

Πώς να ανοίξετε τη διεύθυνση URL χρησιμοποιώντας το Urllib

Προτού εκτελέσουμε τον κώδικα για σύνδεση σε δεδομένα Διαδικτύου, πρέπει να εισαγάγουμε δήλωση για τη μονάδα βιβλιοθήκης URL ή το "urllib".

Ανοίξτε τη διεύθυνση URL χρησιμοποιώντας το Urllib

  • Εισαγωγή urllib
  • Καθορίστε την κύρια λειτουργία σας
  • Δηλώστε τη μεταβλητή webUrl
  • Στη συνέχεια, καλέστε τη συνάρτηση urlopen στη βιβλιοθήκη lib URL
  • Η διεύθυνση URL που ανοίγουμε είναι φροντιστήριο guru99 στο youtube
  • Στη συνέχεια, θα εκτυπώσουμε τον κωδικό αποτελέσματος
  • Ο κωδικός αποτελέσματος ανακτάται καλώντας τη συνάρτηση getcode στη μεταβλητή webUrl που δημιουργήσαμε
  • Θα το μετατρέψουμε σε μια συμβολοσειρά, έτσι ώστε να μπορεί να συνδεθεί με τη συμβολοσειρά μας "κωδικός αποτελέσματος"
  • Αυτός θα είναι ένας κανονικός κωδικός HTTP "200", που υποδεικνύει ότι το αίτημα http διεκπεραιώθηκε με επιτυχία

Πώς να αποκτήσετε τη διεύθυνση URL της φόρμας αρχείου HTML Python

Μπορείτε επίσης να διαβάσετε το αρχείο HTML χρησιμοποιώντας τη "συνάρτηση ανάγνωσης" στο Python, και όταν εκτελείτε τον κώδικα, το αρχείο HTML θα εμφανιστεί στην κονσόλα.

URL φόρμας αρχείου HTML σε Python

  • Καλέστε τη συνάρτηση ανάγνωσης στη μεταβλητή webURL
  • Η μεταβλητή ανάγνωσης επιτρέπει την ανάγνωση των περιεχομένων των αρχείων δεδομένων
  • Διαβάστε ολόκληρο το περιεχόμενο της διεύθυνσης URL σε μια μεταβλητή που ονομάζεται δεδομένα
  • Εκτελέστε τον κώδικα- Θα εκτυπώσει τα δεδομένα σε μορφή HTML

Εδώ είναι ο πλήρης κώδικας

Python 2 Παράδειγμα

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Παράδειγμα

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)