Python Πρόσβαση στο Διαδίκτυο χρησιμοποιώντας Urllib.Request και urlopen()
Τι είναι το urllib;
urllib είναι α Python μονάδα που μπορεί να χρησιμοποιηθεί για το άνοιγμα διευθύνσεων URL. Ορίζει συναρτήσεις και κλάσεις που βοηθούν στις ενέργειες URL.
Με Python μπορείτε επίσης να αποκτήσετε πρόσβαση και να ανακτήσετε δεδομένα από το διαδίκτυο όπως XML, HTML, JSON κ.λπ. Μπορείτε επίσης να χρησιμοποιήσετε Python για να εργαστείτε απευθείας με αυτά τα δεδομένα. Σε αυτό το σεμινάριο θα δούμε πώς μπορούμε να ανακτήσουμε δεδομένα από τον Ιστό. Για παράδειγμα, εδώ χρησιμοποιήσαμε μια διεύθυνση URL βίντεο guru99 και θα έχουμε πρόσβαση σε αυτήν τη διεύθυνση URL βίντεο χρησιμοποιώντας Python καθώς και εκτύπωση αρχείου HTML αυτής της διεύθυνσης URL.
Πώς να ανοίξετε τη διεύθυνση URL χρησιμοποιώντας το Urllib
Προτού εκτελέσουμε τον κώδικα για σύνδεση σε δεδομένα Διαδικτύου, πρέπει να εισαγάγουμε δήλωση για τη μονάδα βιβλιοθήκης URL ή το "urllib".
- Εισαγωγή urllib
- Καθορίστε την κύρια λειτουργία σας
- Δηλώστε τη μεταβλητή webUrl
- Στη συνέχεια, καλέστε τη συνάρτηση urlopen στη βιβλιοθήκη lib URL
- Η διεύθυνση URL που ανοίγουμε είναι φροντιστήριο guru99 στο youtube
- Στη συνέχεια, θα εκτυπώσουμε τον κωδικό αποτελέσματος
- Ο κωδικός αποτελέσματος ανακτάται καλώντας τη συνάρτηση getcode στη μεταβλητή webUrl που δημιουργήσαμε
- Θα το μετατρέψουμε σε μια συμβολοσειρά, έτσι ώστε να μπορεί να συνδεθεί με τη συμβολοσειρά μας "κωδικός αποτελέσματος"
- Αυτός θα είναι ένας κανονικός κωδικός HTTP "200", που υποδεικνύει ότι το αίτημα http διεκπεραιώθηκε με επιτυχία
Πώς να αποκτήσετε τη διεύθυνση URL της φόρμας αρχείου HTML Python
Μπορείτε επίσης να διαβάσετε το αρχείο HTML χρησιμοποιώντας τη "συνάρτηση ανάγνωσης" στο Python, και όταν εκτελείτε τον κώδικα, το αρχείο HTML θα εμφανιστεί στην κονσόλα.
- Καλέστε τη συνάρτηση ανάγνωσης στη μεταβλητή webURL
- Η μεταβλητή ανάγνωσης επιτρέπει την ανάγνωση των περιεχομένων των αρχείων δεδομένων
- Διαβάστε ολόκληρο το περιεχόμενο της διεύθυνσης URL σε μια μεταβλητή που ονομάζεται δεδομένα
- Εκτελέστε τον κώδικα- Θα εκτυπώσει τα δεδομένα σε μορφή HTML
Εδώ είναι ο πλήρης κώδικας
Python 2 Παράδειγμα
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 Παράδειγμα
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)