Εκμάθηση βαθιάς μάθησης για αρχάριους: Βασικές αρχές νευρωνικών δικτύων
Τι είναι το Deep Learning;
Βαθιά μάθηση είναι ένα λογισμικό υπολογιστή που μιμείται το δίκτυο των νευρώνων στον εγκέφαλο. Είναι ένα υποσύνολο της μηχανικής μάθησης που βασίζεται σε τεχνητά νευρωνικά δίκτυα με μάθηση αναπαράστασης. Ονομάζεται βαθιά μάθηση επειδή χρησιμοποιεί βαθιά νευρωνικά δίκτυα. Αυτή η μάθηση μπορεί να είναι εποπτευόμενη, ημι-εποπτευόμενη ή χωρίς επίβλεψη.
Οι αλγόριθμοι βαθιάς μάθησης κατασκευάζονται με συνδεδεμένα επίπεδα.
- Το πρώτο επίπεδο ονομάζεται επίπεδο εισόδου
- Το τελευταίο επίπεδο ονομάζεται Επίπεδο Εξόδου
- Όλα τα ενδιάμεσα στρώματα ονομάζονται κρυφά επίπεδα. Η λέξη βαθιά σημαίνει ότι το δίκτυο ενώνει νευρώνες σε περισσότερα από δύο επίπεδα.

Κάθε κρυφό στρώμα αποτελείται από νευρώνες. Οι νευρώνες συνδέονται μεταξύ τους. Ο νευρώνας θα επεξεργαστεί και στη συνέχεια θα διαδώσει το σήμα εισόδου που λαμβάνει το στρώμα από πάνω του. Η ισχύς του σήματος που δίνεται στον νευρώνα στο επόμενο στρώμα εξαρτάται από το βάρος, την προκατάληψη και τη συνάρτηση ενεργοποίησης.
Το δίκτυο καταναλώνει μεγάλες ποσότητες δεδομένων εισόδου και τα λειτουργεί μέσω πολλαπλών επιπέδων. το δίκτυο μπορεί να μάθει όλο και πιο πολύπλοκα χαρακτηριστικά των δεδομένων σε κάθε επίπεδο.
Διαδικασία βαθιάς μάθησης
Ένα βαθύ νευρωνικό δίκτυο παρέχει ακρίβεια αιχμής σε πολλές εργασίες, από τον εντοπισμό αντικειμένων έως την αναγνώριση ομιλίας. Μπορούν να μάθουν αυτόματα, χωρίς προκαθορισμένες γνώσεις ρητά κωδικοποιημένες από τους προγραμματιστές.
Για να κατανοήσετε την ιδέα της βαθιάς μάθησης, φανταστείτε μια οικογένεια, με ένα βρέφος και γονείς. Το νήπιο δείχνει αντικείμενα με το μικρό του δάχτυλο και λέει πάντα τη λέξη «γάτα». Καθώς οι γονείς του ανησυχούν για την εκπαίδευσή του, του λένε συνέχεια «Ναι, αυτή είναι γάτα» ή «Όχι, αυτή δεν είναι γάτα». Το βρέφος επιμένει στο να δείχνει αντικείμενα αλλά γίνεται πιο ακριβές με τις «γάτες». Το παιδάκι, κατά βάθος, δεν ξέρει γιατί μπορεί να πει ότι είναι γάτα ή όχι. Μόλις έμαθε πώς να ιεραρχεί σύνθετα χαρακτηριστικά που έρχεται με μια γάτα κοιτάζοντας το κατοικίδιο συνολικά και συνεχίζει να εστιάζει σε λεπτομέρειες όπως η ουρά ή η μύτη πριν να αποφασίσει.
Ένα νευρωνικό δίκτυο λειτουργεί ακριβώς το ίδιο. Κάθε επίπεδο αντιπροσωπεύει ένα βαθύτερο επίπεδο γνώσης, δηλαδή την ιεραρχία της γνώσης. Ένα νευρωνικό δίκτυο με τέσσερα επίπεδα θα μάθει πιο πολύπλοκα χαρακτηριστικά από ότι με δύο επίπεδα.
Η μάθηση γίνεται σε δύο φάσεις:
Πρώτη φάση: Η πρώτη φάση αποτελείται από την εφαρμογή ενός μη γραμμικού μετασχηματισμού της εισόδου και τη δημιουργία ενός στατιστικού μοντέλου ως εξόδου.
Δεύτερη φάση: Η δεύτερη φάση στοχεύει στη βελτίωση του μοντέλου με μια μαθηματική μέθοδο γνωστή ως παράγωγο.
Το νευρωνικό δίκτυο επαναλαμβάνει αυτές τις δύο φάσεις εκατοντάδες έως χιλιάδες φορές μέχρι να φτάσει σε ένα ανεκτό επίπεδο ακρίβειας. Η επανάληψη αυτής της δύο φάσεων ονομάζεται επανάληψη.
Για να δώσετε ένα παράδειγμα Deep Learning, ρίξτε μια ματιά στην παρακάτω κίνηση, το μοντέλο προσπαθεί να μάθει πώς να χορεύει. Μετά από 10 λεπτά προπόνησης, το μοντέλο δεν ξέρει να χορεύει και μοιάζει με σκαρίφημα.
Μετά από 48 ώρες μάθησης, ο υπολογιστής κυριαρχεί στην τέχνη του χορού.
Ταξινόμηση Νευρωνικών Δικτύων
Ρηχό νευρωνικό δίκτυο: Το ρηχό νευρωνικό δίκτυο έχει μόνο ένα κρυφό στρώμα μεταξύ της εισόδου και της εξόδου.
Βαθύ νευρωνικό δίκτυο: Τα βαθιά νευρωνικά δίκτυα έχουν περισσότερα από ένα στρώματα. Για παράδειγμα, το μοντέλο Google LeNet για την αναγνώριση εικόνας μετράει 22 επίπεδα.
Σήμερα, η βαθιά εκμάθηση χρησιμοποιείται με πολλούς τρόπους, όπως αυτοκίνητο χωρίς οδηγό, κινητό τηλέφωνο, μηχανή αναζήτησης Google, ανίχνευση απάτης, τηλεόραση και ούτω καθεξής.
Τύποι δικτύων βαθιάς μάθησης
Τώρα σε αυτό το σεμινάριο Deep Neural Network, θα μάθουμε για τους τύπους των Deep Learning Networks:
Νευρωνικά δίκτυα τροφοδοσίας
Ο απλούστερος τύπος τεχνητού νευρωνικού δικτύου. Με αυτόν τον τύπο αρχιτεκτονικής, οι πληροφορίες ρέουν προς μία μόνο κατεύθυνση, προς τα εμπρός. Σημαίνει ότι οι ροές των πληροφοριών ξεκινούν από το επίπεδο εισόδου, πηγαίνουν στα «κρυμμένα» επίπεδα και τελειώνουν στο επίπεδο εξόδου. Το δίκτυο
δεν έχει βρόχο. Οι πληροφορίες σταματούν στα επίπεδα εξόδου.
Επαναλαμβανόμενα νευρωνικά δίκτυα (RNN)
RNN είναι ένα πολυεπίπεδο νευρωνικό δίκτυο που μπορεί να αποθηκεύσει πληροφορίες σε κόμβους περιβάλλοντος, επιτρέποντάς του να μάθει ακολουθίες δεδομένων και να εξάγει έναν αριθμό ή μια άλλη ακολουθία. Με απλά λόγια, είναι ένα τεχνητό νευρωνικό δίκτυο των οποίων οι συνδέσεις μεταξύ των νευρώνων περιλαμβάνουν βρόχους. Τα RNN είναι κατάλληλα για την επεξεργασία ακολουθιών εισόδων.
Για παράδειγμα, εάν η εργασία είναι να προβλέψετε την επόμενη λέξη στην πρόταση «Θέλετε ένα…………;
- Οι νευρώνες RNN θα λάβουν ένα σήμα που οδηγεί στην αρχή της πρότασης.
- Το δίκτυο λαμβάνει τη λέξη "Do" ως είσοδο και παράγει ένα διάνυσμα του αριθμού. Αυτό το διάνυσμα τροφοδοτείται πίσω στον νευρώνα για να παρέχει μια μνήμη στο δίκτυο. Αυτό το στάδιο βοηθά το δίκτυο να θυμάται ότι έλαβε "Do" και το έλαβε στην πρώτη θέση.
- Το δίκτυο θα προχωρήσει ομοίως στις επόμενες λέξεις. Παίρνει τη λέξη «εσείς» και «θέλω». Η κατάσταση των νευρώνων ενημερώνεται με τη λήψη κάθε λέξης.
- Το τελικό στάδιο εμφανίζεται μετά τη λήψη της λέξης «α». Το νευρωνικό δίκτυο θα παρέχει μια πιθανότητα για κάθε αγγλική λέξη που μπορεί να χρησιμοποιηθεί για να ολοκληρωθεί η πρόταση. Ένα καλά εκπαιδευμένο RNN πιθανότατα αποδίδει μεγάλη πιθανότητα σε «καφέ», «ποτό», «μπέργκερ» κ.λπ.
Κοινές χρήσεις του RNN
- Βοηθήστε τους εμπόρους κινητών αξιών να δημιουργήσουν αναλυτικές αναφορές
- Εντοπίστε ανωμαλίες στη σύμβαση των οικονομικών καταστάσεων
- Εντοπισμός δόλιας συναλλαγής με πιστωτική κάρτα
- Δώστε μια λεζάντα για τις εικόνες
- Ισχυρά chatbots
- Οι τυπικές χρήσεις του RNN εμφανίζονται όταν οι επαγγελματίες εργάζονται με δεδομένα ή ακολουθίες χρονοσειρών (π.χ. ηχογραφήσεις ή κείμενο).
Συγκροτήματα νευρωνικά δίκτυα (CNN)
CNN είναι ένα πολυεπίπεδο νευρωνικό δίκτυο με μοναδική αρχιτεκτονική σχεδιασμένο να εξάγει όλο και πιο πολύπλοκα χαρακτηριστικά των δεδομένων σε κάθε επίπεδο για τον προσδιορισμό της εξόδου. Τα CNN είναι κατάλληλα για αντιληπτικές εργασίες.
Το CNN χρησιμοποιείται κυρίως όταν υπάρχει ένα μη δομημένο σύνολο δεδομένων (π.χ. εικόνες) και οι επαγγελματίες πρέπει να εξάγουν πληροφορίες από αυτό.
Για παράδειγμα, εάν η εργασία είναι να προβλέψετε μια λεζάντα εικόνας:
- Το CNN λαμβάνει μια εικόνα ας πούμε μιας γάτας, αυτή η εικόνα, με όρους υπολογιστή, είναι μια συλλογή του pixel. Γενικά, ένα στρώμα για την εικόνα σε κλίμακα του γκρι και τρία επίπεδα για μια έγχρωμη εικόνα.
- Κατά τη διάρκεια της εκμάθησης χαρακτηριστικών (δηλαδή, κρυφών επιπέδων), το δίκτυο θα αναγνωρίσει μοναδικά χαρακτηριστικά, για παράδειγμα, την ουρά της γάτας, το αυτί κ.λπ.
- Όταν το δίκτυο μάθει καλά πώς να αναγνωρίζει μια εικόνα, μπορεί να παρέχει μια πιθανότητα για κάθε εικόνα που γνωρίζει. Η ετικέτα με την υψηλότερη πιθανότητα θα γίνει η πρόβλεψη του δικτύου.
Μάθηση Ενίσχυσης
Ενίσχυση μάθησης είναι ένα υποπεδίο της μηχανικής μάθησης στο οποίο τα συστήματα εκπαιδεύονται λαμβάνοντας εικονικές «ανταμοιβές» ή «τιμωρίες», ουσιαστικά μαθαίνοντας με δοκιμή και σφάλμα. Το DeepMind της Google χρησιμοποίησε ενισχυτική εκμάθηση για να κερδίσει έναν άνθρωπο πρωταθλητή στα παιχνίδια Go. Η ενισχυτική μάθηση χρησιμοποιείται επίσης σε βιντεοπαιχνίδια για τη βελτίωση της εμπειρίας παιχνιδιού παρέχοντας εξυπνότερα bots.
Ένας από τους πιο διάσημους αλγόριθμους είναι:
- Q-μάθηση
- Δίκτυο Deep Q
- State-Action-Reward-State-Action (SARSA)
- Deep Deterministic Policy Gradient (DDPG)
Παραδείγματα εφαρμογών βαθιάς μάθησης
Τώρα σε αυτό το σεμινάριο Deep Learning για αρχάριους, ας μάθουμε για τις εφαρμογές Deep Learning:
AI στα Οικονομικά
Ο τομέας της χρηματοοικονομικής τεχνολογίας έχει ήδη αρχίσει να χρησιμοποιεί την τεχνητή νοημοσύνη για να εξοικονομήσει χρόνο, να μειώσει το κόστος και να προσθέσει αξία. Η βαθιά μάθηση αλλάζει τον κλάδο των δανείων χρησιμοποιώντας πιο ισχυρή αξιολόγηση πιστοληπτικής ικανότητας. Οι υπεύθυνοι λήψης πιστωτικών αποφάσεων μπορούν να χρησιμοποιήσουν την τεχνητή νοημοσύνη για ισχυρές αιτήσεις δανεισμού πιστώσεων για να επιτύχουν ταχύτερη και ακριβέστερη αξιολόγηση κινδύνου, χρησιμοποιώντας νοημοσύνη μηχανών για να λάβουν υπόψη τον χαρακτήρα και την ικανότητα των αιτούντων.
Η Underwrite είναι μια εταιρεία Fintech που παρέχει μια λύση τεχνητής νοημοσύνης για εταιρείες που δημιουργούν πιστώσεις. Το underwrite.ai χρησιμοποιεί τεχνητή νοημοσύνη για να εντοπίσει ποιος αιτών είναι πιο πιθανό να αποπληρώσει ένα δάνειο. Η προσέγγισή τους ξεπερνά ριζικά τις παραδοσιακές μεθόδους.
AI στο HR
Η Under Armour, μια εταιρεία αθλητικών ειδών φέρνει επανάσταση στις προσλήψεις και εκσυγχρονίζει την εμπειρία των υποψηφίων με τη βοήθεια της AI. Μάλιστα, η Under Armour Μειώνει τον χρόνο πρόσληψης για τα καταστήματα λιανικής κατά 35%. Η Under Armour αντιμετώπισε ένα αυξανόμενο ενδιαφέρον δημοτικότητας το 2012. Είχαν, κατά μέσο όρο, 30000 βιογραφικά το μήνα. Η ανάγνωση όλων αυτών των εφαρμογών και η έναρξη της διαδικασίας εξέτασης και συνέντευξης κράτησε πάρα πολύ. Η μακρά διαδικασία για την πρόσληψη και την επιβίβαση ατόμων επηρέασε την ικανότητα της Under Armour να έχει τα καταστήματα λιανικής της πλήρως στελεχωμένα, ανεπτυγμένα και έτοιμα για λειτουργία.
Εκείνη την εποχή, η Under Armour είχε όλη την «must have» τεχνολογία HR, όπως λύσεις συναλλαγών για προμήθεια, εφαρμογή, παρακολούθηση και ενσωμάτωση, αλλά αυτά τα εργαλεία δεν ήταν αρκετά χρήσιμα. Under armor επιλέξτε HireVue, ένας πάροχος τεχνητής νοημοσύνης για λύσεις ανθρώπινου δυναμικού, τόσο για κατ' απαίτηση όσο και για ζωντανές συνεντεύξεις. Τα αποτελέσματα ήταν μπλόφα. κατάφεραν να μειώσουν κατά 35% τον χρόνο πλήρωσης. Σε αντάλλαγμα, προσέλαβε στελέχη υψηλότερης ποιότητας.
AI στο μάρκετινγκ
Το AI είναι ένα πολύτιμο εργαλείο για τις προκλήσεις διαχείρισης εξυπηρέτησης πελατών και εξατομίκευσης. Η βελτιωμένη αναγνώριση ομιλίας στη διαχείριση τηλεφωνικών κέντρων και τη δρομολόγηση κλήσεων ως αποτέλεσμα της εφαρμογής τεχνικών τεχνητής νοημοσύνης επιτρέπει μια πιο απρόσκοπτη εμπειρία για τους πελάτες.
Για παράδειγμα, η ανάλυση ήχου βαθιάς μάθησης επιτρέπει στα συστήματα να αξιολογούν τον συναισθηματικό τόνο ενός πελάτη. Εάν ο πελάτης ανταποκρίνεται ελάχιστα στο AI chatbot, το σύστημα μπορεί να αναδρομολογηθεί η συνομιλία σε πραγματικούς, ανθρώπινους χειριστές που αναλαμβάνουν το ζήτημα.
Εκτός από τα τρία παραπάνω παραδείγματα Deep Learning, η τεχνητή νοημοσύνη χρησιμοποιείται ευρέως σε άλλους τομείς/βιομηχανίες.
Γιατί είναι σημαντική η βαθιά μάθηση;
Η βαθιά μάθηση είναι ένα ισχυρό εργαλείο για να κάνει την πρόβλεψη ένα αποτέλεσμα που μπορεί να γίνει πράξη. Η βαθιά μάθηση υπερέχει στην ανακάλυψη προτύπων (μάθηση χωρίς επίβλεψη) και στην πρόβλεψη με βάση τη γνώση. Big δεδομένων είναι το καύσιμο για βαθιά μάθηση. Όταν συνδυάζονται και τα δύο, ένας οργανισμός μπορεί να αποκομίσει πρωτόγνωρα αποτελέσματα όσον αφορά την παραγωγικότητα, τις πωλήσεις, τη διαχείριση και την καινοτομία.
Η βαθιά μάθηση μπορεί να ξεπεράσει την παραδοσιακή μέθοδο. Για παράδειγμα, οι αλγόριθμοι βαθιάς μάθησης είναι 41% πιο ακριβείς από τον αλγόριθμο μηχανικής μάθησης στην ταξινόμηση εικόνων, 27% πιο ακριβείς στην αναγνώριση προσώπου και 25% στην αναγνώριση φωνής.
Περιορισμοί της βαθιάς μάθησης
Τώρα σε αυτό το σεμινάριο νευρωνικών δικτύων, θα μάθουμε για τους περιορισμούς του Deep Learning:
Επισήμανση δεδομένων
Τα περισσότερα τρέχοντα μοντέλα τεχνητής νοημοσύνης εκπαιδεύονται μέσω της «εποπτευόμενης μάθησης». Σημαίνει ότι οι άνθρωποι πρέπει να επισημαίνουν και να κατηγοριοποιούν τα υποκείμενα δεδομένα, κάτι που μπορεί να είναι μια αρκετά μεγάλη και επιρρεπής σε σφάλματα αγγαρεία. Για παράδειγμα, εταιρείες που αναπτύσσουν τεχνολογίες αυτοοδηγούμενων αυτοκινήτων προσλαμβάνουν εκατοντάδες άτομα για να σχολιάσουν με μη αυτόματο τρόπο ώρες ροών βίντεο από πρωτότυπα οχήματα για να βοηθήσουν στην εκπαίδευση αυτών των συστημάτων.
Αποκτήστε τεράστια σύνολα δεδομένων εκπαίδευσης
Έχει αποδειχθεί ότι απλές τεχνικές βαθιάς μάθησης όπως το CNN μπορούν, σε ορισμένες περιπτώσεις, να μιμηθούν τη γνώση ειδικών στην ιατρική και σε άλλους τομείς. Το τρέχον κύμα των μάθηση μηχανής, ωστόσο, απαιτεί σύνολα δεδομένων εκπαίδευσης που δεν είναι μόνο επισημασμένα αλλά και επαρκώς ευρεία και καθολικά.
Οι μέθοδοι βαθιάς μάθησης απαιτούσαν χιλιάδες παρατηρήσεις για να γίνουν τα μοντέλα σχετικά καλά στις εργασίες ταξινόμησης και, σε ορισμένες περιπτώσεις, εκατομμύρια για να εκτελεστούν σε επίπεδο ανθρώπου. Χωρίς έκπληξη, η βαθιά μάθηση είναι διάσημη στις γιγάντιες εταιρείες τεχνολογίας. χρησιμοποιούν μεγάλα δεδομένα για να συγκεντρώσουν petabyte δεδομένων. Τους επιτρέπει να δημιουργήσουν ένα εντυπωσιακό και εξαιρετικά ακριβές μοντέλο βαθιάς μάθησης.
Εξηγήστε ένα πρόβλημα
Τα μεγάλα και πολύπλοκα μοντέλα μπορεί να είναι δύσκολο να εξηγηθούν, με ανθρώπινους όρους. Για παράδειγμα, γιατί ελήφθη μια συγκεκριμένη απόφαση. Είναι ένας λόγος που η αποδοχή ορισμένων εργαλείων τεχνητής νοημοσύνης είναι αργή σε τομείς εφαρμογής όπου η ερμηνευτικότητα είναι χρήσιμη ή όντως απαιτείται.
Επιπλέον, καθώς επεκτείνεται η εφαρμογή της τεχνητής νοημοσύνης, οι κανονιστικές απαιτήσεις θα μπορούσαν επίσης να οδηγήσουν στην ανάγκη για πιο εξηγήσιμα μοντέλα τεχνητής νοημοσύνης.
Σύνοψη
Επισκόπηση Deep Learning: Η βαθιά μάθηση είναι το νέο state-of-the-art για τεχνητή νοημοσύνη. Η αρχιτεκτονική Deep Learning αποτελείται από ένα επίπεδο εισόδου, κρυφά επίπεδα και ένα επίπεδο εξόδου. Η λέξη βαθιά σημαίνει ότι υπάρχουν περισσότερα από δύο πλήρως συνδεδεμένα στρώματα.
Υπάρχει ένας τεράστιος αριθμός νευρωνικών δικτύων, όπου κάθε αρχιτεκτονική έχει σχεδιαστεί για να εκτελεί μια δεδομένη εργασία. Για παράδειγμα, το CNN λειτουργεί πολύ καλά με εικόνες, το RNN παρέχει εντυπωσιακά αποτελέσματα με χρονοσειρές και ανάλυση κειμένου.
Η βαθιά μάθηση δραστηριοποιείται πλέον σε διαφορετικούς τομείς, από τη χρηματοδότηση μέχρι το μάρκετινγκ, την αλυσίδα εφοδιασμού και το μάρκετινγκ. Οι μεγάλες εταιρείες είναι οι πρώτες που χρησιμοποιούν τη βαθιά μάθηση επειδή διαθέτουν ήδη μια μεγάλη δεξαμενή δεδομένων. Η βαθιά μάθηση απαιτεί να έχετε ένα εκτεταμένο σύνολο δεδομένων εκπαίδευσης.