Μη εποπτευόμενη μηχανική εκμάθηση: Algorithms, Τύποι με Παράδειγμα

Τι είναι η μάθηση χωρίς επίβλεψη;

Μη εποπτευόμενη μάθηση είναι μια τεχνική μηχανικής μάθησης στην οποία οι χρήστες δεν χρειάζεται να επιβλέπουν το μοντέλο. Αντίθετα, επιτρέπει στο μοντέλο να εργαστεί μόνο του για να ανακαλύψει μοτίβα και πληροφορίες που προηγουμένως δεν είχαν εντοπιστεί. Ασχολείται κυρίως με τα δεδομένα χωρίς ετικέτα.

Μη εποπτευόμενη μάθηση Algorithms

Μη εποπτευόμενη μάθηση Algorithms επιτρέπουν στους χρήστες να εκτελούν πιο σύνθετες εργασίες επεξεργασίας σε σύγκριση με την εποπτευόμενη μάθηση. Ωστόσο, η μάθηση χωρίς επίβλεψη μπορεί να είναι πιο απρόβλεπτη σε σύγκριση με άλλες φυσικές μεθόδους μάθησης. Οι αλγόριθμοι μάθησης χωρίς επίβλεψη περιλαμβάνουν ομαδοποίηση, ανίχνευση ανωμαλιών, νευρωνικά δίκτυα κ.λπ.

Παράδειγμα Μη εποπτευόμενης Μηχανικής Εκμάθησης

Ας πάρουμε ένα παράδειγμα μάθησης χωρίς επίβλεψη για ένα μωρό και τον οικογενειακό του σκύλο.

Παράδειγμα Μη εποπτευόμενης Μηχανικής Εκμάθησης

Γνωρίζει και αναγνωρίζει αυτόν τον σκύλο. Λίγες εβδομάδες αργότερα ένας οικογενειακός φίλος φέρνει μαζί ένα σκύλο και προσπαθεί να παίξει με το μωρό.

Παράδειγμα Μη εποπτευόμενης Μηχανικής Εκμάθησης

Το μωρό δεν έχει δει αυτό το σκυλί νωρίτερα. Αλλά αναγνωρίζει πολλά χαρακτηριστικά (2 αυτιά, μάτια, περπάτημα στα 4 πόδια) είναι σαν το κατοικίδιο σκυλί της. Αναγνωρίζει το νέο ζώο ως σκύλο. Αυτή είναι η μάθηση χωρίς επίβλεψη, όπου δεν διδάσκεσαι αλλά μαθαίνεις από τα δεδομένα (σε αυτήν την περίπτωση δεδομένα για έναν σκύλο.) εποπτευόμενη μάθηση, ο οικογενειακός φίλος θα έλεγε στο μωρό ότι είναι σκύλος όπως φαίνεται στο παραπάνω παράδειγμα μάθησης χωρίς επίβλεψη.

Γιατί μάθηση χωρίς επίβλεψη;

Ακολουθούν οι κύριοι λόγοι για τη χρήση της Εκμάθησης χωρίς επίβλεψη Μηχανική μάθηση:

  • Η μη εποπτευόμενη μηχανική εκμάθηση εντοπίζει κάθε είδους άγνωστα μοτίβα στα δεδομένα.
  • Οι μέθοδοι χωρίς επίβλεψη σάς βοηθούν να βρείτε λειτουργίες που μπορεί να είναι χρήσιμες για την κατηγοριοποίηση.
  • Πραγματοποιείται σε πραγματικό χρόνο, ώστε όλα τα δεδομένα εισόδου να αναλύονται και να επισημαίνονται παρουσία των εκπαιδευομένων.
  • Είναι ευκολότερο να λαμβάνετε δεδομένα χωρίς ετικέτα από έναν υπολογιστή παρά δεδομένα με ετικέτα, τα οποία χρειάζονται χειροκίνητη παρέμβαση.

ClusterΤύποι μάθησης χωρίς επίβλεψη Algorithms

Ακολουθούν οι τύποι ομαδοποίησης των αλγορίθμων Μη εποπτευόμενης Μηχανικής Εκμάθησης:

Τα προβλήματα μάθησης χωρίς επίβλεψη ομαδοποιούνται περαιτέρω σε προβλήματα ομαδοποίησης και συσχέτισης.

ClusterING

ClusterING
ClusterING

ClusterΗ μάθηση είναι μια σημαντική έννοια όταν πρόκειται για μάθηση χωρίς επίβλεψη. Ασχολείται κυρίως με την εύρεση μιας δομής ή μοτίβου σε μια συλλογή μη κατηγοριοποιημένων δεδομένων. Μάθηση χωρίς επίβλεψη ClusterΟι αλγόριθμοι επεξεργασίας θα επεξεργάζονται τα δεδομένα σας και θα βρουν φυσικά συμπλέγματα (ομάδες) εάν υπάρχουν στα δεδομένα. Μπορείτε επίσης να τροποποιήσετε πόσα συμπλέγματα θα πρέπει να αναγνωρίζουν οι αλγόριθμοί σας. Σας επιτρέπει να προσαρμόσετε την ευαισθησία αυτών των ομάδων.

Υπάρχουν διάφοροι τύποι ομαδοποίησης που μπορείτε να χρησιμοποιήσετε:

Αποκλειστικό (διαμερισμός)

Σε αυτήν τη μέθοδο ομαδοποίησης, τα δεδομένα ομαδοποιούνται με τέτοιο τρόπο ώστε ένα δεδομένα να μπορεί να ανήκει σε ένα μόνο σύμπλεγμα.

Παράδειγμα: K-means

Συγκεντρωτικά

Σε αυτήν την τεχνική ομαδοποίησης, κάθε δεδομένα είναι ένα σύμπλεγμα. Οι επαναληπτικές ενώσεις μεταξύ των δύο πλησιέστερων συστάδων μειώνουν τον αριθμό των συστάδων.

Παράδειγμα: Ιεραρχική ομαδοποίηση

Επικάλυψη

Σε αυτή την τεχνική, τα ασαφή σύνολα χρησιμοποιούνται για τη ομαδοποίηση δεδομένων. Κάθε σημείο μπορεί να ανήκει σε δύο ή περισσότερα clusters με ξεχωριστούς βαθμούς συμμετοχής.

Εδώ, τα δεδομένα θα συσχετιστούν με μια κατάλληλη τιμή συνδρομής. Παράδειγμα: Fuzzy C-Means

Πιθανοτική

Αυτή η τεχνική χρησιμοποιεί κατανομή πιθανοτήτων για να δημιουργήσει τα συμπλέγματα

Παράδειγμα: Ακολουθούν λέξεις-κλειδιά

  • «Αντρικό παπούτσι».
  • “γυναικείο παπούτσι.”
  • «γυναικείο γάντι».
  • «Αντρικό γάντι».

μπορούν να ομαδοποιηθούν σε δύο κατηγορίες «παπούτσι» και «γάντι» ή «άνδρας» και «γυναίκες».

ClusterΤύποι

Ακολουθούν οι τύποι ομαδοποίησης της Μηχανικής Εκμάθησης:

  • Ιεραρχική ομαδοποίηση
  • Κ-σημαίνει ομαδοποίηση
  • K-NN (k κοντινότεροι γείτονες)
  • Ανάλυση κύριων συστατικών
  • Μοναδική Αποσύνθεση Αξίας
  • Ανεξάρτητη Ανάλυση Στοιχείων

Ιεραρχικός ClusterING

Η ιεραρχική ομαδοποίηση είναι ένας αλγόριθμος που δημιουργεί μια ιεραρχία συστάδων. Ξεκινά με όλα τα δεδομένα που έχουν εκχωρηθεί σε ένα δικό τους σύμπλεγμα. Εδώ, δύο στενά συμπλέγματα θα βρίσκονται στο ίδιο σύμπλεγμα. Αυτός ο αλγόριθμος τελειώνει όταν απομένει μόνο ένα σύμπλεγμα.

Κ-μέσα ClusterING

Το K σημαίνει ότι είναι ένας επαναληπτικός αλγόριθμος ομαδοποίησης που σας βοηθά να βρείτε την υψηλότερη τιμή για κάθε επανάληψη. Αρχικά, επιλέγεται ο επιθυμητός αριθμός συμπλεγμάτων. Σε αυτήν τη μέθοδο ομαδοποίησης, πρέπει να ομαδοποιήσετε τα σημεία δεδομένων σε k ομάδες. Ένα μεγαλύτερο k σημαίνει μικρότερες ομάδες με μεγαλύτερη ευαισθησία με τον ίδιο τρόπο. Ένα χαμηλότερο k σημαίνει μεγαλύτερες ομάδες με λιγότερη ευαισθησία.

Η έξοδος του αλγορίθμου είναι μια ομάδα "ετικέτες". Εκχωρεί σημείο δεδομένων σε μία από τις ομάδες k. Στην ομαδοποίηση k-means, κάθε ομάδα ορίζεται δημιουργώντας ένα κέντρο για κάθε ομάδα. Τα κεντροειδή είναι σαν την καρδιά του συμπλέγματος, που συλλαμβάνει τα σημεία που βρίσκονται πιο κοντά τους και τα προσθέτει στο σύμπλεγμα.

Η ομαδοποίηση K-mean ορίζει περαιτέρω δύο υποομάδες:

  • Συσσωματωτική ομαδοποίηση
  • Δενδρογράφημα

Συσσωματωτική ομαδοποίηση

Αυτός ο τύπος ομαδοποίησης K-means ξεκινά με έναν σταθερό αριθμό συστάδων. Κατανέμει όλα τα δεδομένα στον ακριβή αριθμό των συμπλεγμάτων. Αυτή η μέθοδος ομαδοποίησης δεν απαιτεί τον αριθμό των συστάδων K ως είσοδο. Η διαδικασία συσσωμάτωσης ξεκινά με το σχηματισμό κάθε δεδομένων ως ενιαίας συστάδας.

Αυτή η μέθοδος χρησιμοποιεί κάποιο μέτρο απόστασης, μειώνει τον αριθμό των συστάδων (ένα σε κάθε επανάληψη) με τη διαδικασία συγχώνευσης. Τέλος, έχουμε ένα μεγάλο σύμπλεγμα που περιέχει όλα τα αντικείμενα.

Δενδρογράφημα

Στη μέθοδο ομαδοποίησης Δενδρογράμματος, κάθε επίπεδο θα αντιπροσωπεύει ένα πιθανό σύμπλεγμα. Το ύψος του δενδρογράμματος δείχνει το επίπεδο ομοιότητας μεταξύ δύο συστάδων ένωσης. Όσο πιο κοντά στο κάτω μέρος της διαδικασίας είναι πιο παρόμοια συστάδα που είναι η εύρεση της ομάδας από το δενδρόγραμμα που δεν είναι φυσικό και κυρίως υποκειμενικό.

Κ- Πλησιέστεροι γείτονες

K- ο πλησιέστερος γείτονας είναι ο απλούστερος από όλους τους ταξινομητές μηχανικής μάθησης. Διαφέρει από άλλες τεχνικές μηχανικής μάθησης, καθώς δεν παράγει μοντέλο. Είναι ένας απλός αλγόριθμος που αποθηκεύει όλες τις διαθέσιμες περιπτώσεις και ταξινομεί νέες περιπτώσεις με βάση ένα μέτρο ομοιότητας.

Λειτουργεί πολύ καλά όταν υπάρχει απόσταση μεταξύ των παραδειγμάτων. Η ταχύτητα εκμάθησης είναι αργή όταν το σετ εκπαίδευσης είναι μεγάλο και ο υπολογισμός της απόστασης είναι μη τετριμμένος.

Ανάλυση βασικών εξαρτημάτων

Σε περίπτωση που θέλετε χώρο μεγαλύτερης διάστασης. Πρέπει να επιλέξετε μια βάση για αυτόν τον χώρο και μόνο τις 200 πιο σημαντικές βαθμολογίες αυτής της βάσης. Αυτή η βάση είναι γνωστή ως κύριο συστατικό. Το υποσύνολο που επιλέγετε αποτελεί έναν νέο χώρο που είναι μικρός σε μέγεθος σε σύγκριση με τον αρχικό χώρο. Διατηρεί όσο το δυνατόν περισσότερο την πολυπλοκότητα των δεδομένων.

Σχέση

Οι κανόνες συσχέτισης σάς επιτρέπουν να δημιουργείτε συσχετίσεις μεταξύ αντικειμένων δεδομένων μέσα σε μεγάλες βάσεις δεδομένων. Αυτή η τεχνική χωρίς επίβλεψη αφορά την ανακάλυψη ενδιαφέρων σχέσεων μεταξύ μεταβλητών σε μεγάλες βάσεις δεδομένων. Για παράδειγμα, οι άνθρωποι που αγοράζουν ένα νέο σπίτι είναι πιο πιθανό να αγοράσουν νέα έπιπλα.

Άλλα παραδείγματα:

  • Μια υποομάδα ασθενών με καρκίνο που ομαδοποιούνται με βάση τις μετρήσεις γονιδιακής τους έκφρασης
  • Ομάδες αγοραστών με βάση το ιστορικό περιήγησης και αγορών τους
  • Ομάδα ταινιών με βάση τη βαθμολογία που δίνουν οι θεατές ταινιών

Εποπτευόμενη έναντι Μη εποπτευόμενης Μηχανικής Εκμάθησης

Εδώ είναι η κύρια διαφορά μεταξύ Εποπτευόμενη έναντι μη εποπτευόμενης μάθησης:

Παράμετροι Εποπτευόμενη τεχνική μηχανικής εκμάθησης Τεχνική μηχανικής εκμάθησης χωρίς επίβλεψη
Εισαγωγή δεδομένων Algorithms εκπαιδεύονται χρησιμοποιώντας δεδομένα με ετικέτα. Algorithms χρησιμοποιούνται έναντι δεδομένων που δεν φέρουν ετικέτα
Υπολογιστική Πολυπλοκότητα Η εποπτευόμενη μάθηση είναι μια απλούστερη μέθοδος. Η μάθηση χωρίς επίβλεψη είναι υπολογιστικά περίπλοκη
Ακρίβεια Μέθοδος υψηλής ακρίβειας και αξιοπιστίας. Less ακριβής και αξιόπιστη μέθοδος.

Εφαρμογές Μη εποπτευόμενης Μηχανικής Εκμάθησης

Ορισμένες εφαρμογές των Τεχνικών μάθησης χωρίς επίβλεψη είναι:

  • Clusterχωρίζει αυτόματα το σύνολο δεδομένων σε ομάδες με βάση τις ομοιότητές τους
  • Ο εντοπισμός ανωμαλιών μπορεί να ανακαλύψει ασυνήθιστα σημεία δεδομένων στο σύνολο δεδομένων σας. Είναι χρήσιμο για την εύρεση δόλιων συναλλαγών
  • Η εξόρυξη συσχέτισης προσδιορίζει σύνολα στοιχείων που συχνά εμφανίζονται μαζί στο σύνολο δεδομένων σας
  • Τα μοντέλα λανθάνουσας μεταβλητής χρησιμοποιούνται ευρέως για την προεπεξεργασία δεδομένων. Όπως η μείωση του αριθμού των χαρακτηριστικών σε ένα σύνολο δεδομένων ή η αποσύνθεση του συνόλου δεδομένων σε πολλαπλά στοιχεία

Μειονεκτήματα της μάθησης χωρίς επίβλεψη

  • Δεν μπορείτε να λάβετε ακριβείς πληροφορίες σχετικά με την ταξινόμηση δεδομένων και η έξοδος ως δεδομένα που χρησιμοποιούνται σε μάθηση χωρίς επίβλεψη έχει ετικέτα και δεν είναι γνωστή
  • Less Η ακρίβεια των αποτελεσμάτων οφείλεται στο ότι τα δεδομένα εισόδου δεν είναι γνωστά και δεν επισημαίνονται από τους ανθρώπους εκ των προτέρων. Αυτό σημαίνει ότι το μηχάνημα χρειάζεται να το κάνει αυτό μόνο του.
  • Οι φασματικές κλάσεις δεν αντιστοιχούν πάντα σε κλάσεις πληροφοριών.
  • Ο χρήστης πρέπει να αφιερώσει χρόνο στην ερμηνεία και την επισήμανση των κλάσεων που ακολουθούν αυτήν την ταξινόμηση.
  • Οι φασματικές ιδιότητες των κλάσεων μπορούν επίσης να αλλάξουν με την πάροδο του χρόνου, ώστε να μην μπορείτε να έχετε τις ίδιες πληροφορίες κλάσης ενώ μετακινείστε από τη μια εικόνα στην άλλη.

Περίληψη

  • Η μάθηση χωρίς επίβλεψη είναι μια τεχνική μηχανικής μάθησης, όπου δεν χρειάζεται να επιβλέπετε το μοντέλο.
  • Η μη εποπτευόμενη μηχανική εκμάθηση σάς βοηθά να βρίσκετε κάθε είδους άγνωστα μοτίβα στα δεδομένα.
  • ClusterΤο ing και το Association είναι δύο τύποι μάθησης χωρίς επίβλεψη.
  • Τέσσερις τύποι μεθόδων ομαδοποίησης είναι 1) Αποκλειστικές 2) Συσσωματωτικές 3) Επικαλυπτόμενες 4) Πιθανολογικές.
  • Σημαντικοί τύποι ομαδοποίησης είναι: 1) Ιεραρχική ομαδοποίηση 2) ​​K-σημαίνει ομαδοποίηση 3) K-NN 4) Ανάλυση κύριου συστατικού 5) Αποσύνθεση μοναδικής τιμής 6) Ανάλυση ανεξάρτητων συνιστωσών.
  • Οι κανόνες συσχέτισης σάς επιτρέπουν να δημιουργείτε συσχετίσεις μεταξύ αντικειμένων δεδομένων μέσα σε μεγάλες βάσεις δεδομένων.
  • Στην εποπτευόμενη μάθηση, Algorithms εκπαιδεύονται χρησιμοποιώντας δεδομένα με ετικέτα ενώ βρίσκονται σε μάθηση χωρίς επίβλεψη Algorithms χρησιμοποιούνται έναντι δεδομένων που δεν φέρουν ετικέτα.
  • Ο εντοπισμός ανωμαλιών μπορεί να ανακαλύψει σημαντικά σημεία δεδομένων στο σύνολο δεδομένων σας, τα οποία είναι χρήσιμα για την εύρεση δόλιων συναλλαγών.
  • Το μεγαλύτερο μειονέκτημα της μάθησης χωρίς επίβλεψη είναι ότι δεν μπορείτε να λάβετε ακριβείς πληροφορίες σχετικά με την ταξινόμηση δεδομένων.