Apprendimento supervisionato e non supervisionato: differenza tra loro
Differenza chiave tra apprendimento supervisionato e non supervisionato
- Nell'apprendimento supervisionato, si addestra la macchina utilizzando dati ben "etichettati".
- L'apprendimento non supervisionato è una tecnica di machine learning, in cui non è necessario supervisionare il modello.
- L'apprendimento supervisionato consente di raccogliere dati o produrre un output di dati dall'esperienza precedente.
- L'apprendimento automatico non supervisionato ti aiuta a trovare tutti i tipi di modelli sconosciuti nei dati.
- La regressione e la classificazione sono due tipi di tecniche di machine learning supervisionate.
- Clustering e associazione sono due tipi di apprendimento non supervisionato.
- In un modello di apprendimento supervisionato verranno fornite le variabili di input e output mentre con il modello di apprendimento non supervisionato verranno forniti solo i dati di input
Che cos'è l'apprendimento automatico supervisionato?
Nell'apprendimento supervisionato, addestri la macchina utilizzando i dati che funzionano bene “etichettato.” Significa che alcuni dati sono già contrassegnati con la risposta corretta. Può essere paragonato all'apprendimento che avviene in presenza di un supervisore o di un insegnante.
Un algoritmo di apprendimento supervisionato apprende dai dati di addestramento etichettati e ti aiuta a prevedere i risultati per dati imprevisti. Costruire, scalare e distribuire con successo un modello di data science accurato e supervisionato di machine learning richiede tempo e competenze tecniche da parte di un team di data scientist altamente qualificati. Inoltre, il data scientist deve ricostruire i modelli per assicurarsi che le informazioni fornite rimangano vere fino a quando i dati non cambiano.
Cos'è l'apprendimento non supervisionato?
L'apprendimento non supervisionato è una tecnica di machine learning, in cui non è necessario supervisionare il modello. È invece necessario consentire al modello di funzionare da solo per scoprire informazioni. Si occupa principalmente dei dati non etichettati.
Gli algoritmi di apprendimento non supervisionato consentono di eseguire attività di elaborazione più complesse rispetto all'apprendimento supervisionato. Tuttavia, l'apprendimento non supervisionato può essere più imprevedibile rispetto ad altri metodi di apprendimento naturale, apprendimento profondo e apprendimento per rinforzo.
Perché l’apprendimento supervisionato?
- L'apprendimento supervisionato consente di raccogliere dati o produrre un output di dati dall'esperienza precedente.
- Ti aiuta a ottimizzare i criteri di prestazione utilizzando l'esperienza
- L'apprendimento automatico supervisionato ti aiuta a risolvere vari tipi di problemi di calcolo del mondo reale.
Perché l’apprendimento non supervisionato?
Ecco i motivi principali per utilizzare l’apprendimento non supervisionato:
- L’apprendimento automatico non supervisionato trova tutti i tipi di modelli sconosciuti nei dati.
- I metodi non supervisionati ti aiutano a trovare funzionalità che possono essere utili per la categorizzazione.
- Si svolge in tempo reale, quindi tutti i dati di input devono essere analizzati ed etichettati in presenza degli studenti.
- È più semplice ottenere dati senza etichetta da un computer rispetto a dati etichettati, che richiedono un intervento manuale.
Come funziona l'apprendimento supervisionato?
Ad esempio, vuoi addestrare una macchina per aiutarti a prevedere quanto tempo impiegherai per tornare a casa dal posto di lavoro. Qui inizierai creando un set di dati etichettati. Questi dati includono
- Condizioni meteo
- Ora del giorno
- Solo
Tutti questi dettagli sono i tuoi input. L'output è la quantità di tempo impiegata per tornare a casa in quel giorno specifico.
Sai istintivamente che se fuori piove, ci vorrà più tempo per tornare a casa. Ma la macchina ha bisogno di dati e statistiche.
Vediamo ora come è possibile sviluppare un modello di apprendimento supervisionato di questo esempio che aiuti l'utente a determinare il tempo di percorrenza. La prima cosa che devi creare è un set di dati di addestramento. Questo set di allenamento conterrà il tempo totale del tragitto giornaliero e i fattori corrispondenti come il tempo, il tempo, ecc. In base a questo set di allenamento, la tua macchina potrebbe vedere che esiste una relazione diretta tra la quantità di pioggia e il tempo che impiegherai per tornare a casa.
Quindi, accerta che più piove, più a lungo dovrai guidare per tornare a casa. Potrebbe anche vedere la connessione tra il momento in cui lasci il lavoro e il tempo in cui sarai in viaggio.
Più sei vicino alle 6, più tempo impiegherai per tornare a casa. La tua macchina potrebbe trovare alcune relazioni con i tuoi dati etichettati.
Questo è l'inizio del tuo modello di dati. Inizia a influenzare il modo in cui la pioggia influisce sul modo in cui le persone guidano. Si comincia anche a notare che sempre più persone viaggiano in un determinato momento della giornata.
Come funziona l'apprendimento non supervisionato?
Prendiamo il caso di un bambino e del suo cane di famiglia.
Lei conosce e identifica questo cane. Qualche settimana dopo un amico di famiglia porta con sé un cane e cerca di giocare con il bambino.
Il bambino non ha mai visto questo cane prima. Ma riconosce molte caratteristiche (2 orecchie, occhi, cammina su 4 zampe) come se fosse il suo cane da compagnia. Identifica un nuovo animale come un cane. Questo è un apprendimento non supervisionato, in cui non ti viene insegnato ma impari dai dati (in questo caso i dati su un cane). Se questo fosse stato un apprendimento supervisionato, l'amico di famiglia avrebbe detto al bambino che è un cane.
Tipi di tecniche di machine learning supervisionate
Regressione
La tecnica di regressione prevede un singolo valore di output utilizzando i dati di training.
Esempio: puoi utilizzare la regressione per prevedere il prezzo della casa dai dati di addestramento. Le variabili di input saranno la località, la dimensione di una casa, ecc.
Classificazione
Classificare significa raggruppare l'output all'interno di una classe. Se l'algoritmo tenta di etichettare l'input in due classi distinte, si parla di classificazione binaria. La selezione tra più di due classi viene definita classificazione multiclasse.
Esempio: Determinare se qualcuno sarà o meno inadempiente rispetto al prestito.
Punti di forza: Gli output hanno sempre un'interpretazione probabilistica e l'algoritmo può essere regolarizzato per evitare un overfitting.
Punti di debolezza: La regressione logistica potrebbe avere prestazioni inferiori quando ci sono confini decisionali multipli o non lineari. Questo metodo non è flessibile, quindi non cattura relazioni più complesse.
Tipi di tecniche di machine learning non supervisionate
Problemi di apprendimento non supervisionato ulteriormente raggruppati in problemi di clustering e associazione.
ClusterING
ClusterL'ing è un concetto importante quando si tratta di apprendimento non supervisionato. Si occupa principalmente di trovare una struttura o un modello in una raccolta di dati non categorizzati. ClusterGli algoritmi di ing elaboreranno i tuoi dati e troveranno cluster (gruppi) naturali se esistono nei dati. Puoi anche modificare quanti cluster i tuoi algoritmi dovrebbero identificare. Ti consente di regolare la granularità di questi gruppi.
Associazione
Le regole di associazione consentono di stabilire associazioni tra oggetti dati all'interno di database di grandi dimensioni. Questa tecnica non supervisionata riguarda la scoperta di relazioni interessanti tra variabili in database di grandi dimensioni. Ad esempio, le persone che acquistano una nuova casa hanno maggiori probabilità di acquistare nuovi mobili.
Altri esempi:
- Un sottogruppo di pazienti affetti da cancro raggruppati in base alle misurazioni dell'espressione genica
- Gruppi di acquirenti in base alla cronologia di navigazione e di acquisto
- Gruppo di film in base alla valutazione data dagli spettatori del film
Differenza tra apprendimento supervisionato e non supervisionato
parametri | Tecnica di machine learning supervisionata | Tecnica di machine learning non supervisionata |
---|---|---|
Processo | In un modello di apprendimento supervisionato verranno fornite variabili di input e output. | Nel modello di apprendimento non supervisionato, verranno forniti solo i dati di input |
Dati in ingresso | Algorithms vengono addestrati utilizzando dati etichettati. | Algorithms vengono utilizzati rispetto a dati non etichettati |
Algorithms Usato | Supporta macchine vettoriali, rete neurale, regressione lineare e logistica, foresta casuale e alberi di classificazione. | Gli algoritmi non supervisionati possono essere suddivisi in diverse categorie: like Cluster algoritmi, K-means, clustering gerarchico, ecc. |
Complessità computazionale | L’apprendimento supervisionato è un metodo più semplice. | L'apprendimento non supervisionato è computazionalmente complesso |
Uso dei dati | Il modello di apprendimento supervisionato utilizza i dati di training per apprendere un collegamento tra input e output. | L'apprendimento non supervisionato non utilizza i dati di output. |
Precisione dei risultati | Metodo estremamente accurato e affidabile. | Less metodo accurato e affidabile. |
Apprendimento in tempo reale | Il metodo di apprendimento avviene offline. | Il metodo di apprendimento avviene in tempo reale. |
Numero di classi | Il numero di classi è noto. | Il numero delle classi non è noto. |
Principale svantaggio | Classificare i big data può essere una vera sfida nell’apprendimento supervisionato. | Non è possibile ottenere informazioni precise sull'ordinamento dei dati e l'output come dati utilizzati nell'apprendimento non supervisionato è etichettato e non noto. |