Tutorial sul deep learning per principianti: nozioni di base sulla rete neurale

Cos'è l'apprendimento profondo?

Deep Learning è un software per computer che imita la rete di neuroni del cervello. È un sottoinsieme dell'apprendimento automatico basato su reti neurali artificiali con apprendimento per rappresentazione. Si chiama deep learning perché fa uso di reti neurali profonde. Questo apprendimento può essere supervisionato, semi-supervisionato o non supervisionato.

Gli algoritmi di deep learning sono costruiti con livelli connessi.

  • Il primo livello è chiamato Livello di input
  • L'ultimo livello è chiamato Livello di output
  • Tutti i livelli intermedi sono chiamati Livelli nascosti. La parola profondo significa che la rete unisce i neuroni in più di due strati.
Deep Learning
Cos'è l'apprendimento profondo?

Ogni strato nascosto è composto da neuroni. I neuroni sono collegati tra loro. Il neurone elaborerà e quindi propagherà il segnale di ingresso che riceve allo strato sopra di esso. La forza del segnale inviato al neurone nello strato successivo dipende dal peso, dalla polarizzazione e dalla funzione di attivazione.

La rete consuma grandi quantità di dati di input e li gestisce attraverso più livelli; a ogni livello la rete può apprendere caratteristiche sempre più complesse dei dati.

Processo di apprendimento profondo

Una rete neurale profonda fornisce una precisione all'avanguardia in molte attività, dal rilevamento di oggetti al riconoscimento vocale. Possono apprendere automaticamente, senza conoscenze predefinite codificate esplicitamente dai programmatori.

Processo di apprendimento profondo
Processo di apprendimento profondo

Per comprendere l'idea di apprendimento profondo, immagina una famiglia con un neonato e i genitori. Il bambino piccolo indica gli oggetti con il mignolo e dice sempre la parola "gatto". Poiché i genitori sono preoccupati per la sua istruzione, continuano a dirgli "Sì, è un gatto" o "No, non è un gatto". Il neonato continua a indicare gli oggetti ma diventa più preciso con "gatti". Il bambino piccolo, in fondo, non sa perché può dire che è un gatto o no. Ha appena imparato a gerarchizzare caratteristiche complesse arrivando a un gatto guardando l'animale domestico nel suo complesso e continua a concentrarsi su dettagli come la coda o il naso prima di decidere.

Una rete neurale funziona più o meno allo stesso modo. Ogni strato rappresenta un livello di conoscenza più profondo, ovvero la gerarchia della conoscenza. Una rete neurale con quattro strati apprenderà caratteristiche più complesse rispetto a una con due strati.

L’apprendimento avviene in due fasi:

Prima fase: La prima fase consiste nell'applicare una trasformazione non lineare dell'input e creare un modello statistico come output.
Seconda fase: La seconda fase mira a migliorare il modello con un metodo matematico noto come derivata.

La rete neurale ripete queste due fasi da centinaia a migliaia di volte finché non raggiunge un livello di precisione tollerabile. La ripetizione di queste due fasi è chiamata iterazione.

Per fornire un esempio di deep learning, dai un'occhiata al movimento qui sotto, il modello sta cercando di imparare a ballare. Dopo 10 minuti di allenamento, la modella non sa ballare e sembra uno scarabocchio.

Processo di apprendimento profondo

Dopo 48 ore di apprendimento, il computer padroneggia l'arte della danza.

Processo di apprendimento profondo

Classificazione delle reti neurali

Rete neurale superficiale: La rete neurale superficiale ha solo uno strato nascosto tra l'input e l'output.

Rete neurale profonda: Le reti neurali profonde hanno più di uno strato. Ad esempio, il modello Google LeNet per il riconoscimento delle immagini conta 22 livelli.

Al giorno d'oggi, il deep learning viene utilizzato in molti modi, come un'auto senza conducente, un telefono cellulare, il motore di ricerca di Google, il rilevamento di frodi, la TV e così via.

Tipi di reti di deep learning

Ora in questo tutorial sulla rete neurale profonda, impareremo i tipi di reti di deep learning:

Tipi di reti di deep learning
Tipi di reti di deep learning

Reti neurali feed-forward

Il tipo più semplice di rete neurale artificiale. Con questo tipo di architettura, le informazioni fluiscono in una sola direzione, in avanti. Ciò significa che i flussi di informazioni iniziano allo strato di input, vanno agli strati "nascosti" e terminano allo strato di output. La rete

non ha un ciclo. Le informazioni si fermano ai livelli di output.

Reti neurali ricorrenti (RNN)

RNN è una rete neurale multistrato che può memorizzare informazioni in nodi di contesto, consentendole di apprendere sequenze di dati e di produrre un numero o un'altra sequenza. In parole semplici, è una rete neurale artificiale le cui connessioni tra neuroni includono loop. Le RNN sono adatte per l'elaborazione di sequenze di input.

Reti neurali ricorrenti

Reti neurali ricorrenti

Ad esempio, se il compito è prevedere la parola successiva nella frase “Vuoi un…………?

  • I neuroni RNN riceveranno un segnale che punta all'inizio della frase.
  • La rete riceve la parola "Do" come input e produce un vettore del numero. Questo vettore viene restituito al neurone per fornire una memoria alla rete. Questa fase aiuta la rete a ricordare di aver ricevuto il "Do" e di averlo ricevuto in prima posizione.
  • La rete procederà allo stesso modo con le parole successive. Ci vuole la parola "tu" e "vuoi". Lo stato dei neuroni viene aggiornato dopo aver ricevuto ogni parola.
  • La fase finale avviene dopo aver ricevuto la parola “a”. La rete neurale fornirà una probabilità per ogni parola inglese che può essere utilizzata per completare la frase. Una RNN ben addestrata probabilmente assegna un’alta probabilità a “café”, “drink”, “burger”, ecc.

Usi comuni di RNN

  • Aiuta i trader di titoli a generare report analitici
  • Rilevare anomalie nel contratto di bilancio
  • Rileva transazioni fraudolente con carta di credito
  • Fornire una didascalia per le immagini
  • Chatbot potenti
  • Gli usi standard di RNN si verificano quando i professionisti lavorano con dati o sequenze di serie temporali (ad esempio, registrazioni audio o testo).

Reti neurali convoluzionali (CNN)

CNN è una rete neurale multistrato con un'architettura unica progettata per estrarre caratteristiche sempre più complesse dei dati a ogni livello per determinare l'output. Le CNN sono adatte per compiti percettivi.

Rete neurale convoluzionale

Rete neurale convoluzionale

La CNN viene utilizzata principalmente quando è presente un set di dati non strutturati (ad esempio, immagini) e i professionisti devono estrarre informazioni da esso.

Ad esempio, se l'attività è prevedere la didascalia di un'immagine:

  • La CNN riceve un'immagine, diciamo, di un gatto, questa immagine, in termini informatici, è una raccolta di pixel. Generalmente, uno strato per l'immagine in scala di grigi e tre strati per un'immagine a colori.
  • Durante l'apprendimento delle caratteristiche (ovvero i livelli nascosti), la rete identificherà caratteristiche uniche, ad esempio la coda del gatto, l'orecchio, ecc.
  • Quando la rete ha imparato a fondo come riconoscere un'immagine, può fornire una probabilità per ogni immagine che conosce. L'etichetta con la probabilità più alta diventerà la previsione della rete.

Insegnamento rafforzativo

Insegnamento rafforzativo è un sottocampo dell’apprendimento automatico in cui i sistemi vengono addestrati ricevendo “premi” o “punizioni” virtuali, imparando essenzialmente per tentativi ed errori. DeepMind di Google ha utilizzato l'apprendimento per rinforzo per battere un campione umano nei giochi Go. L'apprendimento per rinforzo viene utilizzato anche nei videogiochi per migliorare l'esperienza di gioco fornendo bot più intelligenti.

Uno degli algoritmi più famosi sono:

  • Q-apprendimento
  • Rete Q profonda
  • Stato-Azione-Ricompensa-Stato-Azione (SARSA)
  • Gradiente politico deterministico profondo (DDPG)

Esempi di applicazioni di deep learning

Ora in questo tutorial sul Deep Learning per principianti, impariamo a conoscere le applicazioni di Deep Learning:

L'intelligenza artificiale nella finanza

Il settore della tecnologia finanziaria ha già iniziato a utilizzare l’intelligenza artificiale per risparmiare tempo, ridurre i costi e aggiungere valore. Il deep learning sta cambiando il settore dei prestiti utilizzando un punteggio di credito più solido. I decisori del credito possono utilizzare l’intelligenza artificiale per solide applicazioni di prestito di credito per ottenere una valutazione del rischio più rapida e accurata, utilizzando l’intelligenza artificiale per tenere conto del carattere e della capacità dei richiedenti.

Underwrite è una società Fintech che fornisce una soluzione di intelligenza artificiale per le aziende produttrici di credito. underwrite.ai utilizza l'intelligenza artificiale per rilevare quale richiedente ha maggiori probabilità di rimborsare un prestito. Il loro approccio supera radicalmente i metodi tradizionali.

IA nelle risorse umane

Under Armour, un'azienda di abbigliamento sportivo, rivoluziona le assunzioni e modernizza l'esperienza dei candidati con l'aiuto dell'intelligenza artificiale. Infatti, Under Armour riduce i tempi di assunzione per i suoi negozi al dettaglio del 35%. Under Armour ha riscontrato un crescente interesse in termini di popolarità nel 2012. Avevano, in media, 30000 curriculum al mese. Leggere tutte quelle candidature e iniziare il processo di selezione e colloquio stava richiedendo troppo tempo. Il lungo processo per assumere e integrare le persone ha avuto un impatto sulla capacità di Under Armour di avere i propri negozi al dettaglio completamente attrezzati, attrezzati e pronti a funzionare.

A quel tempo, Under Armour disponeva di tutte le tecnologie HR "indispensabili", come soluzioni transazionali per l'approvvigionamento, la candidatura, il monitoraggio e l'onboarding, ma tali strumenti non erano abbastanza utili. Sotto l'armatura scegli HireVue, un fornitore di intelligenza artificiale per soluzioni HR, sia per colloqui on-demand che dal vivo. I risultati erano bluff; sono riusciti a diminuire del 35% il tempo di riempimento. In cambio, il personale assunto è di qualità superiore.

AI nel marketing

L’intelligenza artificiale è uno strumento prezioso per la gestione del servizio clienti e le sfide di personalizzazione. Il miglioramento del riconoscimento vocale nella gestione dei call center e nell'instradamento delle chiamate come risultato dell'applicazione delle tecniche di intelligenza artificiale consente un'esperienza più fluida per i clienti.

Ad esempio, l'analisi dell'audio con deep learning consente ai sistemi di valutare il tono emotivo di un cliente. Se il cliente risponde male al AI chatbot, il sistema può reindirizzare la conversazione a operatori umani reali che si occupano della questione.

A parte i tre esempi di deep learning sopra riportati, l’intelligenza artificiale è ampiamente utilizzata in altri settori/industrie.

Perché è importante il deep learning?

Il deep learning è uno strumento potente per rendere la previsione un risultato utilizzabile. Il deep learning eccelle nella scoperta di modelli (apprendimento non supervisionato) e nella previsione basata sulla conoscenza. Big dati è il carburante per l'apprendimento profondo. Quando entrambi sono combinati, un'organizzazione può raccogliere risultati senza precedenti in termini di produttività, vendite, gestione e innovazione.

Il deep learning può superare il metodo tradizionale. Ad esempio, gli algoritmi di deep learning sono più accurati del 41% rispetto all’algoritmo di machine learning nella classificazione delle immagini, del 27% più accurati nel riconoscimento facciale e del 25% nel riconoscimento vocale.

Limitazioni dell'apprendimento profondo

Ora in questo tutorial sulla rete neurale impareremo le limitazioni del Deep Learning:

Etichettatura dei dati

La maggior parte degli attuali modelli di intelligenza artificiale vengono addestrati tramite “apprendimento supervisionato”. Ciò significa che gli esseri umani devono etichettare e classificare i dati sottostanti, il che può essere un compito considerevole e soggetto a errori. Ad esempio, le aziende che sviluppano tecnologie per auto a guida autonoma stanno assumendo centinaia di persone per annotare manualmente ore di feed video provenienti da veicoli prototipo per aiutare ad addestrare questi sistemi.

Ottieni enormi set di dati di addestramento

È stato dimostrato che semplici tecniche di deep learning come la CNN possono, in alcuni casi, imitare la conoscenza di esperti in medicina e in altri campi. L'attuale ondata di machine learning, tuttavia, richiede set di dati di addestramento che non siano solo etichettati ma anche sufficientemente ampi e universali.

I metodi di deep learning hanno richiesto migliaia di osservazioni affinché i modelli diventassero relativamente efficaci nei compiti di classificazione e, in alcuni casi, milioni affinché potessero essere eseguiti al livello degli esseri umani. Senza sorpresa, il deep learning è famoso nelle grandi aziende tecnologiche; stanno utilizzando i big data per accumulare petabyte di dati. Consente loro di creare un modello di deep learning impressionante e altamente accurato.

Spiega un problema

I modelli grandi e complessi possono essere difficili da spiegare, in termini umani. Ad esempio, perché è stata presa una particolare decisione. È uno dei motivi per cui l'accettazione di alcuni strumenti di IA è lenta in aree applicative in cui l'interpretabilità è utile o addirittura richiesta.

Inoltre, con l’espansione dell’applicazione dell’intelligenza artificiale, i requisiti normativi potrebbero anche guidare la necessità di modelli di intelligenza artificiale più spiegabili.

Sommario

Panoramica sull'apprendimento profondo: Il deep learning è il nuovo stato dell'arte per intelligenza artificiale. L'architettura di apprendimento profondo è composta da un livello di input, livelli nascosti e un livello di output. La parola profondo significa che ci sono più di due livelli completamente connessi.

Esiste una vasta quantità di reti neurali, in cui ogni architettura è progettata per svolgere un dato compito. Ad esempio, la CNN funziona molto bene con le immagini, la RNN fornisce risultati impressionanti con serie temporali e analisi del testo.

Il deep learning è ora attivo in diversi campi, dalla finanza al marketing, alla supply chain e al marketing. Le grandi aziende sono le prime a utilizzare il deep learning perché dispongono già di un ampio pool di dati. Il deep learning richiede la disponibilità di un ampio set di dati di addestramento.