Посібник із глибокого навчання для початківців: основи нейронної мережі
Що таке глибоке навчання?
Глибоке навчання це комп’ютерне програмне забезпечення, яке імітує мережу нейронів у мозку. Це підмножина машинного навчання на основі штучних нейронних мереж із навчанням представлення. Це називається глибоким навчанням, оскільки воно використовує глибокі нейронні мережі. Це навчання може бути контрольованим, напівконтрольованим або неконтрольованим.
Алгоритми глибокого навчання будуються з підключеними шарами.
- Перший шар називається вхідним
- Останній шар називається вихідним шаром
- Усі шари між ними називаються прихованими шарами. Слово deep означає, що мережа об’єднує нейрони більш ніж у два шари.

Кожен прихований шар складається з нейронів. Нейрони пов'язані один з одним. Нейрон оброблятиме, а потім поширюватиме вхідний сигнал, який він отримує, шаром над ним. Сила сигналу, який подається нейрону в наступному шарі, залежить від ваги, зміщення та функції активації.
Мережа споживає велику кількість вхідних даних і обробляє їх через кілька рівнів; мережа може вивчати дедалі складніші характеристики даних на кожному рівні.
Процес глибокого навчання
Глибока нейронна мережа забезпечує найсучаснішу точність у багатьох завданнях, від виявлення об’єктів до розпізнавання мови. Вони можуть навчатися автоматично, без попередньо визначених знань, явно закодованих програмістами.
Щоб зрозуміти ідею глибокого навчання, уявіть сім’ю з немовлям і батьками. Малюк вказує на предмети мізинцем і завжди вимовляє слово «кіт». Оскільки його батьки стурбовані його освітою, вони постійно кажуть йому: «Так, це кіт» або «Ні, це не кіт». Дитина наполегливо вказує на предмети, але стає точнішою з «кішками». Маленька дитина в глибині душі не знає, чому він може сказати, що це кішка чи ні. Він щойно навчився створювати ієрархії складних рис кота, дивлячись на тварину в цілому та продовжуючи зосереджуватися на таких деталях, як хвости чи ніс, перш ніж прийняти рішення.
Нейронна мережа працює так само. Кожен рівень представляє більш глибокий рівень знань, тобто ієрархію знань. Нейронна мережа з чотирма шарами вивчатиме більш складні функції, ніж із двома рівнями.
Навчання відбувається в два етапи:
Перша фаза: Перший етап складається із застосування нелінійного перетворення вхідних даних і створення статистичної моделі як вихідних даних.
Друга фаза: другий етап спрямований на вдосконалення моделі за допомогою математичного методу, відомого як похідна.
Нейронна мережа повторює ці дві фази від сотень до тисяч разів, поки не досягне допустимого рівня точності. Повторення цієї двох фаз називається ітерацією.
Щоб навести приклад глибокого навчання, подивіться на рух нижче, модель намагається навчитися танцювати. Після 10 хвилин тренування модель не вміє танцювати, і це схоже на каракулі.
Після 48 годин навчання комп’ютер опановує мистецтво танцю.
Класифікація нейронних мереж
Неглибока нейронна мережа: Неглибока нейронна мережа має лише один прихований шар між входом і виходом.
Глибока нейронна мережа: Глибинні нейронні мережі мають більше одного рівня. Наприклад, модель Google LeNet для розпізнавання зображень нараховує 22 шари.
Зараз глибоке навчання використовується у багатьох відношеннях, наприклад, безпілотний автомобіль, мобільний телефон, пошукова система Google, виявлення шахрайства, телебачення тощо.
Типи мереж глибокого навчання
Тепер у цьому підручнику з глибоких нейронних мереж ми дізнаємося про типи мереж глибокого навчання:
Нейронні мережі прямого зв’язку
Найпростіший тип штучної нейронної мережі. У такому типі архітектури інформація рухається лише в одному напрямку, вперед. Це означає, що потоки інформації починаються на вхідному рівні, йдуть до «прихованих» шарів і закінчуються на вихідному рівні. Мережа
не має петлі. Інформація зупиняється на вихідних шарах.
Повторювані нейронні мережі (RNN)
RNN це багаторівнева нейронна мережа, яка може зберігати інформацію в контекстних вузлах, що дозволяє вивчати послідовності даних і виводити число або іншу послідовність. Простими словами, це штучні нейронні мережі, зв’язки між нейронами яких включають петлі. RNN добре підходять для обробки послідовностей вхідних даних.
Наприклад, якщо завдання полягає в тому, щоб передбачити наступне слово в реченні «Do you want a…………?»
- Нейрони RNN отримають сигнал, який вкаже на початок речення.
- Мережа отримує на вхід слово «Do» і створює вектор числа. Цей вектор повертається до нейрона, щоб надати пам’ять мережі. Цей етап допомагає мережі запам’ятати, що вона отримала «Do» і вона отримала його на першій позиції.
- Мережа так само перейде до наступних слів. Для цього потрібні слова «ти» і «хочу». Стан нейронів оновлюється після отримання кожного слова.
- Заключний етап настає після отримання слова «а». Нейронна мережа надасть ймовірність для кожного англійського слова, яким можна завершити речення. Добре навчений RNN, ймовірно, призначить високу ймовірність «кафе», «напій», «бургер» тощо.
Загальне використання RNN
- Допомагайте торговцям цінними паперами створювати аналітичні звіти
- Виявлення відхилень у договорі фінансової звітності
- Виявляти шахрайські операції з кредитною карткою
- Додайте підпис до зображень
- Потужні чат-боти
- Стандартне використання RNN відбувається, коли практики працюють із даними або послідовністю часових рядів (наприклад, аудіозаписи чи текст).
Свертові нейронні мережі (CNN)
CNN це багаторівнева нейронна мережа з унікальною архітектурою, розробленою для вилучення дедалі складніших характеристик даних на кожному рівні для визначення результату. CNN добре підходять для завдань сприйняття.
CNN здебільшого використовується, коли є неструктурований набір даних (наприклад, зображення), і практикуючим спеціалістам потрібно витягти з нього інформацію.
Наприклад, якщо завдання передбачити підпис до зображення:
- CNN отримує зображення, скажімо, кота, це зображення, кажучи комп’ютерною мовою, є набором пікселів. Як правило, один шар для зображення у градаціях сірого та три шари для кольорового зображення.
- Під час вивчення функцій (тобто прихованих шарів) мережа визначить унікальні особливості, наприклад, хвіст кота, вухо тощо.
- Коли мережа досконально навчилася розпізнавати зображення, вона може надати ймовірність для кожного зображення, яке їй відомо. Мітка з найбільшою ймовірністю стане прогнозом мережі.
Навчання зміцненню
Підсилення навчання це підполе машинного навчання, в якому системи навчаються шляхом отримання віртуальних «винагород» або «покарань», по суті навчання методом проб і помилок. DeepMind від Google використав навчання з підкріпленням, щоб перемогти чемпіона в іграх Go. Навчання з підкріпленням також використовується у відеоіграх для покращення ігрового досвіду шляхом надання розумніших ботів.
Одними з найвідоміших алгоритмів є:
- Q-навчання
- Глибока мережа Q
- Стан-Дія-Нагорода-Держава-Дія (SARSA)
- Глибокий детермінований градієнт політики (DDPG)
Приклади програм глибокого навчання
Тепер у цьому підручнику з глибокого навчання для початківців давайте дізнаємося про програми глибокого навчання:
AI у фінансах
Сектор фінансових технологій уже почав використовувати штучний інтелект для економії часу, скорочення витрат і збільшення вартості. Глибоке навчання змінює індустрію кредитування завдяки більш надійному кредитному рейтингу. Особи, які приймають кредитні рішення, можуть використовувати штучний інтелект для надійних заявок на кредитування, щоб досягти швидшої та точнішої оцінки ризиків, використовуючи машинний інтелект для врахування характеру та потенціалу заявників.
Underwrite – це фінансово-технологічна компанія, яка надає рішення штучного інтелекту для кредитних компаній. underwrite.ai використовує штучний інтелект, щоб визначити, хто з заявників, швидше за все, поверне позику. Їхній підхід радикально перевершує традиційні методи.
ШІ в HR
Компанія Under Armour, що займається виробництвом спортивного одягу, революціонізує наймання та модернізує досвід кандидатів за допомогою ШІ. Насправді Under Armour скорочує час найму для своїх роздрібних магазинів на 35%. Популярність Under Armour зростала ще в 2012 році. Вони мали в середньому 30000 XNUMX резюме на місяць. Читання всіх цих заяв і початок процесу перевірки та співбесіди займали надто багато часу. Тривалий процес найму та залучення людей вплинув на здатність Under Armour повністю укомплектувати свої роздрібні магазини персоналом, налаштувати їх і бути готовими до роботи.
На той час у Under Armour були всі «необхідні» HR-технології, такі як транзакційні рішення для пошуку джерел, подання заявок, відстеження та адаптації, але ці інструменти не були достатньо корисними. Під броню вибрати HireVue, постачальник штучного інтелекту для кадрових рішень, як для співбесід на замовлення, так і для живих співбесід. Результати були блефовими; їм вдалося скоротити на 35% час заповнення. Натомість найняли більш якісні кадри.
AI з маркетингу
AI є цінним інструментом для управління обслуговуванням клієнтів і викликів персоналізації. Покращене розпізнавання мовлення в управлінні колл-центром і маршрутизації викликів завдяки застосуванню методів штучного інтелекту забезпечує більш безпроблемний досвід для клієнтів.
Наприклад, глибокий аналіз аудіо дозволяє системам оцінювати емоційний тон клієнта. Якщо клієнт погано реагує на AI чат, система може перенаправити розмову до реальних людей-операторів, які беруть на себе цю проблему.
Окрім трьох наведених вище прикладів глибокого навчання, ШІ широко використовується в інших секторах/галузях.
Чому глибоке навчання важливе?
Глибоке навчання є потужним інструментом для того, щоб зробити прогнозування ефективним результатом. Глибоке навчання виділяється у виявленні шаблонів (навчання без нагляду) і прогнозуванні на основі знань. Велике даних це паливо для глибокого навчання. Якщо обидва поєднати, організація може отримати безпрецедентні результати з точки зору продуктивності, продажів, управління та інновацій.
Глибоке навчання може перевершити традиційний метод. Наприклад, алгоритми глибокого навчання на 41% точніші за алгоритм машинного навчання в класифікації зображень, на 27% точніші в розпізнаванні обличчя та на 25% у розпізнаванні голосу.
Обмеження глибокого навчання
У цьому підручнику з нейронної мережі ми дізнаємося про обмеження глибокого навчання:
Маркування даних
Більшість сучасних моделей ШІ навчаються за допомогою «навчання під наглядом». Це означає, що люди повинні позначати та класифікувати основні дані, що може бути значною та схильною до помилок роботою. Наприклад, компанії, що розробляють технології безпілотних автомобілів, наймають сотні людей, щоб вручну коментувати години відео з прототипів транспортних засобів, щоб допомогти навчити ці системи.
Отримайте величезні навчальні набори даних
Було показано, що прості методи глибокого навчання, такі як CNN, можуть у деяких випадках імітувати знання експертів у медицині та інших галузях. Сучасна хвиля навчання за допомогою машиниоднак вимагає навчальних наборів даних, які не тільки позначені, але й достатньо широкі та універсальні.
Методи глибокого навчання вимагали тисяч спостережень, щоб моделі стали відносно добре справлятися із завданнями класифікації, а в деяких випадках – мільйони для виконання ними на рівні людини. Не дивно, глибоке навчання відоме в гігантських технологічних компаніях; вони використовують великі дані для накопичення петабайтів даних. Це дозволяє їм створити вражаючу та високоточну модель глибокого навчання.
Поясніть проблему
Великі та складні моделі важко пояснити людськими термінами. Наприклад, чому було прийнято те чи інше рішення. Це одна з причин того, що деякі інструменти штучного інтелекту повільно сприймаються в областях застосування, де інтерпретація є корисною або дійсно необхідною.
Крім того, у міру розширення застосування штучного інтелекту регулятивні вимоги також можуть викликати потребу в більш зрозумілих моделях штучного інтелекту.
Підсумки
Огляд глибокого навчання: Глибоке навчання – це новий стан мистецтва для штучний інтелект. Архітектура глибокого навчання складається з вхідного рівня, прихованих шарів і вихідного рівня. Слово глибокий означає, що існує більше двох повністю пов’язаних шарів.
Існує величезна кількість нейронних мереж, кожна архітектура яких розроблена для виконання певного завдання. Наприклад, CNN дуже добре працює з картинками, RNN забезпечує вражаючі результати з часовими рядами та аналізом тексту.
Зараз глибоке навчання активно застосовується в різних сферах, від фінансів до маркетингу, ланцюга поставок і маркетингу. Великі фірми першими використовують глибоке навчання, оскільки вони вже мають великий пул даних. Для глибокого навчання потрібен великий набір навчальних даних.