Учебное пособие по глубокому обучению для начинающих: основы нейронной сети

Что такое глубокое обучение?

Глубокое обучение — это компьютерное программное обеспечение, имитирующее сеть нейронов мозга. Это подмножество машинного обучения, основанное на искусственных нейронных сетях с обучением представлений. Это называется глубоким обучением, потому что оно использует глубокие нейронные сети. Это обучение может быть контролируемым, полуконтролируемым или неконтролируемым.

Алгоритмы глубокого обучения состоят из связанных слоев.

  • Первый слой называется входным слоем.
  • Последний слой называется выходным слоем.
  • Все слои между ними называются скрытыми слоями. Слово «глубокий» означает, что сеть объединяет нейроны более чем в два слоя.
Глубокое обучение
Что такое глубокое обучение?

Каждый скрытый слой состоит из нейронов. Нейроны связаны друг с другом. Нейрон будет обрабатывать, а затем распространять входной сигнал, который он получает, на слой над ним. Сила сигнала, подаваемого нейрону следующего слоя, зависит от веса, смещения и функции активации.

Сеть потребляет большие объемы входных данных и обрабатывает их на нескольких уровнях; сеть может изучать все более сложные характеристики данных на каждом уровне.

Процесс глубокого обучения

Глубокая нейронная сеть обеспечивает высочайшую точность во многих задачах — от обнаружения объектов до распознавания речи. Они могут учиться автоматически, без заранее определенных знаний, явно закодированных программистами.

Процесс глубокого обучения
Процесс глубокого обучения

Чтобы понять идею глубокого обучения, представьте себе семью с младенцем и родителями. Малыш указывает на предметы мизинцем и всегда произносит слово «кот». Поскольку его родители обеспокоены его образованием, они постоянно говорят ему: «Да, это кот» или «Нет, это не кот». Младенец упорно указывает на предметы, но становится более точным в обращении с «кошками». Маленький ребенок в глубине души не знает, почему он может говорить, кот это или нет. Он только что научился выстраивать иерархию сложных особенностей кошки, глядя на животное в целом, и продолжать концентрироваться на таких деталях, как хвост или нос, прежде чем принять решение.

Нейронная сеть работает примерно так же. Каждый слой представляет более глубокий уровень знаний, т. е. иерархию знаний. Нейронная сеть с четырьмя слоями выучит более сложные признаки, чем с двумя слоями.

Обучение происходит в два этапа:

Первая фаза: Первый этап состоит из применения нелинейного преобразования входных данных и создания статистической модели на выходе.
Вторая фаза: Второй этап направлен на улучшение модели с помощью математического метода, известного как производная.

Нейронная сеть повторяет эти две фазы сотни и тысячи раз, пока не достигнет приемлемого уровня точности. Повторение этой двухфазной фазы называется итерацией.

В качестве примера глубокого обучения взгляните на движение ниже: модель пытается научиться танцевать. После 10 минут тренировки модель не умеет танцевать и выглядит как каракули.

Процесс глубокого обучения

После 48 часов обучения компьютер овладевает искусством танца.

Процесс глубокого обучения

Классификация нейронных сетей

Мелкая нейронная сеть: Нейронная сеть Shallow имеет только один скрытый слой между входом и выходом.

Глубокая нейронная сеть: Глубокие нейронные сети имеют более одного слоя. Например, модель Google LeNet для распознавания изображений насчитывает 22 слоя.

В настоящее время глубокое обучение используется во многих сферах, например, в беспилотных автомобилях, мобильных телефонах, поисковой системе Google, обнаружении мошенничества, телевидении и так далее.

Типы сетей глубокого обучения

Теперь в этом руководстве по глубоким нейронным сетям мы узнаем о типах сетей глубокого обучения:

Типы сетей глубокого обучения
Типы сетей глубокого обучения

Нейронные сети прямого распространения

Самый простой тип искусственной нейронной сети. При таком типе архитектуры информация течет только в одном направлении — вперед. Это означает, что потоки информации начинаются на входном слое, идут к «скрытым» слоям и заканчиваются на выходном слое. Сеть

не имеет петли. Информация останавливается на выходных слоях.

Рекуррентные нейронные сети (RNN)

РНН — это многослойная нейронная сеть, которая может хранить информацию в узлах контекста, что позволяет ей изучать последовательности данных и выводить число или другую последовательность. Проще говоря, это искусственные нейронные сети, связи между нейронами которых включают в себя петли. RNN хорошо подходят для обработки последовательностей входных данных.

Рекуррентные нейронные сети

Рекуррентные нейронные сети

Например, если задача состоит в том, чтобы угадать следующее слово в предложении «Хочешь…………?»

  • Нейроны RNN получат сигнал, указывающий на начало предложения.
  • Сеть получает на вход слово «Do» и создает вектор числа. Этот вектор передается обратно нейрону, чтобы обеспечить память сети. Этот этап помогает сети запомнить, что она получила «Do» и получила его на первой позиции.
  • Аналогично сеть перейдет к следующим словам. Требуется слово «ты» и «хочу». Состояние нейронов обновляется при получении каждого слова.
  • Завершающий этап наступает после получения слова «а». Нейронная сеть предоставит вероятность для каждого английского слова, которое можно использовать для завершения предложения. Хорошо обученная RNN, вероятно, присваивает высокую вероятность словам «кафе», «напиток», «гамбургер» и т. д.

Распространенное использование RNN

  • Помогите трейдерам ценными бумагами создавать аналитические отчеты
  • Выявить отклонения в договоре финансовой отчетности
  • Обнаружение мошеннических транзакций по кредитной карте
  • Добавьте подпись к изображениям
  • Мощные чат-боты
  • Стандартное использование RNN происходит, когда практикующие специалисты работают с данными или последовательностями временных рядов (например, аудиозаписями или текстом).

Сверточные нейронные сети (CNN)

CNN — это многослойная нейронная сеть с уникальной архитектурой, предназначенная для извлечения все более сложных характеристик данных на каждом уровне для определения выходных данных. CNN хорошо подходят для задач восприятия.

Сверточная нейронная сеть

Сверточная нейронная сеть

CNN в основном используется, когда имеется неструктурированный набор данных (например, изображения), и специалистам необходимо извлечь из него информацию.

Например, если задача состоит в том, чтобы предсказать подпись к изображению:

  • CNN получает изображение, скажем, кошки. Говоря компьютерным языком, это изображение представляет собой набор пикселей. Обычно один слой для изображения в оттенках серого и три слоя для цветного изображения.
  • Во время изучения объектов (т. е. скрытых слоев) сеть будет идентифицировать уникальные объекты, например, хвост кошки, ухо и т. д.
  • Когда сеть полностью научится распознавать изображение, она сможет предоставить вероятность для каждого известного ей изображения. Метка с наибольшей вероятностью станет предсказанием сети.

Усиление обучения

Укрепление обучения — это подобласть машинного обучения, в которой системы обучаются, получая виртуальные «награды» или «наказания», по сути обучаясь методом проб и ошибок. Компания DeepMind от Google использовала обучение с подкреплением, чтобы победить чемпиона среди людей в играх го. Обучение с подкреплением также используется в видеоиграх для улучшения игрового процесса за счет создания более умных ботов.

Одними из самых известных алгоритмов являются:

  • Q-обучения
  • Сеть Deep Q
  • Государство-Действие-Награда-Государство-Действие (SARSA)
  • Глубокий детерминированный политический градиент (DDPG)

Примеры приложений глубокого обучения

Теперь в этом руководстве по глубокому обучению для начинающих давайте узнаем о приложениях глубокого обучения:

ИИ в финансах

Сектор финансовых технологий уже начал использовать ИИ для экономии времени, сокращения затрат и повышения ценности. Глубокое обучение меняет кредитную индустрию за счет использования более надежного кредитного скоринга. Лица, принимающие кредитные решения, могут использовать ИИ для создания надежных приложений для кредитования, чтобы быстрее и точнее оценивать риски, используя машинный интеллект для учета характера и возможностей заявителей.

Underwrite — финтех-компания, предоставляющая решения на базе искусственного интеллекта для кредитных компаний. underwrite.ai использует искусственный интеллект, чтобы определить, какой из заявителей с большей вероятностью выплатит кредит. Их подход радикально превосходит традиционные методы.

AI в HR

Компания Under Armour, производящая спортивную одежду, производит революцию в подборе кадров и модернизирует опыт кандидатов с помощью искусственного интеллекта. Фактически, Under Armour сокращает время найма сотрудников для своих розничных магазинов на 35%. Еще в 2012 году популярность Under Armour столкнулась с растущим интересом. В среднем у них было 30000 XNUMX резюме в месяц. Чтение всех этих заявлений и начало процесса отбора и собеседования заняло слишком много времени. Длительный процесс найма и трудоустройства людей повлиял на способность Under Armour полностью укомплектовать свои розничные магазины, расширить их возможности и подготовить к работе.

В то время в Under Armour были все необходимые HR-технологии, такие как транзакционные решения для поиска, применения, отслеживания и адаптации, но эти инструменты не были достаточно полезными. Под броню выбираем HireVue, поставщика искусственного интеллекта для HR-решений, как для интервью по запросу, так и для проведения интервью в режиме реального времени. Результаты оказались блефом; им удалось сократить время заполнения на 35%. Взамен нанимают более качественный персонал.

AI в маркетинге

ИИ — ценный инструмент для решения задач управления обслуживанием клиентов и персонализации. Улучшенное распознавание речи при управлении колл-центром и маршрутизации вызовов в результате применения методов искусственного интеллекта обеспечивает более комфортное обслуживание клиентов.

Например, анализ аудио с глубоким обучением позволяет системам оценить эмоциональный тон клиента. Если клиент плохо реагирует на AI chatbot, система может перенаправить разговор на реальных операторов-людей, которые возьмут на себя решение проблемы.

Помимо трех приведенных выше примеров глубокого обучения, ИИ широко используется в других секторах/отраслях.

Почему глубокое обучение важно?

Глубокое обучение — мощный инструмент, позволяющий превратить прогнозирование в действенный результат. Глубокое обучение превосходно обнаруживает закономерности (обучение без учителя) и прогнозирует на основе знаний. Большие Данные является топливом для глубокого обучения. Когда оба эти фактора объединены, организация может получить беспрецедентные результаты с точки зрения производительности, продаж, управления и инноваций.

Глубокое обучение может превзойти традиционный метод. Например, алгоритмы глубокого обучения на 41% точнее алгоритмов машинного обучения при классификации изображений, на 27% точнее при распознавании лиц и на 25% при распознавании голоса.

Ограничения глубокого обучения

Теперь в этом руководстве по нейронной сети мы узнаем об ограничениях глубокого обучения:

Маркировка данных

Большинство современных моделей ИИ обучаются посредством «контролируемого обучения». Это означает, что люди должны маркировать и классифицировать лежащие в основе данные, что может быть значительной и подверженной ошибкам рутинной работой. Например, компании, разрабатывающие технологии беспилотных автомобилей, нанимают сотни людей для ручного аннотирования часов видеопотоков с прототипов автомобилей, чтобы помочь в обучении этих систем.

Получите огромные наборы обучающих данных

Было показано, что простые методы глубокого обучения, такие как CNN, могут в некоторых случаях имитировать знания экспертов в медицине и других областях. Нынешняя волна обучение с помощью машиныОднако для этого требуются наборы обучающих данных, которые не только размечены, но также достаточно обширны и универсальны.

Методы глубокого обучения требовали тысяч наблюдений, чтобы модели относительно хорошо справлялись с задачами классификации, а в некоторых случаях и миллионы наблюдений, чтобы они могли работать на уровне людей. Неудивительно, что глубокое обучение широко распространено в гигантских технологических компаниях; они используют большие данные для накопления петабайт данных. Это позволяет им создавать впечатляющую и высокоточную модель глубокого обучения.

Объясните проблему

Большие и сложные модели бывает трудно объяснить человеческим языком. Например, почему было получено то или иное решение. Это одна из причин того, что некоторые инструменты ИИ принимаются медленно в тех областях приложений, где интерпретируемость полезна или даже необходима.

Более того, по мере расширения применения ИИ нормативные требования также могут привести к необходимости создания более объяснимых моделей ИИ.

Итого

Обзор глубокого обучения: Глубокое обучение — это новый уровень развития искусственный интеллект. Архитектура глубокого обучения состоит из входного слоя, скрытых слоев и выходного слоя. Слово «глубокий» означает, что существует более двух полностью связанных слоев.

Существует огромное количество нейронных сетей, каждая архитектура которых предназначена для выполнения определенной задачи. Например, CNN очень хорошо работает с изображениями, RNN дает впечатляющие результаты при анализе временных рядов и текста.

Глубокое обучение сейчас активно применяется в различных областях: от финансов до маркетинга, цепочки поставок и маркетинга. Крупные фирмы первыми используют глубокое обучение, поскольку у них уже есть большой объем данных. Глубокое обучение требует наличия обширного набора обучающих данных.