Урок за задълбочено обучение за начинаещи: Основи на невронните мрежи
Какво е дълбоко обучение?
Дълбоко обучение е компютърен софтуер, който имитира мрежата от неврони в мозъка. Това е подмножество от машинно обучение, базирано на изкуствени невронни мрежи с обучение на представяне. Нарича се дълбоко обучение, защото използва дълбоки невронни мрежи. Това обучение може да бъде контролирано, полуконтролирано или неконтролирано.
Алгоритмите за дълбоко обучение са изградени със свързани слоеве.
- Първият слой се нарича входен слой
- Последният слой се нарича изходен слой
- Всички слоеве между тях се наричат скрити слоеве. Думата дълбоко означава, че мрежата обединява неврони в повече от два слоя.

Всеки скрит слой се състои от неврони. Невроните са свързани помежду си. Невронът ще обработи и след това ще разпространи входния сигнал, който получава в слоя над него. Силата на сигнала, даден на неврона в следващия слой, зависи от теглото, отклонението и функцията за активиране.
Мрежата консумира големи количества входни данни и ги управлява чрез множество слоеве; мрежата може да научи все по-сложни характеристики на данните на всеки слой.
Дълбок процес на обучение
Дълбока невронна мрежа осигурява най-съвременна точност в много задачи, от откриване на обекти до разпознаване на реч. Те могат да учат автоматично, без предварително дефинирани знания, изрично кодирани от програмистите.
За да разберете идеята за задълбочено обучение, представете си семейство с бебе и родители. Детето посочва предмети с малкия си пръст и винаги казва думата „котка“. Тъй като родителите му са загрижени за образованието му, те продължават да му казват „Да, това е котка“ или „Не, това не е котка“. Бебето продължава да посочва предмети, но става по-точно с „котки“. Малкото дете дълбоко в себе си не знае защо може да каже, че е котка или не. Той току-що се е научил как да йерархизира сложните черти, идвайки с котка, като гледа домашния любимец като цяло и продължава да се фокусира върху детайли като опашките или носа, преди да вземе решение.
Невронната мрежа работи по същия начин. Всеки слой представлява по-дълбоко ниво на знание, т.е. йерархията на знанието. Невронна мрежа с четири слоя ще научи по-сложна функция, отколкото с два слоя.
Обучението протича в две фази:
Първа фаза: Първата фаза се състои от прилагане на нелинейна трансформация на входа и създаване на статистически модел като изход.
Втора фаза: Втората фаза има за цел подобряване на модела с математически метод, известен като производна.
Невронната мрежа повтаря тези две фази стотици до хиляди пъти, докато достигне приемливо ниво на точност. Повторението на тази две фази се нарича итерация.
За да дадете пример за дълбоко обучение, погледнете движението по-долу, моделът се опитва да се научи как да танцува. След 10 минути тренировка моделът не знае как да танцува и изглежда като драсканица.
След 48 часа учене компютърът овладява изкуството на танците.
Класификация на невронните мрежи
Плитка невронна мрежа: Плитката невронна мрежа има само един скрит слой между входа и изхода.
Дълбока невронна мрежа: Дълбоките невронни мрежи имат повече от един слой. Например моделът на Google LeNet за разпознаване на изображения има 22 слоя.
В днешно време дълбокото обучение се използва по много начини като кола без шофьор, мобилен телефон, търсачка на Google, откриване на измами, телевизия и т.н.
Видове мрежи за задълбочено обучение
Сега в този урок за дълбоки невронни мрежи ще научим за видовете мрежи за дълбоко обучение:
Feed-forward невронни мрежи
Най-простият тип изкуствена невронна мрежа. При този тип архитектура информацията тече само в една посока, напред. Това означава, че информационните потоци започват от входния слой, отиват до „скритите“ слоеве и завършват на изходния слой. Мрежата
няма цикъл. Информацията спира на изходните слоеве.
Повтарящи се невронни мрежи (RNN)
RNN е многопластова невронна мрежа, която може да съхранява информация в контекстни възли, което й позволява да научи последователности от данни и да изведе число или друга последователност. С прости думи, това е изкуствена невронна мрежа, чиито връзки между невроните включват вериги. RNN са много подходящи за обработка на последователности от входове.
Например, ако задачата е да се предвиди следващата дума в изречението „Искате ли …………?
- Невроните RNN ще получат сигнал, който сочи към началото на изречението.
- Мрежата получава думата „Do“ като вход и произвежда вектор на числото. Този вектор се връща обратно към неврона, за да осигури памет на мрежата. Този етап помага на мрежата да запомни, че е получила „Do“ и го е получила на първа позиция.
- Мрежата ще продължи по подобен начин към следващите думи. Отнема думата „ти“ и „искам“. Състоянието на невроните се актуализира при получаване на всяка дума.
- Последният етап настъпва след получаване на думата „а“. Невронната мрежа ще предостави вероятност за всяка английска дума, която може да се използва за завършване на изречението. Добре обучен RNN вероятно приписва голяма вероятност на „кафене“, „напитка“, „бургер“ и т.н.
Обичайни употреби на RNN
- Помогнете на търговците на ценни книжа да генерират аналитични отчети
- Откриване на аномалии в договора за финансов отчет
- Откриване на измамна транзакция с кредитна карта
- Осигурете надпис за изображения
- Силни чатботове
- Стандартните употреби на RNN възникват, когато практикуващите работят с времеви серии от данни или последователности (напр. аудио записи или текст).
Конволюционни невронни мрежи (CNN)
CNN е многопластова невронна мрежа с уникална архитектура, предназначена да извлича все по-сложни характеристики на данните на всеки слой, за да определи изхода. CNN са много подходящи за перцептивни задачи.
CNN се използва най-вече, когато има неструктуриран набор от данни (напр. изображения) и практикуващите трябва да извлекат информация от него.
Например, ако задачата е да се предвиди надпис на изображение:
- CNN получава изображение, да кажем, на котка, това изображение, на компютърен език, е колекция от пиксели. Обикновено един слой за картина в сивата скала и три слоя за цветна картина.
- По време на изучаването на функции (т.е. скрити слоеве), мрежата ще идентифицира уникални характеристики, например опашката на котката, ухото и т.н.
- Когато мрежата напълно научи как да разпознава картина, тя може да предостави вероятност за всяко изображение, което знае. Етикетът с най-голяма вероятност ще стане прогнозата на мрежата.
Укрепване на обучението
Укрепване на обучението е подполе на машинното обучение, в което системите се обучават чрез получаване на виртуални „награди“ или „наказания“, по същество учене чрез проба и грешка. DeepMind на Google използва обучение за подсилване, за да победи човешки шампион в игрите Go. Обучението с подсилване се използва и във видеоигрите за подобряване на игровото изживяване чрез предоставяне на по-интелигентни ботове.
Едни от най-известните алгоритми са:
- Q-обучение
- Дълбока Q мрежа
- Състояние-действие-награда-държавно действие (SARSA)
- Дълбок детерминистичен политически градиент (DDPG)
Примери за приложения за дълбоко обучение
Сега в този урок за задълбочено обучение за начинаещи, нека научим за приложенията за задълбочено обучение:
AI във финансите
Секторът на финансовите технологии вече е започнал да използва AI, за да спести време, да намали разходите и да добави стойност. Задълбоченото обучение променя кредитната индустрия чрез използване на по-стабилен кредитен рейтинг. Вземащите кредитни решения могат да използват AI за стабилни приложения за кредитиране, за да постигнат по-бърза и по-точна оценка на риска, като използват машинен интелект, за да вземат предвид характера и капацитета на кандидатите.
Underwrite е финтех компания, предоставяща AI решение за кредитни компании. underwrite.ai използва AI, за да открие кой кандидат е по-вероятно да върне заем. Техният подход радикално превъзхожда традиционните методи.
AI в HR
Under Armour, компания за спортно облекло, революционизира наемането и модернизира опита на кандидатите с помощта на AI. Всъщност Under Armour намалява времето за наемане на служители в магазините си с 35%. Under Armour се сблъскаха с нарастващ интерес през 2012 г. Те имаха средно 30000 XNUMX автобиографии на месец. Четенето на всички тези заявления и започването на процеса на проверка и интервю отне твърде много време. Дългият процес за наемане и приемане на хора се отрази на способността на Under Armour да има своите магазини за продажба на дребно с пълен персонал, настроени и готови за работа.
По това време Under Armour разполагаше с всички „задължителни“ HR технологии, като транзакционни решения за снабдяване, кандидатстване, проследяване и адаптиране, но тези инструменти не бяха достатъчно полезни. Под броня изберете HireVue, доставчик на AI за HR решение, както за интервюта по заявка, така и за интервюта на живо. Резултатите бяха блъфиращи; успяха да намалят с 35% времето за запълване. В замяна на това наетите по-качествени кадри.
AI в маркетинга
AI е ценен инструмент за управление на обслужването на клиенти и предизвикателства при персонализирането. Подобреното разпознаване на реч в управлението на кол-центъра и маршрутизирането на повикванията в резултат на прилагането на AI техники позволява по-безпроблемно изживяване за клиентите.
Например, дълбокият анализ на аудиото позволява на системите да оценят емоционалния тон на клиента. Ако клиентът реагира зле на AI чат бот, системата може да пренасочи разговора към реални човешки оператори, които поемат проблема.
Освен трите примера за дълбоко обучение по-горе, AI се използва широко в други сектори/индустрии.
Защо Deep Learning е важно?
Дълбокото обучение е мощен инструмент за превръщане на прогнозите в приложим резултат. Дълбокото обучение се отличава с откриване на модели (неконтролирано обучение) и базирано на знания предвиждане. Big данни е горивото за задълбочено обучение. Когато и двете се комбинират, една организация може да пожъне безпрецедентни резултати по отношение на продуктивността, продажбите, управлението и иновациите.
Дълбокото обучение може да надмине традиционния метод. Например, алгоритмите за дълбоко обучение са с 41% по-точни от алгоритъма за машинно обучение при класифициране на изображения, 27% по-точни при разпознаване на лица и 25% при разпознаване на глас.
Ограничения на дълбокото обучение
Сега в този урок за невронни мрежи ще научим за ограниченията на Deep Learning:
Етикетиране на данни
Повечето настоящи модели на AI се обучават чрез „наблюдавано обучение“. Това означава, че хората трябва да етикетират и категоризират основните данни, което може да бъде доста голяма и податлива на грешки работа. Например, компаниите, разработващи технологии за самоуправляващи се автомобили, наемат стотици хора, за да анотират ръчно часове видео емисии от прототипни превозни средства, за да помогнат за обучението на тези системи.
Получете огромни набори от данни за обучение
Доказано е, че простите техники за дълбоко обучение като CNN могат в някои случаи да имитират знанията на експерти в медицината и други области. Сегашната вълна от машинно обучение, обаче, изисква набори от данни за обучение, които не само са етикетирани, но и достатъчно широки и универсални.
Методите за задълбочено обучение изискват хиляди наблюдения, за да могат моделите да станат относително добри в класификационните задачи и в някои случаи милиони, за да ги изпълнят на ниво хора. Без изненада дълбокото обучение е известно в гигантските технологични компании; те използват големи данни, за да натрупат петабайти данни. Това им позволява да създадат впечатляващ и много точен модел на дълбоко обучение.
Обяснете проблем
Големите и сложни модели могат да бъдат трудни за обяснение от човешка гледна точка. Например защо е получено конкретно решение. Това е една от причините, поради която приемането на някои AI инструменти е бавно в области на приложение, където интерпретируемостта е полезна или наистина се изисква.
Освен това, тъй като приложението на AI се разширява, регулаторните изисквания също могат да предизвикат необходимостта от по-обясними модели на AI.
Oбобщение
Общ преглед на дълбокото обучение: Дълбокото обучение е новото състояние на техниката за изкуствен интелект. Архитектурата за дълбоко обучение се състои от входен слой, скрити слоеве и изходен слой. Думата дълбоко означава, че има повече от два напълно свързани слоя.
Има огромно количество невронни мрежи, където всяка архитектура е проектирана да изпълнява дадена задача. Например CNN работи много добре със снимки, RNN предоставя впечатляващи резултати с времеви серии и анализ на текст.
Дълбокото обучение вече е активно в различни области, от финанси до маркетинг, верига за доставки и маркетинг. Големите фирми са първите, които използват задълбочено обучение, защото вече имат голям набор от данни. Дълбокото обучение изисква да имате обширен набор от данни за обучение.