Контролирано машинно обучение: Какво е, Algorithms с примери
Какво е контролирано машинно обучение?
Контролирано машинно обучение е алгоритъм, който се учи от етикетирани данни за обучение, за да ви помогне да предвидите резултати за непредвидени данни. При контролирано обучение вие обучавате машината, като използвате данни, които са добре „етикетирани“. Това означава, че някои данни вече са маркирани с правилни отговори. Може да се сравни с учене в присъствието на ръководител или учител.
Успешно изграждане, мащабиране и внедряване точен моделите за контролирано машинно обучение изискват време и технически опит от екип от висококвалифицирани специалисти по данни. освен това Дата ученият трябва да възстанови модели за да се уверите, че дадените прозрения остават верни, докато данните му се променят.
Как работи контролираното обучение
Наблюдаваното машинно обучение използва набори от данни за обучение, за да постигне желаните резултати. Тези набори от данни съдържат входни данни и правилния изход, който помага на модела да се учи по-бързо. Например, искате да обучите машина, която да ви помогне да предвидите колко време ще ви отнеме да се приберете от работното си място.
Тук започвате със създаване на набор от етикетирани данни. Тези данни включват:
- Метеорологични условия
- Време на деня
- Ваканция
Всички тези подробности са вашите въведени данни в този пример за контролирано обучение. Резултатът е времето, необходимо за прибиране вкъщи в този конкретен ден.
Инстинктивно знаете, че ако навън вали, ще ви отнеме повече време, за да се приберете. Но машината се нуждае от данни и статистика.
Нека да видим някои примери за контролирано обучение за това как можете да разработите модел за контролирано обучение от този пример, който помага на потребителя да определи времето за пътуване. Първото нещо, което трябва да създадете, е комплект за обучение. Този тренировъчен набор ще съдържа общото време за пътуване до работното място и съответните фактори като време, време и т.н. Въз основа на този тренировъчен набор вашата машина може да види, че има пряка връзка между количеството дъжд и времето, което ще ви отнеме, за да се приберете у дома.
Така че установява, че колкото повече вали, толкова по-дълго ще шофирате, за да се върнете в дома си. Може също така да види връзката между времето, в което тръгвате от работа, и времето, в което ще сте на път.
Колкото по-близо сте до 6 часа, толкова повече време ви отнема да се приберете. Вашата машина може да намери някои от връзките с вашите етикетирани данни.
Това е началото на вашия модел на данни. Започва да оказва влияние върху начина, по който хората шофират. Също така започва да се вижда, че повече хора пътуват през определено време от деня.
Видове контролирано машинно обучение Algorithms
Следват видовете алгоритми за контролирано машинно обучение:
Регресия
Техниката на регресия прогнозира единична изходна стойност, използвайки данни за обучение.
Пример: Можете да използвате регресия, за да предвидите цената на къщата от данни за обучение. Входните променливи ще бъдат местоположение, размер на къща и т.н.
Силни: Резултатите винаги имат вероятностна интерпретация и алгоритъмът може да бъде регулиран, за да се избегне пренастройване.
Слабости: Логистичната регресия може да се представи по-слабо, когато има множество или нелинейни граници на решения. Този метод не е гъвкав, така че не улавя по-сложни връзки.
Логистична регресия:
Метод на логистична регресия, използван за оценка на дискретни стойности въз основа на даден набор от независими променливи. Помага ви да предскажете вероятността за настъпване на дадено събитие чрез монтиране на данни към функция logit. Следователно, той е известен също като логистична регресия. Тъй като прогнозира вероятността, изходната му стойност е между 0 и 1.
Ето няколко вида регресия Algorithms
Класификация
Класификация означава групиране на изхода в клас. Ако алгоритъмът се опитва да етикетира входа в два различни класа, това се нарича двоична класификация. Изборът между повече от два класа се нарича многокласова класификация.
Пример: Определяне дали някой ще бъде неплатенец по заема.
Силни: Класификационното дърво се представя много добре на практика
Слабости: Неограничени, отделните дървета са склонни към прекомерно оборудване.
Ето няколко вида класификация Algorithms
Наивни байесови класификатори
Наивният байесов модел (NBN) е лесен за изграждане и много полезен за големи набори от данни. Този метод е съставен от директни ациклични графи с един родител и няколко деца. Той предполага независимост между дъщерните възли, отделени от техния родител.
Дървета за вземане на решения
Дърветата на решенията класифицират екземпляра, като ги сортират въз основа на стойността на характеристиката. При този метод всеки режим е характеристика на екземпляр. Той трябва да бъде класифициран и всеки клон представлява стойност, която възелът може да приеме. Това е широко използвана техника за класификация. При този метод класификацията е дърво, което е известно като дърво на решенията.
Помага ви да оцените реалните стойности (цена за закупуване на автомобил, брой обаждания, общи месечни продажби и т.н.).
Поддържаща векторна машина
Машината за поддържащи вектори (SVM) е вид алгоритъм за обучение, разработен през 1990 г. Този метод се основава на резултати от статистическата теория за обучение, въведена от Vap Nik.
SVM машините също са тясно свързани с функциите на ядрото, което е централна концепция за повечето задачи за обучение. Рамката на ядрото и SVM се използват в различни области. Тя включва извличане на мултимедийна информация, биоинформатика и разпознаване на образи.
Наблюдавани срещу неконтролирани техники за машинно обучение
Базиран на | Техника за контролирано машинно обучение | Техника за машинно обучение без надзор |
---|---|---|
Входни данни | Algorithms се обучават с помощта на етикетирани данни. | Algorithms се използват срещу данни, които не са етикетирани |
Изчислителна сложност | Обучението под наблюдение е по-прост метод. | Ученето без надзор е сложно изчислително |
Точност | Много точен и надежден метод. | Less точен и надежден метод. |
Предизвикателства в контролираното машинно обучение
Ето предизвикателствата, пред които е изправено контролираното машинно обучение:
- Неуместна входна функция, представяща данни за обучение, може да даде неточни резултати
- Подготовката и предварителната обработка на данни винаги е предизвикателство.
- Точността страда, когато са въведени невъзможни, малко вероятни и непълни стойности като данни за обучение
- Ако съответният експерт не е на разположение, тогава другият подход е „груба сила“. Това означава, че трябва да помислите за правилните характеристики (входни променливи), на които да обучите машината. Може да е неточно.
Предимства на контролираното обучение
Ето предимствата на контролираното машинно обучение:
- Учене под наблюдение в Machine Learning ви позволява да събирате данни или да създавате изходни данни от предишния опит
- Помага ви да оптимизирате критериите за ефективност, като използвате опита
- Контролираното машинно обучение ви помага да решавате различни видове изчислителни проблеми в реалния свят.
Недостатъци на контролираното обучение
По-долу са недостатъците на контролираното машинно обучение:
- Границата на вземане на решения може да бъде претоварена, ако вашият тренировъчен набор няма примери, които искате да имате в клас
- Трябва да изберете много добри примери от всеки клас, докато обучавате класификатора.
- класифициране голямо количество от данни може да бъде истинско предизвикателство.
- Обучението за контролирано обучение изисква много време за изчисление.
Най-добри практики за контролирано обучение
- Преди да направите каквото и да било друго, трябва да решите какъв вид данни ще се използват като набор за обучение
- Трябва да решите структурата на научената функция и алгоритъма за обучение.
- Съберете съответните резултати или от човешки експерти, или от измервания
Oбобщение
- В алгоритмите за контролирано обучение вие обучавате машината, като използвате данни, които са добре „етикетирани“.
- Искате да обучите машина, която ви помага да предвидите колко време ще ви отнеме да се приберете от работното си място, е пример за контролирано обучение.
- Регресията и класификацията са две измерения на алгоритъма за контролирано машинно обучение.
- Контролирано обучение е по-прост метод, докато обучението без надзор е сложен метод.
- Най-голямото предизвикателство при контролираното обучение е, че неуместната входна функция представя данни за обучението може да даде неточни резултати.
- Основното предимство на контролираното обучение е, че ви позволява да събирате данни или да създавате изходни данни от предишния опит.
- Недостатъкът на този модел е, че границата на вземане на решения може да бъде пренапрегната, ако вашият обучителен набор няма примери, които искате да имате в клас.
- Като най-добра практика за контролирано обучение, първо трябва да решите какъв вид данни трябва да се използват като набор за обучение.