초보자를 위한 딥 러닝 튜토리얼: 신경망 기초
딥러닝이란?
깊은 학습 뇌의 뉴런 네트워크를 모방한 컴퓨터 소프트웨어입니다. 표현 학습 기능을 갖춘 인공 신경망을 기반으로 하는 기계 학습의 하위 집합입니다. 심층 신경망을 활용하기 때문에 딥러닝이라고 합니다. 이 학습은 지도, 준지도, 비지도로 이루어질 수 있습니다.
딥러닝 알고리즘은 연결된 층으로 구성됩니다.
- 첫 번째 레이어를 입력 레이어라고 합니다.
- 마지막 레이어를 출력 레이어라고 합니다.
- 그 사이에 있는 모든 레이어를 숨겨진 레이어라고 합니다. Deep이라는 단어는 네트워크가 두 개 이상의 레이어에서 뉴런을 연결한다는 것을 의미합니다.

각 히든 레이어는 뉴런으로 구성됩니다. 뉴런은 서로 연결되어 있습니다. 뉴런은 그 위의 레이어에서 수신하는 입력 신호를 처리한 다음 전파합니다. 다음 계층의 뉴런에 주어진 신호의 강도는 가중치, 편향 및 활성화 함수에 따라 달라집니다.
네트워크는 대량의 입력 데이터를 소비하고 이를 여러 계층을 통해 운영하며, 네트워크는 각 계층에서 데이터의 점점 더 복잡한 기능을 학습할 수 있습니다.
딥러닝 과정
심층 신경망은 객체 감지부터 음성 인식까지 다양한 작업에서 최첨단 정확도를 제공합니다. 프로그래머가 명시적으로 코딩한 사전 정의된 지식 없이도 자동으로 학습할 수 있습니다.
심층 학습의 개념을 이해하기 위해 유아와 부모가 있는 가족을 상상해 보세요. 유아는 작은 손가락으로 물건을 가리키고 항상 '고양이'라는 단어를 말합니다. 그의 부모는 그의 교육에 대해 걱정하면서 계속해서 그에게 '네, 그것은 고양이입니다' 또는 '아니요, 그것은 고양이가 아닙니다'라고 말합니다. 유아는 물건을 가리키는 것을 고집하지만 '고양이'에 대해 더 정확하게 말합니다. 어린 아이는 깊은 곳에서 그것이 고양이인지 아닌지 왜 말할 수 있는지 모릅니다. 그는 방금 애완동물 전체를 보고 고양이를 생각해 내는 복잡한 특징의 계층을 배우고 꼬리나 코와 같은 세부 사항에 계속 집중하여 마음을 정하는 법을 배웠습니다.
신경망도 비슷하게 작동합니다. 각 층은 더 깊은 수준의 지식, 즉 지식의 계층을 나타냅니다. 4개의 층이 있는 신경망은 2개의 층이 있는 신경망보다 더 복잡한 특징을 학습합니다.
학습은 두 단계로 이루어집니다.
첫 번째 단계: 첫 번째 단계는 입력의 비선형 변환을 적용하고 출력으로 통계 모델을 생성하는 것으로 구성됩니다.
두 번째 단계: 두 번째 단계는 도함수라고 알려진 수학적 방법을 사용하여 모델을 개선하는 것을 목표로 합니다.
신경망은 허용 가능한 정확도 수준에 도달할 때까지 이 두 단계를 수백에서 수천 번 반복합니다. 이 두 단계의 반복을 반복이라고 합니다.
딥러닝의 예를 들기 위해 아래 동작을 살펴보세요. 모델이 춤추는 방법을 배우려고 합니다. 10분간의 훈련 후에도 모델은 춤을 추지 못하고 낙서처럼 보입니다.
48시간의 학습 끝에 컴퓨터는 춤의 기술을 완벽하게 터득했다.
신경망 분류
얕은 신경망: 얕은 신경망은 입력과 출력 사이에 하나의 숨겨진 레이어만 갖습니다.
심층 신경망: 심층 신경망에는 두 개 이상의 레이어가 있습니다. 예를 들어 이미지 인식을 위한 Google LeNet 모델은 22개의 레이어를 계산합니다.
요즘 딥러닝은 무인자동차, 휴대폰, 구글 검색엔진, 사기탐지, TV 등 다양한 분야에서 활용되고 있습니다.
딥러닝 네트워크의 유형
이제 이 Deep Neural network 튜토리얼에서는 Deep Learning Networks의 유형에 대해 배웁니다.
피드포워드 신경망
가장 간단한 유형의 인공 신경망입니다. 이 유형의 아키텍처에서는 정보가 한 방향, 즉 앞으로만 흐릅니다. 즉, 정보의 흐름은 입력 계층에서 시작하여 "숨겨진" 계층으로 이동하고 출력 계층에서 끝납니다. 네트워크
루프가 없습니다. 정보는 출력 레이어에서 중지됩니다.
순환 신경망(RNN)
RNN 컨텍스트 노드에 정보를 저장할 수 있는 다층 신경망으로, 데이터 시퀀스를 학습하고 숫자나 다른 시퀀스를 출력할 수 있습니다. 간단히 말해서, 뉴런 간 연결에 루프가 포함된 인공 신경망입니다. RNN은 입력 시퀀스를 처리하는 데 적합합니다.
예를 들어, 작업이 "Do you want a......?"라는 문장에서 다음 단어를 예측하는 것이라면
- RNN 뉴런은 문장의 시작을 가리키는 신호를 수신합니다.
- 네트워크는 "Do"라는 단어를 입력으로 받고 숫자의 벡터를 생성합니다. 이 벡터는 뉴런에 피드백되어 네트워크에 메모리를 제공합니다. 이 단계는 네트워크가 "Do"를 수신했으며 첫 번째 위치에서 수신했음을 기억하는 데 도움이 됩니다.
- 네트워크는 유사하게 다음 단어로 진행됩니다. "당신"과 "원하다"라는 단어가 필요합니다. 뉴런의 상태는 각 단어를 수신할 때마다 업데이트됩니다.
- 마지막 단계는 "a"라는 단어를 받은 후에 발생합니다. 신경망은 문장을 완성하는 데 사용할 수 있는 각 영어 단어에 대한 확률을 제공합니다. 잘 훈련된 RNN은 아마도 "카페", "음료", "버거" 등에 높은 확률을 할당할 것입니다.
RNN의 일반적인 용도
- 증권 거래자가 분석 보고서를 생성하도록 지원
- 재무제표 계약의 이상 징후 발견
- 신용카드 사기 거래 적발
- 이미지에 캡션 제공
- 파워 챗봇
- RNN의 표준 사용은 실무자가 시계열 데이터 또는 시퀀스(예: 오디오 녹음 또는 텍스트)로 작업할 때 발생합니다.
컨볼 루션 신경망 (CNN)
현지 시간 각 계층에서 점점 더 복잡한 데이터 특징을 추출하여 출력을 결정하도록 설계된 고유한 아키텍처를 갖춘 다층 신경망입니다. CNN은 지각 작업에 적합합니다.
CNN은 구조화되지 않은 데이터 세트(예: 이미지)가 있고 실무자가 여기에서 정보를 추출해야 할 때 주로 사용됩니다.
예를 들어 작업이 이미지 캡션을 예측하는 것이라면 다음과 같습니다.
- CNN은 고양이의 이미지를 수신하는데, 컴퓨터 용어로 이 이미지는 픽셀의 모음입니다. 일반적으로 회색조 그림에는 한 개의 레이어가 있고 컬러 그림에는 세 개의 레이어가 있습니다.
- 특징 학습(즉, 숨겨진 레이어) 중에 네트워크는 고양이 꼬리, 귀 등과 같은 고유한 특징을 식별합니다.
- 네트워크가 사진을 인식하는 방법을 철저히 학습하면 알고 있는 각 이미지에 대한 확률을 제공할 수 있습니다. 확률이 가장 높은 레이블이 네트워크의 예측이 됩니다.
강화 학습
강화 학습 본질적으로 시행착오를 통해 학습하는 가상의 "보상" 또는 "처벌"을 받아 시스템을 훈련시키는 기계 학습의 하위 분야입니다. Google의 DeepMind는 강화 학습을 사용하여 바둑 게임에서 인간 챔피언을 이겼습니다. 강화 학습은 더 똑똑한 봇을 제공하여 게임 경험을 향상시키기 위해 비디오 게임에도 사용됩니다.
가장 유명한 알고리즘 중 하나는 다음과 같습니다.
- Q- 학습
- 딥 Q 네트워크
- 국가-행동-보상-국가-행동(SARSA)
- 심층 결정론적 정책 변화도(DDPG)
딥러닝 애플리케이션의 예
이제 초보자를 위한 딥 러닝 튜토리얼에서는 딥 러닝 애플리케이션에 대해 알아 보겠습니다.
금융 분야의 AI
금융 기술 부문에서는 이미 시간을 절약하고 비용을 절감하며 가치를 추가하기 위해 AI를 사용하기 시작했습니다. 딥 러닝은 보다 강력한 신용 평가를 사용하여 대출 업계를 변화시키고 있습니다. 신용 의사 결정자는 강력한 신용 대출 애플리케이션에 AI를 사용하여 더 빠르고 정확한 위험 평가를 달성할 수 있으며, 기계 지능을 사용하여 신청자의 성격과 역량을 고려할 수 있습니다.
Underwrite는 여신회사에 AI 솔루션을 제공하는 핀테크 회사입니다. underwrite.ai는 AI를 사용하여 어떤 신청자가 대출금을 갚을 가능성이 더 높은지 감지합니다. 그들의 접근 방식은 기존 방법보다 훨씬 뛰어납니다.
HR의 AI
스포츠웨어 회사인 언더 아머는 AI의 도움으로 채용에 혁명을 일으키고 지원자 경험을 현대화합니다. 실제로 언더 아머는 리테일 매장의 채용 시간을 35% 단축합니다. 언더 아머는 2012년에 인기 있는 관심에 직면했습니다. 그들은 평균적으로 한 달에 30000개의 이력서를 받았습니다. 그 모든 지원서를 읽고 스크리닝과 면접 과정을 시작하는 데 너무 오랜 시간이 걸렸습니다. 사람들을 고용하고 탑승시키는 데 걸리는 긴 과정은 언더 아머가 리테일 매장을 완전히 직원을 배치하고, 램프를 설치하고, 운영할 준비를 하는 능력에 영향을 미쳤습니다.
당시 Under Armour는 소싱, 적용, 추적, 온보딩을 위한 트랜잭션 솔루션 등 '필수' HR 기술을 모두 갖추고 있었지만 이러한 도구는 충분히 유용하지 않았습니다. 언더아머 선택 고용는 온디맨드 인터뷰와 실시간 인터뷰 모두를 위한 HR 솔루션용 AI 제공업체입니다. 결과는 허세였습니다. 충전 시간을 35% 단축했습니다. 그 대가로 더 높은 품질의 직원을 고용했습니다.
마케팅의 AI
AI는 고객 서비스 관리 및 개인화 문제를 위한 귀중한 도구입니다. AI 기술을 적용한 결과 콜센터 관리 및 통화 라우팅의 음성 인식이 향상되어 고객에게 보다 원활한 경험을 제공합니다.
예를 들어, 오디오에 대한 딥러닝 분석을 통해 시스템은 고객의 감정적 어조를 평가할 수 있습니다. 고객의 반응이 좋지 않은 경우 인공 지능 봇봇, 시스템은 문제를 담당하는 실제 인간 운영자에게 대화를 전달할 수 있습니다.
위의 세 가지 딥러닝 사례 외에도 AI는 다른 부문/산업에서 널리 사용되고 있습니다.
딥러닝이 왜 중요한가요?
딥러닝은 예측을 실행 가능한 결과로 만드는 강력한 도구입니다. 딥 러닝은 패턴 발견(비지도 학습)과 지식 기반 예측에 탁월합니다. 빅 데이터 딥 러닝의 연료입니다. 둘 다 결합되면 조직은 생산성, 판매, 관리 및 혁신 측면에서 전례 없는 결과를 거둘 수 있습니다.
딥 러닝은 기존 방식보다 성능이 우수할 수 있습니다. 예를 들어, 딥 러닝 알고리즘은 이미지 분류에서 머신 러닝 알고리즘보다 41% 더 정확하고, 얼굴 인식에서는 27%, 음성 인식에서는 25% 더 정확합니다.
딥러닝의 한계
이제 이 신경망 튜토리얼에서는 딥러닝의 한계에 대해 알아 보겠습니다.
데이터 라벨링
대부분의 현재 AI 모델은 "지도 학습"을 통해 훈련됩니다. 즉, 인간은 기본 데이터에 레이블을 지정하고 분류해야 하며, 이는 규모가 크고 오류가 발생하기 쉬운 일이 될 수 있습니다. 예를 들어, 자율주행차 기술을 개발하는 회사는 수백 명의 사람을 고용하여 프로토타입 차량의 수 시간 분량의 비디오 피드에 수동으로 주석을 달아 이러한 시스템을 훈련합니다.
대규모 훈련 데이터 세트 확보
CNN과 같은 간단한 딥러닝 기술은 경우에 따라 의학 및 기타 분야 전문가의 지식을 모방할 수 있는 것으로 나타났습니다. 현재의 물결 기계 학습그러나 라벨이 지정될 뿐만 아니라 충분히 광범위하고 보편적인 교육 데이터 세트가 필요합니다.
딥 러닝 방법을 사용하려면 모델이 분류 작업을 상대적으로 잘 수행하기 위해 수천 번의 관찰이 필요했고 어떤 경우에는 인간 수준에서 수행하려면 수백만 번의 관찰이 필요했습니다. 놀랍지도 않게 딥 러닝은 거대 기술 기업에서 유명합니다. 그들은 빅데이터를 사용하여 페타바이트 규모의 데이터를 축적하고 있습니다. 이를 통해 인상적이고 매우 정확한 딥 러닝 모델을 만들 수 있습니다.
문제를 설명하세요
크고 복잡한 모델은 인간의 관점에서 설명하기 어려울 수 있습니다. 예를 들어, 특정 결정을 내린 이유가 무엇인지. 해석 가능성이 유용하거나 실제로 필요한 응용 분야에서 일부 AI 도구의 수용이 느린 이유 중 하나입니다.
또한 AI 적용이 확대됨에 따라 규제 요구 사항으로 인해 더 설명 가능한 AI 모델이 필요할 수도 있습니다.
요약
딥러닝 개요: 딥러닝은 새로운 최첨단 기술입니다. 인공 지능. 딥 러닝 아키텍처는 입력 레이어, 숨겨진 레이어, 출력 레이어로 구성됩니다. 딥이라는 단어는 두 개 이상의 완전히 연결된 레이어가 있다는 것을 의미합니다.
각 아키텍처가 주어진 작업을 수행하도록 설계된 방대한 양의 신경망이 있습니다. 예를 들어, CNN은 사진과 매우 잘 작동하고, RNN은 시계열 및 텍스트 분석에서 인상적인 결과를 제공합니다.
딥러닝은 이제 금융부터 마케팅, 공급망, 마케팅까지 다양한 분야에서 활발히 활동하고 있습니다. 대기업은 이미 대규모 데이터 풀을 보유하고 있기 때문에 딥러닝을 가장 먼저 사용합니다. 딥러닝에는 광범위한 훈련 데이터 세트가 필요합니다.