지도 학습과 비지도 학습: 차이점
지도 학습과 비지도 학습의 주요 차이점
- 지도 학습에서는 잘 "라벨이 지정된" 데이터를 사용하여 기계를 훈련합니다.
- 비지도 학습은 모델을 감독할 필요가 없는 기계 학습 기술입니다.
- 지도 학습을 사용하면 이전 경험에서 데이터를 수집하거나 데이터 출력을 생성할 수 있습니다.
- 비지도 머신러닝은 데이터에서 알려지지 않은 모든 종류의 패턴을 찾는 데 도움이 됩니다.
- 회귀와 분류는 지도형 기계 학습 기술의 두 가지 유형입니다.
- Clustering과 Association은 비지도 학습의 두 가지 유형입니다.
- 지도 학습 모델에서는 입력 및 출력 변수가 제공되고 비지도 학습 모델에서는 입력 데이터만 제공됩니다.
지도 머신러닝이란 무엇입니까?
지도 학습에서는 잘 알려진 데이터를 사용하여 기계를 훈련시킵니다. “라벨이 붙은.” 이는 일부 데이터에 이미 정답 태그가 지정되어 있음을 의미합니다. 이는 감독자나 교사가 있는 곳에서 이루어지는 학습에 비유될 수 있습니다.
지도 학습 알고리즘은 레이블이 지정된 훈련 데이터로부터 학습하여 예상치 못한 데이터의 결과를 예측하는 데 도움이 됩니다. 정확한 지도형 기계 학습 데이터 과학 모델을 성공적으로 구축, 확장 및 배포하려면 고도로 숙련된 데이터 과학자 팀의 시간과 기술 전문 지식이 필요합니다. 또한 데이터 과학자는 데이터가 변경될 때까지 제공된 통찰력이 그대로 유지되도록 모델을 다시 구축해야 합니다.
비지도 학습이란 무엇입니까?
비지도 학습은 모델을 감독할 필요가 없는 기계 학습 기술입니다. 대신, 모델이 스스로 작동하여 정보를 검색할 수 있도록 허용해야 합니다. 주로 레이블이 없는 데이터를 다룹니다.
비지도 학습 알고리즘은 지도 학습에 비해 더 복잡한 처리 작업을 수행할 수 있게 해줍니다. 하지만 비지도 학습은 다른 자연 학습 딥 러닝 및 강화 학습 방법에 비해 예측할 수 없을 수 있습니다.
왜 지도 학습인가?
- 지도 학습을 사용하면 이전 경험에서 데이터를 수집하거나 데이터 출력을 생성할 수 있습니다.
- 경험을 활용하여 성과 기준을 최적화하는 데 도움이 됩니다.
- 지도 기계 학습은 다양한 유형의 실제 계산 문제를 해결하는 데 도움이 됩니다.
왜 비지도 학습인가?
비지도 학습을 사용하는 주요 이유는 다음과 같습니다.
- 비지도 머신러닝은 데이터에서 알려지지 않은 모든 종류의 패턴을 찾아냅니다.
- 비지도 방법은 분류에 유용할 수 있는 특징을 찾는 데 도움이 됩니다.
- 이는 실시간으로 이루어지므로 모든 입력 데이터는 학습자가 있는 곳에서 분석되고 라벨이 지정됩니다.
- 수동 개입이 필요한 레이블이 있는 데이터보다 컴퓨터에서 레이블이 없는 데이터를 얻는 것이 더 쉽습니다.
지도 학습은 어떻게 작동하나요?
예를 들어, 직장에서 집으로 운전해서 가는 데 걸리는 시간을 예측하는 데 도움이 되도록 기계를 훈련하려고 합니다. 여기서는 레이블이 지정된 데이터 세트를 만드는 것부터 시작합니다. 이 데이터에는 다음이 포함됩니다.
- 기상 조건
- 하루 중 시간
- 휴가
이 모든 세부 사항은 귀하의 입력입니다. 출력은 그 특정 날짜에 집으로 돌아오는 데 걸린 시간입니다.
당신은 밖에 비가 오면 집으로 운전하는 데 더 오랜 시간이 걸릴 것이라는 것을 본능적으로 알고 있습니다. 하지만 기계에는 데이터와 통계가 필요합니다.
이제 사용자가 통근 시간을 결정하는 데 도움이 되는 이 예제의 지도 학습 모델을 개발할 수 있는 방법을 살펴보겠습니다. 가장 먼저 생성해야 할 것은 훈련 데이터 세트입니다. 이 훈련 세트에는 총 통근 시간과 날씨, 시간 등과 같은 해당 요소가 포함됩니다. 이 훈련 세트를 기반으로 컴퓨터는 비의 양과 집에 도착하는 데 걸리는 시간 사이에 직접적인 관계가 있음을 확인할 수 있습니다.
따라서 비가 많이 올수록 집으로 돌아가기 위해 운전하는 시간이 길어지는 것으로 확인되었습니다. 또한 퇴근 시간과 출근 시간 사이의 연관성을 확인할 수도 있습니다.
오후 6시에 가까울수록 집에 도착하는 데 시간이 더 걸립니다. 귀하의 컴퓨터는 레이블이 지정된 데이터와의 일부 관계를 찾을 수 있습니다.
이것이 데이터 모델의 시작입니다. 비가 사람들의 운전 방식에 어떤 영향을 미치는지에 영향을 미치기 시작합니다. 또한 하루 중 특정 시간대에 더 많은 사람들이 여행하는 것을 보기 시작했습니다.
비지도 학습은 어떻게 작동하나요?
아기와 그녀의 가족 개의 경우를 생각해 봅시다.
그녀는 이 개를 알고 식별합니다. 몇 주 후 가족 친구가 개를 데리고 와서 아기와 놀려고 합니다.
아기는 이전에 이 개를 본 적이 없습니다. 하지만 귀 2개, 눈, 다리 4개로 걷기 등 많은 특징이 그녀의 애완견과 유사하다는 것을 인식합니다. 그녀는 개와 같은 새로운 동물을 식별합니다. 이것은 비지도 학습으로, 가르치지는 않지만 데이터(이 경우 개에 대한 데이터)로부터 학습합니다. 이것이 지도 학습이었다면 가족 친구는 아기에게 그것이 개라고 말했을 것입니다.
지도형 기계 학습 기술의 유형
리그레션
회귀 기법은 훈련 데이터를 사용하여 단일 출력 값을 예측합니다.
예: 회귀를 사용하여 훈련 데이터에서 주택 가격을 예측할 수 있습니다. 입력 변수는 지역, 주택 크기 등입니다.
분류
분류란 출력을 클래스 내에서 그룹화하는 것을 의미합니다. 알고리즘이 입력을 두 개의 서로 다른 클래스로 분류하려고 시도하는 경우 이를 이진 분류라고 합니다. 두 개 이상의 클래스 중에서 선택하는 것을 다중 클래스 분류라고 합니다.
예시: 누군가가 대출 불이행자가 될지 여부를 결정합니다.
장점: 출력은 항상 확률론적으로 해석되며 알고리즘은 과적합을 방지하기 위해 정규화될 수 있습니다.
약점: 로지스틱 회귀는 다중 또는 비선형 결정 경계가 있는 경우 성능이 떨어질 수 있습니다. 이 방법은 유연하지 않으므로 더 복잡한 관계를 포착하지 못합니다.
비지도 머신러닝 기술의 유형
비지도 학습 문제는 클러스터링 문제와 연관 문제로 세분화됩니다.
ClusterING
Clustering은 비지도 학습에 있어서 중요한 개념입니다. 주로 분류되지 않은 데이터 모음에서 구조나 패턴을 찾는 것을 다룹니다. Clustering 알고리즘은 데이터를 처리하고 데이터에 자연스러운 클러스터(그룹)가 있는 경우 이를 찾습니다. 알고리즘이 식별해야 하는 클러스터 수를 수정할 수도 있습니다. 이를 통해 이러한 그룹의 세분성을 조정할 수 있습니다.
협회
연관 규칙을 사용하면 대규모 데이터베이스 내의 데이터 개체 간에 연관을 설정할 수 있습니다. 이 비지도 기술은 대규모 데이터베이스의 변수 간의 흥미로운 관계를 발견하는 것입니다. 예를 들어, 새 집을 구입하는 사람들은 새 가구를 구입할 가능성이 가장 높습니다.
다른 예 :
- 유전자 발현 측정에 따라 그룹화된 암 환자의 하위 그룹
- 검색 및 구매 내역을 기반으로 한 쇼핑객 그룹
- 영화 관객이 평가한 영화 그룹
지도 학습과 비지도 학습의 차이점
파라미터 | 감독된 기계 학습 기술 | 비지도 머신러닝 기술 |
---|---|---|
방법 | 지도 학습 모델에서는 입력 및 출력 변수가 제공됩니다. | 비지도 학습 모델에서는 입력 데이터만 제공됩니다. |
입력 데이터 | Algorithms 레이블이 지정된 데이터를 사용하여 훈련됩니다. | Algorithms 레이블이 지정되지 않은 데이터에 대해 사용됩니다. |
Algorithms 사용 된 | 벡터 머신, 신경망, 선형 및 물류 회귀, 랜덤 포레스트, 분류 트리를 지원합니다. | 비지도 알고리즘은 다음과 같은 여러 범주로 나눌 수 있습니다. Cluster 알고리즘, K-평균, 계층적 클러스터링 등 |
계산 복잡성 | 지도 학습은 더 간단한 방법입니다. | 비지도 학습은 계산적으로 복잡합니다 |
데이터 사용 | 지도 학습 모델은 훈련 데이터를 사용하여 입력과 출력 사이의 연결을 학습합니다. | 비지도 학습은 출력 데이터를 사용하지 않습니다. |
결과의 정확성 | 매우 정확하고 신뢰할 수 있는 방법입니다. | Less 정확하고 신뢰할 수 있는 방법입니다. |
실시간 학습 | 학습 방법은 오프라인으로 진행됩니다. | 학습 방법은 실시간으로 진행됩니다. |
수업 수 | 수업 수는 알려져 있습니다. | 수업 수는 알 수 없습니다. |
주요 단점 | 빅데이터를 분류하는 것은 지도 학습에서 정말 어려운 일이 될 수 있습니다. | 데이터 정렬에 관한 정확한 정보를 얻을 수 없으며, 비지도 학습에 사용되는 데이터로 출력이 표시되어 알 수 없습니다. |