教師あり学習と教師なし学習: それらの違い

教師あり学習と教師なし学習の主な違い

  • 教師あり学習では、適切に「ラベル付け」されたデータを使用してマシンをトレーニングします。
  • 教師なし学習は、モデルを監視する必要のない機械学習手法です。
  • 教師あり学習を使用すると、データを収集したり、以前のエクスペリエンスからデータ出力を生成したりできます。
  • 教師なし機械学習は、データ内のあらゆる種類の未知のパターンを見つけるのに役立ちます。
  • 回帰と分類は、教師あり機械学習手法の XNUMX 種類です。
  • Clustering と Association は 2 つのタイプの教師なし学習です。
  • 教師あり学習モデルでは入力変数と出力変数が与えられますが、教師なし学習モデルでは入力データのみが与えられます。

教師あり機械学習とは?

教師あり学習では、適切なデータを使用してマシンをトレーニングします。 「ラベル付き」 これは、一部のデータにすでに正解のタグが付いていることを意味します。 それは、監督や教師の存在下で行われる学習にたとえることができます。

教師あり学習アルゴリズムは、ラベル付きトレーニング データから学習し、予期せぬデータの結果を予測するのに役立ちます。 正確な教師あり機械学習データ サイエンス モデルの構築、スケーリング、導入を成功させるには、時間と高度なスキルを持つデータ サイエンティスト チームによる技術的専門知識が必要です。 さらに、データ サイエンティストはモデルを再構築して、データが変更されるまで与えられた洞察が真実であることを確認する必要があります。

教師なし学習とは

教師なし学習は、モデルを監視する必要のない機械学習手法です。 代わりに、モデルが独自に動作して情報を検出できるようにする必要があります。 主にラベルのないデータを扱います。

教師なし学習アルゴリズムを使用すると、教師あり学習に比べてより複雑な処理タスクを実行できます。ただし、教師なし学習は、他の自然学習、ディープラーニング、強化学習の方法に比べて予測が困難になる可能性があります。

なぜ教師あり学習なのか?

  • 教師あり学習を使用すると、データを収集したり、以前のエクスペリエンスからデータ出力を生成したりできます。
  • 経験を活用してパフォーマンス基準を最適化するのに役立ちます
  • 教師あり機械学習は、現実世界のさまざまな種類の計算問題を解決するのに役立ちます。

なぜ教師なし学習なのか?

教師なし学習を使用する主な理由は次のとおりです。

  • 教師なし機械学習は、データ内のあらゆる種類の未知のパターンを見つけます。
  • 教師なしメソッドは、分類に役立つ特徴を見つけるのに役立ちます。
  • これはリアルタイムで行われるため、学習者の立ち会いの下ですべての入力データが分析され、ラベルが付けられます。
  • 手動介入が必要なラベル付きデータよりも、ラベルなしデータをコンピューターから取得する方が簡単です。

教師あり学習はどのように機能するのでしょうか?

たとえば、職場から車で帰宅するまでにかかる時間を予測できるようにマシンをトレーニングしたいとします。 ここでは、ラベル付きデータのセットを作成することから始めます。 このデータには以下が含まれます

  • 気象条件
  • 時刻
  • クリスマス・その他

これらすべての詳細が入力です。出力は、その特定の日に帰宅するのにかかった時間です。

教師あり学習の仕組み
教師あり学習の仕組み

外で雨が降っていると、車で家に帰るまでに時間がかかることが本能的にわかります。 しかし、マシンにはデータと統計が必要です。

次に、ユーザーが通勤時間を決定するのに役立つこの例の教師あり学習モデルを開発する方法を見てみましょう。 最初に作成する必要があるのは、トレーニング データ セットです。 このトレーニング セットには、総通勤時間と、天候、時間などの対応する要素が含まれています。このトレーニング セットに基づいて、マシンは、雨の量と帰宅までにかかる時間との間に直接的な関係があることを認識する可能性があります。

したがって、雨が降れば降るほど、自宅に戻るまでの運転時間が長くなることがわかります。 また、退社時間と外出時間との関係も分かるかもしれません。

午後6時に近づくほど、家に帰るまでに時間がかかります。 マシンは、ラベル付きデータとの関係の一部を検出する可能性があります。

学習フェーズ
学習フェーズ

これがデータ モデルの始まりです。 雨が人々の運転にどのような影響を与えるかが影響を及ぼし始めています。 また、特定の時間帯に旅行する人が増えることもわかり始めています。

教師なし学習はどのように機能するのでしょうか?

赤ちゃんとその飼い犬の場合を考えてみましょう。

教師なし学習の仕組み
教師なし学習の仕組み

彼女はその犬を知っていて、識別します。数週間後、家族の友人が犬を連れてきて、赤ちゃんと遊ぼうとします。

教師なし学習の仕組み

赤ちゃんはこの犬をこれまで見たことがありません。 しかし、多くの特徴 (2 つの耳、目、4 足で歩く) が彼女のペットの犬に似ていることを認識します。 彼女は犬のような新しい動物を特定しました。 これは教師なし学習であり、教えられるのではなくデータ (この場合は犬に関するデータ) から学習します。これが教師あり学習であった場合、家族の友人は赤ちゃんに「これは犬です」と教えていたでしょう。

教師あり機械学習手法の種類

教師あり機械学習手法の種類
教師あり機械学習手法の種類

不具合

回帰手法では、トレーニング データを使用して単一の出力値を予測します。

例: 回帰を使用して、トレーニング データから住宅価格を予測できます。 入力変数は、地域、家のサイズなどになります。

Classification

分類とは、出力をクラス内にグループ化することを意味します。 アルゴリズムが入力を XNUMX つの異なるクラスにラベル付けしようとする場合、それは二項分類と呼ばれます。 XNUMX つ以上のクラスから選択することを、マルチクラス分類と呼びます。

: 誰かがローンの不履行者になるかどうかを判断します。

強み: 出力には常に確率的な解釈があり、過学習を避けるためにアルゴリズムを正規化できます。

弱み: 決定境界が複数または非線形である場合、ロジスティック回帰はパフォーマンスが低下する可能性があります。この方法は柔軟性がないため、より複雑な関係を捉えることはできません。

教師なし機械学習手法の種類

教師なし学習の問題は、さらにクラスタリング問題と関連付け問題に分類されます。

Clusterる

Clusterる

Cluster教師なし学習に関しては、「ing」は重要な概念です。これは主に、分類されていないデータの集合から構造やパターンを見つけることを扱います。 Clustering アルゴリズムはデータを処理し、データ内に存在する場合は自然なクラスター (グループ) を検出します。また、アルゴリズムが識別するクラスターの数を変更することもできます。これにより、これらのグループの粒度を調整できます。

協会

関連付けルールを使用すると、大規模なデータベース内のデータ オブジェクト間の関連付けを確立できます。 この教師なし手法は、大規模なデータベース内の変数間の興味深い関係を発見することを目的としています。 たとえば、新しい家を購入する人は、新しい家具を購入する可能性が最も高くなります。

その他の例:

  • 遺伝子発現測定値によってグループ化されたがん患者のサブグループ
  • 閲覧履歴と購入履歴に基づいた買い物客のグループ
  • 映画視聴者による評価による映画グループ

教師あり学習と教師なし学習の違い

教師あり学習と教師なし学習
教師あり学習と教師なし学習
Parameters 教師あり機械学習手法 教師なし機械学習手法
プロセス 教師あり学習モデルでは、入力変数と出力変数が与えられます。 教師なし学習モデルでは、入力データのみが与えられます
入力データ Algorithms ラベル付きデータを使用してトレーニングされます。 Algorithms ラベルの付いていないデータに対して使用される
Algorithms 中古 ベクター マシン、ニューラル ネットワーク、線形回帰およびロジスティクス回帰、ランダム フォレスト、および分類ツリーをサポートします。 教師なしアルゴリズムは、次のようないくつかのカテゴリに分類できます。 Cluster アルゴリズム、K-means、階層的クラスタリングなど。
計算の複雑さ 教師あり学習はより簡単な方法です。 教師なし学習は計算が複雑である
データの使用 教師あり学習モデルは、トレーニング データを使用して入力と出力の間のリンクを学習します。 教師なし学習では出力データを使用しません。
結果の正確性 精度が高く信頼できる手法です。 Less 正確かつ信頼できる方法。
リアルタイム学習 学習方法はオフラインで行われます。 学習方法はリアルタイムで行われます。
クラス数 クラスの数はわかっています。 クラス数は不明。
主な欠点 ビッグデータの分類は、教師あり学習において大きな課題となる可能性があります。 データの並べ替えに関する正確な情報を取得することはできず、教師なし学習で使用されるデータとしての出力はラベル付けされており、不明です。