初心者向けディープラーニングチュートリアル: ニューラルネットワークの基礎

ディープラーニングとは何ですか?

深層学習 は、脳内のニューロンのネットワークを模倣するコンピューター ソフトウェアです。 これは、表現学習を備えた人工ニューラル ネットワークに基づく機械学習のサブセットです。 ディープ ニューラル ネットワークを利用するため、ディープ ラーニングと呼ばれます。 この学習は、教師あり、半教師あり、または教師なしで行うことができます。

深層学習アルゴリズムは、接続されたレイヤーで構築されます。

  • 最初の層は入力層と呼ばれます
  • 最後の層は出力層と呼ばれます
  • 間にあるすべてのレイヤーは非表示レイヤーと呼ばれます。 「深い」という言葉は、ネットワークが XNUMX つ以上の層でニューロンを結合していることを意味します。
深層学習
ディープラーニングとは何ですか?

各隠し層はニューロンで構成されます。 ニューロンは互いに接続されています。 ニューロンは、受信した入力信号を処理して、その上の層に伝播します。 次の層のニューロンに与えられる信号の強度は、重み、バイアス、および活性化関数によって異なります。

ネットワークは大量の入力データを消費し、それらを複数のレイヤーを通じて操作します。 ネットワークはますます学習できるようになりますplex 各層のデータの特徴。

深層学習プロセス

ディープ ニューラル ネットワークは、物体検出から音声認識まで、多くのタスクにおいて最先端の精度を提供します。 プログラマーによって明示的にコーディングされた事前定義された知識がなくても、自動的に学習できます。

深層学習プロセス
深層学習プロセス

ディープラーニングの概念を理解するには、乳児と両親がいる家族を想像してください。その幼児は小指で物を指し、いつも「猫」という言葉を言います。両親は彼の教育を心配しているため、「はい、あれは猫です」「いいえ、あれは猫ではありません」と言い続けます。乳児は物体を指すことに固執しますが、「猫」ではより正確になります。この小さな子供は心の底では、なぜ自分が猫であるか猫ではないと言えるのか分かりません。彼は雇用の仕方を学んだばかりだarchiエスコムplex ペット全体を見て猫を導き出し、デに焦点を当て続ける機能tails など tails または、彼の決断をする前に鼻を鳴らします。

ニューラル ネットワークもまったく同じように機能します。 各層は、より深いレベルの知識、つまり知識の階層を表します。 XNUMX 層のニューラル ネットワークは、より多くのことを学習します。plex XNUMX 層よりも優れた機能を発揮します。

学習は XNUMX つのフェーズで行われます。

第1段階: 最初のフェーズは、入力の非線形変換を適用し、出力として統計モデルを作成することで構成されます。
第二段階: 第 XNUMX フェーズは、微分として知られる数学的手法を使用してモデルを改善することを目的としています。

ニューラル ネットワークは、許容できるレベルの精度に達するまで、これら XNUMX つのフェーズを数百回から数千回繰り返します。 この XNUMX つのフェーズの繰り返しを反復と呼びます。

ディープラーニングの例として、以下のモーションを見てください。モデルはダンスの仕方を学ぼうとしています。 10分間のトレーニングの後、モデルは踊り方を知らず、落書きのように見えます。

深層学習プロセス

48 時間の学習を経て、コンピューターはダンスの技術を習得します。

深層学習プロセス

ニューラルネットワークの分類

浅いニューラルネットワーク: 浅いニューラル ネットワークには、入力と出力の間に隠れ層が XNUMX つだけあります。

ディープニューラルネットワーク: ディープ ニューラル ネットワークには複数の層があります。 たとえば、画像認識の Google LeNet モデルは 22 層を数えます。

現在、ディープラーニングは、無人運転車、携帯電話、Google 検索エンジン、不正行為検出、テレビなど、さまざまな方法で使用されています。

深層学習ネットワークの種類

このディープ ニューラル ネットワーク チュートリアルでは、ディープ ラーニング ネットワークの種類について学びます。

深層学習ネットワークの種類
深層学習ネットワークの種類

フィードフォワード ニューラル ネットワーク

最も単純なタイプの人工ニューラル ネットワーク。このタイプでは、 archiこの構造では、情報は一方向、つまり前方にのみ流れます。つまり、情報の流れは入力層で始まり、「隠れた」層に進み、出力層で終わります。ネットワーク

ループがありません。 情報は出力層で止まります。

リカレント ニューラル ネットワーク (RNN)

Rnn 情報をコンテキスト ノードに保存できる多層ニューラル ネットワークです。wing データシーケンスを学習し、数値または別のシーケンスを出力します。 簡単に言えば、ニューロン間の接続がループを含む人工ニューラル ネットワークです。 RNN は、入力シーケンスの処理に適しています。

リカレントニューラルネットワーク

リカレントニューラルネットワーク

たとえば、タスクが文内の次の単語を予測することである場合、「Do you want a…………??」

  • RNN ニューロンは、文の始まりを示す信号を受け取ります。
  • ネットワークは単語「Do」を入力として受け取り、その数値のベクトルを生成します。 このベクトルはニューロンにフィードバックされ、ネットワークにメモリを提供します。 この段階は、ネットワークが「Do」を受け取ったこと、そしてそれを最初の位置で受け取ったことを記憶するのに役立ちます。
  • ネットワークは同様に次のワードに進みます。 「あなた」と「欲しい」という言葉が必要です。 ニューロンの状態は、各単語を受信すると更新されます。
  • 最終段階は「a」という言葉を受け取った後に起こります。 ニューラル ネットワークは、文を完成させるために使用できる各英単語の確率を提供します。 よく訓練された RNN は、おそらく「カフェ」、「飲み物」、「ハンバーガー」などに高い確率を割り当てます。

RNN の一般的な使用法

  • 証券トレーダーによる分析レポートの作成を支援
  • 財務諸表の契約上の異常を検出する
  • 不正なクレジット カード取引を検出する
  • 画像にキャプションを付ける
  • 出力 chatbots
  • RNN の標準的な使用法は、実践者が時系列データまたはシーケンス (音声録音やテキストなど) を扱うときに発生します。

畳み込みニューラルネットワーク(CNN)

CNN 独自の機能を備えた多層ニューラル ネットワークです。 archiますます com を抽出するように設計された構造plex 各層のデータの特徴を調べて出力を決定します。 CNN は知覚タスクに適しています。

畳み込みニューラルネットワーク

畳み込みニューラルネットワーク

CNN は主に、非構造化データセット (画像など) があり、そこから情報を抽出する必要がある場合に使用されます。

たとえば、タスクが画像キャプションを予測することである場合:

  • CNN は、たとえば猫の画像を受け取ります。この画像は、コンピューター用語で言えば、ピクセルの集合です。 一般に、グレースケール画像の場合は XNUMX つのレイヤー、カラー画像の場合は XNUMX つのレイヤーになります。
  • 特徴の学習 (つまり、隠れ層) 中に、ネットワークは固有の特徴 (たとえば、猫の尻尾、耳など) を識別します。
  • ネットワークが画像を認識する方法を完全に学習すると、ネットワークが認識している各画像の確率を提供できるようになります。 最も高い確率を持つラベルがネットワークの予測になります。

強化学習

強化学習 は、仮想の「報酬」または「罰」を受け取ることによってシステムがトレーニングされる機械学習のサブフィールドであり、基本的には試行錯誤によって学習します。 Google の DeepMind は、強化学習を使用して囲碁ゲームで人間のチャンピオンに勝利しました。 強化学習はビデオ ゲームでも使用され、よりスマートなボットを提供することでゲーム エクスペリエンスを向上させます。

最も有名なアルゴリズムの XNUMX つは次のとおりです。

  • Qラーニング
  • ディープ Q ネットワーク
  • 状態-行動-報酬-状態-行動 (SARSA)
  • 深い決定論的ポリシー勾配 (DDPG)

ディープラーニングの応用例

この初心者向けディープ ラーニング チュートリアルでは、ディープ ラーニング アプリケーションについて学びましょう。

金融における AI

金融テクノロジー分野では、時間の節約、コストの削減、付加価値の向上を目的として、すでに AI の使用が始まっています。 ディープラーニングは、より堅牢な信用スコアリングを使用して融資業界を変えています。 信用意思決定者は、機械知能を使用して申込者の性格や能力を考慮に入れ、堅牢な信用融資アプリケーションに AI を使用して、より迅速かつ正確なリスク評価を実現できます。

Underwrite は、クレジット会社向けに AI ソリューションを提供するフィンテック企業です。 underwrite.ai は AI を使用して、どの申請者がローンを返済する可能性が高いかを検出します。 彼らのアプローチは従来の方法を根本的に上回ります。

HRにおけるAI

スポーツウェア会社 Under Armour は、AI を活用して採用に革命を起こし、候補者のエクスペリエンスを最新化しています。 実際、Under Armour は小売店の雇用時間を 35% 削減しました。 アンダーアーマーはグロい問題に直面したwing 2012 年当時、彼らは月に平均 30000 件の履歴書を持っていました。これらの応募書類をすべて読み、選考と面接のプロセスを開始するには時間がかかりすぎました。人材を雇用して入社させるまでの長いプロセスは、アンダーアーマーの小売店にスタッフを完全に配置する能力に影響を与えました。 ramp完了し、操作する準備ができました。

当時、Under Armour は、調達、応募、追跡、オンボーディングのためのトランザクション ソリューションなど、「必須」の HR テクノロジーをすべて導入していましたが、それらのツールは十分に役に立ちませんでした。 アンダーアーマーを選ぶ HireVueは、オンデマンド面接とライブ面接の両方を行う HR ソリューション用の AI プロバイダーです。 結果はハッタリだった。 充填時間を 35% 短縮することに成功しました。 その見返りに、より質の高いスタッフを雇用しました。

マーケティングにおけるAI

AI は、顧客サービス管理とパーソナライゼーションの課題に対する貴重なツールです。 AI 技術を適用した結果、コールセンター管理およびコール ルーティングにおける音声認識が向上し、顧客はよりシームレスなエクスペリエンスを得ることができます。

たとえば、オーディオのディープラーニング分析により、システムは顧客の感情の調子を評価できます。 顧客の反応が悪い場合は、 AI chatbot、システムは、問題を引き継ぐ実際の人間のオペレーターに会話を再ルーティングできます。

上記の XNUMX つのディープ ラーニングの例とは別に、AI は他の分野/業界でも広く使用されています。

ディープラーニングはなぜ重要なのでしょうか?

ディープラーニングは、予測を実用的な結果にするための強力なツールです。 ディープラーニングは、パターン発見 (教師なし学習) と知識ベースの予測に優れています。 ビッグデータ ディープラーニングの燃料となります。両方を組み合わせると、組織は生産性、販売、管理、および生産性の面で前例のない成果を得ることができます。novaる。

ディープラーニングは従来の方法を上回るパフォーマンスを発揮します。 たとえば、深層学習アルゴリズムは、画像分類では機械学習アルゴリズムより 41% 精度が高く、顔認識では 27%、音声認識では 25% 精度が高くなります。

ディープラーニングの限界

このニューラル ネットワーク チュートリアルでは、深層学習の制限について学びます。

データのラベル付け

現在の AI モデルのほとんどは、「教師あり学習」を通じてトレーニングされています。 つまり、人間が基になるデータにラベルを付けて分類する必要があり、これは膨大な作業であり、間違いが発生しやすい作業となる可能性があります。 たとえば、自動運転車技術を開発している企業は、自動運転車のシステムのトレーニングを支援するために、プロトタイプ車両からの何時間ものビデオフィードに手動で注釈を付けるために数百人を雇用しています。

巨大なトレーニング データセットを取得する

CNN のような単純な深層学習技術は、場合によっては、医学やその他の分野の専門家の知識を模倣できることが示されています。 現在の波は、 機械学習ただし、ラベルが付いているだけでなく、十分に広範で普遍的なトレーニング データセットが必要です。

ディープラーニング手法では、モデルが分類タスクを比較的上手に実行できるようになるまでに数千回の観察が必要で、場合によっては人間のレベルで実行するには数百万回の観察が必要でした。 当然のことながら、ディープラーニングは巨大テクノロジー企業で有名です。 彼らはビッグデータを使用してペタバイト規模のデータを蓄積しています。 これにより、印象的で高精度の深層学習モデルを作成できます。

問題を説明する

ラージアンドコムplex モデルは人間の言葉で説明するのが難しい場合があります。 たとえば、特定の決定が得られた理由などです。 これが、解釈可能性が役立つ、または実際に必要とされるアプリケーション分野で一部の AI ツールの受け入れが遅れている理由の XNUMX つです。

さらに、AI の応用が拡大するにつれて、規制要件により、より説明可能な AI モデルの必要性も高まる可能性があります。

まとめ

ディープラーニングの概要: ディープラーニングは、新しい最先端技術です。 人工知能。ディープラーニング archi構造は入力層、隠れ層、出力層で構成されます。 「深い」という言葉は、完全に接続された層が 2 つ以上あることを意味します。

膨大な量のニューラル ネットワークがあり、それぞれが archi構造は、特定のタスクを実行するように設計されています。たとえば、CNN は画像に非常に適しており、RNN は時系列分析とテキスト分析で優れた結果を提供します。

ディープラーニングは現在、金融からマーケティング、サプライチェーン、マーケティングに至るまで、さまざまな分野で活躍しています。 大企業はすでに大量のデータを保有しているため、ディープラーニングを最初に使用します。 ディープ ラーニングには、広範なトレーニング データセットが必要です。