深層学習を視覚的に説明

視覚的な例を使用してディープラーニングを理解する

による写真 ジュリアン・トロミュール on Unsplash

ディープラーニングは最も強力な AI 技術の 1 つですが、理解するのが難しい場合があります。このブログでは、ビジュアルと例を使用してディープラーニングについて説明していきます。

深層学習アーキテクチャは、私たちの脳の仕組みからインスピレーションを受けています。それはニューロンの接続です。深層学習モデルには多くのパラメーターを含めることができます。パラメーターの数はレイヤーとニューロンの数に基づいており、洗練されたアーキテクチャでは指数関数的に増加する可能性があります。

このブログでは、金融詐欺検出のビジネスユースケースを取り上げます。不正検出における最大の課題の 1 つは、クラスの不均衡の問題です。これは、機械学習モデルのトレーニングに使用されるデータには不正のケースがほとんどないことを意味します。

深層学習アーキテクチャ (著者による画像)

それは、干し草の山から針を見つけるために機械学習モデルをトレーニングするようなものです。不正検出は特別な問題であり、ディープ ラーニング アーキテクチャなどの高度なアプローチを必要とすることが正当化されます。

この例では、銀行取引システムからデータを取得します。データは次のようになります。データには、金融取引の種類、金額、発信元と宛先の旧残高、新残高が含まれます。取引が不正であったかどうかを示すフラグもあります。

データセットの引用はブログの最後にあります。

不正検出データ(著者による画像)

データはトレーニング データとテスト データに分割されます。深層学習モデルはトレーニング セット上で開発され、テスト データ上で検証されます。その後、このモデルを使用して、目に見えないデータに対する不正行為を予測できます。

トレーニング / テストの分割 (著者による画像)

不正行為を予測するための深層学習モデルをここに示します。入力ニューロンはトランザクション データに対応します。各ニューロンは、取引の種類、金額、出発地と目的地の残高情報などの入力データの列に対応します。

中間層が 1 つと、次に最終層があり、2 つのニューロンがあり、1 つは非不正を予測し、もう 1 つは不正なしを予測します。

線は、異なる層間で渡される信号です。緑の線は正の信号を示し、赤の線は負の信号を示します

不正行為検出のための深層学習モデル (著者による画像)

ニューロン 1_0 がニューロン Fraud に正の信号を渡していることがわかります。

これは、不正取引がどのようなものかを深く学習したことを意味します。これはエキサイティングです !

ニューロン 1_0 がニューロン 2_1 に正の信号を渡しています (詐欺) (著者による画像)

ニューロン 1_0 の内部を覗いてみましょう。

ニューロン1_0の内部(著者による画像)

レーダー チャートは、ニューロンがデータについて学習した内容を表します。青い線は高い値を示し、赤い線は低い値を示します。レーダー チャートは、原点では高いものの、新旧のバランスがほぼ同様であることを示しています。しかし、目的地の新旧のバランスには非常に大きな違いがあります。

このような状況は詐欺の兆候です。この状況は以下に視覚的に示すことができます。

不正取引がどのように行われるかを視覚的に示したもの (著者による画像)

ここに示されているのは、混同行列を使用した深層学習モデルの精度です。

混同行列 (著者による画像)

合計で約95000万62件の取引があり、そのうち不正取引は52件と、取引全体よりも極めて少ない。ただし、ディープラーニング モデルは、XNUMX を不正行為 (真陽性 (tp) とも呼ばれます) として正しく識別できるため、うまく機能しています。

偽陽性 (fp) が 1 件あります。これは、詐欺ではありませんが、モデルが誤って詐欺としてフラグを立てたことを意味します。したがって、精度、つまり tp / (tp +fp) は 98% に等しくなります。

また、偽陰性 (fn) が 10 件あります。これは不正な取引であることを意味しますが、私たちのモデルではそれらを予測できません。したがって、メジャー再現率は tp / (tp +fn) となり、83% になります。

ディープラーニング アーキテクチャは、不正行為の検出などの複雑な問題の解決に役立つため、非常に強力です。ディープ ラーニング アーキテクチャを視覚的に分析する方法は、アーキテクチャと問題の解決方法を理解するのに役立ちます。

不正行為検出のための合成金融データセットのデータソースの引用

不正行為検出用の合成財務データセットは、次の場所から入手できます。 https://www.kaggle.com/competitions/spaceship-titanic/overview

「ライセンス」セクションで指定されているように、ライセンスがあります。 CC BY-SA 4.0.

  • シェアする — あらゆる媒体または形式で素材をコピーおよび再配布すること
  • 適応する — 商業目的であっても、あらゆる目的で素材をリミックス、変換、構築します。

お困りの方は メディアに参加する 私の紹介リンク付き。

お困りの方は 申し込む 新しいストーリーをリリースするたびに最新情報を入手できるようにするためです。

私の Web サイトにアクセスして、コーディングなしで分析を行うことができます。 https://experiencedatascience.com

この Web サイトでは、興味深く革新的なデータ サイエンスと AI 体験を提供する、今後開催される AI ワークショップに参加することもできます。

ここに私の YouTube チャンネルへのリンクがあります
https://www.youtube.com/c/DataScienceDemonstrated

視覚的に説明された深層学習 ソース https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 (https://towardsdatascience.com/feed 経由) から再公開

<!–

–>

タイムスタンプ:

より多くの ブロックチェーンコンサルタント