2023 年に金融実務家が学ぶ GenAI の XNUMX つの用語

2023 年に金融実務家が学ぶ GenAI の XNUMX つの用語

金融実務家が 2023 年の PlatoBlockchain Data Intelligence で学んだ XNUMX つの GenAI 用語。垂直検索。あい。

2023 年は、戦争、暴力、人口移動、大災害、過激主義、生活費の高騰、貧困など、地球上の多くの人にとって困難な年でした。私たちの業界で働いている人たちは比較的幸運で、エキサイティングな GenerativeAI の竜巻によって元気づけられた人もいました。 2000 年代に HFT が資本市場の語彙を変革し、2010 年代にデジタル化が銀行業務と金融サービスの語彙を変革したのと同じように、GenAI もかなりのスピードで新しい AI 語彙集をもたらしました。

それに伴い、私たちは多くの用語に遭遇しました。その多くは 2022 年にはほとんど使用されていませんでしたが、現在では新しい意味、またはまったく異なる意味を持っています。私や金融サービスに携わる他の多くの人は、これらを毎日使用しています。もしあなたがそうではない(不運)少数の人の一人なら、ここで私のお気に入りの XNUMX つを簡単におさらいしておきましょう。

用語 1: ベクトル データベース

いわゆるベクトル データベースは、プロンプトに対する応答の品質を向上させる手段として、多くのエンタープライズ GenAI スタックの中核となっています。代替手段、たとえば、データベースを付属せずに大規模言語モデルを「微調整」する [LLM] は高価であり、リスクとコンプライアンスのオーバーヘッドを伴います。ベクトル データベースは企業独自の情報を取得し、費用対効果をもたらし、比較制御を可能にします。金融サービス企業は確かにベクトル データベースの使用を待ち望んでいます。

金融業界では皮肉なことに、ベクトルはトレーディングやリスク管理において主流の行列代数に長年にわたって不可欠なものでした。このような「ベクトル」や行列のデータ ストレージも何十年も前から存在しており、通常は列型データベース、または Python (Pandas)、R、MATLAB、SAS などの言語で使用されるテーブルやデータフレームとして使用されています。たとえば金融時系列データやパネル データとして、線形回帰や時系列回帰などの手法と組み合わせて取得して使用すると、予測分析、異常検出、計量経済学が推進されます。また、バックテスト、特にトレーディング、ポートフォリオ管理、リスク戦略に関する情報を提供するのにも役立ちます。資本市場(フロントオフィスとミドルオフィス)が行列代数の担当を主導しましたが、マーケティング、不正行為検出、デジタル化などの分析中心のユースケースは一般に、金融組織全体でデータサイエンスとベクトルを採用しました。

したがって、元同僚が 2021 年 XNUMX 月に「ベクター データベース」のスタートアップ企業で働き始めたとき、私は魅了されました。

ベクトル データベースを使用して複雑な問題を解決する
ChatGPT 以前の 2022 年 XNUMX 月の記事が私の目に留まりました。なぜなら、彼は非常に特殊なベクトル タイプ、ベクトル埋め込み、単語や画像などの非構造化情報から知識をキャプチャする、エンコードされた簡単に検索できるナビゲート可能なベクトルを強調していたからです。その年の後半に ChatGPT が開始されたとき、そのようなベクトル ストアは、埋め込み型は、意味論的な意味を管理するための重要な手段に昇格しました。最も一般的に、ストアはベクトル データベースです。

今ではたくさんあります
。すでに、金融サービスや資本市場アプリを強化しています。

自然言語処理のユースケース
例: 法的文書や財務報告書の要約、ソーシャル メディアやニュース フィードからの感情のキャプチャなど。しかし、彼らはさらに多くのことにも取り組んでいます

関連するアプリケーション
、たとえば、従来の統計や機械学習と並行して、取引やリスク管理の洞察を強化します。

ちなみに、私の元同僚が入社した会社は GenAI のユニコーン企業となり、その評価額は 750 億 XNUMX 万ドルとかなり高くなっています。手に入れられたら素敵な作品ですね!

ターム 2: RAG、別名 検索拡張生成

2023 年春、少なくとも大文字の RAG の「検索拡張世代」という用語の意味では、RAG という言葉はほとんど誰の口にもありませんでした。 Google での用語の検索統計は 2023 年 XNUMX 月頃から加速し、秋から秋にかけて、ベクトル データベースが大規模言語モデルの「確率的オウム」を飼いならすのに役立つ主要なパイプライン アプローチである RAG がいたるところに存在しました。 RAG は、一方ではパイプラインをカプセル化してエンタープライズ データ ワークフローをプロビジョニングし、他方では金融会社が幻覚を軽減し、社内および社外のリスク管理および AI コンプライアンス プロセスに対応できるように実用的に支援します。  


たくさんの種類のRAG
パイプラインは恐ろしいほど複雑に見える場合があります。ただし、RAG は、プロンプト、エンタープライズ データ、および大規模な言語モデルの間にデータ パイプラインを提供するものとして単純に考えてください。さらに詳しく知り、それが金融にどのような影響を与えるかを確認するには、私の記事を読んでください。

フィネトラブログ
またはウォッチ
この素晴らしいウェブキャスト
RAG のリスク管理の機会を要約します。いずれかの段階で実装を開始する場合は、LangChain や RAG などの「RAG フレンドリーな」環境を検討することになるでしょう。
ラマインデックス。

ターム 3: 幻覚

私は前のセクションで「幻覚」という用語を使用し、それが RAG によって解決され、ひいてはベクトル データベースによって解決される問題であると提起しました。 GenAI を使用すると、幻覚は、薬物にインスピレーションを得たビートルズの「サージェント ペパーズ ロンリー ハーツ クラブ バンド」やビーチボーイズの「グッド ヴァイブレーション」など、単に精神を刺激する創造性のトリガーではなくなります。また、それらは多くの人々によって実践されているシャーマニックな夢想の領域でもありません。
東シベリアのチュクチ族、ヨガ、マッサージ、タントラセックスなどの精神を変えるテクニックを利用した身体活動も含まれません。現在、「幻覚」という言葉は、モデルがアクセスできない情報をナビゲートする LLM の失敗や、既存の情報の悪用にも当てはまります。それは非常にすぐに明らかになりました

ChatGPT、Bard、および同様のシステムは、作られた「幻覚」反応を引き起こす傾向がありました
、そしてこれらは、情報に基づいていない行動が続いたときにリスクをもたらしました。 

ここがひねりです。 AI 投資家のマーク・アンドリーセン氏は、ほとんどの人は幻覚をバグだと考えていますが、AI が機能として使用される場合には、幻覚は機能として役立つ可能性があると示唆しています。 共同作成者、提案者、推測者。ブレーンストーミングの補助として、彼らのでっち上げた推測は人間の創造性を刺激することができます。たとえば、アンドリーセン氏は、弁護士が訴訟準備中に AI の「でっち上げ」提案をどのように利用して、新しい法的戦略を想像するかを強調しています。金融サービスの分野では、ウォール街のトレーダーはすでに生成型 AI とベクトル データベースを使用して、取引の機会を見つけています。つまり、大衆がザグに動くときにジグザグに動くようにするためです。

GenAI についてどう思うかはともかく、GenAI は確かに私たちに楽しい新しい辞書をもたらしてくれました。

タイムスタンプ:

より多くの フィンテクトラ