知識埋め込み用のディープグラフライブラリを使用して、Trumidで高度な機械学習システムを開発する

プラトン再発行

フォロワー： 0

これは、TrumidのMutisyaNdundaと共同で作成したゲスト投稿です。

多くの業界と同様に、社債市場は万能のアプローチには向いていません。それは広大で、流動性は断片化されており、機関投資家は特定のニーズに合わせたソリューションを求めています。 AIと機械学習（ML）の進歩を利用して、顧客体験を改善し、運用ワークフローの効率と精度を高め、取引プロセスの複数の側面をサポートすることでパフォーマンスを向上させることができます。

トルミッドは、明日のクレジット取引ネットワークを構築する金融テクノロジー企業です。これは、企業の債券市場参加者間の効率的な取引、情報の配布、および実行のための市場です。 Trumidは、最先端の製品設計とテクノロジーの原則を市場に関する深い専門知識と組み合わせることにより、クレジット取引のエクスペリエンスを最適化しています。その結果、XNUMXつの直感的なプラットフォーム内でプロトコルと実行ツールの完全なエコシステムを提供する統合取引ソリューションが実現します。

債券取引市場は、伝統的に、ルールベースのテクノロジーによって支援されるオフラインの買い手/売り手マッチングプロセスを含んでいました。 Trumidは、この体験を変革するイニシアチブに着手しました。トレーダーは、その電子取引プラットフォームを通じて、何千もの債券にアクセスして売買したり、熱心なユーザーのコミュニティとやり取りしたり、さまざまな取引プロトコルや実行ソリューションにアクセスしたりできます。ユーザーのネットワークが拡大する中、TrumidのAIおよびデータ戦略チームは AWS 機械学習ソリューションラボ。目的は、Trumidで利用可能な債券に対するユーザーの関心と好みをモデル化することにより、よりパーソナライズされた取引体験を提供できるMLシステムを開発することでした。

これらのMLモデルを使用すると、各ユーザーに情報を表示する方法をパーソナライズして、トレーダーが関心を持つ可能性のある最も関連性が高く実用的な情報に優先順位を付けてアクセスできるようにすることで、洞察とアクションまでの時間を短縮できます。

この課題を解決するために、TrumidとML Solutions Labは、知識埋め込み用のディープグラフライブラリを使用して構築されたディープニューラルネットワークモデルに基づいて、エンドツーエンドのデータ準備、モデルトレーニング、推論プロセスを開発しました（DGL-KE）。エンドツーエンドのソリューションアマゾンセージメーカーも展開されました。

グラフ機械学習のメリット

実世界のデータは複雑で相互接続されており、多くの場合、ネットワーク構造が含まれています。例としては、自然界の分子、ソーシャルネットワーク、インターネット、道路、金融取引プラットフォームなどがあります。

グラフは、エンティティ間の関係に埋め込まれている重要で豊富な情報を抽出することにより、この複雑さをモデル化する自然な方法を提供します。

従来のMLアルゴリズムでは、データをテーブルまたはシーケンスとして整理する必要があります。これは一般的にはうまく機能しますが、一部のドメインはグラフでより自然かつ効果的に表されます（この投稿の後半で説明するように、相互に関連するオブジェクトのネットワークなど）。これらのグラフデータセットをテーブルまたはシーケンスに強制する代わりに、グラフMLアルゴリズムを使用して、構成ノード、エッジ、およびその他の機能に関する情報を含む、グラフ形式で表示されるデータを表現し、そこから学習することができます。

債券取引は本質的に、さまざまな種類の債券商品を含む買い手と売り手の間の相互作用のネットワークとして表されることを考えると、効果的なソリューションは、市場に参加するトレーダーのコミュニティのネットワーク効果を利用する必要があります。ここで、トレーディングネットワーク効果をどのように活用し、このビジョンを実装したかを見てみましょう。

ソリューション

債券取引は、取引規模、期間、発行者、レート、クーポン値、ビッド/アスクオファー、関連する取引プロトコルのタイプなど、いくつかの要因によって特徴付けられます。 Trumidは、注文と取引に加えて、「関心のある兆候」（IOI）も取得します。過去の相互作用データは、時間の経過とともに進化する取引行動と市場の状況を具体化します。このデータを使用して、トレーダー、債券、発行者間のタイムスタンプ付きの相互作用のグラフを作成し、グラフMLを使用して将来の相互作用を予測しました。

推奨ソリューションは、XNUMXつの主要なステップで構成されています。

取引データをグラフデータセットとして準備する
知識グラフ埋め込みモデルのトレーニング
新しい取引の予測
ソリューションをスケーラブルなワークフローとしてパッケージ化

次のセクションでは、各ステップについて詳しく説明します。

取引データをグラフデータセットとして準備する

取引データをグラフとして表す方法はたくさんあります。 XNUMXつのオプションは、ノード、エッジ、およびプロパティでデータを網羅的に表すことです。トレーダーはプロパティ（雇用者や在職期間など）を持つノードとして、債券はプロパティ（発行者、未払い額、満期、レート、クーポン値）を持つノードとして、および取引プロパティ（日付、タイプ、サイズ）を持つエッジとして。もうXNUMXつのオプションは、データを単純化し、ノードとリレーションのみを使用することです（リレーションは、取引または発行者のようにタイプされたエッジです）。この後者のアプローチは、私たちの場合によりうまく機能し、次の図に示すグラフを使用しました。

トレーダー、債券、債券発行者間の関係のグラフ

さらに、廃止されたと見なされるエッジの一部を削除しました。トレーダーが100を超える異なる債券を操作した場合、最後の100の債券のみを保持しました。

最後に、グラフデータセットをエッジのリストとして保存しました TSV フォーマット：

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

知識グラフ埋め込みモデルのトレーニング

ノードとリレーションのみで構成されるグラフ（知識グラフと呼ばれることもあります）の場合、DGLチームは知識グラフ埋め込みフレームワークを開発しました DGL-KE。 KEは知識の埋め込みの略で、ノードと関係（知識）を座標（埋め込み）で表し、座標から元のグラフ構造を復元できるように座標を最適化（トレーニング）するという考え方です。利用可能な埋め込みモデルのリストから、TransE（翻訳埋め込み）を選択しました。 TransEは、次の等式を近似することを目的として、埋め込みをトレーニングします。

ソースノードの埋め込み+リレーションの埋め込み=ターゲットノードの埋め込み（1）

を呼び出してモデルをトレーニングしました dglke_train 指図。トレーニングの出力は、トレーニングされた埋め込みを含むモデルフォルダーです。

TransEの詳細については、を参照してください。マルチリレーショナルデータをモデル化するための埋め込みの翻訳.

新しい取引の予測

私たちのモデルでトレーダーからの新しい取引を予測するために、等式（1）を使用しました：トレーダーの埋め込みを取引最近の埋め込みに追加し、結果の埋め込みに最も近い債券を探しました。

これはXNUMXつのステップで行いました。

とのすべての可能な貿易最近の関係のスコアを計算します dglke_predict.
各トレーダーの上位100の最高スコアを計算します。

DGL-KEの使用方法の詳細については、以下を参照してください。ディープグラフライブラリを使用した知識グラフの埋め込みの大規模なトレーニングおよび DGL-KEドキュメント.

ソリューションをスケーラブルなワークフローとしてパッケージ化

SageMakerノートブックを使用して、コードを開発およびデバッグしました。本番環境では、モデルを単純なAPI呼び出しとして呼び出す必要がありました。データの準備、モデルトレーニング、予測を分離する必要がなく、パイプライン全体を15つのスクリプトとしてパッケージ化し、SageMaker処理を使用すると便利であることがわかりました。 SageMaker処理を使用すると、リソースの割り当てやデータ転送について心配することなく、選択したインスタンスタイプとDockerイメージでスクリプトをリモートで実行できます。 GPUインスタンスは、スクリプトの実行に必要なXNUMX分間のみ使用され、料金が支払われるため、これは単純で費用効果が高いものでした。

SageMaker処理の使用方法の詳細については、を参照してください。 Amazon SageMaker処理–フルマネージドデータ処理とモデル評価および処理.

結果

私たちのカスタムグラフモデルは、他の方法と比較して非常に良好に機能しました。パフォーマンスは80％向上し、すべてのトレーダータイプでより安定した結果が得られました。平均リコール（推奨者によって予測された実際の取引の割合、すべてのトレーダーの平均）によってパフォーマンスを測定しました。他の標準的な指標では、改善は50〜130％の範囲でした。

このパフォーマンスにより、トレーダーと債券のマッチングが向上し、モデル内でのトレーダーエクスペリエンスの向上が示されました。機械学習は、スケーリングが難しいハードコードされたルールから大きな一歩を踏み出しました。

まとめ

Trumidは、革新的な製品とワークフローの効率をユーザーのコミュニティに提供することに重点を置いています。明日のクレジット取引ネットワークを構築するには、より迅速なイノベーションを支援するように設計されたAWS MLSolutionsLabなどの同業者や業界の専門家との継続的なコラボレーションが必要です。

詳細については、次のリソースを参照してください。

著者について

マーク・ヴァン・アウトフースデン アマゾンウェブサービスのアマゾンMLソリューションラボチームのシニアデータサイエンティストです。彼はAWSのお客様と協力して、人工知能と機械学習でビジネス上の問題を解決しています。仕事以外では、ビーチで彼を見つけたり、子供たちと遊んだり、サーフィンやカイトサーフィンをしたりすることがあります。

ムティシャ・ンドゥンダ Trumidのデータ戦略およびAIの責任者です。彼は、資本市場、取引、および金融テクノロジーにおいて20年以上の幅広い制度的経験を持つ経験豊富な金融専門家です。 Mutisyaは、人工知能、機械学習、ビッグデータ分析でXNUMX年以上の経験を持つ、強力な定量的および分析的バックグラウンドを持っています。 Trumidの前は、独自のAIアルゴリズムを利用した分析ソリューションを金融機関に提供する金融テクノロジー企業であるAlphaVertexのCEOを務めていました。 Mutisyaは、コーネル大学で電気工学の学士号を取得し、コーネル大学で金融工学の修士号を取得しています。

Trumid では、PlatoBlockchain データインテリジェンスを埋め込むためのディープグラフライブラリを使用して、高度な機械学習システムを開発しています。垂直検索。あい。 アイザック・プリヴィテラ は、Amazon Machine Learning Solutions Labのシニアデータサイエンティストであり、顧客のビジネス上の問題に対処するために、特注の機械学習およびディープラーニングソリューションを開発しています。彼は主にコンピュータービジョンの分野で働いており、AWSのお客様が分散トレーニングとアクティブラーニングを利用できるようにすることに重点を置いています。

タイムスタンプ：２０２２年７月１１日２０２２年７月１１日

タイムスタンプ： 2023 年 10 月 17 日

知識埋め込み用のディープグラフライブラリを使用して、Trumidで高度な機械学習システムを開発する

プラトン再発行

グラフ機械学習のメリット

ソリューション

取引データをグラフデータセットとして準備する

知識グラフ埋め込みモデルのトレーニング

新しい取引の予測

ソリューションをスケーラブルなワークフローとしてパッケージ化

結果

まとめ

著者について

より多くの AWS機械学習

Patsnap が Amazon SageMaker で GPT-2 推論を低レイテンシーと低コストでどのように使用したか | アマゾンウェブサービス

Amazon SageMaker Edge Manager と AWS IoT Greengrass を使用したエッジでの MLOps

エンタープライズ管理コントロール、簡単なサインアップ、Amazon CodeWhisperer の拡張プログラミング言語サポート

Amazon Kendra の Exchange コネクタを使用して Microsoft Exchange コンテンツにインデックスを付ける

IMDb ナレッジグラフを使用した電力の推奨事項と検索 – パート 3

デフォルトのライフサイクル設定でAmazonSageMakerStudioでAmazonSageMakerDataWranglerを使用する

Amazon Polly を使用してウェブページを読み、コンテンツをハイライトする

Amazon Personalize と Amazon OpenSearch Service の統合で検索結果をパーソナライズ | アマゾンウェブサービス

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー