Розробка вдосконалених систем машинного навчання в Trumid за допомогою бібліотеки Deep Graph для вбудовування знань

Перевидано Платоном

читають: 0

Це гостьовий пост, написаний у співавторстві з Мутією Ндундою з Trumid.

Як і в багатьох галузях, ринок корпоративних облігацій не піддається універсальному підходу. Він величезний, ліквідність фрагментована, а інституційні клієнти вимагають рішень, адаптованих до їхніх конкретних потреб. Досягнення штучного інтелекту та машинного навчання (ML) можна використовувати для покращення взаємодії з клієнтами, підвищення ефективності та точності операційних робочих процесів і підвищення продуктивності за рахунок підтримки багатьох аспектів торгового процесу.

Трумід – фінансово-технологічна компанія, яка будує майбутню мережу кредитної торгівлі — ринок для ефективної торгівлі, поширення інформації та виконання між учасниками ринку корпоративних облігацій. Trumid оптимізує досвід кредитної торгівлі, поєднуючи передовий дизайн продукту та технологічні принципи з глибоким знанням ринку. Результатом є інтегроване торгове рішення, яке забезпечує повну екосистему протоколів і інструментів виконання в рамках однієї інтуїтивно зрозумілої платформи.

Ринок торгівлі облігаціями традиційно включав офлайн-процеси зіставлення покупців і продавців за допомогою технології на основі правил. Трумід виступив з ініціативою трансформувати цей досвід. Через свою електронну торгову платформу трейдери можуть отримати доступ до тисяч облігацій для купівлі або продажу, спільноти зацікавлених користувачів для взаємодії, а також різноманітних торгових протоколів і рішень для виконання. З розширенням мережі користувачів команда Trumid зі стратегії штучного інтелекту та даних співпрацює з Лабораторія рішень машинного навчання AWS. Мета полягала в тому, щоб розробити системи ML, які могли б забезпечити більш персоналізований досвід торгівлі шляхом моделювання інтересу та переваг користувачів щодо облігацій, доступних на Trumid.

Ці моделі ML можна використовувати, щоб пришвидшити час для розуміння та дій шляхом персоналізації того, як інформація відображається кожному користувачеві, щоб гарантувати пріоритетність і доступність найбільш релевантної та дієвої інформації, яка може бути важливою для трейдера.

Щоб вирішити цю проблему, Trumid і ML Solutions Lab розробили наскрізну підготовку даних, навчання моделі та процес логічного висновку на основі моделі глибокої нейронної мережі, побудованої за допомогою бібліотеки Deep Graph Library для вбудовування знань (DGL-KE). Наскрізне рішення з Amazon SageMaker також було розгорнуто.

Переваги графового машинного навчання

Дані реального світу складні та взаємопов’язані, і часто містять мережеві структури. Приклади включають молекули в природі, соціальні мережі, Інтернет, дороги та фінансові торгові платформи.

Графіки забезпечують природний спосіб моделювання цієї складності шляхом вилучення важливої та насиченої інформації, вбудованої у зв’язки між об’єктами.

Традиційні алгоритми ML вимагають організації даних у вигляді таблиць або послідовностей. Загалом це працює добре, але деякі домени природніше й ефективніше представлено за допомогою графіків (наприклад, мережа пов’язаних один з одним об’єктів, як показано далі в цій публікації). Замість того, щоб зводити ці набори даних графів до таблиць або послідовностей, ви можете використовувати алгоритми ML для графів, щоб представляти та навчатися на основі даних, представлених у формі графіка, включаючи інформацію про складові вузли, ребра та інші функції.

Враховуючи, що торгівля облігаціями за своєю суттю представлена як мережа взаємодій між покупцями та продавцями, що включає різні типи інструментів облігацій, ефективне рішення має використовувати мережевий вплив спільнот трейдерів, які беруть участь у ринку. Давайте подивимося, як ми використали ефекти торгової мережі та реалізували це бачення тут.

рішення

Торгівля облігаціями характеризується декількома факторами, зокрема розміром угоди, терміном, емітентом, ставкою, купонними цінами, пропозицією купівлі/пропозиції та типом торгового протоколу. Окрім замовлень і угод, Trumid також фіксує «показники інтересу» (IOI). Історичні дані взаємодії втілюють торгову поведінку та ринкові умови, що змінюються з часом. Ми використали ці дані, щоб побудувати графік взаємодій між трейдерами, облігаціями та емітентами, а також використали графік ML для прогнозування майбутніх взаємодій.

Рекомендаційне рішення складалося з чотирьох основних етапів:

Підготовка торгових даних у вигляді набору даних графіка
Навчання моделі вбудовування графа знань
Прогнозування нових угод
Упаковка рішення як масштабований робочий процес

У наступних розділах ми докладніше обговорюємо кожен крок.

Підготовка торгових даних у вигляді набору даних графіка

Існує багато способів представлення торгових даних у вигляді графіка. Одним із варіантів є вичерпне представлення даних за допомогою вузлів, країв і властивостей: трейдери як вузли з властивостями (наприклад, роботодавець або володіння), облігації як вузли з властивостями (емітент, непогашена сума, термін погашення, ставка, купонна вартість) і угоди як ребра з властивостями (дата, тип, розмір). Іншим варіантом є спрощення даних і використання лише вузлів і зв’язків (зв’язки є типізованими ребрами, як-от traded або issued-by). Цей останній підхід спрацював краще в нашому випадку, і ми використали графік, представлений на наступному малюнку.

Графік відносин між трейдерами, облігаціями та емітентами облігацій

Крім того, ми видалили деякі межі, які вважаються застарілими: якщо трейдер взаємодіяв із більш ніж 100 різними облігаціями, ми зберігали лише останні 100 облігацій.

Нарешті ми зберегли набір даних графіка як список ребер у TSV формат:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

Навчання моделі вбудовування графа знань

Для графів, які складаються лише з вузлів і зв’язків (часто їх називають графами знань), команда DGL розробила структуру вбудовування графів знань DGL-KE. KE означає вбудовування знань, ідея полягає в тому, щоб представити вузли та зв’язки (знання) за допомогою координат (вбудовування) та оптимізувати (навчати) координати так, щоб вихідну структуру графа можна було відновити з координат. У списку доступних моделей вбудовування ми вибрали TransE (трансляційні вбудовування). TransE тренує вбудовування з метою наближення такої рівності:

Вбудовування вихідного вузла + вбудовування відношення = вбудовування цільового вузла (1)

Ми навчили модель, викликавши dglke_train команда. Результатом навчання є папка моделі, яка містить навчені вбудовування.

Додаткову інформацію про TransE див Переклад вбудовування для моделювання мультиреляційних даних.

Прогнозування нових угод

Щоб передбачити нові угоди від трейдера за допомогою нашої моделі, ми використали рівність (1): додайте вбудовування трейдера до вбудовування останньої торгівлі та шукали облігації, найближчі до результуючого вбудовування.

Ми зробили це в два кроки:

Обчисліть бали для всіх можливих останніх торговельних відносин з dglke_predict.
Обчисліть 100 найвищих балів для кожного трейдера.

Докладні інструкції щодо використання DGL-KE див Навчальні вбудовування графіків знань у масштабі за допомогою бібліотеки Deep Graph та Документація DGL-KE.

Упаковка рішення як масштабований робочий процес

Ми використовували блокноти SageMaker для розробки та налагодження нашого коду. Для виробництва ми хотіли викликати модель як простий виклик API. Ми виявили, що нам не потрібно розділяти підготовку даних, навчання моделі та прогнозування, і було зручно запакувати весь конвеєр як єдиний сценарій і використовувати обробку SageMaker. Обробка SageMaker дозволяє віддалено запускати сценарій на вибраному типі екземпляра та образі Docker, не турбуючись про розподіл ресурсів і передачу даних. Для нас це було просто та економічно ефективно, оскільки екземпляр GPU використовується та оплачується лише протягом 15 хвилин, необхідних для запуску сценарію.

Докладні інструкції щодо використання обробки SageMaker див Amazon SageMaker Processing – повністю керована обробка даних і оцінка моделі та Обробка.

результати

Наша користувацька модель графіка показала себе дуже добре порівняно з іншими методами: продуктивність покращилася на 80%, із більш стабільними результатами для всіх типів трейдерів. Ми вимірювали ефективність за допомогою середнього запам’ятовування (відсоток фактичних угод, передбачених рекомендувачем, усереднений для всіх трейдерів). З іншими стандартними показниками покращення становило 50–130%.

Ця продуктивність дозволила нам краще поєднувати трейдерів і облігації, що вказує на покращений досвід трейдерів у моделі, завдяки машинному навчанню, яке робить великий крок уперед від жорстко закодованих правил, які може бути важко масштабувати.

Висновок

Trumid зосереджено на постачанні інноваційних продуктів і ефективності робочого процесу для своєї спільноти користувачів. Побудова майбутньої мережі кредитної торгівлі потребує постійної співпраці з колегами та галузевими експертами, такими як AWS ML Solutions Lab, розроблена, щоб допомогти вам швидше впроваджувати інновації.

Для отримання додаткової інформації див. такі ресурси:

Про авторів

Марк ван Оудхойден є старшим спеціалістом із обробки даних у команді Amazon ML Solutions Lab у Amazon Web Services. Він працює з клієнтами AWS над вирішенням бізнес-проблем за допомогою штучного інтелекту та машинного навчання. Поза роботою ви можете зустріти його на пляжі, грати з дітьми, займатися серфінгом або кайтсерфінгом.

Мутіся Ндунда є керівником стратегії даних та ШІ в Trumid. Він є досвідченим фінансовим професіоналом із більш ніж 20-річним досвідом інституційної діяльності на ринках капіталу, торгівлі та фінансових технологіях. Мутіся має потужний кількісний та аналітичний досвід із понад десятирічним досвідом у сфері штучного інтелекту, машинного навчання та аналітики великих даних. До Труміда він був генеральним директором Alpha Vertex, фінансово-технологічної компанії, яка пропонує фінансовим установам аналітичні рішення на основі власних алгоритмів ШІ. Мутіся має ступінь бакалавра з електротехніки в Корнельському університеті та ступінь магістра з фінансової інженерії в Корнельському університеті.

Розробка передових систем машинного навчання в Trumid за допомогою бібліотеки Deep Graph Library для вбудовування знань PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai. Ісаак Привітар є старшим спеціалістом із обробки даних у Amazon Machine Learning Solutions Lab, де він розробляє індивідуальні рішення для машинного та глибокого навчання для вирішення бізнес-проблем клієнтів. Він працює головним чином у сфері комп’ютерного бачення, зосереджуючись на тому, щоб надати клієнтам AWS можливість розподіленого навчання та активного навчання.

Часова мітка: Липень 25, 2022Липень 25, 2022

Часова мітка: Жовтень 17, 2023

Розробка передових систем машинного навчання в Trumid за допомогою бібліотеки Deep Graph Library для вбудовування знань

Перевидано Платоном

Переваги графового машинного навчання

рішення

Підготовка торгових даних у вигляді набору даних графіка

Навчання моделі вбудовування графа знань

Прогнозування нових угод

Упаковка рішення як масштабований робочий процес

результати

Висновок

Про авторів

Більше від AWS Машинне навчання

Як Patsnap використовував висновок GPT-2 на Amazon SageMaker із низькою затримкою та вартістю | Веб-сервіси Amazon

MLO на межі з Amazon SageMaker Edge Manager і AWS IoT Greengrass

Адміністративний контроль підприємства, проста реєстрація та розширена підтримка мови програмування для Amazon CodeWhisperer

Індексуйте вміст Microsoft Exchange за допомогою конектора Exchange для Amazon Kendra

Ефективні рекомендації та пошук за допомогою графіка знань IMDb – Частина 3

Використовуйте Amazon SageMaker Data Wrangler в Amazon SageMaker Studio з конфігурацією життєвого циклу за замовчуванням

Читайте веб-сторінки та виділіть вміст за допомогою Amazon Polly

Персоналізуйте результати пошуку за допомогою інтеграції Amazon Personalize та Amazon OpenSearch Service | Веб-сервіси Amazon

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки