Mengembangkan Sistem Pembelajaran Mesin Tingkat Lanjut Di Trumid Dengan Perpustakaan Grafik Dalam Untuk Menanamkan Pengetahuan

Diterbitkan Ulang Oleh Plato

Followers: 0

Ini adalah posting tamu yang ditulis bersama dengan Mutisya Ndunda dari Trumid.

Seperti banyak industri, pasar obligasi korporasi tidak cocok dengan pendekatan satu ukuran untuk semua. Ini luas, likuiditas terfragmentasi, dan klien institusional menuntut solusi yang disesuaikan dengan kebutuhan spesifik mereka. Kemajuan dalam AI dan pembelajaran mesin (ML) dapat digunakan untuk meningkatkan pengalaman pelanggan, meningkatkan efisiensi dan akurasi alur kerja operasional, dan meningkatkan kinerja dengan mendukung berbagai aspek proses perdagangan.

Trumid adalah perusahaan teknologi keuangan yang membangun jaringan perdagangan kredit masa depan—pasar untuk perdagangan yang efisien, penyebaran informasi, dan eksekusi antara pelaku pasar obligasi korporasi. Trumid mengoptimalkan pengalaman perdagangan kredit dengan menggabungkan desain produk terdepan dan prinsip-prinsip teknologi dengan keahlian pasar yang mendalam. Hasilnya adalah solusi perdagangan terintegrasi yang menghadirkan ekosistem protokol dan alat eksekusi lengkap dalam satu platform intuitif.

Pasar perdagangan obligasi secara tradisional melibatkan proses pencocokan pembeli/penjual offline yang dibantu oleh teknologi berbasis aturan. Trumid telah memulai inisiatif untuk mengubah pengalaman ini. Melalui platform perdagangan elektroniknya, pedagang dapat mengakses ribuan obligasi untuk membeli atau menjual, komunitas pengguna yang terlibat untuk berinteraksi, dan berbagai protokol perdagangan dan solusi eksekusi. Dengan jaringan pengguna yang berkembang, tim AI dan Strategi Data Trumid bermitra dengan Lab Solusi Pembelajaran Mesin AWS. Tujuannya adalah untuk mengembangkan sistem ML yang dapat memberikan pengalaman perdagangan yang lebih personal dengan memodelkan minat dan preferensi pengguna untuk obligasi yang tersedia di Trumid.

Model ML ini dapat digunakan untuk mempercepat waktu untuk wawasan dan tindakan dengan mempersonalisasi bagaimana informasi ditampilkan kepada setiap pengguna untuk memastikan bahwa informasi yang paling relevan dan dapat ditindaklanjuti yang mungkin diperhatikan oleh pedagang diprioritaskan dan dapat diakses.

Untuk mengatasi tantangan ini, Trumid dan ML Solutions Lab mengembangkan persiapan data end-to-end, pelatihan model, dan proses inferensi berdasarkan model jaringan saraf dalam yang dibangun menggunakan Deep Graph Library for Knowledge Embedding (DGL-KE). Solusi ujung ke ujung dengan Amazon SageMaker juga dikerahkan.

Manfaat pembelajaran mesin grafik

Data dunia nyata kompleks dan saling berhubungan, dan sering kali berisi struktur jaringan. Contohnya termasuk molekul di alam, jejaring sosial, internet, jalan raya, dan platform perdagangan keuangan.

Grafik menyediakan cara alami untuk memodelkan kompleksitas ini dengan mengekstraksi informasi penting dan kaya yang tertanam dalam hubungan antar entitas.

Algoritme ML tradisional memerlukan data untuk diatur sebagai tabel atau urutan. Ini umumnya bekerja dengan baik, tetapi beberapa domain lebih alami dan efektif diwakili oleh grafik (seperti jaringan objek yang terkait satu sama lain, seperti yang diilustrasikan nanti dalam posting ini). Alih-alih memaksa kumpulan data grafik ini ke dalam tabel atau urutan, Anda dapat menggunakan algoritme ML grafik untuk mewakili dan mempelajari data seperti yang disajikan dalam bentuk grafiknya, termasuk informasi tentang simpul penyusun, tepi, dan fitur lainnya.

Mengingat bahwa perdagangan obligasi secara inheren direpresentasikan sebagai jaringan interaksi antara pembeli dan penjual yang melibatkan berbagai jenis instrumen obligasi, solusi yang efektif perlu memanfaatkan efek jaringan dari komunitas pedagang yang berpartisipasi di pasar. Mari kita lihat bagaimana kami memanfaatkan efek jaringan perdagangan dan menerapkan visi ini di sini.

Solusi

Perdagangan obligasi dicirikan oleh beberapa faktor, termasuk ukuran perdagangan, jangka waktu, penerbit, kurs, nilai kupon, penawaran bid/ask, dan jenis protokol perdagangan yang terlibat. Selain pesanan dan perdagangan, Trumid juga menangkap "indikasi minat" (IOI). Data interaksi historis mewujudkan perilaku perdagangan dan kondisi pasar yang berkembang dari waktu ke waktu. Kami menggunakan data ini untuk membuat grafik interaksi stempel waktu antara pedagang, obligasi, dan penerbit, dan menggunakan grafik ML untuk memprediksi interaksi di masa mendatang.

Solusi rekomendasi terdiri dari empat langkah utama:

Mempersiapkan data perdagangan sebagai kumpulan data grafik
Melatih model penyematan grafik pengetahuan
Memprediksi perdagangan baru
Mengemas solusi sebagai alur kerja yang skalabel

Pada bagian berikut, kami membahas setiap langkah secara lebih rinci.

Mempersiapkan data perdagangan sebagai kumpulan data grafik

Ada banyak cara untuk merepresentasikan data trading sebagai grafik. Salah satu pilihannya adalah merepresentasikan data secara mendalam dengan simpul, tepi, dan properti: pedagang sebagai simpul dengan properti (seperti pemberi kerja atau kepemilikan), obligasi sebagai simpul dengan properti (penerbit, jumlah terutang, jatuh tempo, tingkat, nilai kupon), dan perdagangan sebagai tepi dengan properti (tanggal, jenis, ukuran). Pilihan lain adalah menyederhanakan data dan hanya menggunakan node dan relasi (relasi diketik tepi seperti diperdagangkan atau dikeluarkan oleh). Pendekatan terakhir ini bekerja lebih baik dalam kasus kami, dan kami menggunakan grafik yang direpresentasikan dalam gambar berikut.

Grafik Hubungan Pedagang, Obligasi dan Penerbit Obligasi

Selain itu, kami menghapus beberapa tepi yang dianggap usang: jika seorang pedagang berinteraksi dengan lebih dari 100 obligasi yang berbeda, kami hanya menyimpan 100 obligasi terakhir.

Akhirnya, kami menyimpan dataset grafik sebagai daftar tepi di TSV format:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

Melatih model penyematan grafik pengetahuan

Untuk grafik yang hanya terdiri dari node dan relasi (sering disebut grafik pengetahuan), tim DGL mengembangkan kerangka kerja penyisipan grafik pengetahuan DGL-KE. KE adalah singkatan dari knowledge embedding, gagasan untuk merepresentasikan node dan relasi (knowledge) dengan koordinat (embeddings) dan mengoptimalkan (melatih) koordinat sehingga struktur grafik asli dapat dipulihkan dari koordinat. Dalam daftar model embedding yang tersedia, kami memilih TransE (translational embeddings). TransE melatih embeddings dengan tujuan mendekati kesetaraan berikut:

Penyematan simpul sumber + penyematan relasi = penyematan simpul target (1)

Kami melatih model dengan menerapkan dglke_train memerintah. Output pelatihan adalah folder model yang berisi embeddings terlatih.

Untuk detail lebih lanjut tentang TransE, lihat Menerjemahkan Embeddings untuk Pemodelan Data Multi-relasional.

Memprediksi perdagangan baru

Untuk memprediksi perdagangan baru dari seorang pedagang dengan model kami, kami menggunakan persamaan (1): tambahkan penyematan pedagang ke penyematan perdagangan terbaru dan cari obligasi yang paling dekat dengan penyematan yang dihasilkan.

Kami melakukan ini dalam dua langkah:

Hitung skor untuk semua kemungkinan hubungan perdagangan baru-baru ini dengan dglke_predict.
Hitung 100 skor tertinggi untuk setiap trader.

Untuk petunjuk rinci tentang cara menggunakan DGL-KE, lihat Pelatihan embeddings grafik pengetahuan dalam skala dengan Deep Graph Library dan Dokumentasi DGL-KE.

Mengemas solusi sebagai alur kerja yang skalabel

Kami menggunakan notebook SageMaker untuk mengembangkan dan men-debug kode kami. Untuk produksi, kami ingin memanggil model sebagai panggilan API sederhana. Kami menemukan bahwa kami tidak perlu memisahkan persiapan data, pelatihan model, dan prediksi, dan lebih mudah untuk mengemas seluruh saluran sebagai skrip tunggal dan menggunakan pemrosesan SageMaker. Pemrosesan SageMaker memungkinkan Anda menjalankan skrip dari jarak jauh pada jenis instans yang dipilih dan gambar Docker tanpa harus khawatir tentang alokasi sumber daya dan transfer data. Ini sederhana dan hemat biaya bagi kami, karena instans GPU hanya digunakan dan dibayar selama 15 menit yang diperlukan untuk menjalankan skrip.

Untuk petunjuk terperinci tentang cara menggunakan pemrosesan SageMaker, lihat Amazon SageMaker Processing - Pemrosesan Data Terkelola Sepenuhnya dan Evaluasi Model dan Pengolahan.

Hasil

Model grafik khusus kami berkinerja sangat baik dibandingkan dengan metode lain: kinerja meningkat sebesar 80%, dengan hasil yang lebih stabil di semua jenis pedagang. Kami mengukur kinerja dengan mengingat rata-rata (persentase perdagangan aktual yang diprediksi oleh pemberi rekomendasi, dirata-ratakan pada semua pedagang). Dengan metrik standar lainnya, peningkatannya berkisar antara 50-130%.

Performa ini memungkinkan kami untuk mencocokkan pedagang dan obligasi dengan lebih baik, menunjukkan pengalaman pedagang yang ditingkatkan dalam model, dengan pembelajaran mesin yang memberikan langkah maju yang besar dari aturan kode keras, yang mungkin sulit untuk diukur.

Kesimpulan

Trumid berfokus pada memberikan produk inovatif dan efisiensi alur kerja kepada komunitas pengguna mereka. Membangun jaringan perdagangan kredit masa depan membutuhkan kolaborasi berkelanjutan dengan rekan dan pakar industri seperti AWS ML Solutions Lab, yang dirancang untuk membantu Anda berinovasi lebih cepat.

Untuk informasi lebih lanjut, lihat sumber daya berikut:

Tentang penulis

Marc van Oudheusden adalah Ilmuwan Data Senior dengan tim Amazon ML Solutions Lab di Amazon Web Services. Dia bekerja dengan pelanggan AWS untuk memecahkan masalah bisnis dengan kecerdasan buatan dan pembelajaran mesin. Di luar pekerjaan Anda mungkin menemukannya di pantai, bermain dengan anak-anaknya, berselancar atau bermain layang-layang.

Mutisya Ndunda adalah Kepala Strategi Data dan AI di Trumid. Dia adalah profesional keuangan berpengalaman dengan lebih dari 20 tahun pengalaman institusional yang luas di pasar modal, perdagangan, dan teknologi keuangan. Mutisya memiliki latar belakang kuantitatif dan analitik yang kuat dengan pengalaman lebih dari satu dekade dalam kecerdasan buatan, pembelajaran mesin, dan analitik data besar. Sebelum Trumid, dia adalah CEO Alpha Vertex, sebuah perusahaan teknologi keuangan yang menawarkan solusi analitis yang didukung oleh algoritme AI milik lembaga keuangan. Mutisya meraih gelar sarjana di bidang Teknik Elektro dari Cornell University dan gelar master di bidang Financial Engineering dari Cornell University.

Mengembangkan sistem pembelajaran mesin canggih di Trumid dengan Deep Graph Library for Knowledge Embedding PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai. Ishak Privitera adalah Senior Data Scientist di Amazon Machine Learning Solutions Lab, tempat ia mengembangkan solusi pembelajaran mesin dan pembelajaran mendalam untuk mengatasi masalah bisnis pelanggan. Dia bekerja terutama di bidang visi komputer, dengan fokus untuk memungkinkan pelanggan AWS dengan pelatihan terdistribusi dan pembelajaran aktif.

Stempel Waktu: Juli 25, 2022Juli 25, 2022

Stempel Waktu: Oktober 17, 2023

Mengembangkan sistem pembelajaran mesin canggih di Trumid dengan Deep Graph Library for Knowledge Embedding

Diterbitkan Ulang Oleh Plato

Manfaat pembelajaran mesin grafik

Solusi

Mempersiapkan data perdagangan sebagai kumpulan data grafik

Melatih model penyematan grafik pengetahuan

Memprediksi perdagangan baru

Mengemas solusi sebagai alur kerja yang skalabel

Hasil

Kesimpulan

Tentang penulis

Lebih dari Pembelajaran Mesin AWS

Bagaimana Patsnap menggunakan inferensi GPT-2 di Amazon SageMaker dengan latensi dan biaya rendah | Layanan Web Amazon

MLOps di tepi dengan Amazon SageMaker Edge Manager dan AWS IoT Greengrass

Kontrol administratif perusahaan, pendaftaran sederhana, dan dukungan bahasa pemrograman yang diperluas untuk Amazon CodeWhisperer

Buat indeks konten Microsoft Exchange Anda menggunakan konektor Exchange untuk Amazon Kendra

Rekomendasi daya dan pencarian menggunakan grafik pengetahuan IMDb – Bagian 3

Gunakan Amazon SageMaker Data Wrangler di Amazon SageMaker Studio dengan konfigurasi siklus hidup default

Baca halaman web dan sorot konten menggunakan Amazon Polly

Personalisasikan hasil pencarian Anda dengan integrasi Amazon Personalize dan Amazon OpenSearch Service | Layanan Web Amazon

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun