تطوير أنظمة التعلم الآلي المتقدمة في Trumid باستخدام مكتبة الرسم البياني العميق لتضمين المعرفة

أعاد نشره أفلاطون

المتابعون: 0

هذا منشور ضيف شارك في كتابته موتيسيا ندوندا من تروميد.

مثل العديد من الصناعات ، فإن سوق سندات الشركات لا يصلح لمنهج واحد يناسب الجميع. إنها ضخمة ، والسيولة مجزأة ، والعملاء المؤسسيون يطلبون حلولًا مصممة خصيصًا لاحتياجاتهم الخاصة. يمكن استخدام التطورات في الذكاء الاصطناعي والتعلم الآلي (ML) لتحسين تجربة العملاء ، وزيادة كفاءة ودقة تدفقات العمل التشغيلية ، وتحسين الأداء من خلال دعم جوانب متعددة من عملية التداول.

تروميد هي شركة تكنولوجيا مالية تبني شبكة تداول ائتمان الغد - سوق للتداول الفعال ونشر المعلومات والتنفيذ بين المشاركين في سوق سندات الشركات. تعمل Trumid على تحسين تجربة تداول الائتمان من خلال الجمع بين تصميم المنتجات الرائدة ومبادئ التكنولوجيا والخبرة العميقة في السوق. والنتيجة هي حل تجاري متكامل يقدم نظامًا بيئيًا كاملًا من البروتوكولات وأدوات التنفيذ ضمن منصة واحدة سهلة الاستخدام.

يشتمل سوق تداول السندات تقليديًا على عمليات مطابقة المشتري / البائع غير المتصلة بالإنترنت بمساعدة التكنولوجيا المستندة إلى القواعد. شرع تروميد في مبادرة لتحويل هذه التجربة. من خلال منصة التداول الإلكترونية ، يمكن للمتداولين الوصول إلى آلاف السندات للشراء أو البيع ، ومجتمع من المستخدمين المتفاعلين للتفاعل معهم ، ومجموعة متنوعة من بروتوكولات التداول وحلول التنفيذ. من خلال شبكة موسعة من المستخدمين ، دخل فريق Trumid للذكاء الاصطناعي واستراتيجية البيانات في شراكة مع مختبر حلول التعلم الآلي في AWS. كان الهدف هو تطوير أنظمة ML التي يمكن أن توفر تجربة تداول أكثر تخصيصًا من خلال نمذجة اهتمامات وتفضيلات المستخدمين للسندات المتاحة في Trumid.

يمكن استخدام نماذج ML هذه لتسريع وقت الرؤية والعمل من خلال تخصيص كيفية عرض المعلومات لكل مستخدم للتأكد من أن المعلومات الأكثر صلة وقابلة للتنفيذ التي قد يهتم بها المتداول يتم تحديد أولوياتها وإمكانية الوصول إليها.

لحل هذا التحدي ، طور Trumid و ML Solutions Lab إعدادًا شاملاً للبيانات ، وتدريبًا نموذجيًا ، وعملية استنتاج استنادًا إلى نموذج شبكة عصبية عميقة تم إنشاؤها باستخدام مكتبة الرسم البياني العميق لتضمين المعرفة (DGL-KE). حل شامل مع الأمازون SageMaker تم نشره أيضًا.

فوائد التعلم الآلي للرسم البياني

بيانات العالم الحقيقي معقدة ومترابطة ، وغالبًا ما تحتوي على هياكل شبكة. تشمل الأمثلة الجزيئات في الطبيعة والشبكات الاجتماعية والإنترنت والطرق ومنصات التداول المالي.

توفر الرسوم البيانية طريقة طبيعية لنمذجة هذا التعقيد عن طريق استخراج المعلومات المهمة والغنية المضمنة في العلاقات بين الكيانات.

تتطلب خوارزميات ML التقليدية تنظيم البيانات في شكل جداول أو تسلسلات. يعمل هذا بشكل جيد بشكل عام ، ولكن يتم تمثيل بعض المجالات بشكل طبيعي وفعال من خلال الرسوم البيانية (مثل شبكة من الكائنات المرتبطة ببعضها البعض ، كما هو موضح لاحقًا في هذا المنشور). بدلاً من فرض مجموعات بيانات الرسم البياني هذه في جداول أو تسلسلات ، يمكنك استخدام خوارزميات ML للرسم البياني لتمثيل البيانات والتعلم منها كما هو معروض في نموذج الرسم البياني الخاص بها ، بما في ذلك معلومات حول العقد المكونة والحواف والميزات الأخرى.

بالنظر إلى أن تداول السندات يتم تمثيله بطبيعته كشبكة من التفاعلات بين المشترين والبائعين التي تتضمن أنواعًا مختلفة من أدوات السندات ، فإن الحل الفعال يحتاج إلى تسخير تأثيرات الشبكة لمجتمعات المتداولين الذين يشاركون في السوق. دعونا نلقي نظرة على كيفية الاستفادة من تأثيرات شبكة التداول وتنفيذ هذه الرؤية هنا.

الحلول

يتميز تداول السندات بعدة عوامل ، بما في ذلك حجم التداول ، المدة ، المُصدر ، السعر ، قيم القسيمة ، عرض الشراء / العرض ، ونوع بروتوكول التداول المتضمن. بالإضافة إلى الأوامر والصفقات ، يلتقط Trumid أيضًا "مؤشرات الاهتمام" (IOIs). تجسد بيانات التفاعل التاريخية سلوك التداول وظروف السوق التي تتطور بمرور الوقت. استخدمنا هذه البيانات لبناء رسم بياني للتفاعلات ذات الطابع الزمني بين المتداولين والسندات والمصدرين ، واستخدمنا الرسم البياني ML للتنبؤ بالتفاعلات المستقبلية.

يتكون حل التوصية من أربع خطوات رئيسية:

تحضير بيانات التداول كمجموعة بيانات الرسم البياني
تدريب نموذج تضمين الرسم البياني للمعرفة
توقع الصفقات الجديدة
قم بتعبئة الحل كتدفق عمل قابل للتطوير

في الأقسام التالية ، نناقش كل خطوة بمزيد من التفصيل.

تحضير بيانات التداول كمجموعة بيانات الرسم البياني

هناك العديد من الطرق لتمثيل بيانات التداول كرسم بياني. يتمثل أحد الخيارات في تمثيل البيانات بشكل شامل مع العقد والحواف والخصائص: التجار كعقد مع خصائص (مثل صاحب العمل أو الحيازة) ، والسندات كعقد مع الخصائص (المُصدر ، والمبلغ المستحق ، والاستحقاق ، والسعر ، وقيمة القسيمة) ، والصفقات كحواف لها خصائص (التاريخ ، النوع ، الحجم). خيار آخر هو تبسيط البيانات واستخدام العقد والعلاقات فقط (العلاقات هي حواف مكتوبة مثل المتاجرة أو الصادرة). نجح هذا النهج الأخير بشكل أفضل في حالتنا ، واستخدمنا الرسم البياني الموضح في الشكل التالي.

رسم بياني للعلاقات بين المتداولين والسندات ومصدري السندات

بالإضافة إلى ذلك ، أزلنا بعض الحواف التي اعتبرناها قديمة: إذا تفاعل المتداول مع أكثر من 100 سند مختلف ، فقد احتفظنا بآخر 100 سند فقط.

أخيرًا ، قمنا بحفظ مجموعة بيانات الرسم البياني كقائمة من الحواف بتنسيق تي اس شكل:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

تدريب نموذج تضمين الرسم البياني للمعرفة

بالنسبة للرسوم البيانية المكونة فقط من العقد والعلاقات (غالبًا ما تسمى الرسوم البيانية المعرفية) ، طور فريق DGL إطار عمل تضمين الرسم البياني المعرفي DGL-KE. يرمز KE إلى تضمين المعرفة ، والفكرة هي تمثيل العقد والعلاقات (المعرفة) من خلال الإحداثيات (التضمينات) وتحسين (تدريب) الإحداثيات بحيث يمكن استرداد هيكل الرسم البياني الأصلي من الإحداثيات. في قائمة نماذج التضمين المتاحة ، اخترنا TransE (حفلات الزفاف متعدية). حفلات الزفاف TransE قطارات بهدف تقريب المساواة التالية:

تضمين العقدة المصدر + تضمين العلاقة = تضمين العقدة الهدف (1)

قمنا بتدريب النموذج من خلال استدعاء dglke_train يأمر. مخرجات التدريب عبارة عن ملف نموذجي يحتوي على الزخارف المدربة.

لمزيد من التفاصيل حول TransE ، يرجى الرجوع إلى ترجمة الزخارف لنمذجة البيانات متعددة العلاقات.

توقع الصفقات الجديدة

للتنبؤ بالتداولات الجديدة من المتداول باستخدام نموذجنا ، استخدمنا المساواة (1): أضف التضمين للمتداول إلى التضمين الأخير للتداول وبحث عن السندات الأقرب إلى التضمين الناتج.

لقد فعلنا ذلك في خطوتين:

حساب الدرجات لجميع العلاقات التجارية الحديثة الممكنة مع dglke_predict.
احسب أعلى 100 نقطة لكل متداول.

للحصول على إرشادات مفصلة حول كيفية استخدام DGL-KE ، يرجى الرجوع إلى تدريب حفلات الزفاف على الرسم البياني المعرفي على نطاق واسع باستخدام مكتبة الرسم البياني العميق و وثائق DGL-KE.

قم بتعبئة الحل كتدفق عمل قابل للتطوير

استخدمنا دفاتر SageMaker لتطوير وتصحيح الكود الخاص بنا. للإنتاج ، أردنا استدعاء النموذج على أنه استدعاء بسيط لواجهة برمجة التطبيقات. وجدنا أننا لسنا بحاجة إلى فصل إعداد البيانات ، والتدريب على النموذج ، والتنبؤ ، وكان من الملائم تجميع خط الأنابيب بالكامل كبرنامج نصي واحد واستخدام معالجة SageMaker. تتيح لك معالجة SageMaker تشغيل برنامج نصي عن بُعد على نوع مثيل مختار وصورة Docker دون الحاجة إلى القلق بشأن تخصيص الموارد ونقل البيانات. كان هذا بسيطًا وفعالًا من حيث التكلفة بالنسبة لنا ، نظرًا لاستخدام مثيل GPU ودفع ثمنه فقط خلال الـ 15 دقيقة اللازمة لتشغيل البرنامج النصي.

للحصول على إرشادات مفصلة حول كيفية استخدام معالجة SageMaker ، راجع Amazon SageMaker Processing - معالجة البيانات المدارة بالكامل وتقييم النموذج و اﻟﻤﻌﺎﻟﺠﺔ.

النتائج

كان أداء نموذج الرسم البياني المخصص الخاص بنا جيدًا جدًا مقارنة بالطرق الأخرى: تحسن الأداء بنسبة 80٪ ، مع نتائج أكثر استقرارًا عبر جميع أنواع المتداولين. قمنا بقياس الأداء من خلال الاسترجاع المتوسط (النسبة المئوية للصفقات الفعلية التي تنبأ بها الموصي ، بمتوسط جميع المتداولين). مع المقاييس القياسية الأخرى ، تراوح التحسن بين 50-130٪.

مكننا هذا الأداء من مطابقة المتداولين والسندات بشكل أفضل ، مما يشير إلى تجربة متداول محسّنة داخل النموذج ، مع التعلم الآلي الذي يقدم خطوة كبيرة للأمام من القواعد المشفرة ، والتي قد يكون من الصعب قياسها.

وفي الختام

يركز Trumid على تقديم منتجات مبتكرة وكفاءات سير العمل لمجتمع المستخدمين. يتطلب بناء شبكة تداول ائتمان الغد تعاونًا مستمرًا مع أقرانهم وخبراء الصناعة مثل AWS ML Solutions Lab ، المصمم لمساعدتك على الابتكار بشكل أسرع.

لمزيد من المعلومات ، راجع الموارد التالية:

عن المؤلفين

مارك فان أودهيوسدن هو عالم بيانات أقدم مع فريق Amazon ML Solutions Lab في Amazon Web Services. يعمل مع عملاء AWS لحل مشاكل العمل باستخدام الذكاء الاصطناعي والتعلم الآلي. خارج العمل ، قد تجده على الشاطئ أو يلعب مع أطفاله أو يمارس رياضة ركوب الأمواج أو ركوب الأمواج شراعيًا.

موتيسيا ندوندا هو رئيس إستراتيجية البيانات والذكاء الاصطناعي في Trumid. وهو خبير مالي محنك يتمتع بخبرة مؤسسية واسعة تزيد عن 20 عامًا في أسواق رأس المال والتجارة والتكنولوجيا المالية. يتمتع Mutisya بخلفية كمية وتحليلية قوية مع أكثر من عشر سنوات من الخبرة في مجال الذكاء الاصطناعي والتعلم الآلي وتحليلات البيانات الضخمة. قبل تروميد ، كان الرئيس التنفيذي لشركة Alpha Vertex ، وهي شركة تكنولوجيا مالية تقدم حلولًا تحليلية مدعومة بخوارزميات الذكاء الاصطناعي للمؤسسات المالية. يحمل موتيسيا درجة البكالوريوس في الهندسة الكهربائية من جامعة كورنيل ودرجة الماجستير في الهندسة المالية من جامعة كورنيل.

تطوير أنظمة التعلم الآلي المتقدمة في Trumid باستخدام مكتبة الرسم البياني العميق لتضمين المعرفة ذكاء بيانات PlatoBlockchain. البحث العمودي. عاي. إسحاق بريفتيرا هو عالم بيانات أول في مختبر حلول التعلم الآلي في أمازون ، حيث يطور حلول التعلم الآلي والتعلم العميق المفصلة لمعالجة مشاكل عمل العملاء. يعمل بشكل أساسي في مجال رؤية الكمبيوتر ، مع التركيز على تمكين عملاء AWS من خلال التدريب الموزع والتعلم النشط.

الطابع الزمني: 25 تموز، 202225 تموز، 2022

الطابع الزمني: أبريل 12، 2023

تطوير أنظمة التعلم الآلي المتقدمة في Trumid باستخدام مكتبة الرسم البياني العميق لتضمين المعرفة

أعاد نشره أفلاطون

فوائد التعلم الآلي للرسم البياني

الحلول

تحضير بيانات التداول كمجموعة بيانات الرسم البياني

تدريب نموذج تضمين الرسم البياني للمعرفة

توقع الصفقات الجديدة

قم بتعبئة الحل كتدفق عمل قابل للتطوير

النتائج

وفي الختام

عن المؤلفين

اكثر من التعلم الآلي من AWS

تقليل التكلفة ووقت التطوير باستخدام الوضع المحلي لخطوط أنابيب Amazon SageMaker

تحسين تكلفة نشر نماذج Amazon SageMaker JumpStart الأساسية باستخدام نقاط النهاية غير المتزامنة من Amazon SageMaker | خدمات الويب الأمازون

كيف يمكن لمقدمي الخدمة استخدام معالجة اللغة الطبيعية لاكتساب رؤى من تذاكر العملاء باستخدام Amazon Comprehend

حدد غابات المنغروف باستخدام ميزات صور الأقمار الصناعية باستخدام Amazon SageMaker Studio و Amazon SageMaker Autopilot - الجزء 1

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي