Entwicklung fortschrittlicher maschineller Lernsysteme bei Trumid mit der Deep Graph Library for Knowledge Embedding PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Entwicklung fortschrittlicher Systeme für maschinelles Lernen bei Trumid mit der Deep Graph Library for Knowledge Embedding

Dies ist ein Gastbeitrag, der zusammen mit Mutisya Ndunda von Trumid geschrieben wurde.

Wie viele Branchen eignet sich der Markt für Unternehmensanleihen nicht für einen einheitlichen Ansatz. Es ist riesig, die Liquidität ist fragmentiert und institutionelle Kunden verlangen Lösungen, die auf ihre spezifischen Bedürfnisse zugeschnitten sind. Fortschritte in KI und maschinellem Lernen (ML) können genutzt werden, um das Kundenerlebnis zu verbessern, die Effizienz und Genauigkeit betrieblicher Arbeitsabläufe zu steigern und die Leistung zu steigern, indem mehrere Aspekte des Handelsprozesses unterstützt werden.

unterstützt ist ein Finanztechnologieunternehmen, das das Kredithandelsnetzwerk von morgen aufbaut – einen Marktplatz für effizienten Handel, Informationsverbreitung und Ausführung zwischen Marktteilnehmern für Unternehmensanleihen. Trumid optimiert das Kredithandelserlebnis, indem es modernste Produktdesign- und Technologieprinzipien mit umfassender Marktexpertise kombiniert. Das Ergebnis ist eine integrierte Handelslösung, die ein vollständiges Ökosystem von Protokollen und Ausführungstools innerhalb einer intuitiven Plattform bereitstellt.

Der Anleihenhandelsmarkt umfasst traditionell Offline-Käufer/Verkäufer-Matching-Prozesse, die durch regelbasierte Technologie unterstützt werden. Trumid hat eine Initiative gestartet, um diese Erfahrung zu transformieren. Über seine elektronische Handelsplattform können Händler auf Tausende von Anleihen zum Kauf oder Verkauf zugreifen, auf eine Community engagierter Benutzer, mit denen sie interagieren können, und auf eine Vielzahl von Handelsprotokollen und Ausführungslösungen. Mit einem wachsenden Netzwerk von Benutzern ging Trumids Team für KI und Datenstrategie eine Partnerschaft mit dem ein AWS Machine Learning Solutions Lab. Das Ziel war die Entwicklung von ML-Systemen, die ein personalisierteres Handelserlebnis bieten könnten, indem sie das Interesse und die Präferenzen der Benutzer für auf Trumid verfügbare Anleihen modellieren.

Diese ML-Modelle können verwendet werden, um die Zeit bis zur Einsicht und zum Handeln zu verkürzen, indem die Art und Weise, wie Informationen jedem Benutzer angezeigt werden, personalisiert wird, um sicherzustellen, dass die relevantesten und umsetzbarsten Informationen, die einem Händler wichtig sein könnten, priorisiert und zugänglich sind.

Um diese Herausforderung zu lösen, haben Trumid und das ML Solutions Lab einen End-to-End-Datenvorbereitungs-, Modelltrainings- und Inferenzprozess entwickelt, der auf einem tiefen neuronalen Netzwerkmodell basiert, das mit der Deep Graph Library for Knowledge Embedding erstellt wurde (DGL-KE). Eine End-to-End-Lösung mit Amazon Sage Maker wurde auch eingesetzt.

Vorteile des maschinellen Lernens von Graphen

Daten aus der realen Welt sind komplex und miteinander verbunden und enthalten häufig Netzwerkstrukturen. Beispiele sind Moleküle in der Natur, soziale Netzwerke, das Internet, Straßen und Finanzhandelsplattformen.

Diagramme bieten eine natürliche Möglichkeit, diese Komplexität zu modellieren, indem sie wichtige und reichhaltige Informationen extrahieren, die in die Beziehungen zwischen Entitäten eingebettet sind.

Herkömmliche ML-Algorithmen erfordern, dass Daten als Tabellen oder Sequenzen organisiert werden. Dies funktioniert im Allgemeinen gut, aber einige Domänen werden natürlicher und effektiver durch Diagramme dargestellt (z. B. ein Netzwerk von Objekten, die miteinander in Beziehung stehen, wie später in diesem Beitrag veranschaulicht). Anstatt diese Diagrammdatensätze in Tabellen oder Sequenzen zu zwingen, können Sie Diagramm-ML-Algorithmen verwenden, um die Daten in ihrer Diagrammform darzustellen und daraus zu lernen, einschließlich Informationen über konstituierende Knoten, Kanten und andere Merkmale.

In Anbetracht der Tatsache, dass der Handel mit Anleihen von Natur aus ein Netzwerk von Interaktionen zwischen Käufern und Verkäufern darstellt, an denen verschiedene Arten von Anleiheinstrumenten beteiligt sind, muss eine effektive Lösung die Netzwerkeffekte der am Markt teilnehmenden Händlergemeinschaften nutzen. Schauen wir uns an, wie wir die Handelsnetzwerkeffekte genutzt und diese Vision hier umgesetzt haben.

Lösung

Der Handel mit Anleihen ist durch mehrere Faktoren gekennzeichnet, darunter Handelsgröße, Laufzeit, Emittent, Kurs, Kuponwerte, Geld-/Briefkurs und Art des beteiligten Handelsprotokolls. Neben Orders und Trades erfasst Trumid auch „Indications of Interest“ (IOIs). Die historischen Interaktionsdaten verkörpern das Handelsverhalten und die sich im Laufe der Zeit entwickelnden Marktbedingungen. Wir haben diese Daten verwendet, um ein Diagramm mit zeitgestempelten Interaktionen zwischen Händlern, Anleihen und Emittenten zu erstellen, und haben Graph ML verwendet, um zukünftige Interaktionen vorherzusagen.

Die Empfehlungslösung umfasste vier Hauptschritte:

  • Aufbereitung der Handelsdaten als Grafikdatensatz
  • Trainieren eines Modells zum Einbetten von Wissensgraphen
  • Vorhersage neuer Trades
  • Verpacken der Lösung als skalierbarer Workflow

In den folgenden Abschnitten besprechen wir jeden Schritt im Detail.

Aufbereitung der Handelsdaten als Grafikdatensatz

Es gibt viele Möglichkeiten, Handelsdaten als Diagramm darzustellen. Eine Möglichkeit besteht darin, die Daten vollständig mit Knoten, Kanten und Eigenschaften darzustellen: Händler als Knoten mit Eigenschaften (z. B. Arbeitgeber oder Amtszeit), Anleihen als Knoten mit Eigenschaften (Emittent, ausstehender Betrag, Laufzeit, Kurs, Kuponwert) und Trades als Kanten mit Eigenschaften (Datum, Typ, Größe). Eine andere Möglichkeit besteht darin, die Daten zu vereinfachen und nur Knoten und Beziehungen zu verwenden (Beziehungen sind typisierte Kanten wie gehandelt oder ausgestellt von). Dieser letztere Ansatz funktionierte in unserem Fall besser, und wir verwendeten den in der folgenden Abbildung dargestellten Graphen.

Diagramm der Beziehungen zwischen Händlern, Anleihen und Anleiheemittenten

Darüber hinaus haben wir einige der als veraltet angesehenen Kanten entfernt: Wenn ein Händler mit mehr als 100 verschiedenen Anleihen interagiert hat, haben wir nur die letzten 100 Anleihen behalten.

Schließlich haben wir den Diagrammdatensatz als Liste von Kanten gespeichert TSV Format:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

Trainieren eines Modells zum Einbetten von Wissensgraphen

Für Graphen, die nur aus Knoten und Beziehungen bestehen (häufig als Wissensgraphen bezeichnet), hat das DGL-Team das Framework zum Einbetten von Wissensgraphen entwickelt DGL-KE. KE steht für Knowledge Embedding, wobei die Idee darin besteht, Knoten und Relationen (Wissen) durch Koordinaten (Embeddings) darzustellen und die Koordinaten so zu optimieren (trainieren), dass aus den Koordinaten die ursprüngliche Graphenstruktur wiederhergestellt werden kann. In der Liste der verfügbaren Einbettungsmodelle haben wir TransE (translationale Einbettungen) ausgewählt. TransE trainiert Einbettungen mit dem Ziel, die folgende Gleichheit anzunähern:

Quellknoteneinbettung + Beziehungseinbettung = Zielknoteneinbettung (1)

Wir haben das Modell trainiert, indem wir die aufgerufen haben dglke_train Befehl. Das Ergebnis des Trainings ist ein Modellordner, der die trainierten Einbettungen enthält.

Weitere Einzelheiten zu TransE finden Sie unter Übersetzen von Einbettungen zur Modellierung multirelationaler Daten.

Vorhersage neuer Trades

Um neue Trades von einem Trader mit unserem Modell vorherzusagen, haben wir die Gleichheit (1) verwendet: Addieren Sie die Trader-Einbettung zur Trade-Recent-Einbettung und suchten nach Anleihen, die der resultierenden Einbettung am nächsten liegen.

Das haben wir in zwei Schritten gemacht:

  1. Berechnen Sie die Punktzahlen für alle möglichen Handelsbeziehungen mit dglke_predict.
  2. Berechnen Sie die 100 höchsten Punktzahlen für jeden Trader.

Detaillierte Anweisungen zur Verwendung des DGL-KE finden Sie unter Schulung von Einbettungen von Wissensgraphen in großem Maßstab mit der Deep Graph Library und DGL-KE Dokumentation.

Verpacken der Lösung als skalierbarer Workflow

Wir haben SageMaker-Notebooks verwendet, um unseren Code zu entwickeln und zu debuggen. Für die Produktion wollten wir das Modell als einfachen API-Aufruf aufrufen. Wir stellten fest, dass wir die Datenvorbereitung, das Modelltraining und die Vorhersage nicht trennen mussten, und es war praktisch, die gesamte Pipeline in einem einzigen Skript zu packen und die SageMaker-Verarbeitung zu verwenden. Die SageMaker-Verarbeitung ermöglicht es Ihnen, ein Skript remote auf einem ausgewählten Instance-Typ und Docker-Image auszuführen, ohne sich um Ressourcenzuweisung und Datenübertragung kümmern zu müssen. Dies war für uns einfach und kostengünstig, da die GPU-Instanz nur während der 15 Minuten verwendet und bezahlt wird, die für die Ausführung des Skripts benötigt werden.

Ausführliche Anweisungen zur Verwendung der SageMaker-Verarbeitung finden Sie unter Amazon SageMaker Processing - Vollständig verwaltete Datenverarbeitung und Modellbewertung und In Bearbeitung.

Die Ergebnisse

Unser benutzerdefiniertes Diagrammmodell hat im Vergleich zu anderen Methoden sehr gut abgeschnitten: Die Leistung wurde um 80 % verbessert, mit stabileren Ergebnissen bei allen Händlertypen. Wir haben die Leistung anhand des mittleren Rückrufs gemessen (Prozentsatz der vom Empfehler vorhergesagten tatsächlichen Trades, gemittelt über alle Trader). Bei anderen Standardmetriken lag die Verbesserung zwischen 50 und 130 %.

Diese Leistung ermöglichte es uns, Trader und Anleihen besser aufeinander abzustimmen, was auf eine verbesserte Trader-Erfahrung innerhalb des Modells hinweist, wobei maschinelles Lernen einen großen Schritt nach vorn gegenüber hartcodierten Regeln bedeutet, die schwierig zu skalieren sein können.

Zusammenfassung

Trumid konzentriert sich auf die Bereitstellung innovativer Produkte und effizienterer Arbeitsabläufe für seine Benutzergemeinschaft. Der Aufbau des Kredithandelsnetzwerks von morgen erfordert eine kontinuierliche Zusammenarbeit mit Kollegen und Branchenexperten wie dem AWS ML Solutions Lab, das darauf ausgelegt ist, Sie bei schnelleren Innovationen zu unterstützen.

Weitere Informationen finden Sie in den folgenden Ressourcen:


Über die Autoren

Entwicklung fortschrittlicher maschineller Lernsysteme bei Trumid mit der Deep Graph Library for Knowledge Embedding PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Marc van Oudheusden ist Senior Data Scientist im Amazon ML Solutions Lab-Team bei Amazon Web Services. Er arbeitet mit AWS-Kunden zusammen, um Geschäftsprobleme mit künstlicher Intelligenz und maschinellem Lernen zu lösen. Außerhalb der Arbeit findet man ihn vielleicht am Strand, beim Spielen mit seinen Kindern, beim Surfen oder Kitesurfen.

Entwicklung fortschrittlicher maschineller Lernsysteme bei Trumid mit der Deep Graph Library for Knowledge Embedding PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Mutisya Ndunda ist Head of Data Strategy and AI bei Trumid. Er ist ein erfahrener Finanzexperte mit über 20 Jahren umfassender institutioneller Erfahrung in den Bereichen Kapitalmärkte, Handel und Finanztechnologie. Mutisya verfügt über einen starken quantitativen und analytischen Hintergrund mit über einem Jahrzehnt Erfahrung in den Bereichen künstliche Intelligenz, maschinelles Lernen und Big-Data-Analyse. Vor Trumid war er CEO von Alpha Vertex, einem Finanztechnologieunternehmen, das Finanzinstituten Analyselösungen anbietet, die auf proprietären KI-Algorithmen basieren. Mutisya hat einen Bachelor-Abschluss in Elektrotechnik von der Cornell University und einen Master-Abschluss in Financial Engineering von der Cornell University.

Entwicklung fortschrittlicher maschineller Lernsysteme bei Trumid mit der Deep Graph Library for Knowledge Embedding PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Isaak Privitera ist Senior Data Scientist im Amazon Machine Learning Solutions Lab, wo er maßgeschneiderte maschinelle Lern- und Deep-Learning-Lösungen entwickelt, um die Geschäftsprobleme von Kunden anzugehen. Er arbeitet hauptsächlich im Bereich Computer Vision und konzentriert sich darauf, AWS-Kunden verteiltes Training und aktives Lernen zu ermöglichen.

Zeitstempel:

Mehr von AWS Maschinelles Lernen