Ανάπτυξη προηγμένων συστημάτων μηχανικής μάθησης στο Trumid με τη Βιβλιοθήκη Deep Graph για ενσωμάτωση γνώσης της νοημοσύνης δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Ανάπτυξη προηγμένων συστημάτων μηχανικής εκμάθησης στο Trumid με τη Βιβλιοθήκη Deep Graph for Knowledge Embedding

Αυτό είναι ένα guest post που συντάχθηκε με τον Mutisya Ndunda από το Trumid.

Όπως πολλοί κλάδοι, η αγορά εταιρικών ομολόγων δεν προσφέρεται για μια προσέγγιση που ταιριάζει σε όλους. Είναι τεράστιο, η ρευστότητα είναι κατακερματισμένη και οι θεσμικοί πελάτες απαιτούν λύσεις προσαρμοσμένες στις συγκεκριμένες ανάγκες τους. Οι εξελίξεις στην τεχνητή νοημοσύνη και τη μηχανική μάθηση (ML) μπορούν να χρησιμοποιηθούν για τη βελτίωση της εμπειρίας του πελάτη, την αύξηση της αποτελεσματικότητας και την ακρίβεια των λειτουργικών ροών εργασίας και τη βελτίωση της απόδοσης υποστηρίζοντας πολλαπλές πτυχές της διαδικασίας συναλλαγών.

Τρούμιντ είναι μια εταιρεία χρηματοοικονομικής τεχνολογίας που δημιουργεί το αυριανό δίκτυο συναλλαγών πιστώσεων—μια αγορά για αποτελεσματικές συναλλαγές, διάδοση πληροφοριών και εκτέλεση μεταξύ των συμμετεχόντων στην αγορά εταιρικών ομολόγων. Η Trumid βελτιστοποιεί την εμπειρία συναλλαγών πιστώσεων συνδυάζοντας αρχές σχεδιασμού προϊόντων αιχμής και τεχνολογίας με βαθιά τεχνογνωσία στην αγορά. Το αποτέλεσμα είναι μια ολοκληρωμένη λύση συναλλαγών που παρέχει ένα πλήρες οικοσύστημα πρωτοκόλλων και εργαλείων εκτέλεσης σε μια διαισθητική πλατφόρμα.

Η αγορά συναλλαγών ομολόγων περιλαμβάνει παραδοσιακά διαδικασίες αντιστοίχισης αγοραστών/πωλητών εκτός σύνδεσης με τη βοήθεια τεχνολογίας που βασίζεται σε κανόνες. Ο Trumid έχει ξεκινήσει μια πρωτοβουλία για να μεταμορφώσει αυτή την εμπειρία. Μέσω της ηλεκτρονικής πλατφόρμας συναλλαγών του, οι έμποροι μπορούν να έχουν πρόσβαση σε χιλιάδες ομόλογα για αγορά ή πώληση, σε μια κοινότητα αφοσιωμένων χρηστών για αλληλεπίδραση και σε μια ποικιλία πρωτοκόλλων συναλλαγών και λύσεων εκτέλεσης. Με ένα διευρυνόμενο δίκτυο χρηστών, η ομάδα AI και Data Strategy του Trumid συνεργάστηκε με το AWS Machine Learning Solutions Lab. Ο στόχος ήταν να αναπτυχθούν συστήματα ML που θα μπορούσαν να προσφέρουν μια πιο εξατομικευμένη εμπειρία συναλλαγών διαμορφώνοντας το ενδιαφέρον και τις προτιμήσεις των χρηστών για ομόλογα διαθέσιμα στο Trumid.

Αυτά τα μοντέλα ML μπορούν να χρησιμοποιηθούν για την επιτάχυνση του χρόνου για τη γνώση και τη δράση, εξατομικεύοντας τον τρόπο εμφάνισης των πληροφοριών σε κάθε χρήστη, ώστε να διασφαλίζεται ότι οι πιο σχετικές και εφαρμόσιμες πληροφορίες για τις οποίες μπορεί να ενδιαφέρονται οι έμποροι έχουν προτεραιότητα και είναι προσβάσιμες.

Για να λύσουν αυτήν την πρόκληση, ο Trumid και το ML Solutions Lab ανέπτυξαν μια ολοκληρωμένη προετοιμασία δεδομένων, εκπαίδευση μοντέλων και διαδικασία εξαγωγής συμπερασμάτων που βασίζεται σε ένα μοντέλο βαθιάς νευρωνικού δικτύου που δημιουργήθηκε χρησιμοποιώντας τη Βιβλιοθήκη Deep Graph για Ενσωμάτωση Γνώσης (ΔΓΛ-ΚΕ). Μια λύση από άκρο σε άκρο με Amazon Sage Maker αναπτύχθηκε επίσης.

Οφέλη της μηχανικής εκμάθησης γραφημάτων

Τα δεδομένα του πραγματικού κόσμου είναι πολύπλοκα και διασυνδεδεμένα και συχνά περιέχουν δομές δικτύου. Παραδείγματα περιλαμβάνουν μόρια στη φύση, κοινωνικά δίκτυα, διαδίκτυο, δρόμους και πλατφόρμες χρηματοοικονομικών συναλλαγών.

Τα γραφήματα παρέχουν έναν φυσικό τρόπο μοντελοποίησης αυτής της πολυπλοκότητας εξάγοντας σημαντικές και πλούσιες πληροφορίες που είναι ενσωματωμένες στις σχέσεις μεταξύ οντοτήτων.

Οι παραδοσιακοί αλγόριθμοι ML απαιτούν τα δεδομένα να οργανωθούν ως πίνακες ή σειρές. Αυτό γενικά λειτουργεί καλά, αλλά ορισμένοι τομείς αντιπροσωπεύονται πιο φυσικά και αποτελεσματικά από γραφήματα (όπως ένα δίκτυο αντικειμένων που σχετίζονται μεταξύ τους, όπως φαίνεται παρακάτω σε αυτήν την ανάρτηση). Αντί να εξαναγκάζετε αυτά τα σύνολα δεδομένων γραφημάτων σε πίνακες ή ακολουθίες, μπορείτε να χρησιμοποιήσετε αλγόριθμους ML γραφημάτων για να αναπαραστήσετε και να μάθετε από τα δεδομένα όπως παρουσιάζονται στη μορφή γραφήματος, συμπεριλαμβανομένων πληροφοριών σχετικά με τους κόμβους, τις ακμές και άλλα χαρακτηριστικά.

Λαμβάνοντας υπόψη ότι η διαπραγμάτευση ομολόγων αντιπροσωπεύεται εγγενώς ως ένα δίκτυο αλληλεπιδράσεων μεταξύ αγοραστών και πωλητών που περιλαμβάνει διάφορους τύπους ομολογιακών μέσων, χρειάζεται μια αποτελεσματική λύση για την αξιοποίηση των επιπτώσεων του δικτύου των κοινοτήτων εμπόρων που συμμετέχουν στην αγορά. Ας δούμε πώς αξιοποιήσαμε τα αποτελέσματα του δικτύου συναλλαγών και εφαρμόσαμε αυτό το όραμα εδώ.

Λύση

Η διαπραγμάτευση ομολόγων χαρακτηρίζεται από διάφορους παράγοντες, όπως το μέγεθος της συναλλαγής, η διάρκεια, ο εκδότης, το επιτόκιο, οι αξίες κουπονιών, η προσφορά προσφοράς/ζήτησης και ο τύπος του εμπλεκόμενου πρωτοκόλλου συναλλαγών. Εκτός από τις παραγγελίες και τις συναλλαγές, το Trumid συλλαμβάνει επίσης «ενδείξεις ενδιαφέροντος» (IOIs). Τα ιστορικά δεδομένα αλληλεπίδρασης ενσωματώνουν τη συναλλακτική συμπεριφορά και τις συνθήκες της αγοράς που εξελίσσονται με την πάροδο του χρόνου. Χρησιμοποιήσαμε αυτά τα δεδομένα για να δημιουργήσουμε ένα γράφημα των αλληλεπιδράσεων με χρονική σήμανση μεταξύ εμπόρων, ομολόγων και εκδοτών και χρησιμοποιήσαμε το γράφημα ML για να προβλέψουμε μελλοντικές αλληλεπιδράσεις.

Η λύση σύστασης περιλάμβανε τέσσερα κύρια βήματα:

  • Προετοιμασία των δεδομένων συναλλαγών ως σύνολο δεδομένων γραφήματος
  • Εκπαίδευση ενός μοντέλου ενσωμάτωσης γραφήματος γνώσης
  • Πρόβλεψη νέων συναλλαγών
  • Συσκευασία της λύσης ως επεκτάσιμη ροή εργασίας

Στις επόμενες ενότητες, θα συζητήσουμε κάθε βήμα με περισσότερες λεπτομέρειες.

Προετοιμασία των δεδομένων συναλλαγών ως σύνολο δεδομένων γραφήματος

Υπάρχουν πολλοί τρόποι για να αναπαραστήσετε τα δεδομένα συναλλαγών ως γράφημα. Μια επιλογή είναι να αναπαραστήσετε τα δεδομένα εξαντλητικά με κόμβους, ακμές και ιδιότητες: έμποροι ως κόμβοι με ιδιότητες (όπως εργοδότης ή θητεία), ομόλογα ως κόμβοι με ιδιότητες (εκδότης, εκκρεμές ποσό, λήξη, επιτόκιο, αξία κουπονιού) και συναλλαγές ως ακμές με ιδιότητες (ημερομηνία, τύπος, μέγεθος). Μια άλλη επιλογή είναι να απλοποιήσετε τα δεδομένα και να χρησιμοποιήσετε μόνο κόμβους και σχέσεις (οι σχέσεις είναι πληκτρολογημένες ακμές όπως διαπραγματεύονται ή εκδίδονται από). Αυτή η τελευταία προσέγγιση λειτούργησε καλύτερα στην περίπτωσή μας και χρησιμοποιήσαμε το γράφημα που απεικονίζεται στο παρακάτω σχήμα.

Γράφημα σχέσεων μεταξύ εμπόρων, ομολόγων και εκδοτών ομολόγων

Επιπλέον, αφαιρέσαμε ορισμένα από τα άκρα που θεωρούνται απαρχαιωμένα: εάν ένας έμπορος αλληλεπιδρούσε με περισσότερα από 100 διαφορετικά ομόλογα, κρατούσαμε μόνο τα τελευταία 100 ομόλογα.

Τέλος, αποθηκεύσαμε το σύνολο δεδομένων γραφήματος ως λίστα ακμών TSV μορφή:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

Εκπαίδευση ενός μοντέλου ενσωμάτωσης γραφήματος γνώσης

Για γραφήματα που αποτελούνται μόνο από κόμβους και σχέσεις (συχνά ονομάζονται γραφήματα γνώσης), η ομάδα DGL ανέπτυξε το πλαίσιο ενσωμάτωσης γραφημάτων γνώσης ΔΓΛ-ΚΕ. Το KE σημαίνει ενσωμάτωση γνώσης, με την ιδέα να αναπαραστήσουμε κόμβους και σχέσεις (γνώση) με συντεταγμένες (ενσωματώσεις) και να βελτιστοποιήσουμε (εκπαιδεύσουμε) τις συντεταγμένες έτσι ώστε η αρχική δομή του γραφήματος να μπορεί να ανακτηθεί από τις συντεταγμένες. Στη λίστα με τα διαθέσιμα μοντέλα ενσωμάτωσης, επιλέξαμε TransE (μεταφραστικές ενσωματώσεις). Η TransE εκτελεί ενσωματώσεις αμαξοστοιχιών με στόχο την προσέγγιση της ακόλουθης ισότητας:

Ενσωμάτωση κόμβου πηγής + ενσωμάτωση σχέσης = ενσωμάτωση κόμβου προορισμού (1)

Εκπαιδεύσαμε το μοντέλο επικαλούμενοι το dglke_train εντολή. Το αποτέλεσμα της εκπαίδευσης είναι ένας φάκελος μοντέλου που περιέχει τις εκπαιδευμένες ενσωματώσεις.

Για περισσότερες λεπτομέρειες σχετικά με το TransE, ανατρέξτε στο Μετάφραση Ενσωματώσεων για Μοντελοποίηση Πολυσχεσιακών Δεδομένων.

Πρόβλεψη νέων συναλλαγών

Για να προβλέψουμε νέες συναλλαγές από έναν έμπορο με το μοντέλο μας, χρησιμοποιήσαμε την ισότητα (1): προσθέστε την ενσωμάτωση του trader στην πρόσφατη ενσωμάτωση συναλλαγών και αναζητήσαμε ομόλογα πιο κοντά στην προκύπτουσα ενσωμάτωση.

Αυτό το κάναμε σε δύο βήματα:

  1. Υπολογίστε τις βαθμολογίες για όλες τις πιθανές εμπορικές-πρόσφατες σχέσεις με dglke_predict.
  2. Υπολογίστε τις κορυφαίες 100 υψηλότερες βαθμολογίες για κάθε έμπορο.

Για λεπτομερείς οδηγίες σχετικά με τον τρόπο χρήσης του DGL-KE, ανατρέξτε στο Εκπαίδευση ενσωματώσεων γραφημάτων γνώσης σε κλίμακα με τη Βιβλιοθήκη Deep Graph και Τεκμηρίωση DGL-KE.

Συσκευασία της λύσης ως επεκτάσιμη ροή εργασίας

Χρησιμοποιήσαμε σημειωματάρια SageMaker για την ανάπτυξη και τον εντοπισμό σφαλμάτων του κώδικά μας. Για την παραγωγή, θέλαμε να επικαλεστούμε το μοντέλο ως μια απλή κλήση API. Διαπιστώσαμε ότι δεν χρειαζόταν να διαχωρίσουμε την προετοιμασία δεδομένων, την εκπαίδευση μοντέλων και την πρόβλεψη και ήταν βολικό να συσκευάσουμε ολόκληρη τη διοχέτευση ως ένα ενιαίο σενάριο και να χρησιμοποιήσουμε την επεξεργασία του SageMaker. Η επεξεργασία του SageMaker σάς επιτρέπει να εκτελείτε ένα σενάριο εξ αποστάσεως σε επιλεγμένο τύπο παρουσίας και εικόνα Docker χωρίς να χρειάζεται να ανησυχείτε για την κατανομή πόρων και τη μεταφορά δεδομένων. Αυτό ήταν απλό και οικονομικά αποδοτικό για εμάς, επειδή η παρουσία της GPU χρησιμοποιείται και πληρώνεται μόνο κατά τη διάρκεια των 15 λεπτών που απαιτούνται για την εκτέλεση του σεναρίου.

Για λεπτομερείς οδηγίες σχετικά με τον τρόπο χρήσης της επεξεργασίας SageMaker, βλ Επεξεργασία Amazon SageMaker - Πλήρως διαχειριζόμενη επεξεργασία δεδομένων και αξιολόγηση μοντέλου και Επεξεργασία.

Αποτελέσματα

Το προσαρμοσμένο μοντέλο γραφημάτων μας απέδωσε πολύ καλά σε σύγκριση με άλλες μεθόδους: η απόδοση βελτιώθηκε κατά 80%, με πιο σταθερά αποτελέσματα σε όλους τους τύπους εμπόρου. Μετρήσαμε την απόδοση μέσω της μέσης ανάκλησης (ποσοστό των πραγματικών συναλλαγών που προβλέπει ο εισηγητής, ο μέσος όρος όλων των εμπόρων). Με άλλες τυπικές μετρήσεις, η βελτίωση κυμάνθηκε από 50–130%.

Αυτή η απόδοση μας επέτρεψε να ταιριάξουμε καλύτερα τους εμπόρους και τα ομόλογα, υποδεικνύοντας μια βελτιωμένη εμπειρία εμπόρου στο μοντέλο, με τη μηχανική εκμάθηση να προσφέρει ένα μεγάλο βήμα μπροστά από τους αυστηρούς κωδικοποιημένους κανόνες, που μπορεί να είναι δύσκολο να κλιμακωθούν.

Συμπέρασμα

Η Trumid επικεντρώνεται στην παροχή καινοτόμων προϊόντων και αποδοτικότητας ροής εργασιών στην κοινότητα των χρηστών της. Η δημιουργία του αυριανού δικτύου συναλλαγών πιστώσεων απαιτεί συνεχή συνεργασία με ομοτίμους και ειδικούς του κλάδου, όπως το AWS ML Solutions Lab, που έχει σχεδιαστεί για να σας βοηθά να καινοτομείτε πιο γρήγορα.

Για περισσότερες πληροφορίες, ανατρέξτε στους ακόλουθους πόρους:


Σχετικά με τους συγγραφείς

Ανάπτυξη προηγμένων συστημάτων μηχανικής μάθησης στο Trumid με τη Βιβλιοθήκη Deep Graph για ενσωμάτωση γνώσης της νοημοσύνης δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Marc van Oudheusden είναι Ανώτερος Επιστήμονας Δεδομένων με την ομάδα του Amazon ML Solutions Lab στο Amazon Web Services. Συνεργάζεται με πελάτες AWS για την επίλυση επιχειρηματικών προβλημάτων με την τεχνητή νοημοσύνη και τη μηχανική μάθηση. Εκτός δουλειάς μπορεί να τον βρείτε στην παραλία, να παίζει με τα παιδιά του, να κάνει σερφ ή kitesurf.

Ανάπτυξη προηγμένων συστημάτων μηχανικής μάθησης στο Trumid με τη Βιβλιοθήκη Deep Graph για ενσωμάτωση γνώσης της νοημοσύνης δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Mutisya Ndunda είναι ο επικεφαλής της στρατηγικής δεδομένων και της τεχνητής νοημοσύνης στην Trumid. Είναι έμπειρος χρηματοοικονομικός επαγγελματίας με πάνω από 20 χρόνια ευρείας θεσμικής εμπειρίας στις κεφαλαιαγορές, τις συναλλαγές και τη χρηματοοικονομική τεχνολογία. Η Mutisya έχει ισχυρό ποσοτικό και αναλυτικό υπόβαθρο με πάνω από μια δεκαετία εμπειρία στην τεχνητή νοημοσύνη, τη μηχανική μάθηση και την ανάλυση μεγάλων δεδομένων. Πριν από τον Trumid, ήταν Διευθύνων Σύμβουλος της Alpha Vertex, μιας εταιρείας χρηματοοικονομικής τεχνολογίας που προσφέρει αναλυτικές λύσεις με ιδιόκτητους αλγόριθμους AI σε χρηματοπιστωτικά ιδρύματα. Ο Mutisya είναι κάτοχος πτυχίου Ηλεκτρολόγου Μηχανικού από το Πανεπιστήμιο Cornell και μεταπτυχιακού τίτλου στη Χρηματοοικονομική Μηχανική από το Πανεπιστήμιο Cornell.

Ανάπτυξη προηγμένων συστημάτων μηχανικής μάθησης στο Trumid με τη Βιβλιοθήκη Deep Graph για ενσωμάτωση γνώσης της νοημοσύνης δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Ισαάκ Πριβιτέρα είναι Senior Data Scientist στο Amazon Machine Learning Solutions Lab, όπου αναπτύσσει εξατομικευμένες λύσεις μηχανικής μάθησης και βαθιάς μάθησης για την αντιμετώπιση των επιχειρηματικών προβλημάτων των πελατών. Εργάζεται κυρίως στον χώρο της υπολογιστικής όρασης, εστιάζοντας στο να παρέχει στους πελάτες AWS κατανεμημένη εκπαίδευση και ενεργή μάθηση.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS