Developing Advanced Machine Learning Systems At Trumid With The Deep Graph Library For Knowledge Embedding

Taasavaldanud Platon

järgijaid: 0

See on külalispostitus, mis on kirjutatud koos Trumidi Mutisya Ndundaga.

Nagu paljudes tööstusharudes, ei sobi ka ettevõtete võlakirjade turg kõigile ühele lähenemisviisile. See on suur, likviidsus on killustatud ja institutsionaalsed kliendid nõuavad nende konkreetsetele vajadustele kohandatud lahendusi. Tehisintellekti ja masinõppe (ML) edusamme saab kasutada kliendikogemuse parandamiseks, töövoogude tõhususe ja täpsuse suurendamiseks ning jõudluse parandamiseks, toetades kauplemisprotsessi mitmeid aspekte.

Trumid on finantstehnoloogia ettevõte, mis loob homse krediidikaubanduse võrgustiku – turuplatsi tõhusaks kauplemiseks, teabe levitamiseks ja elluviimiseks ettevõtete võlakirjade turuosaliste vahel. Trumid optimeerib krediidiga kauplemise kogemust, ühendades tipptasemel tootedisaini ja tehnoloogia põhimõtted sügava turuteadmistega. Tulemuseks on integreeritud kauplemislahendus, mis pakub ühes intuitiivses platvormis täielikku protokollide ja täitmistööriistade ökosüsteemi.

Võlakirjade kauplemisturg on traditsiooniliselt hõlmanud võrguühenduseta ostja/müüja sobitamise protsesse, mida aitab reeglitel põhinev tehnoloogia. Trumid on algatanud selle kogemuse muutmise algatuse. Selle elektroonilise kauplemisplatvormi kaudu saavad kauplejad juurdepääsu tuhandetele võlakirjadele ostmiseks või müümiseks, kaasatud kasutajate kogukonnale, kellega suhelda, ning mitmesugustele kauplemisprotokollidele ja täitmislahendustele. Laieneva kasutajavõrgustikuga tegi Trumidi AI ja andmestrateegia meeskond koostööd AWS-i masinõppelahenduste labor. Eesmärk oli arendada ML-süsteeme, mis võiksid pakkuda isikupärasemat kauplemiskogemust, modelleerides kasutajate huvisid ja eelistusi Trumidis saadaolevate võlakirjade vastu.

Neid ML-mudeleid saab kasutada ülevaate saamiseks ja tegutsemiseks kuluva aja kiirendamiseks, isikupärastades, kuidas teavet igale kasutajale kuvatakse, et tagada kõige asjakohasem ja otstarbekam teave, millest kaupleja võib hoolida, prioriteediks ja juurdepääsetavaks.

Selle väljakutse lahendamiseks töötasid Trumid ja ML Solutions Lab välja täieliku andmete ettevalmistamise, mudeli koolituse ja järeldusprotsessi, mis põhines sügaval närvivõrgu mudelil, mis on loodud teadmiste kinnistamise jaoks mõeldud Deep Graph raamatukogu (DGL-KE). Täielik lahendus koos Amazon SageMaker samuti kasutusele võeti.

Graafikmasinõppe eelised

Reaalmaailma andmed on keerulised ja omavahel seotud ning sisaldavad sageli võrgustruktuure. Näited hõlmavad molekule looduses, sotsiaalseid võrgustikke, Internetti, teid ja finantskauplemisplatvorme.

Graafikud pakuvad loomulikku viisi selle keerukuse modelleerimiseks, eraldades olulise ja rikkaliku teabe, mis on põimitud üksustevahelistesse suhetesse.

Traditsioonilised ML-algoritmid nõuavad andmete korrastamist tabelite või jadadena. See toimib üldiselt hästi, kuid mõned domeenid on loomulikumalt ja tõhusamalt esindatud graafikutega (nt üksteisega seotud objektide võrgustik, nagu on illustreeritud selles postituses hiljem). Selle asemel, et neid graafiku andmekogumeid tabeliteks või jadadeks sundida, saate kasutada graafiku ML-algoritme, et nii graafiku kujul esitatud andmeid esitada kui ka neist õppida, sealhulgas teavet koostisosade sõlmede, servade ja muude funktsioonide kohta.

Arvestades, et võlakirjadega kauplemine on oma olemuselt kujutatud ostjate ja müüjate vahelise suhtluse võrgustikuna, mis hõlmab erinevat tüüpi võlakirjainstrumente, peab tõhusa lahenduse leidmiseks kasutama turul osalevate kauplejate kogukondade võrguefekte. Vaatame, kuidas me kasutasime kauplemisvõrgustiku mõjusid ja rakendasime seda visiooni siin.

Lahendus

Võlakirjadega kauplemist iseloomustavad mitmed tegurid, sealhulgas tehingu suurus, tähtaeg, emitent, määr, kupongi väärtused, ostu- ja müügipakkumine ning kaasatud kauplemisprotokolli tüüp. Lisaks tellimustele ja tehingutele jäädvustab Trumid ka "huvimärke" (IOI). Ajaloolised interaktsiooniandmed hõlmavad kauplemiskäitumist ja aja jooksul muutuvaid turutingimusi. Kasutasime neid andmeid kauplejate, võlakirjade ja emitentide vaheliste ajatempliga interaktsioonide graafiku koostamiseks ning kasutasime graafiku ML tulevaste interaktsioonide ennustamiseks.

Soovituslahendus koosnes neljast peamisest etapist:

Kauplemisandmete ettevalmistamine graafiku andmekogumina
Teadmiste graafiku manustamismudeli koolitamine
Uute tehingute ennustamine
Lahenduse pakkimine skaleeritava töövoona

Järgmistes osades käsitleme iga sammu üksikasjalikumalt.

Kauplemisandmete ettevalmistamine graafiku andmekogumina

Kauplemisandmete esitamiseks graafikuna on palju võimalusi. Üks võimalus on esitada andmed ammendavalt sõlmede, servade ja omadustega: kauplejad omadustega sõlmedena (nt tööandja või kehtivusaeg), võlakirjad omadustega sõlmedena (emitent, tasumata summa, tähtaeg, määr, kupongi väärtus) ja tehingud omadustega (kuupäev, tüüp, suurus) servadena. Teine võimalus on andmete lihtsustamine ja ainult sõlmede ja seoste kasutamine (relatsioonid on trükitud servad, nagu kaubeldavad või emiteeritud). Viimane lähenemisviis toimis meie puhul paremini ja kasutasime järgmisel joonisel kujutatud graafikut.

Kauplejate, võlakirjade ja võlakirjade emitentide vaheliste suhete graafik

Lisaks eemaldasime mõned vananenuks peetud servad: kui kaupleja suhtles rohkem kui 100 erineva võlakirjaga, jätsime alles ainult viimased 100 võlakirja.

Lõpuks salvestasime graafiku andmestiku servade loendina TSV formaat:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

Teadmiste graafiku manustamismudeli koolitamine

Ainult sõlmedest ja suhetest koosnevate graafikute jaoks (mida sageli nimetatakse teadmiste graafikuteks) töötas DGL-i meeskond välja teadmiste graafiku manustamise raamistiku DGL-KE. KE tähistab teadmiste kinnistamist, mille idee on esindada sõlmpunkte ja seoseid (teadmisi) koordinaatide abil (sisseehitamine) ja optimeerida (treenida) koordinaate, et koordinaatidest saaks taastada algse graafiku struktuuri. Saadaolevate manustamismudelite loendist valisime TransE (translational embeddings). TransE koolitab manuseid eesmärgiga lähendada järgmist võrdsust:

Lähtesõlme manustamine + seose manustamine = sihtsõlme manustamine (1)

Koolitasime mudelit, kutsudes esile dglke_train käsk. Koolituse väljundiks on mudelkaust, mis sisaldab treenitud manuseid.

TransE kohta lisateabe saamiseks vaadake Manustuste tõlkimine mitme relatsiooniga andmete modelleerimiseks.

Uute tehingute ennustamine

Meie mudeliga kaupleja uute tehingute ennustamiseks kasutasime võrdsust (1): lisage kaupleja manustatud hiljutisele tehingule ja otsisime saadud manustamisele kõige lähemal olevaid võlakirju.

Tegime seda kahes etapis:

Arvutage hinded kõigi võimalike hiljutiste kaubandussuhete kohta dglke_predict.
Arvutage iga kaupleja 100 parimat tulemust.

Üksikasjalikud juhised DGL-KE kasutamise kohta leiate aadressilt Teadmiste graafikute manustamise koolitus Deep Graph Library abil ja DGL-KE dokumentatsioon.

Lahenduse pakkimine skaleeritava töövoona

Kasutasime oma koodi arendamiseks ja silumiseks SageMakeri märkmikke. Tootmise jaoks soovisime mudelit kasutada lihtsa API-kutsena. Leidsime, et meil ei ole vaja eraldada andmete ettevalmistamist, mudelikoolitust ja ennustamist ning mugav oli kogu konveier ühte skripti pakkida ja SageMakeri töötlemist kasutada. SageMakeri töötlemine võimaldab teil skripti valitud eksemplaritüübil ja Dockeri pildil kaugkäivitada, ilma et peaksite ressursside eraldamise ja andmeedastuse pärast muretsema. See oli meie jaoks lihtne ja kulutõhus, sest GPU eksemplari kasutatakse ja selle eest makstakse ainult skripti käitamiseks vajaliku 15 minuti jooksul.

Üksikasjalikud juhised SageMakeri töötlemise kasutamise kohta leiate siit Amazon SageMaker Processing – täielikult hallatud andmetöötlus ja mudeli hindamine ja Töötlemine.

Tulemused

Meie kohandatud graafikumudel toimis teiste meetoditega võrreldes väga hästi: jõudlus paranes 80% ja tulemused olid kõigi kauplejate tüüpide puhul stabiilsemad. Mõõtsime tulemuslikkust keskmise tagasikutsumise järgi (soovitaja ennustatud tegelike tehingute protsent, kõigi kauplejate keskmine). Muude standardsete mõõdikute puhul oli paranemine vahemikus 50–130%.

See jõudlus võimaldas meil kauplejaid ja võlakirju paremini sobitada, mis näitab mudelis paremat kauplemiskogemust, kusjuures masinõpe annab suure sammu edasi kodeeritud reeglitest, mida võib olla raske skaleerida.

Järeldus

Trumid on keskendunud uuenduslike toodete ja töövoo tõhususe pakkumisele oma kasutajate kogukonnale. Homse krediidikauplemisvõrgustiku loomine nõuab pidevat koostööd kaaslaste ja valdkonnaekspertidega, nagu AWS ML Solutions Lab, mis on loodud selleks, et aidata teil kiiremini uuendusi teha.

Lisateabe saamiseks vaadake järgmisi ressursse:

Autoritest

Marc van Oudheusden on Amazon Web Servicesi Amazon ML Solutions Labi meeskonna vanemandmeteadlane. Ta teeb koostööd AWS-i klientidega, et lahendada tehisintellekti ja masinõppega seotud äriprobleeme. Väljaspool tööd võite teda leida rannast, lastega mängimas, surfamas või lohesurfamas.

Mutisya Ndunda on Trumidi andmestrateegia ja AI juht. Ta on kogenud finantsspetsialist, kellel on üle 20-aastane ulatuslik institutsiooniline kogemus kapitaliturgude, kauplemise ja finantstehnoloogia vallas. Mutisyal on tugev kvantitatiivne ja analüütiline taust ning enam kui kümneaastane kogemus tehisintellekti, masinõppe ja suurandmete analüütika vallas. Enne Trumidi oli ta Alpha Vertexi tegevjuht, finantstehnoloogia ettevõte, mis pakub finantsasutustele patenteeritud tehisintellekti algoritmidel põhinevaid analüütilisi lahendusi. Mutisya on omandanud bakalaureusekraadi Cornelli ülikoolist elektriinseneri erialal ja magistrikraadi finantsinseneri erialal Cornelli ülikoolist.

Täiustatud masinõppesüsteemide arendamine Trumidis koos PlatoBlockchaini andmeluure teadmistega Deep Graph raamatukoguga. Vertikaalne otsing. Ai. Isaac Privitera on vanemandmeteadlane Amazoni masinõppelahenduste laboris, kus ta arendab klientide äriprobleemide lahendamiseks kohandatud masinõppe- ja süvaõppelahendusi. Ta töötab peamiselt arvutinägemise ruumis, keskendudes AWS-i klientidele hajutatud koolituse ja aktiivõppe võimaldamisele.

Ajatempel: Juuli 25, 2022Juuli 25, 2022

Ajatempel: Oktoober 17, 2023

Täiustatud masinõppesüsteemide arendamine Trumidis koos teadmiste manustamise jaoks mõeldud Deep Graph raamatukoguga

Taasavaldanud Platon

Graafikmasinõppe eelised

Lahendus

Kauplemisandmete ettevalmistamine graafiku andmekogumina

Teadmiste graafiku manustamismudeli koolitamine

Uute tehingute ennustamine

Lahenduse pakkimine skaleeritava töövoona

Tulemused

Järeldus

Autoritest

Veel alates AWS-i masinõpe

Kuidas Patsnap kasutas GPT-2 järeldust Amazon SageMakeris madala latentsusaja ja kuluga | Amazoni veebiteenused

MLOd äärel Amazon SageMaker Edge Manageri ja AWS IoT Greengrassiga

Ettevõtte halduskontrollid, lihtne registreerumine ja Amazon CodeWhispereri laiendatud programmeerimiskeele tugi

Indekseerige oma Microsoft Exchange'i sisu, kasutades Amazon Kendra jaoks mõeldud Exchange'i konnektorit

Toitesoovitused ja otsing IMDb teadmiste graafiku abil – 3. osa

Kasutage Amazon SageMakeri stuudios Amazon SageMaker Data Wranglerit elutsükli vaikekonfiguratsiooniga

Lugege veebilehti ja tõstke sisu esile Amazon Polly abil

Isikupärastage oma otsingutulemusi Amazon Personalize'i ja Amazon OpenSearch Service'i integreerimisega | Amazoni veebiteenused

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto