Kehitetään edistyneitä koneoppimisjärjestelmiä Trumidilla PlatoBlockchain Data Intelligencen upottamista varten Deep Graph Libraryn avulla. Pystysuuntainen haku. Ai.

Kehitetään edistyneitä koneoppimisjärjestelmiä Trumidissa Deep Graph Library for Knowledge Embeddingin avulla

Tämä on vieraspostaus, joka on kirjoitettu yhdessä Trumidin Mutisya Ndundan kanssa.

Kuten monilla toimialoilla, yritysten joukkovelkakirjamarkkinat eivät sovellu yhden koon lähestymistapaan. Se on valtava, likviditeetti on hajanaista, ja institutionaaliset asiakkaat vaativat erityistarpeisiinsa räätälöityjä ratkaisuja. Tekoälyn ja koneoppimisen (ML) edistysaskeleita voidaan käyttää parantamaan asiakaskokemusta, lisäämään operatiivisten työnkulkujen tehokkuutta ja tarkkuutta sekä parantamaan suorituskykyä tukemalla useita kaupankäyntiprosessin näkökohtia.

Trumid on finanssiteknologiayritys, joka rakentaa huomisen luottokauppaverkostoa – markkinapaikan tehokkaalle kaupankäynnille, tiedon levittämiselle ja toimeenpanolle yritysten joukkovelkakirjamarkkinoiden toimijoiden välillä. Trumid optimoi luottokaupan kokemusta yhdistämällä huippuluokan tuotesuunnittelun ja teknologian periaatteet syvään markkinaosaamiseen. Tuloksena on integroitu kaupankäyntiratkaisu, joka tarjoaa täydellisen protokollien ja suoritustyökalujen ekosysteemin yhdellä intuitiivisella alustalla.

Joukkovelkakirjakaupan markkinoilla on perinteisesti ollut offline-ostajan/myyjän yhteensovitusprosesseja sääntöpohjaisen teknologian avulla. Trumid on aloittanut aloitteen muuttaakseen tätä kokemusta. Sen sähköisen kaupankäyntialustan kautta kauppiaat voivat käyttää tuhansia joukkovelkakirjoja ostaa tai myydä, sitoutuneiden käyttäjien yhteisö, jonka kanssa voi olla vuorovaikutuksessa, sekä erilaisia ​​kaupankäyntiprotokollia ja toteutusratkaisuja. Laajentuvan käyttäjäverkoston ansiosta Trumidin tekoäly- ja datastrategiatiimi teki yhteistyötä AWS Machine Learning Solutions Lab. Tavoitteena oli kehittää ML-järjestelmiä, jotka voisivat tarjota henkilökohtaisemman kaupankäyntikokemuksen mallintamalla käyttäjien kiinnostusta ja mieltymyksiä Trumidissa saatavilla oleviin joukkovelkakirjoihin.

Näitä ML-malleja voidaan käyttää nopeuttamaan näkemykseen ja toimintaan kuluvaa aikaa personoimalla tietojen näyttötapaa kullekin käyttäjälle, jotta voidaan varmistaa, että elinkeinonharjoittajaa mahdollisesti kiinnostavin oleellisin ja toimivimpi tieto on priorisoitu ja saatavilla.

Tämän haasteen ratkaisemiseksi Trumid ja ML Solutions Lab kehittivät päästä päähän tietojen valmistelun, mallikoulutuksen ja päättelyprosessin, joka perustuu syvään hermoverkkomalliin, joka on rakennettu käyttämällä Deep Graph Library for Knowledge Embeddingia (DGL-KE). Päästä päähän -ratkaisu Amazon Sage Maker otettiin myös käyttöön.

Kuvaajan koneoppimisen edut

Reaalimaailman data on monimutkaista ja toisiinsa yhdistettyä, ja se sisältää usein verkkorakenteita. Esimerkkejä ovat molekyylit luonnossa, sosiaaliset verkostot, Internet, tiet ja rahoituskaupan alustat.

Kaaviot tarjoavat luonnollisen tavan mallintaa tätä monimutkaisuutta poimimalla tärkeää ja rikasta tietoa, joka on upotettu entiteettien välisiin suhteisiin.

Perinteiset ML-algoritmit edellyttävät tietojen järjestämistä taulukoiksi tai sarjoiksi. Tämä toimii yleensä hyvin, mutta jotkin alueet esitetään luonnollisemmin ja tehokkaammin kaavioilla (kuten toisiinsa liittyvien objektien verkosto, kuten myöhemmin tässä viestissä havainnollistetaan). Sen sijaan, että pakottaisit nämä graafitietojoukot taulukoiksi tai sarjoiksi, voit käyttää graafin ML-algoritmeja sekä edustamaan dataa että oppimaan niistä kaaviomuodossa, mukaan lukien tiedot muodostavista solmuista, reunoista ja muista ominaisuuksista.

Ottaen huomioon, että joukkovelkakirjakauppa on luonnostaan ​​edustettuna ostajien ja myyjien välisenä vuorovaikutuksen verkostona, johon liittyy erilaisia ​​joukkovelkakirjainstrumentteja, tehokkaan ratkaisun on hyödynnettävä markkinoille osallistuvien kauppiasyhteisöjen verkostovaikutuksia. Katsotaanpa, kuinka hyödynsimme kaupankäyntiverkoston vaikutuksia ja toteutimme tämän vision täällä.

Ratkaisu

Joukkovelkakirjakauppaa luonnehtivat useat tekijät, mukaan lukien kaupan koko, termi, liikkeeseenlaskija, korko, kuponkien arvot, osto-/myyntitarjous ja kaupankäyntiprotokollan tyyppi. Tilausten ja kauppojen lisäksi Trumid tallentaa myös "indications of interest" (IOI). Historialliset vuorovaikutustiedot ilmentävät kaupankäyntikäyttäytymistä ja ajan myötä muuttuvia markkinaolosuhteita. Käytimme näitä tietoja luodaksemme kaavion aikaleimatuista vuorovaikutuksista kauppiaiden, joukkovelkakirjojen ja liikkeeseenlaskijoiden välillä, ja käytimme kuvaajaa ML ennustaaksemme tulevia vuorovaikutuksia.

Suositusratkaisu koostui neljästä päävaiheesta:

  • Kaupankäyntitietojen valmistelu kaaviotietojoukoksi
  • Tietograafin upotusmallin koulutus
  • Uusien kauppojen ennustaminen
  • Ratkaisun pakkaaminen skaalautuvaksi työnkuluksi

Seuraavissa osioissa käsittelemme jokaista vaihetta yksityiskohtaisemmin.

Kaupankäyntitietojen valmistelu kaaviotietojoukoksi

On monia tapoja esittää kaupankäyntitiedot kaaviona. Yksi vaihtoehto on esittää tiedot tyhjentävästi solmujen, reunojen ja ominaisuuksien avulla: kauppiaat solmuina, joilla on ominaisuuksia (kuten työnantaja tai omistusoikeus), joukkovelkakirjat solmuina, joilla on ominaisuuksia (liikkeeseenlaskija, jäljellä oleva määrä, maturiteetti, korko, kuponkiarvo) ja kaupat. reunuksina ominaisuuksineen (päivämäärä, tyyppi, koko). Toinen vaihtoehto on yksinkertaistaa dataa ja käyttää vain solmuja ja suhteita (relaatiot ovat kirjoitettuja reunoja, kuten kaupankäynnin tai liikkeeseenlaskijan). Tämä jälkimmäinen lähestymistapa toimi paremmin meidän tapauksessamme, ja käytimme seuraavassa kuvassa esitettyä kaaviota.

Kaavio kauppiaiden, joukkovelkakirjojen ja joukkovelkakirjalainojen liikkeeseenlaskijoiden välisistä suhteista

Lisäksi poistimme joitain vanhentuneiksi pidetyistä reunoista: jos kauppias oli vuorovaikutuksessa yli 100 eri joukkovelkakirjalainan kanssa, säilytimme vain 100 viimeistä joukkovelkakirjalainaa.

Lopuksi tallensimme kaaviotietojoukon reunojen luettelona TSV muoto:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

Tietograafin upotusmallin koulutus

Vain solmuista ja suhteista koostuville kaavioille (jota kutsutaan usein tietokaavioiksi) DGL-tiimi kehitti tietograafin upotuskehyksen. DGL-KE. KE tarkoittaa tiedon upottamista, jonka ideana on esittää solmuja ja suhteita (tietoa) koordinaattein (embeddings) ja optimoida (kouluttaa) koordinaatit niin, että alkuperäinen kuvaajarakenne voidaan palauttaa koordinaateista. Saatavilla olevien upotusmallien luettelosta valitsimme TransE:n (translational embeddings). TransE kouluttaa upotuksia tavoitteenaan lähentää seuraavaa yhtäläisyyttä:

Lähdesolmun upotus + relaatioupotus = kohdesolmun upotus (1)

Koulutimme mallin kutsumalla dglke_train komento. Koulutuksen tulos on mallikansio, joka sisältää opetetut upotukset.

Lisätietoja TransE:stä on kohdassa Upotusten kääntäminen monirelaatiotietojen mallintamiseen.

Uusien kauppojen ennustaminen

Ennakoidaksemme uusia kauppoja kauppiaalta mallillamme käytimme yhtäläisyyttä (1): lisäämme kauppiaan upotuksen äskettäiseen kaupankäyntiin ja etsimme joukkovelkakirjoja, jotka ovat lähinnä tuloksena olevaa upotusta.

Teimme tämän kahdessa vaiheessa:

  1. Laske pisteet kaikista mahdollisista viimeaikaisista kauppasuhteista dglke_predict.
  2. Laske kunkin kauppiaan 100 parasta pisteitä.

Katso yksityiskohtaiset ohjeet DGL-KE:n käytöstä Koulutus tietotaulukon upotukset mittakaavassa Deep Graph Libraryn avulla ja DGL-KE:n dokumentaatio.

Ratkaisun pakkaaminen skaalautuvaksi työnkuluksi

Käytimme SageMaker-muistikirjoja koodimme kehittämiseen ja virheenkorjaukseen. Tuotannossa halusimme käyttää mallia yksinkertaisena API-kutsuna. Huomasimme, että meidän ei tarvinnut erottaa tietojen valmistelua, mallin koulutusta ja ennustamista, ja oli kätevää pakata koko putki yhdeksi skriptiksi ja käyttää SageMaker-käsittelyä. SageMaker-käsittelyn avulla voit suorittaa komentosarjan etänä valitulla ilmentymätyypillä ja Docker-kuvalla ilman, että sinun tarvitsee huolehtia resurssien allokoinnista ja tiedonsiirrosta. Tämä oli meille yksinkertaista ja kustannustehokasta, koska GPU-instanssia käytetään ja siitä maksetaan vain skriptin suorittamiseen tarvittavan 15 minuutin aikana.

Katso tarkemmat ohjeet SageMaker-käsittelyn käyttämisestä Amazon SageMaker Processing - täysin hallinnoitu tietojenkäsittely ja mallin arviointi ja Käsittely.

tulokset

Muokattu kaaviomallimme toimi erittäin hyvin muihin menetelmiin verrattuna: suorituskyky parani 80 % ja tulokset vakaammat kaikissa kauppiaissa. Mittasimme tehokkuutta keskimääräisellä palautuksella (suosittajan ennustama prosenttiosuus todellisista kaupoista, kaikkien kauppiaiden keskiarvo). Muilla vakiomittareilla parannus oli 50–130 %.

Tämän suorituskyvyn ansiosta pystyimme paremmin vastaamaan kauppiaita ja joukkovelkakirjoja, mikä osoittaa, että mallin sisällä on parannettu kauppiaskokemus, ja koneoppiminen on suuri askel eteenpäin kovakoodatuista säännöistä, joita voi olla vaikea skaalata.

Yhteenveto

Trumid on keskittynyt toimittamaan innovatiivisia tuotteita ja tehostamaan työnkulkua käyttäjäyhteisölleen. Huomisen luottokaupan verkoston rakentaminen edellyttää jatkuvaa yhteistyötä vertaisten ja alan asiantuntijoiden, kuten AWS ML Solutions Labin, kanssa, joka on suunniteltu auttamaan sinua innovoimaan nopeammin.

Lisätietoja on seuraavissa resursseissa:


Tietoja kirjoittajista

Kehitetään edistyneitä koneoppimisjärjestelmiä Trumidilla PlatoBlockchain Data Intelligencen upottamista varten Deep Graph Libraryn avulla. Pystysuuntainen haku. Ai.Marc van Oudheusden on vanhempi tietotutkija Amazon ML Solutions Lab -tiimissä Amazon Web Services -palvelussa. Hän työskentelee AWS-asiakkaiden kanssa ratkaistakseen liiketoimintaongelmia tekoälyn ja koneoppimisen avulla. Työn ulkopuolella saatat löytää hänet rannalta leikkimässä lastensa kanssa, surffaamassa tai leijalautailemassa.

Kehitetään edistyneitä koneoppimisjärjestelmiä Trumidilla PlatoBlockchain Data Intelligencen upottamista varten Deep Graph Libraryn avulla. Pystysuuntainen haku. Ai.Mutisya Ndunda on Trumidin tietostrategia- ja tekoälypäällikkö. Hän on kokenut rahoitusalan ammattilainen, jolla on yli 20 vuoden laaja institutionaalinen kokemus pääomamarkkinoista, kaupankäynnistä ja rahoitusteknologiasta. Mutisyalla on vahva kvantitatiivinen ja analyyttinen tausta, jolla on yli vuosikymmenen kokemus tekoälystä, koneoppimisesta ja big datan analytiikasta. Ennen Trumidia hän toimi Alpha Vertexin toimitusjohtajana, rahoitusteknologiayhtiössä, joka tarjoaa rahoituslaitoksille patentoiduilla tekoälyalgoritmeilla toimivia analyyttisiä ratkaisuja. Mutisya on suorittanut sähkötekniikan kandidaatin tutkinnon Cornellin yliopistosta ja maisterin tutkinnon rahoitustekniikasta Cornellin yliopistosta.

Kehitetään edistyneitä koneoppimisjärjestelmiä Trumidilla PlatoBlockchain Data Intelligencen upottamista varten Deep Graph Libraryn avulla. Pystysuuntainen haku. Ai.Isaac Privitera on vanhempi tietotutkija Amazon Machine Learning Solutions Labissa, jossa hän kehittää räätälöityjä koneoppimis- ja syväoppimisratkaisuja asiakkaiden liiketoimintaongelmiin. Hän työskentelee ensisijaisesti tietokonenäön parissa keskittyen mahdollistamaan AWS-asiakkaiden hajautettu koulutus ja aktiivinen oppiminen.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen