Developing Advanced Machine Learning Systems At Trumid With The Deep Graph Library For Knowledge Embedding

Újra kiadta Platón

Követő: 0

Ez egy vendégbejegyzés, amelyet Mutisya Ndundával közösen írt a Trumidtól.

Sok iparághoz hasonlóan a vállalati kötvények piaca sem alkalmas egy mindenkire érvényes megközelítésre. Hatalmas, a likviditás széttagolt, és az intézményi ügyfelek egyedi igényeikre szabott megoldásokat igényelnek. A mesterséges intelligencia és a gépi tanulás (ML) fejlesztése felhasználható az ügyfélélmény javítására, a működési munkafolyamatok hatékonyságának és pontosságának növelésére, valamint a teljesítmény fokozására a kereskedési folyamat több aspektusának támogatásával.

Trumid egy pénzügyi technológiai vállalat, amely a holnap hitelkereskedési hálózatát építi fel – egy piactér a hatékony kereskedéshez, információterjesztéshez és a vállalati kötvénypiaci szereplők közötti végrehajtáshoz. A Trumid úgy optimalizálja a hitelkereskedési tapasztalatot, hogy az élvonalbeli terméktervezési és technológiai elveket mély piaci szakértelemmel kombinálja. Az eredmény egy integrált kereskedési megoldás, amely a protokollok és a végrehajtási eszközök teljes ökoszisztémáját biztosítja egyetlen intuitív platformon belül.

A kötvénykereskedési piac hagyományosan offline vevő/eladó párosítási folyamatokat tartalmaz, amelyeket szabályalapú technológia segít. Trumid kezdeményezésbe kezdett, hogy átalakítsa ezt az élményt. Az elektronikus kereskedési platformon keresztül a kereskedők több ezer kötvényhez férhetnek hozzá vételre vagy eladásra, elkötelezett felhasználók közösségéhez, amellyel kapcsolatba léphetnek, valamint számos kereskedési protokollhoz és végrehajtási megoldáshoz. A felhasználók bővülő hálózatával a Trumid mesterséges intelligencia- és adatstratégiai csapata együttműködött a AWS Machine Learning Solutions Lab. A cél az volt, hogy olyan ML-rendszereket fejlesszenek ki, amelyek személyre szabottabb kereskedési élményt nyújthatnak, modellezve a felhasználók érdeklődését és preferenciáit a Trumidon elérhető kötvények iránt.

Ezek az ML-modellek felgyorsíthatják a betekintéshez és a cselekvéshez szükséges időt azáltal, hogy személyre szabják az információk megjelenítésének módját az egyes felhasználók számára, így biztosítva, hogy a kereskedő számára fontos és leginkább hasznosítható információk prioritást élvezzenek és hozzáférhetők legyenek.

Ennek a kihívásnak a megoldására Trumid és az ML Solutions Lab végpontok közötti adat-előkészítési, modelltanítási és következtetési folyamatot dolgozott ki a Deep Graph Library for Knowledge Embedding segítségével épített mély neurális hálózati modellen (DGL-KE). Végponttól végpontig megoldás Amazon SageMaker is bevetésre került.

A gráfgépi tanulás előnyei

A valós adatok összetettek és összekapcsolódnak, és gyakran tartalmaznak hálózati struktúrákat. Ilyenek például a természetben található molekulák, a közösségi hálózatok, az internet, az utak és a pénzügyi kereskedési platformok.

A grafikonok természetes módot biztosítanak ennek a bonyolultságnak a modellezésére az entitások közötti kapcsolatokba ágyazott fontos és gazdag információk kinyerésével.

A hagyományos ML algoritmusok megkövetelik, hogy az adatokat táblázatokba vagy sorozatokba rendezzék. Ez általában jól működik, de néhány tartományt természetesebben és hatékonyabban ábrázolnak gráfok (például egymáshoz kapcsolódó objektumok hálózata, amint azt a bejegyzés későbbi részében bemutatjuk). Ahelyett, hogy ezeket a gráf-adatkészleteket táblázatokká vagy sorozatokká kényszerítené, használhat gráf ML-algoritmusokat az adatok ábrázolására és azokból való tanulásra a gráf formájában, beleértve az alkotó csomópontokra, élekre és egyéb jellemzőkre vonatkozó információkat is.

Tekintettel arra, hogy a kötvénykereskedés eredendően a vevők és az eladók közötti interakciók hálózataként jelenik meg, különféle típusú kötvényinstrumentumokkal, hatékony megoldásnak kell kiaknáznia a piacon részt vevő kereskedői közösségek hálózati hatásait. Nézzük meg, hogyan aknáztuk ki a kereskedési hálózat hatásait, és hogyan valósítottuk meg ezt az elképzelést itt.

Megoldás

A kötvénykereskedést számos tényező jellemzi, beleértve a kereskedés nagyságát, futamidejét, kibocsátóját, árfolyamát, kuponértékeit, vételi/adási ajánlatát és az érintett kereskedési protokoll típusát. A megbízásokon és kereskedéseken kívül a Trumid az „érdeklődési jelzéseket” (IOI) is rögzíti. A történelmi interakciós adatok testesítik meg a kereskedési viselkedést és az idő múlásával változó piaci feltételeket. Ezeket az adatokat felhasználtuk a kereskedők, kötvények és kibocsátók közötti időbélyegzett interakciók grafikonjának elkészítésére, az ML grafikont pedig a jövőbeli interakciók előrejelzésére.

Az ajánlási megoldás négy fő lépésből állt:

A kereskedési adatok elkészítése grafikon adatkészletként
Tudásgráf beágyazó modell betanítása
Új kereskedések előrejelzése
A megoldás skálázható munkafolyamatként történő csomagolása

A következő szakaszokban az egyes lépéseket részletesebben tárgyaljuk.

A kereskedési adatok elkészítése grafikon adatkészletként

Számos módja van a kereskedési adatok grafikonként történő ábrázolásának. Az egyik lehetőség az adatok kimerítő ábrázolása csomópontokkal, élekkel és tulajdonságokkal: a kereskedők csomópontként tulajdonságokkal (például munkáltató vagy birtoklás), a kötvények tulajdonságokkal rendelkező csomópontokként (kibocsátó, fennálló összeg, lejárat, kamatláb, kuponérték) és kereskedések mint élek tulajdonságokkal (dátum, típus, méret). Egy másik lehetőség az adatok egyszerűsítése, és csak csomópontok és relációk használata (a relációk tipizált élek, például kereskedés vagy kibocsátás). Ez utóbbi megközelítés esetünkben jobban működött, és a következő ábrán látható grafikont használtuk.

A kereskedők, a kötvények és a kötvénykibocsátók közötti kapcsolatok grafikonja

Ezenkívül eltávolítottunk néhány elavultnak tekintett élt: ha egy kereskedő több mint 100 különböző kötvénnyel lépett kapcsolatba, akkor csak az utolsó 100 kötvényt tartottuk meg.

Végül elmentettük a gráf adatkészletet élek listájaként TSV formátum:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

Tudásgráf beágyazó modell betanítása

A csak csomópontokból és relációkból álló gráfokhoz (amelyeket gyakran tudásgráfoknak neveznek) a DGL csapata kifejlesztette a tudásgráf beágyazó keretrendszert. DGL-KE. A KE a tudásbeágyazás rövidítése, melynek célja a csomópontok és kapcsolatok (tudás) koordinátákkal való megjelenítése (beágyazások), valamint a koordináták optimalizálása (tanítása), hogy az eredeti gráfszerkezet visszaállítható legyen a koordinátákból. Az elérhető beágyazási modellek listájában a TransE-t (transzlációs beágyazások) választottuk. A TransE beágyazásokat képez be azzal a céllal, hogy közelítse a következő egyenlőséget:

Forráscsomópont-beágyazás + relációs beágyazás = célcsomópont-beágyazás (1)

A modell meghívásával betanítottuk a dglke_train parancs. A betanítás kimenete a betanított beágyazásokat tartalmazó modellmappa.

A TransE-vel kapcsolatos további részletekért lásd: Beágyazások fordítása többrelációs adatok modellezéséhez.

Új kereskedések előrejelzése

A modellünkkel egy kereskedőtől származó új kereskedések előrejelzéséhez az (1) egyenlőséget használtuk: a kereskedő beágyazását adjuk hozzá a legutóbbi kereskedési beágyazáshoz, és keressük az eredményül kapott beágyazáshoz legközelebb eső kötvényeket.

Ezt két lépésben tettük meg:

Számítsa ki az összes lehetséges közelmúltbeli kereskedelmi kapcsolat pontszámát dglke_predict.
Számítsa ki a 100 legmagasabb pontszámot minden kereskedő esetében.

A DGL-KE használatára vonatkozó részletes utasításokért lásd: Tudásgráf-beágyazások képzése a Deep Graph Library segítségével és a DGL-KE Dokumentáció.

A megoldás skálázható munkafolyamatként történő csomagolása

A kód fejlesztéséhez és hibakereséséhez SageMaker notebookokat használtunk. A termeléshez a modellt egyszerű API-hívásként szerettük volna meghívni. Azt találtuk, hogy nem kell különválasztani az adat-előkészítést, a modellképzést és az előrejelzést, és kényelmes volt az egész folyamatot egyetlen szkriptbe csomagolni, és a SageMaker-feldolgozást használni. A SageMaker feldolgozás lehetővé teszi egy szkript távoli futtatását egy kiválasztott példánytípuson és Docker-képen anélkül, hogy aggódnia kellene az erőforrások elosztása és az adatátvitel miatt. Ez egyszerű és költséghatékony volt számunkra, mivel a GPU-példányt csak a szkript futásához szükséges 15 perc alatt használják és fizetik ki.

A SageMaker feldolgozás használatára vonatkozó részletes utasításokért lásd: Amazon SageMaker Processing – Teljesen felügyelt adatfeldolgozás és modellértékelés és a Feldolgozás.

Eredmények

Egyedi grafikonmodellünk nagyon jól teljesített más módszerekkel összehasonlítva: a teljesítmény 80%-kal javult, stabilabb eredményekkel minden kereskedőtípusnál. A teljesítményt átlagos visszahívással mértük (az ajánló által megjósolt tényleges kereskedések százalékos aránya, az összes kereskedőre átlagolva). Más szabványos mérőszámokkal a javulás 50–130% között mozgott.

Ez a teljesítmény lehetővé tette a kereskedők és a kötvények jobb összeegyeztetését, ami a modellen belüli fokozott kereskedői élményt jelzi, és a gépi tanulás nagy előrelépést jelent a nehezen skálázható, keményen kódolt szabályokhoz képest.

Következtetés

A Trumid arra összpontosít, hogy innovatív termékeket és munkafolyamat-hatékonyságot biztosítson felhasználói közösségének. A holnap hitelkereskedési hálózatának kiépítéséhez folyamatos együttműködésre van szükség olyan társaikkal és iparági szakértőkkel, mint például az AWS ML Solutions Lab, amely a gyorsabb innovációt szolgálja.

További információért tekintse meg a következő forrásokat:

A szerzőkről

Marc van Oudheusden az Amazon Web Services Amazon ML Solutions Lab csapatának vezető adattudósa. Az AWS-ügyfelekkel együttműködve megoldja az üzleti problémákat mesterséges intelligencia és gépi tanulás segítségével. Munkán kívül megtalálhatja őt a tengerparton, a gyerekeivel játszik, szörfözik vagy kiteszörföz.

Mutisya Ndunda a Trumid adatstratégiájának és mesterséges intelligenciájának vezetője. Tapasztalt pénzügyi szakember, több mint 20 éves széles körű intézményi tapasztalattal a tőkepiacok, a kereskedés és a pénzügyi technológia területén. A Mutisya erős kvantitatív és elemző háttérrel rendelkezik, több mint egy évtizedes tapasztalattal a mesterséges intelligencia, a gépi tanulás és a nagy adatelemzés területén. Trumid előtt az Alpha Vertex, egy pénzügyi technológiai vállalat vezérigazgatója volt, amely szabadalmaztatott mesterségesintelligencia-algoritmusokon alapuló elemzési megoldásokat kínál a pénzintézeteknek. Mutisya a Cornell Egyetemen szerzett villamosmérnöki alapdiplomát, a Cornell Egyetemen pedig pénzügyi mérnöki diplomát szerzett.

Fejlett gépi tanulási rendszerek fejlesztése a Trumidnál a Deep Graph Library for Knowledge beágyazó PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai. Isaac Privitera vezető adattudós az Amazon Machine Learning Solutions Labnál, ahol személyre szabott gépi tanulási és mély tanulási megoldásokat fejleszt az ügyfelek üzleti problémáinak megoldására. Elsősorban a számítógépes látás területén dolgozik, és az AWS-ügyfelek elosztott képzését és aktív tanulását teszi lehetővé.

Időbélyeg: Július 25, 2022Július 25, 2022

Időbélyeg: 17. október 2023.

Fejlett gépi tanulási rendszerek fejlesztése a Trumidnál a Deep Graph Library for Knowledge Embedding segítségével

Újra kiadta Platón

A gráfgépi tanulás előnyei

Megoldás

A kereskedési adatok elkészítése grafikon adatkészletként

Tudásgráf beágyazó modell betanítása

Új kereskedések előrejelzése

A megoldás skálázható munkafolyamatként történő csomagolása

Eredmények

Következtetés

A szerzőkről

Még több AWS gépi tanulás

Hogyan használta Patsnap a GPT-2 következtetést az Amazon SageMakeren alacsony késleltetéssel és költséggel | Amazon webszolgáltatások

MLO-k a széleken az Amazon SageMaker Edge Manager és az AWS IoT Greengrass segítségével

Vállalati adminisztrációs vezérlők, egyszerű regisztráció és kiterjesztett programozási nyelv támogatás az Amazon CodeWhisperer számára

Indexelje Microsoft Exchange-tartalmát az Exchange-összekötő segítségével az Amazon Kendra számára

Teljesítményre vonatkozó ajánlások és keresés IMDb tudásgráf segítségével – 3. rész

Használja az Amazon SageMaker Data Wrangler alkalmazást az Amazon SageMaker Studio alkalmazásban alapértelmezett életciklus-konfigurációval

Olvasson weboldalakat és emeljen ki tartalmat az Amazon Polly segítségével

Tegye személyre keresési eredményeit az Amazon Personalize és az Amazon OpenSearch szolgáltatás integrációjával | Amazon webszolgáltatások

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók