Developing Advanced Machine Learning Systems At Trumid With The Deep Graph Library For Knowledge Embedding

Republicat de Platon

Urmaritori: 0

Aceasta este o postare pentru invitați scrisă împreună cu Mutisya Ndunda de la Trumid.

La fel ca multe industrii, piața obligațiunilor corporative nu se pretează pentru o abordare universală. Este vast, lichiditatea este fragmentată, iar clienții instituționali solicită soluții adaptate nevoilor lor specifice. Progresele în inteligența artificială și învățarea automată (ML) pot fi folosite pentru a îmbunătăți experiența clienților, pentru a crește eficiența și acuratețea fluxurilor de lucru operaționale și pentru a îmbunătăți performanța prin sprijinirea mai multor aspecte ale procesului de tranzacționare.

Trumid este o companie de tehnologie financiară care construiește rețeaua de tranzacționare a creditelor de mâine — o piață pentru tranzacționare eficientă, diseminare a informațiilor și execuție între participanții de pe piața de obligațiuni corporative. Trumid optimizează experiența de tranzacționare a creditelor combinând principiile de ultimă oră în materie de proiectare a produselor și tehnologie cu o expertiză profundă pe piață. Rezultatul este o soluție de tranzacționare integrată care oferă un ecosistem complet de protocoale și instrumente de execuție într-o singură platformă intuitivă.

Piața de tranzacționare a obligațiunilor a implicat în mod tradițional procese de potrivire offline cumpărător/vânzător, ajutate de tehnologia bazată pe reguli. Trumid s-a angajat într-o inițiativă de a transforma această experiență. Prin intermediul platformei sale de tranzacționare electronică, comercianții pot accesa mii de obligațiuni pentru a cumpăra sau a vinde, o comunitate de utilizatori implicați cu care să interacționeze și o varietate de protocoale de tranzacționare și soluții de execuție. Cu o rețea de utilizatori în expansiune, echipa Trumid AI și Data Strategy a colaborat cu Laborator de soluții de învățare automată AWS. Obiectivul a fost de a dezvolta sisteme ML care ar putea oferi o experiență de tranzacționare mai personalizată prin modelarea interesului și preferințelor utilizatorilor pentru obligațiunile disponibile pe Trumid.

Aceste modele de ML pot fi utilizate pentru a accelera timpul de percepție și acțiune prin personalizarea modului în care informațiile sunt afișate pentru fiecare utilizator, pentru a se asigura că informațiile cele mai relevante și acționabile de care un comerciant i-ar păsa sunt prioritizate și accesibile.

Pentru a rezolva această provocare, Trumid și Laboratorul de soluții ML au dezvoltat un proces de pregătire a datelor de la capăt la capăt, antrenament de model și proces de inferență bazat pe un model de rețea neuronală profundă construit folosind Biblioteca Deep Graph pentru încorporarea cunoștințelor (DGL-KE). O soluție end-to-end cu Amazon SageMaker a fost de asemenea dislocat.

Beneficiile învățării automate grafice

Datele din lumea reală sunt complexe și interconectate și conțin adesea structuri de rețea. Exemplele includ moleculele din natură, rețelele sociale, internetul, drumurile și platformele de tranzacționare financiară.

Graficele oferă o modalitate naturală de a modela această complexitate prin extragerea de informații importante și bogate care sunt încorporate în relațiile dintre entități.

Algoritmii tradiționali ML necesită ca datele să fie organizate ca tabele sau secvențe. Acest lucru funcționează în general bine, dar unele domenii sunt reprezentate mai natural și mai eficient prin grafice (cum ar fi o rețea de obiecte legate între ele, așa cum este ilustrat mai târziu în această postare). În loc să constrângeți aceste seturi de date grafice în tabele sau secvențe, puteți utiliza algoritmi ML pentru grafic, atât pentru a reprezenta, cât și pentru a învăța din datele, așa cum sunt prezentate în forma sa de grafic, inclusiv informații despre nodurile constitutive, margini și alte caracteristici.

Având în vedere că tranzacționarea obligațiunilor este reprezentată în mod inerent ca o rețea de interacțiuni între cumpărători și vânzători care implică diverse tipuri de instrumente de obligațiuni, o soluție eficientă trebuie să valorifice efectele de rețea ale comunităților de comercianți care participă la piață. Să ne uităm la modul în care am valorificat efectele rețelei de tranzacționare și am implementat această viziune aici.

Soluţie

Tranzacționarea obligațiunilor este caracterizată de mai mulți factori, inclusiv dimensiunea tranzacției, termenul, emitentul, cursul, valorile cuponului, oferta oferta/cerere și tipul de protocol de tranzacționare implicat. Pe lângă comenzi și tranzacții, Trumid surprinde și „indicații de interes” (IOI). Datele istorice de interacțiune încorporează comportamentul de tranzacționare și condițiile pieței care evoluează în timp. Am folosit aceste date pentru a construi un grafic al interacțiunilor marcate de timp între comercianți, obligațiuni și emitenți și am folosit graficul ML pentru a prezice interacțiunile viitoare.

Soluția de recomandare a cuprins patru pași principali:

Pregătirea datelor de tranzacționare ca un set de date grafic
Antrenarea unui model de încorporare a unui grafic de cunoștințe
Prezicerea de noi tranzacții
Ambalarea soluției ca un flux de lucru scalabil

În secțiunile următoare, discutăm mai detaliat fiecare pas.

Pregătirea datelor de tranzacționare ca un set de date grafic

Există multe moduri de a reprezenta datele de tranzacționare sub formă de grafic. O opțiune este reprezentarea exhaustivă a datelor cu noduri, margini și proprietăți: comercianții ca noduri cu proprietăți (cum ar fi angajator sau mandat), obligațiuni ca noduri cu proprietăți (emitent, sumă restantă, scadență, rată, valoare cupon) și tranzacții ca muchii cu proprietăți (data, tip, dimensiune). O altă opțiune este să simplificați datele și să utilizați numai noduri și relații (relațiile sunt margini tipizate, cum ar fi tranzacționate sau emise de). Această din urmă abordare a funcționat mai bine în cazul nostru și am folosit graficul reprezentat în figura următoare.

Graficul relațiilor dintre comercianți, obligațiuni și emitenți de obligațiuni

În plus, am eliminat unele dintre marginile considerate învechite: dacă un comerciant a interacționat cu mai mult de 100 de obligațiuni diferite, am păstrat doar ultimele 100 de obligațiuni.

În cele din urmă, am salvat setul de date grafic ca o listă de muchii în TSV format:

t987	trade-old		i55198
t995	trade-old		i55306
t987	trade-recent	i24528
t995	trade-recent	i49181
t987	ioi-recent		i24523
t995	ioi-old 		i49178
…
i49611	issued-by		XXX
i46569	issued-by		YYY
i46507	issued-by		ZZZ

Antrenarea unui model de încorporare a unui grafic de cunoștințe

Pentru graficele compuse numai din noduri și relații (deseori numite grafice de cunoștințe), echipa DGL a dezvoltat cadrul de încorporare a graficului de cunoștințe DGL-KE. KE reprezintă incorporarea cunoașterii, ideea fiind de a reprezenta nodurile și relațiile (cunoașterea) prin coordonate (înglobare) și de a optimiza (antrenează) coordonatele astfel încât structura graficului original să poată fi recuperată din coordonate. În lista de modele de încorporare disponibile, am selectat TransE (incorporări translaționale). TransE antrenează înglobări cu obiectivul de a aproxima următoarea egalitate:

Încorporarea nodului sursă + încorporarea relației = încorporarea nodului țintă (1)

Am antrenat modelul invocând dglke_train comanda. Ieșirea instruirii este un folder model care conține înglobările antrenate.

Pentru mai multe detalii despre TransE, consultați Traducerea înglobărilor pentru modelarea datelor multi-relaționale.

Prezicerea de noi tranzacții

Pentru a prezice tranzacții noi de la un comerciant cu modelul nostru, am folosit egalitatea (1): adăugați încorporarea comerciantului la încorporarea comercială recentă și am căutat obligațiunile cele mai apropiate de încorporarea rezultată.

Am făcut acest lucru în doi pași:

Calculați scorurile pentru toate relațiile comerciale posibile recente cu dglke_predict.
Calculați primele 100 cele mai mari scoruri pentru fiecare comerciant.

Pentru instrucțiuni detaliate despre cum să utilizați DGL-KE, consultați Instruirea încorporațiilor de grafice la scară cu Deep Graph Library și Documentația DGL-KE.

Ambalarea soluției ca un flux de lucru scalabil

Am folosit notebook-uri SageMaker pentru a dezvolta și a depana codul nostru. Pentru producție, am vrut să invocăm modelul ca un simplu apel API. Am descoperit că nu trebuie să separăm pregătirea datelor, antrenamentul modelului și predicția și a fost convenabil să împachetăm întregul pipeline ca un singur script și să folosim procesarea SageMaker. Procesarea SageMaker vă permite să rulați un script de la distanță pe un tip de instanță ales și pe o imagine Docker, fără să vă faceți griji cu privire la alocarea resurselor și transferul de date. Acest lucru a fost simplu și rentabil pentru noi, deoarece instanța GPU este utilizată și plătită doar în timpul celor 15 minute necesare pentru a rula scriptul.

Pentru instrucțiuni detaliate despre cum să utilizați procesarea SageMaker, consultați Procesarea Amazon SageMaker – Procesarea datelor și evaluarea modelului complet gestionate și Prelucrare.

REZULTATE

Modelul nostru grafic personalizat a funcționat foarte bine în comparație cu alte metode: performanța s-a îmbunătățit cu 80%, cu rezultate mai stabile pentru toate tipurile de comercianți. Am măsurat performanța prin rechemarea medie (procentul tranzacțiilor reale prezis de recomandator, mediat pe toți comercianții). Cu alte valori standard, îmbunătățirea a variat între 50 și 130%.

Această performanță ne-a permis să potrivim mai bine comercianții și obligațiunile, indicând o experiență îmbunătățită a traderului în cadrul modelului, învățarea automată oferind un mare pas înainte față de regulile codificate, care pot fi dificil de scalat.

Concluzie

Trumid se concentrează pe furnizarea de produse inovatoare și eficiență a fluxului de lucru comunității lor de utilizatori. Construirea rețelei de tranzacționare a creditelor de mâine necesită o colaborare continuă cu colegi și experți din industrie, cum ar fi Laboratorul de soluții AWS ML, conceput pentru a vă ajuta să inovezi mai rapid.

Pentru mai multe informații, consultați următoarele resurse:

Despre autori

Marc van Oudheusden este Senior Data Scientist cu echipa Amazon ML Solutions Lab la Amazon Web Services. Lucrează cu clienții AWS pentru a rezolva problemele de afaceri cu inteligență artificială și învățare automată. În afara serviciului, îl puteți găsi la plajă, jucându-se cu copiii lui, făcând surfing sau kitesurfing.

Mutisya Ndunda este șeful Strategiei de date și IA la Trumid. Este un profesionist financiar experimentat, cu peste 20 de ani de experiență instituțională vastă în piețele de capital, tranzacționare și tehnologie financiară. Mutisya are un fundal cantitativ și analitic puternic, cu peste un deceniu de experiență în inteligența artificială, învățarea automată și analiza datelor mari. Înainte de Trumid, el a fost CEO al Alpha Vertex, o companie de tehnologie financiară care oferă instituțiilor financiare soluții analitice bazate pe algoritmi AI proprietari. Mutisya deține o diplomă de licență în Inginerie Electrică de la Universitatea Cornell și un master în Inginerie Financiară de la Universitatea Cornell.

Dezvoltarea sistemelor avansate de învățare automată la Trumid cu Deep Graph Library pentru Knowledge Embedding PlatoBlockchain Data Intelligence. Căutare verticală. Ai. Isaac Privitera este Senior Data Scientist la Amazon Machine Learning Solutions Lab, unde dezvoltă soluții personalizate de învățare automată și de deep learning pentru a aborda problemele de afaceri ale clienților. Lucrează în primul rând în spațiul viziunii computerizate, concentrându-se pe oferirea clienților AWS de instruire distribuită și învățare activă.

Timestamp-ul: Iulie 25, 2022Iulie 25, 2022

Timestamp-ul: Octombrie 17, 2023

Dezvoltarea sistemelor avansate de învățare automată la Trumid cu Deep Graph Library pentru Knowledge Embedding

Republicat de Platon

Beneficiile învățării automate grafice

Soluţie

Pregătirea datelor de tranzacționare ca un set de date grafic

Antrenarea unui model de încorporare a unui grafic de cunoștințe

Prezicerea de noi tranzacții

Ambalarea soluției ca un flux de lucru scalabil

REZULTATE

Concluzie

Despre autori

Mai mult de la Învățare automată AWS

Cum a folosit Patsnap inferența GPT-2 pe Amazon SageMaker cu latență și cost scăzute | Amazon Web Services

MLOps la margine cu Amazon SageMaker Edge Manager și AWS IoT Greengrass

Controale administrative ale întreprinderii, înregistrare simplă și suport extins pentru limbajul de programare pentru Amazon CodeWhisperer

Indexați conținutul dvs. Microsoft Exchange folosind conectorul Exchange pentru Amazon Kendra

Recomandări de putere și căutare folosind un grafic de cunoștințe IMDb - Partea 3

Utilizați Amazon SageMaker Data Wrangler în Amazon SageMaker Studio cu o configurație implicită a ciclului de viață

Citiți pagini web și evidențiați conținut folosind Amazon Polly

Personalizați-vă rezultatele căutării cu Amazon Personalize și integrarea Amazon OpenSearch Service | Amazon Web Services

Despre noi

Căutare verticală și Ai

Platformă

Rămâneți conectat

Cont