Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code

În ultimii câțiva ani, s-a observat o schimbare extraordinară de paradigmă în modul în care managerii de active instituționale provin și integrează mai multe surse de date în procesul lor de investiții. Cu schimbări frecvente în corelațiile de risc, surse neașteptate de volatilitate și concurență în creștere din partea strategiilor pasive, administratorii de active folosesc un set mai larg de surse de date terțe pentru a obține un avantaj competitiv și pentru a îmbunătăți rentabilitatea ajustată la risc. Cu toate acestea, procesul de extragere a beneficiilor din mai multe surse de date poate fi extrem de dificil. Echipele de inginerie de date ale managerilor de active sunt supraîncărcate cu achiziția și preprocesarea datelor, în timp ce echipele din domeniul științei datelor extrag date pentru informații despre investiții.

Datele terțe sau alternative se referă la datele utilizate în procesul de investiții, provenite din afara furnizorilor tradiționali de date de pe piață. Investitorii instituționali își sporesc frecvent sursele tradiționale de date cu date terțe sau alternative pentru a obține un avantaj în procesul lor de investiții. Exemplele citate în mod obișnuit includ, dar nu se limitează la, imagini prin satelit, datele cărților de credit și sentimentul rețelelor sociale. Administratorii de fonduri investesc aproape 3 miliarde USD anual în seturi de date externe, cheltuielile anuale crescând cu 20-30%.

Odată cu creșterea exponențială a seturilor de date terțe și alternative disponibile, capacitatea de a analiza rapid dacă un nou set de date adaugă noi perspective de investiții este un factor de diferențiere competitiv în industria managementului investițiilor. Serviciile de date și de inteligență artificială AWS no-code low-code (LCNC) permit echipelor netehnice să efectueze screening-ul inițial al datelor, să prioritizeze integrarea datelor, să accelereze timpul până la obținerea informațiilor și să elibereze resurse tehnice valoroase, creând un avantaj competitiv de durată.

În această postare pe blog, discutăm despre modul în care, în calitate de manager instituțional de active, puteți utiliza datele AWS LCNC și serviciile AI pentru a scala procesul inițial de analiză și prioritizare a datelor dincolo de echipele tehnice și pentru a vă accelera luarea deciziilor. Cu serviciile AWS LCNC, puteți să vă abonați și să evaluați rapid diverse seturi de date terță parte, să preprocesați datele și să verificați puterea predictivă a acestora folosind modele de învățare automată (ML) fără a scrie o singură bucată de cod.

Prezentare generală a soluțiilor

Cazul nostru de utilizare este să analizăm puterea de predicție a prețului acțiunilor a unui set de date extern și să identificăm importanța caracteristicilor acestuia - care câmpuri influențează cel mai mult performanța prețului acțiunilor. Acesta servește ca test de primă trecere pentru a identifica care dintre câmpurile multiple dintr-un set de date ar trebui evaluat mai îndeaproape folosind metodologiile cantitative tradiționale pentru a se potrivi cu procesul dvs. de investiții. Acest tip de test de primă trecere poate fi efectuat rapid de către analiști, economisind timp și permițându-vă să prioritizați mai rapid integrarea setului de date. De asemenea, în timp ce folosim prețul acțiunilor ca exemplu țintă, ar putea fi utilizate și alte valori, cum ar fi profitabilitatea, ratele de evaluare sau volumele de tranzacționare. Toate seturile de date utilizate pentru acest caz de utilizare sunt publicate în Schimb de date AWS.

Următoarea diagramă explică arhitectura end-to-end și serviciile AWS LCNC utilizate pentru a conduce deciziile:

Soluția noastră constă din următorii pași și soluții:

  1. Ingestie de date: AWS Data Exchange pentru abonamentul la seturile de date alternative publicate și descărcarea acestora Serviciul Amazon de stocare simplă Găleată (Amazon S3)
  2. Ingineria datelor: AWS Glue Databrew pentru ingineria datelor și transformarea datelor stocate în Amazon S3.
  3. Învățare automată: Amazon SageMaker Canvas pentru construirea unui model de prognoză în serie de timp pentru predicție și identificarea impactului datelor asupra prognozei.
  4. Business intelligence: Amazon QuickSight sau Amazon SageMaker Canvas pentru a revizui importanța caracteristicilor pentru prognoză pentru luarea deciziilor.

Ingestie de date

Schimb de date AWS facilitează găsirea, abonamentul și utilizarea datelor de la terți în cloud. Puteți naviga prin catalogul AWS Data Exchange și puteți găsi produse de date care sunt relevante pentru afacerea dvs. și subscrie la datele de la furnizori fără nicio prelucrare ulterioară și fără a fi nevoie de un proces ETL. Rețineți că mulți furnizori oferă abonamente inițiale gratuite, care vă permit să le analizați datele fără a fi nevoie să suportați mai întâi costuri inițiale.

Pentru acest caz de utilizare, căutați și abonați-vă la seturile de date de mai jos în AWS Data Exchange:

  • 20 de ani de date bursiere la sfârșitul zilei pentru primele 10 companii din SUA după capitalizarea pieței publicat de Alpha Vantage. Acest set de date gratuit conține date istorice de 20 de ani pentru primele 10 acțiuni din SUA în funcție de capitalizarea bursieră, începând cu 5 septembrie 2020. Setul de date conține următoarele 10 simboluri—AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (Clasa A); FB: Facebook, Inc.; GOOG: Alphabet Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; și WMT: Walmart Inc.
  • Câmpurile de date cheie includ
    • Deschis: prețul de deschidere tranzacționat pentru ziua respectivă
    • Ridicat: preț ridicat la tranzacționare pentru ziua respectivă
    • Scăzut: preț scăzut pentru ziua tranzacționat
    • Închidere: prețul de închidere tranzacționat pentru ziua respectivă
    • Volum: volumul de tranzacționare pentru ziua respectivă
    • Închidere ajustată: prețul de închidere al zilei divizat și ajustat în funcție de dividende
    • Rata de împărțire: raportul dintre numărul de acțiuni noi și cel vechi la data intrării în vigoare
    • Dividend: suma plătită a dividendelor în numerar
  • S3 Date scurte privind dobânzile și finanțarea valorilor mobiliare publicat de Parteneri S3. Acest set de date conține următoarele câmpuri:
Câmp Descriere
Data afacerii Data intrării în vigoare a ratei
ID-uri de securitate Identificatorii de securitate conțin Sedol, ISIN, FIGI, Ticker, Bloomberg ID
Nume si Prenume Nume securitate
Tarif de oferta Comision de finanțare compozită de piață plătită pentru pozițiile scurte existente
Rata de licitare Comision de creditare compozită de piață câștigată pentru acțiunile existente împrumutate de către deținătorii lungi
Ultima Rată Comision de creditare compozită de piață câștigată pentru acțiunile suplimentare împrumutate la acea dată (rată la vedere)
aglomerarea Indicatorul de impuls măsoară scurtarea zilnică și evenimentele de acoperire în raport cu flotarea pieței
Scurt dobândă Interes scurt în timp real exprimat în număr de acțiuni
ShortInterestNoțional Dobândă scurtă * Preț (USD)
ShortInterestPct Dobândă scurtă în timp real, exprimată ca procent din capitalul mobil
S3Float Numărul de acțiuni tranzacționabile, inclusiv lungi sintetice create prin vânzarea în lipsă
S3SIPctFloat Proiecția în timp real a dobânzii scurte împărțită la flota S3
IndicativDisponibilitate Cantitatea de împrumut disponibilă proiectată S3
folosire Dobândă scurtă în timp real împărțită la oferta totală de împrumut
DaystoCover10Day Este o măsură de lichiditate = dobândă scurtă / ADTV medie pe 10 zile
DaystoCover30Day Este o măsură de lichiditate = dobândă scurtă / ADTV medie pe 30 zile
DaystoCover90Day Este o măsură de lichiditate = dobândă scurtă / ADTV medie pe 90 zile
Original SI Interes scurt punct în timp

Pentru a obține datele, mai întâi veți căuta setul de date în AWS Data Exchange și vă veți abona la setul de date:

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Odată ce editorul seturilor de date aprobă cererile dvs. de abonament, veți avea seturile de date disponibile pentru a le descărca în compartimentul S3:

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Selectați Adăugați destinația jobului de export automat, furnizați detaliile compartimentului S3 și descărcați setul de date:

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Repetați pașii pentru a obține setul de date Alpha Vantage. Odată finalizat, veți avea ambele seturi de date în compartimentul S3.

Inginerie de date

Odată ce setul de date este în compartimentele dvs. S3, puteți utiliza AWS Glue Databrew pentru a transforma datele. AWS Glue DataBrew oferă peste 350 de transformări predefinite pentru a automatiza sarcinile de pregătire a datelor (cum ar fi filtrarea anomaliilor, standardizarea formatelor și corectarea valorilor nevalide) care altfel ar necesita zile sau săptămâni de scriere a transformărilor codificate manual.

Pentru a crea un set de date coordonat consolidat pentru prognoză în AWS DataBrew, parcurgeți pașii de mai jos. Pentru informații detaliate, vă rugăm să consultați aceasta blogul.

  1. Creați seturile de date DataBrew.
  2. Încărcați seturile de date DataBrew în proiecte DataBrew.
  3. Construiește rețetele DataBrew.
  4. Rulați joburile DataBrew.

Creați seturi de date DataBrew: În AWS Glue DataBrew, a date CCD reprezintă datele care sunt încărcate din compartimentul S3. Vom crea două seturi de date DataBrew — atât pentru prețul acțiunilor la sfârșitul zilei, cât și pentru dobânda scurtă S3. Când vă creați setul de date, introduceți detaliile conexiunii S3 o singură dată. Din acel moment, DataBrew poate accesa datele de bază pentru tine.

Încărcați seturile de date DataBrew în proiecte DataBrew: În AWS Glue DataBrew, a proiect este piesa centrală a eforturilor dumneavoastră de analiză și transformare a datelor. Un proiect DataBrew reunește seturile de date DataBrew și vă permite să dezvoltați o transformare a datelor (rețetă DataBrew). Din nou, vom crea două proiecte DataBrew, pentru prețul acțiunilor la sfârșitul zilei și dobânda scurtă S3.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Construiește rețetele DataBrew: În DataBrew, a reţetă este un set de pași de transformare a datelor. Puteți aplica acești pași setului de date. Pentru cazul de utilizare, vom construi două transformări. Primul va schimba formatul coloanei de marcaj temporal al prețului acțiunilor de la sfârșitul zilei, astfel încât setul de date să poată fi alăturat interesului scurt S3:

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

A doua transformare tratează datele, iar ultimul său pas ne asigură că unim seturile de date într-un singur set de date curatat. Pentru mai multe detalii despre construirea rețetelor de transformare a datelor, consultați aceasta blogul.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Locuri de muncă DataBrew: După crearea rețetelor DataBrew, puteți rula mai întâi jobul DataBrew la prețul acțiunilor de la sfârșitul zilei, urmat de rețeta S3 cu dobândă scurtă. Faceți referire la aceasta blogul pentru a crea un singur set de date consolidat. Salvați setul de date finalizat într-o găleată S3.

Fluxul de lucru end-to-end de inginerie a datelor va arăta astfel:

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Invatare mecanica

Cu setul de date curatat creat după inginerie post-date, puteți utiliza Amazon SageMaker Canvas pentru a vă construi modelul de prognoză și pentru a analiza impactul caracteristicilor asupra prognozei. Amazon SageMaker Canvas oferă utilizatorilor de afaceri o interfață vizuală de tip point-and-click care le permite să construiască modele și să genereze singuri predicții ML precise – fără a necesita experiență ML sau a fi nevoie să scrie o singură linie de cod.

Pentru a construi un model de prognoză în serie de timp în Amazon SageMaker Canvas, urmați pașii de mai jos. Pentru informații detaliate, consultați aceasta blogul:

  1. Selectați setul de date organizat în SageMaker Canvas.
  2. Construiți modelul de prognoză în serie de timp.
  3. Analizați rezultatele și importanța caracteristicilor.

Construiți modelul de prognoză în serie de timp: După ce ați selectat setul de date, selectați coloana țintă care urmează să fie estimată. În cazul nostru, acesta va fi prețul de închidere al ticker-ului stocului. SageMaker Canvas detectează automat că aceasta este o declarație de problemă de prognoză în serie de timp.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Va trebui să configurați modelul după cum urmează pentru prognoza serii temporale. Pentru ID-ul articolului, selectați numele tickerului stocului. Amintiți-vă, setul nostru de date are prețuri de acțiuni pentru primele 10 acțiuni. Selectați coloana de marcaj de timp pentru marca de timp și, în final, introduceți numărul de zile pe care doriți să le prognozați în viitor [Forecast Horizon].

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Acum sunteți gata să construiți modelul. SageMaker Canvas oferă două opțiuni pentru a construi modelul: Construire rapidă și Construire standard. În cazul nostru, vom folosi „Standard Build”.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Construirea standard durează aproximativ trei ore pentru a construi modelul și utilizări Prognoza Amazon, un serviciu de prognoză în serie de timp bazat pe ML ca motor de prognoză de bază. Forecast creează prognoze extrem de precise prin ansamblu de modele de modele tradiționale și de deep learning, fără a necesita experiență ML.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Odată ce modelul este construit, acum puteți revizui performanța modelului (precizia predicției) și importanța caracteristicilor. După cum se poate vedea din figura de mai jos, modelul identifică Crowding și DaysToCover10Day drept cele două caracteristici de top care conduc valorile prognozelor. Acest lucru este în concordanță cu intuiția noastră de piață, deoarece aglomerația este un indicator de impuls care măsoară scurtarea zilnică și acoperă evenimentele, iar dobânda scurtă pe termen scurt este o măsură de lichiditate, care indică modul în care investitorii sunt poziționați într-un stoc. Atât impulsul, cât și lichiditatea pot determina volatilitatea prețurilor.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Acest rezultat indică faptul că aceste două caracteristici (sau câmpuri) au o relație strânsă cu mișcările prețului acțiunilor și pot fi prioritizate mai mult pentru integrare și analiză ulterioară.

Informații de afaceri

În contextul prognozării seriilor temporale, noţiunea de testare înapoi se referă la procesul de evaluare a acurateții unei metode de prognoză folosind datele istorice existente. Procesul este de obicei iterativ și repetat pe mai multe date prezente în datele istorice.

După cum am discutat deja, SageMaker Canvas folosește Amazon Forecast ca motor pentru prognoza serii temporale. Forecast creează un backtest ca parte a procesului de construire a modelului. Acum puteți vedea detaliile predictorului conectându-vă la Amazon Forecast. Pentru o înțelegere mai profundă a explicabilității modelului, consultați aceasta blogul.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Amazon Forecast oferă detalii suplimentare despre valorile predictorilor, cum ar fi eroarea procentuală absolută ponderată (WAPE), eroarea pătratică medie (RMSE), eroarea procentuală medie absolută (MAPE) și eroarea medie absolută scalată (MASE). Puteți exporta scorurile de calitate ale predictorilor din Amazon Forecast.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Amazon Forecast rulează un backtest pentru setul de date din seria temporală furnizat. Rezultatele backtestului sunt disponibile pentru descărcare folosind Exportați rezultatele backtest buton. Rezultatele backtest exportate sunt descărcate într-o găleată S3.

Vom reprezenta acum rezultatele testului backtest în Amazon QuickSight. Pentru a vizualiza rezultatele testului backtest în Amazon QuickSight, conectați-vă la setul de date din Amazon S3 din QuickSight și creați o vizualizare.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

A curăța

Serviciile AWS utilizate în această soluție sunt gestionate și fără server. SageMaker Canvas este conceput pentru a desfășura antrenament ML de lungă durată și va fi mereu activat. Asigurați-vă că vă deconectați în mod explicit de la SageMaker Canvas. Va rog, referiti-va la documentele pentru mai multe detalii.

Concluzie

În această postare pe blog, am discutat despre modul în care, în calitate de manager de active instituțional, puteți utiliza datele AWS low-code fără cod (LCNC) și serviciile AI pentru a accelera evaluarea seturilor de date externe prin descărcarea de screening inițială a setului de date personalului netehnic. Această analiză de primă trecere poate fi făcută rapid pentru a vă ajuta să decideți ce seturi de date ar trebui să li se acorde prioritate pentru integrare și analize ulterioare.

Am demonstrat pas cu pas modul în care un analist de date poate achiziționa noi date terță parte prin AWS Data Exchange , poate folosi serviciile ETL fără cod AWS Glue DataBrew pentru a preprocesa datele și a evalua ce caracteristici dintr-un set de date au cel mai mare impact asupra prognozei modelului .

Odată ce datele sunt pregătite pentru analiză, un analist folosește SageMaker Canvas pentru a construi un model predictiv, pentru a evalua potrivirea acestuia și pentru a identifica caracteristicile semnificative. În exemplul nostru, MAPE (.05) și WAPE (.045) ale modelului au indicat o potrivire bună și au arătat „Crowding” și „DaysToCover10Day” drept semnale din setul de date cu cel mai mare impact asupra prognozei. Această analiză a cuantificat ce date au influențat cel mai mult modelul și, prin urmare, ar putea fi prioritizate pentru investigații ulterioare și includere potențială în semnalele alfa sau în procesul de gestionare a riscurilor. Și, la fel de important, scorurile de explicabilitate indică ce date joacă un rol relativ mic în determinarea prognozei și, prin urmare, pot fi o prioritate mai mică pentru investigații ulterioare.

Pentru a evalua mai rapid capacitatea datelor financiare ale terților de a vă sprijini procesul de investiții, consultați Surse de date ale serviciilor financiare disponibile pe AWS Data Exchange, si da DataBrew și Planșă o incercare azi.


Despre Autori

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Boris Litvin este arhitect principal de soluții, responsabil pentru inovarea în industria serviciilor financiare. Este un fost fondator de Quant și FinTech, pasionat de investițiile sistematice.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Meenakshisundaram Thandavarayan este un specialist senior AI/ML cu AWS. El ajută conturile strategice de înaltă tehnologie în călătoria lor AI și ML. Este foarte pasionat de IA bazată pe date.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Camillo Anania este un Senior Startup Solutions Architect cu AWS, cu sediul în Marea Britanie. Este un tehnolog pasionat care ajută startup-urile de orice dimensiune să se construiască și să se dezvolte.

Accelerați procesul de investiții cu serviciile AWS Low Code-No Code PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Dan Sinnreich este un manager de produs senior cu AWS, axat pe împuternicirea companiilor să ia decizii mai bune cu ML. El a construit anterior platforme de analiză de portofoliu și modele de risc cu mai multe clase de active pentru marii investitori instituționali.

Timestamp-ul:

Mai mult de la Învățare automată AWS