Påskynda investeringsprocessen med AWS Low Code-No Code Services

Återutgiven av Platon

anhängare: 0

De senaste åren har sett ett enormt paradigmskifte i hur institutionella kapitalförvaltare hämtar och integrerar flera datakällor i sin investeringsprocess. Med frekventa förändringar i riskkorrelationer, oväntade källor till volatilitet och ökad konkurrens från passiva strategier, använder kapitalförvaltare en bredare uppsättning datakällor från tredje part för att få en konkurrensfördel och förbättra riskjusterad avkastning. Processen att extrahera fördelar från flera datakällor kan dock vara extremt utmanande. Kapitalförvaltarnas datateknikteam är överbelastade med datainsamling och förbearbetning, medan datavetenskapsteam utvinner data för investeringsinsikter.

Tredjepartsdata eller alternativa data avser data som används i investeringsprocessen, hämtade utanför de traditionella marknadsdataleverantörerna. Institutionella investerare utökar ofta sina traditionella datakällor med tredje parts eller alternativa data för att få ett försprång i sin investeringsprocess. Typiskt citerade exempel inkluderar, men är inte begränsade till, satellitbilder, kreditkortsdata och känslor i sociala medier. Fondförvaltare investerar nästan 3 miljarder dollar årligen i externa datauppsättningar, med årliga utgifter som växer med 20–30 procent.

Med den exponentiella tillväxten av tillgängliga tredjeparts- och alternativa datauppsättningar är möjligheten att snabbt analysera om en ny datauppsättning lägger till nya investeringsinsikter en konkurrensskillnad i investeringsförvaltningsbranschen. AWS no-code low-code (LCNC) data och AI-tjänster gör det möjligt för icke-tekniska team att utföra den initiala datascreeningen, prioritera data onboarding, accelerera tiden till insikter och frigöra värdefulla tekniska resurser – vilket skapar en bestående konkurrensfördel.

I det här blogginlägget diskuterar vi hur du som institutionell kapitalförvaltare kan utnyttja AWS LCNC-data och AI-tjänster för att skala den initiala dataanalys- och prioriteringsprocessen bortom tekniska team och påskynda ditt beslutsfattande. Med AWS LCNC-tjänster kan du snabbt prenumerera på och utvärdera olika tredjepartsdatauppsättningar, förbehandla data och kontrollera deras prediktiva kraft med hjälp av maskininlärningsmodeller (ML) utan att skriva en enda kod.

Lösningsöversikt

Vårt användningsfall är att analysera aktiekursförutsägelsekraften hos en extern datauppsättning och identifiera dess funktionsviktighet – vilka områden som påverkar aktiekursens prestanda mest. Detta fungerar som ett förstapasstest för att identifiera vilka av de flera fälten i en datauppsättning som bör utvärderas närmare med traditionella kvantitativa metoder för att passa din investeringsprocess. Den här typen av förstapass-test kan göras snabbt av analytiker, vilket sparar tid och låter dig snabbare prioritera dataintroduktion. Även om vi använder aktiekursen som vårt målexempel, kan andra mätvärden som lönsamhet, värderingskvoter eller handelsvolymer också användas. Alla datauppsättningar som används för detta användningsfall publiceras i AWS datautbyte.

Följande diagram förklarar end-to-end-arkitekturen och AWS LCNC-tjänsterna som används för att styra besluten:

Vår lösning består av följande steg och lösningar:

Dataintag: AWS Data Exchange för att prenumerera på de publicerade alternativa datauppsättningarna och ladda ner dem till Amazon enkel lagringstjänst (Amazon S3) hink.
Datateknik: AWS Lim DataBrew för datateknik och transformation av data som lagras i Amazon S3.
Maskininlärning: Amazon SageMaker Canvas för att bygga en tidsserieprognosmodell för att förutsäga och identifiera inverkan av data på prognosen.
Affärsinformation: Amazon QuickSight eller Amazon SageMaker Canvas för att granska funktionernas betydelse för prognosen för beslutsfattande.

Upptagning av data

AWS datautbyte gör det enkelt att hitta, prenumerera på och använda data från tredje part i molnet. Du kan bläddra igenom AWS Data Exchange-katalogen och hitta dataprodukter som är relevanta för ditt företag och prenumerera till data från leverantörerna utan ytterligare bearbetning och inget behov av en ETL-process. Observera att många leverantörer erbjuder gratis första prenumerationer, vilket gör att du kan analysera deras data utan att först behöva ta på dig förskottskostnader.

För detta användningsfall, sök och prenumerera på nedanstående datauppsättningar i AWS Data Exchange:

20 års aktiedata vid dagens slut för topp 10 amerikanska företag efter börsvärde publicerad av Alpha Vantage. Denna kostnadsfria datauppsättning innehåller 20 års historisk data för de 10 bästa amerikanska aktierna efter börsvärde den 5 september 2020. Datauppsättningen innehåller följande 10 symboler—AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (Klass A); FB: Facebook, Inc.; GOOG: Alphabet Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; och WMT: Walmart Inc.
Viktiga datafält inkluderar
- Öppet: handlas öppningskurs för dagen
- Högt: Högt vid handlas högt pris för dagen
- Lågt: lågt pris i affären för dagen
- Stäng: handlas stängningskurs för dagen
- Volym: handelsvolym för dagen
- Justerad stängning: split och utdelningsjusterad stängningskurs för dagen
- Split Ratio: förhållandet mellan nytt och gammalt antal aktier på ikraftträdandet
- Utdelning: kontant utdelningsbelopp
S3 Korträntor och värdepappersfinansieringsdata publicerad av S3 partners. Denna datauppsättning innehåller följande fält:

Fält	Beskrivning
Affärsdatum	Ikraftträdandedatum för kursen
Säkerhets-ID:n	Säkerhetsidentifierare innehåller Sedol, ISIN, FIGI, Ticker, Bloomberg ID
Namn	Säkerhetsnamn
Erbjudandepris	Marknadssammansatt finansieringsavgift betalas för befintliga korta positioner
Budränta	Marknadssammansatt utlåningsavgift intjänad för befintliga aktier utlånade av långa innehavare
Senaste kursen	Marknadssammansatt utlåningsavgift intjänad för inkrementella aktier utlånade på det datumet (avistakurs)
Trängsel	Momentumindikatorn mäter daglig kortslutning och täcker händelser i förhållande till marknadens flytande
Kort ränta	Kort ränta i realtid uttryckt i antal aktier
ShortInterestNotional	Kortränta * Pris (USD)
ShortInterestPct	Kort ränta i realtid uttryckt som en procentandel av aktiekapitalet
S3Float	Antalet omsättbara aktier inklusive syntetiska longs skapade genom blankning
S3SIPctFloat	Kort ränteprognose i realtid dividerat med S3-floaten
IndikativTillgänglighet	S3 beräknad tillgänglig utlånbar kvantitet
Utnyttjande	Kort ränta i realtid dividerat med totalt utlånbart utbud
DaytoCover10Day	Det är ett likviditetsmått = kort ränta / 10-dagars genomsnittlig ADTV
DaytoCover30Day	Det är ett likviditetsmått = kort ränta / 30-dagars genomsnittlig ADTV
DaytoCover90Day	Det är ett likviditetsmått = kort ränta / 90-dagars genomsnittlig ADTV
Original SI	Tidpunkt kort intresse

För att få datan ska du först söka efter datasetet i AWS Data Exchange och prenumerera på datasetet:

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

När utgivaren av datauppsättningarna godkänner dina prenumerationsförfrågningar har du datauppsättningarna tillgängliga för nedladdning till din S3-bucket:

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Välja Lägg till destination för automatisk export av jobb, ge information om S3-hinken och ladda ned datamängden:

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Upprepa stegen för att hämta Alpha Vantage-datauppsättningen. När du är klar kommer du att ha båda datauppsättningarna i din S3-hink.

Datateknik

När datasetet är i dina S3-hinkar kan du använda AWS Lim DataBrew att omvandla data. AWS Glue DataBrew erbjuder över 350 förbyggda transformationer för att automatisera databeredningsuppgifter (som filtrering av anomalier, standardisering av format och korrigering av ogiltiga värden) som annars skulle kräva dagar eller veckor av att skriva handkodade transformationer.

För att skapa en konsoliderad kurerad datauppsättning för prognoser i AWS DataBrew, utför stegen nedan. För detaljerad information, se denna blogg.

Skapa DataBrew-datauppsättningarna.
Ladda DataBrew-datauppsättningar i DataBrew-projekt.
Bygg DataBrew-recepten.
Kör DataBrew-jobben.

Skapa DataBrew-dataset: I AWS Glue DataBrew, en dataset representerar data som laddas upp från S3-bucket. Vi kommer att skapa två DataBrew-datauppsättningar – för både aktiekursen vid dagens slut och S3-korträntan. När du skapar din datauppsättning anger du S3-anslutningsinformationen endast en gång. Från den punkten kan DataBrew komma åt den underliggande informationen åt dig.

Ladda DataBrew-datauppsättningarna till DataBrew-projekt: I AWS Glue DataBrew, en projektet är mittpunkten i dina ansträngningar för dataanalys och transformation. Ett DataBrew-projekt samlar DataBrew-datauppsättningarna och gör att du kan utveckla en datatransformation (DataBrew-recept). Även här kommer vi att skapa två DataBrew-projekt, för dagens aktiekurs och S3 kort ränta.

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Bygg DataBrew-recepten: I DataBrew, a Receptet är en uppsättning datatransformationssteg. Du kan tillämpa dessa steg på din datauppsättning. För användningsfallet kommer vi att bygga två transformationer. Den första kommer att ändra formatet på kolumnen för dagens aktiekurstidsstämpel så att datauppsättningen kan kopplas till S3-korträntan:

Den andra transformationen kurerar data, och dess sista steg säkerställer att vi sammanfogar datamängderna till en enda kurerad datauppsättning. För mer information om att bygga recept för datatransformation, se detta blogg.

DataBrew jobb: Efter skapandet av DataBrew-recepten kan du först köra DataBrew-jobbet vid slutet av dagen följt av S3-receptet med kort ränta. Hänvisa till detta blogg för att skapa en enda konsoliderad datauppsättning. Spara den slutliga kurerade datamängden i en S3-hink.

Arbetsflödet för datateknik från slut till slut kommer att se ut så här:

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Maskininlärning

Med den kurerade dataset som skapats efter datateknik kan du använda Amazon SageMaker Canvas att bygga din prognosmodell och analysera effekterna av funktioner på prognosen. Amazon SageMaker Canvas ger företagsanvändare ett visuellt peka-och-klicka-gränssnitt som låter dem bygga modeller och generera exakta ML-förutsägelser på egen hand – utan att kräva någon ML-erfarenhet eller att behöva skriva en enda rad kod.

För att bygga en tidsserieprognosmodell i Amazon SageMaker Canvas, följ stegen nedan. För detaljerad information, se denna blogg:

Välj den kurerade datamängden i SageMaker Canvas.
Bygg tidsserieprognosmodellen.
Analysera resultaten och egenskapens betydelse.

Bygg tidsserieprognosmodellen: När du har valt datamängden väljer du den målkolumn som ska förutsägas. I vårt fall kommer detta att vara stängningskursen för aktiekursen. SageMaker Canvas upptäcker automatiskt att detta är en problemformulering för tidsserier.

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Du måste konfigurera modellen enligt följande för tidsserieprognoser. För artikel-ID, välj aktienamnet. Kom ihåg att vår datauppsättning har aktiekurser för de 10 bästa aktierna. Välj tidsstämpelkolumnen för tidsstämpeln och ange slutligen antalet dagar du vill prognostisera i framtiden [Prognoshorisont].

Nu är du redo att bygga modellen. SageMaker Canvas erbjuder två alternativ för att bygga modellen: Quick Build och Standard Build. I vårt fall kommer vi att använda "Standard Build".

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Standard Build tar cirka tre timmar att bygga modellen och användningarna Amazon Prognos, en tidsserieprognostjänst baserad på ML som den underliggande prognosmotorn. Forecast skapar mycket exakta prognoser genom att modellera modeller av traditionella och djupinlärningsmodeller utan att kräva ML-erfarenhet.

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

När modellen har byggts kan du nu granska modellens prestanda (prediktionsnoggrannhet) och funktionsviktighet. Som framgår av figuren nedan identifierar modellen Crowding och DaysToCover10Day som de två främsta funktionerna som driver prognosvärden. Detta är i linje med vår marknadsintuition, eftersom trängsel är en momentumindikator som mäter dagliga kortslutningar och täcker händelser, och kortfristiga korta räntor är ett likviditetsmått som indikerar hur investerare är positionerade i en aktie. Både momentum och likviditet kan driva prisvolatilitet.

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Detta resultat indikerar att dessa två funktioner (eller fält) har ett nära samband med aktiekursrörelser och kan prioriteras högre för introduktion och vidare analys.

Business intelligence

I samband med tidsserieprognoser, begreppet backtesting hänvisar till processen att bedöma noggrannheten hos en prognosmetod med hjälp av befintliga historiska data. Processen är vanligtvis iterativ och upprepas över flera datum som finns i historiska data.

Som vi redan diskuterat använder SageMaker Canvas Amazon Forecast som motor för tidsserieprognoser. Forecast skapar ett backtest som en del av modellbyggeprocessen. Du kan nu se prediktordetaljerna genom att logga in på Amazon Forecast. För djupare förståelse för modellförklaring, se detta blogg.

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Amazon Forecast tillhandahåller ytterligare information om prediktormått som viktat absolut procentuellt fel (WAPE), root mean square error (RMSE), genomsnittligt absolut procentuellt fel (MAPE) och genomsnittligt absolut skalat fel (MASE). Du kan exportera prediktorkvalitetspoäng från Amazon Forecast.

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Amazon Forecast kör ett baktest för tidsseriedataset som tillhandahålls. Backtest-resultaten är tillgängliga för nedladdning med hjälp av Exportera backtestresultat knapp. Exporterade backtest-resultat laddas ner till en S3-bucket.

Vi kommer nu att plotta backtestresultaten i Amazon QuickSight. För att visualisera backtestresultaten i Amazon QuickSight, anslut till datasetet i Amazon S3 från QuickSight och skapa en visualisering.

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänsterna PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Städa upp

AWS-tjänster som utnyttjas i denna lösning är hanterade och serverlösa till sin natur. SageMaker Canvas är designad för att köra långlöpande ML-träning och kommer alltid att vara på. Se till att du explicit loggar ut SageMaker Canvas. Vänligen hänvisa till dokumenten för mer detaljer.

Slutsats

I det här blogginlägget diskuterade vi hur du som institutionell kapitalförvaltare kan utnyttja AWS low-code no-code (LCNC)-data och AI-tjänster för att påskynda utvärderingen av externa datauppsättningar genom att överföra den initiala datauppsättningsscreeningen till icke-teknisk personal. Denna första-pass-analys kan göras snabbt för att hjälpa dig att bestämma vilka datauppsättningar som ska prioriteras för introduktion och vidare analys.

Vi demonstrerade steg-för-steg hur en dataanalytiker kan skaffa ny tredjepartsdata genom AWS Data Exchange , använda AWS Glue DataBrew no-code ETL-tjänster för att förbehandla data och utvärdera vilka funktioner i ett dataset som har störst inverkan på modellens prognos .

När data är analysklar använder en analytiker SageMaker Canvas för att bygga en prediktiv modell, utvärdera dess passform och identifiera viktiga funktioner. I vårt exempel indikerade modellens MAPE (.05) och WAPE (.045) en god passform och visade "Crowding" och "DaysToCover10Day" som signalerna i datamängden med störst påverkan över prognosen. Denna analys kvantifierade vilken data som påverkade modellen mest och kunde därför prioriteras för vidare utredning och potentiell inkludering i dina alfasignaler eller riskhanteringsprocess. Och lika viktigt är att förklaringspoäng indikerar vilken data som spelar relativt liten roll för att bestämma prognosen och därför kan ha lägre prioritet för vidare undersökning.

För att snabbare utvärdera förmågan hos finansiella data från tredje part att stödja din investeringsprocess, gå igenom Financial Services-datakällor tillgängliga på AWS Data Exchange, och ge DataBrew och Målarduk ett försök idag.

Om författarna

Boris Litvin är Principal Solution Architect, ansvarig för innovation inom Financial Services-branschen. Han är en före detta Quant och FinTech-grundare, brinner för systematiska investeringar.

Meenakshisundaram Thandavarayan är senior AI/ML-specialist med AWS. Han hjälper högteknologiska strategiska konton på deras AI- och ML-resa. Han brinner mycket för datadriven AI.

Camillo Anania är en Senior Startup Solutions Architect med AWS baserad i Storbritannien. Han är en passionerad teknolog som hjälper startups av alla storlekar att bygga och växa.

Dan Sinnreich är Sr. Product Manager med AWS, fokuserad på att ge företag möjlighet att fatta bättre beslut med ML. Han byggde tidigare portföljanalysplattformar och riskmodeller för flera tillgångsklasser för stora institutionella investerare.

Tidsstämpel: December 20, 2022December 23, 2022

Tidsstämpel: Jan 17, 2024

Accelerera investeringsprocessen med AWS Low Code-No Code-tjänster

Återutgiven av Platon

Lösningsöversikt

Upptagning av data

Datateknik

Maskininlärning

Business intelligence

Städa upp

Slutsats

Om författarna

Mer från AWS maskininlärning

Återställ tränade parametrar på stora datamängder med Amazon SageMaker Data Wrangler

Upptäck mönster i textdata med Amazon SageMaker Data Wrangler

Whitepaper: Best Practices för maskininlärning inom hälsovård och biovetenskap

Uppnå värd med låg latens för beslutsträdbaserade ML-modeller på NVIDIA Triton Inference Server på Amazon SageMaker

Hur Amp på Amazon använde data för att öka kundernas engagemang, del 1: Bygga en dataanalysplattform

Om Oss

Vertikal sökning och Ai

plattform

Håll kontakten

Konto