Versnel het investeringsproces met AWS Low Code-No Code Services

Heruitgegeven door Plato

volgers: 0

De afgelopen jaren hebben een enorme paradigmaverschuiving plaatsgevonden in de manier waarop institutionele vermogensbeheerders meerdere gegevensbronnen zoeken en integreren in hun beleggingsproces. Met frequente verschuivingen in risicocorrelaties, onverwachte bronnen van volatiliteit en toenemende concurrentie van passieve strategieën, maken vermogensbeheerders gebruik van een breder scala aan gegevensbronnen van derden om een concurrentievoordeel te behalen en het voor risico gecorrigeerde rendement te verbeteren. Het proces om voordelen uit meerdere gegevensbronnen te halen, kan echter buitengewoon uitdagend zijn. De data-engineeringteams van vermogensbeheerders worden overladen met data-acquisitie en voorverwerking, terwijl datawetenschapsteams data ontginnen voor investeringsinzichten.

Gegevens van derden of alternatieve gegevens verwijzen naar gegevens die worden gebruikt in het beleggingsproces en afkomstig zijn van buiten de traditionele aanbieders van marktgegevens. Institutionele beleggers vullen hun traditionele gegevensbronnen regelmatig aan met gegevens van derden of alternatieve gegevens om een voorsprong te krijgen in hun investeringsproces. Typisch aangehaalde voorbeelden omvatten, maar zijn niet beperkt tot, satellietbeelden, creditcardgegevens en sentiment op sociale media. Fondsbeheerders investeren jaarlijks bijna $ 3 miljard in externe datasets, waarbij de jaarlijkse uitgaven met 20-30 procent toenemen.

Met de exponentiële groei van beschikbare datasets van derden en alternatieve datasets, is de mogelijkheid om snel te analyseren of een nieuwe dataset nieuwe beleggingsinzichten toevoegt, een onderscheidende factor in de sector van investeringsbeheer. AWS no-code low-code (LCNC) data en AI-services stellen niet-technische teams in staat om de eerste datascreening uit te voeren, prioriteit te geven aan data onboarding, time-to-insights te versnellen en waardevolle technische resources vrij te maken, waardoor een blijvend concurrentievoordeel ontstaat.

In deze blogpost bespreken we hoe u als institutionele vermogensbeheerder AWS LCNC-gegevens en AI-services kunt gebruiken om het initiële gegevensanalyse- en prioriteringsproces buiten technische teams op te schalen en uw besluitvorming te versnellen. Met AWS LCNC-services kunt u zich snel abonneren op diverse datasets van derden en deze evalueren, gegevens voorbewerken en hun voorspellende kracht controleren met behulp van machine learning (ML)-modellen zonder ook maar één stukje code te schrijven.

Overzicht oplossingen

Onze use case is om de voorspellende kracht van een externe dataset voor de aandelenkoers te analyseren en het belang ervan te identificeren - welke velden de meeste invloed hebben op de prestaties van de aandelenkoers. Dit dient als een first-pass-test om te bepalen welke van de meerdere velden in een dataset nauwkeuriger moeten worden geëvalueerd met behulp van traditionele kwantitatieve methoden om te passen bij uw beleggingsproces. Dit type first-pass-test kan snel worden uitgevoerd door analisten, waardoor u tijd bespaart en u sneller prioriteit kunt geven aan het onboarden van datasets. Hoewel we de aandelenkoers als ons doelvoorbeeld gebruiken, kunnen ook andere statistieken zoals winstgevendheid, waarderingsratio's of handelsvolumes worden gebruikt. Alle datasets die voor deze use case worden gebruikt, zijn gepubliceerd in AWS-gegevensuitwisseling.

Het volgende diagram legt de end-to-end-architectuur uit en de AWS LCNC-services die worden gebruikt om de beslissingen te sturen:

Onze oplossing bestaat uit de volgende stappen en oplossingen:

Gegevensopname: AWS Data Exchange voor het abonneren op de gepubliceerde alternatieve datasets en het downloaden ervan Amazon eenvoudige opslagservice (Amazon S3) emmer.
Data-engineering: AWS lijm DataBrew voor data-engineering en transformatie van de gegevens die zijn opgeslagen in Amazon S3.
Machine leren: Amazon SageMaker-canvas voor het bouwen van een tijdreeksvoorspellingsmodel voor voorspelling en het identificeren van de impact van gegevens op de voorspelling.
Bedrijfsinformatie: Amazon QuickSight of Amazon SageMaker Canvas om het belang van functies voor de prognose voor besluitvorming te bekijken.

Gegevensopname

AWS-gegevensuitwisseling maakt het gemakkelijk om gegevens van derden in de cloud te vinden, erop te abonneren en te gebruiken. U kunt door de AWS Data Exchange-catalogus bladeren en dataproducten vinden die relevant zijn voor uw bedrijf en abonneren naar de gegevens van de providers zonder enige verdere verwerking en zonder dat een ETL-proces nodig is. Houd er rekening mee dat veel providers gratis initiële abonnementen aanbieden, waarmee u hun gegevens kunt analyseren zonder eerst vooraf kosten te hoeven maken.

Zoek en abonneer u voor deze use case op de onderstaande datasets in AWS Data Exchange:

20 jaar end-of-day-aandelengegevens voor de 10 beste Amerikaanse bedrijven op basis van marktkapitalisatie gepubliceerd door Alfa Vantage. Deze gratis dataset bevat 20 jaar aan historische gegevens voor de top 10 Amerikaanse aandelen op basis van marktkapitalisatie op 5 september 2020. De dataset bevat de volgende 10 symbolen: AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (klasse A); FB: Facebook, Inc.; GOOG: Alphabet Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; en WMT: Walmart Inc.
Sleutelgegevensvelden omvatten
- Open: as-trade openingskoers voor de dag
- Hoog: as-traded hoge prijs voor de dag
- Laag: as-traded lage prijs voor de dag
- Sluiten: as-trade slotkoers voor de dag
- Volume: handelsvolume voor de dag
- Adjusted Close: gesplitste en voor dividend gecorrigeerde slotkoers van de dag
- Splitsingsratio: verhouding tussen nieuw en oud aantal aandelen op de ingangsdatum
- Dividend: uit te keren dividend in contanten
S3 Korte rente- en effectenfinancieringsgegevens gepubliceerd door S3-partners. Deze dataset bevat de volgende velden:

Veld	Omschrijving
Zakelijke datum	Ingangsdatum voor het tarief
Beveiligings-ID's	Beveiligingsidentificatoren bevatten Sedol, ISIN, FIGI, Ticker, Bloomberg ID
Naam	Beveiligingsnaam
Aanbiedingstarief	Markt samengestelde financieringsvergoeding betaald voor bestaande shortposities
Biedpercentage	Markt samengestelde uitleenvergoeding verdiend voor bestaande aandelen uitgeleend door longhouders
Laatste tarief	Markt samengestelde uitleenvergoeding verdiend voor incrementele aandelen die op die datum zijn uitgeleend (contant tarief)
Drukte	De momentumindicator meet dagelijkse shorting en dekking van gebeurtenissen ten opzichte van de marktvlotter
Korte rente	Realtime korte rente uitgedrukt in aantal aandelen
Korte renteNotioneel	ShortInterest * Prijs (USD)
Korte rentePct	Realtime korte rente uitgedrukt als een percentage van de equity float
S3 Zweven	Het aantal verhandelbare aandelen inclusief synthetische longs gecreëerd door short selling
S3SIPctFloat	Realtime korte renteprojectie gedeeld door de S3-float
IndicatieveBeschikbaarheid	S3 verwachte beschikbare uitleenbare hoeveelheid
benutting	Realtime korte rente gedeeld door het totale uitleenbare aanbod
Dagen tot dekking van 10 dagen	Het is een liquiditeitsmaatstaf = korte rente / 10-daags gemiddelde ADTV
Dagen tot dekking van 30 dagen	Het is een liquiditeitsmaatstaf = korte rente / 30-daags gemiddelde ADTV
Dagen tot dekking van 90 dagen	Het is een liquiditeitsmaatstaf = korte rente / 90-daags gemiddelde ADTV
Originele SI	Punt in de tijd korte rente

Om de gegevens op te halen, zoekt u eerst naar de dataset in AWS Data Exchange en abonneert u zich op de dataset:

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Zodra de uitgever van de datasets uw abonnementsaanvragen goedkeurt, heeft u de datasets die u kunt downloaden naar uw S3-bucket:

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

kies Taakbestemming voor automatisch exporteren toevoegen, geef de details van de S3-bucket op en download de dataset:

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Herhaal de stappen om de Alpha Vantage-gegevensset op te halen. Eenmaal voltooid, hebt u beide datasets in uw S3-bucket.

Data-engineering

Zodra de dataset zich in uw S3-buckets bevindt, kunt u deze gebruiken AWS lijm DataBrew om de gegevens te transformeren. AWS Glue DataBrew biedt meer dan 350 vooraf gebouwde transformaties om gegevensvoorbereidingstaken te automatiseren (zoals het filteren van anomalieën, het standaardiseren van formaten en het corrigeren van ongeldige waarden) waarvoor anders dagen of weken van met de hand gecodeerde transformaties nodig zouden zijn.

Voer de onderstaande stappen uit om een geconsolideerde samengestelde dataset voor prognoses in AWS DataBrew te maken. Voor gedetailleerde informatie verwijzen wij u naar deze blog.

Maak de DataBrew-gegevenssets.
Laad DataBrew-datasets in DataBrew-projecten.
Bouw de DataBrew-recepten.
Voer de DataBrew-taken uit.

Maak DataBrew-gegevenssets: In AWS Glue DataBrew, een dataset vertegenwoordigt gegevens die zijn geüpload vanuit de S3-bucket. We zullen twee DataBrew-datasets maken - voor zowel de aandelenkoers aan het einde van de dag als S3 korte rente. Wanneer u uw dataset aanmaakt, voert u de S3-verbindingsgegevens slechts één keer in. Vanaf dat moment heeft DataBrew voor u toegang tot de onderliggende gegevens.

Laad de DataBrew-datasets in DataBrew-projecten: In AWS Glue DataBrew, een project is het middelpunt van uw data-analyse en transformatie-inspanningen. Een DataBrew-project brengt de DataBrew-datasets samen en stelt u in staat een datatransformatie te ontwikkelen (DataBrew-recept). Ook hier zullen we twee DataBrew-projecten maken, voor de aandelenkoers aan het einde van de dag en S3 korte rente.

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Bouw de DataBrew-recepten: In DataBrew, een recept is een reeks gegevenstransformatiestappen. U kunt deze stappen toepassen op uw dataset. Voor de use case bouwen we twee transformaties. De eerste zal het formaat van de tijdstempelkolom van de aandelenkoers aan het einde van de dag wijzigen, zodat de dataset kan worden samengevoegd met de S3 short interest:

De tweede transformatie beheert de data en de laatste stap zorgt ervoor dat we de datasets samenvoegen tot één samengestelde dataset. Raadpleeg dit voor meer informatie over het bouwen van recepten voor gegevenstransformatie blog.

DataBrew-taken: Nadat de DataBrew-recepten zijn gemaakt, kunt u eerst de DataBrew-taak voor de aandelenkoers aan het einde van de dag uitvoeren, gevolgd door het S3-recept voor korte rente. Raadpleeg dit blog om één geconsolideerde dataset te creëren. Sla de uiteindelijke samengestelde dataset op in een S3-bucket.

De end-to-end workflow voor data-engineering ziet er als volgt uit:

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

machine learning

Met de gecureerde dataset die post-data engineering is gemaakt, kunt u gebruiken Amazon SageMaker-canvas om uw prognosemodel te bouwen en de impact van functies op de prognose te analyseren. Amazon SageMaker-canvas biedt zakelijke gebruikers een visuele point-and-click-interface waarmee ze zelf modellen kunnen bouwen en nauwkeurige ML-voorspellingen kunnen genereren, zonder enige ML-ervaring of het schrijven van een enkele regel code.

Volg de onderstaande stappen om een tijdreeksvoorspellingsmodel te bouwen in Amazon SageMaker Canvas. Raadpleeg deze voor gedetailleerde informatie blog:

Selecteer de samengestelde dataset in SageMaker Canvas.
Bouw het tijdreeksvoorspellingsmodel.
Analyseer de resultaten en het belang van functies.

Bouw het tijdreeksvoorspellingsmodel: Nadat u de gegevensset hebt geselecteerd, selecteert u de doelkolom die moet worden voorspeld. In ons geval is dit de slotkoers van de aandelenkoers. SageMaker Canvas detecteert automatisch dat dit een tijdreeksprognose is.

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

U moet het model als volgt configureren voor tijdreeksprognoses. Selecteer voor artikel-ID de naam van de beurskoers. Vergeet niet dat onze dataset beurskoersen bevat voor de top 10 aandelen. Selecteer de tijdstempelkolom voor de tijdstempel en voer ten slotte het aantal dagen in dat u in de toekomst wilt voorspellen [Forecast Horizon].

Nu ben je klaar om het model te bouwen. SageMaker Canvas biedt twee opties om het model te bouwen: Snel bouwen en Standaard bouwen. In ons geval gebruiken we "Standard Build".

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Standard Build duurt ongeveer drie uur om het model te bouwen en te gebruiken Amazon voorspelling, een prognoseservice voor tijdreeksen op basis van ML als onderliggende prognose-engine. Forecast creëert zeer nauwkeurige prognoses door middel van modelvorming van traditionele en deep learning-modellen zonder dat ML-ervaring vereist is.

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Zodra het model is gebouwd, kunt u nu de modelprestaties (voorspellingsnauwkeurigheid) en het belang van de functie bekijken. Zoals te zien is in de onderstaande afbeelding, identificeert het model Crowding en DaysToCover10Day als de twee belangrijkste kenmerken die de voorspellingswaarden bepalen. Dit komt overeen met onze marktintuïtie, aangezien crowding een momentumindicator is die dagelijkse shorting meet en gebeurtenissen dekt, en kortetermijnrente een liquiditeitsmaatstaf is, die aangeeft hoe beleggers in een aandeel zijn gepositioneerd. Zowel momentum als liquiditeit kunnen prijsvolatiliteit stimuleren.

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Dit resultaat geeft aan dat deze twee kenmerken (of velden) een nauwe relatie hebben met aandelenkoersbewegingen en hogere prioriteit kunnen krijgen voor onboarding en verdere analyse.

Business intelligence

In de context van tijdreeksprognoses is de notie van backtesting verwijst naar het proces van het beoordelen van de nauwkeurigheid van een prognosemethode met behulp van bestaande historische gegevens. Het proces is doorgaans iteratief en wordt herhaald over meerdere datums die aanwezig zijn in de historische gegevens.

Zoals we al hebben besproken, gebruikt SageMaker Canvas Amazon Forecast als de engine voor tijdreeksprognoses. Forecast maakt een backtest als onderdeel van het modelbouwproces. U kunt nu de details van de voorspelling bekijken door u aan te melden bij Amazon Forecast. Raadpleeg dit voor meer informatie over de uitlegbaarheid van modellen blog.

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Amazon Forecast biedt aanvullende details over voorspellingsstatistieken zoals gewogen absolute procentuele fout (WAPE), root mean square error (RMSE), mean absolute procentuele fout (MAPE) en mean absolute scaled error (MASE). U kunt de kwaliteitsscores van de voorspelling exporteren vanuit Amazon Forecast.

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Amazon Forecast voert één backtest uit voor de verstrekte tijdreeksgegevensset. De resultaten van de backtest kunnen worden gedownload met behulp van de Exporteer backtestresultaten knop. Geëxporteerde backtestresultaten worden gedownload naar een S3-bucket.

We zullen nu de resultaten van de backtest plotten in Amazon QuickSight. Om de backtestresultaten in Amazon QuickSight te visualiseren, maakt u vanuit QuickSight verbinding met de dataset in Amazon S3 en maakt u een visualisatie.

Versnel het investeringsproces met AWS Low Code-No Code-services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Opruimen

AWS-services die in deze oplossing worden gebruikt, zijn beheerd en serverloos van aard. SageMaker Canvas is ontworpen om langlopende ML-trainingen uit te voeren en zal altijd aan staan. Zorg ervoor dat u zich expliciet afmeldt bij SageMaker Canvas. Raadpleeg de documenten voor meer details.

Conclusie

In deze blogpost hebben we besproken hoe u als institutionele vermogensbeheerder AWS low-code no-code (LCNC)-gegevens en AI-services kunt gebruiken om de evaluatie van externe datasets te versnellen door de initiële datasetscreening over te dragen aan niet-technisch personeel. Deze first-pass-analyse kan snel worden uitgevoerd om u te helpen beslissen welke datasets prioriteit moeten krijgen voor onboarding en verdere analyse.

We hebben stap voor stap gedemonstreerd hoe een data-analist nieuwe data van derden kan verkrijgen via AWS Data Exchange, AWS Glue DataBrew no-code ETL-services kan gebruiken om data voor te verwerken en te evalueren welke functies in een dataset de meeste impact hebben op de voorspelling van het model .

Zodra de gegevens klaar zijn voor analyse, gebruikt een analist SageMaker Canvas om een voorspellend model te bouwen, de pasvorm te evalueren en belangrijke kenmerken te identificeren. In ons voorbeeld gaven de MAPE (.05) en WAPE (.045) van het model een goede fit aan en toonden "Crowding" en "DaysToCover10Day" als de signalen in de dataset met de grootste impact op de prognose. Deze analyse kwantificeerde welke gegevens het model het meest beïnvloedden en kon daarom prioriteit krijgen voor verder onderzoek en mogelijke opname in uw alfasignalen of risicobeheerproces. En net zo belangrijk, verklaarbaarheidsscores geven aan welke gegevens relatief weinig rol spelen bij het bepalen van de voorspelling en daarom een lagere prioriteit kunnen hebben voor verder onderzoek.

Als u sneller wilt beoordelen in hoeverre financiële gegevens van derden uw beleggingsproces kunnen ondersteunen, raadpleegt u de Gegevensbronnen voor financiële dienstverlening beschikbaar op AWS Data Exchange, en geef DataBrouwen en Canvas print vandaag een poging.

Over de auteurs

Boris Litvin is Principal Solution Architect, verantwoordelijk voor innovatie in de financiële dienstverlening. Hij is een voormalige oprichter van Quant en FinTech, gepassioneerd door systematisch beleggen.

Meenakshisundaram Thandavarayan is een Senior AI/ML-specialist bij AWS. Hij helpt hightech strategische accounts op hun AI- en ML-reis. Hij is erg gepassioneerd door datagedreven AI.

Camillo Anania is een Senior Startup Solutions Architect bij AWS gevestigd in het VK. Hij is een gepassioneerde technoloog die startups van elke omvang helpt bouwen en groeien.

Dan Sinnreich is een Sr. Product Manager bij AWS, gericht op het versterken van bedrijven om betere beslissingen te nemen met ML. Voorheen bouwde hij platformen voor portfolio-analyse en multi-asset class risicomodellen voor grote institutionele beleggers.

Tijdstempel: 20 december 202223 december 2022

Tijdstempel: Jan 17, 2024

Versnel het investeringsproces met AWS Low Code-No Code-services

Heruitgegeven door Plato

Overzicht oplossingen

Gegevensopname

Data-engineering

machine learning

Business intelligence

Opruimen

Conclusie

Over de auteurs

Meer van AWS-machine learning

Pas getrainde parameters aan op grote datasets met Amazon SageMaker Data Wrangler

Detecteer patronen in tekstgegevens met Amazon SageMaker Data Wrangler

Whitepaper: Best practices voor machinaal leren in de gezondheidszorg en biowetenschappen

Realiseer low-latency hosting voor op beslissingsboom gebaseerde ML-modellen op NVIDIA Triton Inference Server op Amazon SageMaker

Hoe Amp on Amazon gegevens gebruikte om de klantbetrokkenheid te vergroten, deel 1: Een platform voor gegevensanalyse bouwen

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account