Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester

De sidste par år har set et enormt paradigmeskifte i, hvordan institutionelle kapitalforvaltere henter og integrerer flere datakilder i deres investeringsproces. Med hyppige skift i risikokorrelationer, uventede kilder til volatilitet og stigende konkurrence fra passive strategier, anvender kapitalforvaltere et bredere sæt af tredjepartsdatakilder for at opnå en konkurrencefordel og forbedre risikojusterede afkast. Processen med at udtrække fordele fra flere datakilder kan dog være ekstremt udfordrende. Asset managers dataingeniørteam er overbelastet med dataindsamling og forbehandling, mens datavidenskabsteams miner data til investeringsindsigt.

Tredjeparts- eller alternative data refererer til data, der bruges i investeringsprocessen, hentet uden for de traditionelle markedsdataudbydere. Institutionelle investorer udvider ofte deres traditionelle datakilder med tredjeparts- eller alternative data for at få en fordel i deres investeringsproces. Typisk nævnte eksempler omfatter, men er ikke begrænset til, satellitbilleddannelse, kreditkortdata og sociale medier. Fondsforvaltere investerer næsten 3 milliarder USD årligt i eksterne datasæt, hvor det årlige forbrug vokser med 20-30 procent.

Med den eksponentielle vækst af tilgængelige tredjeparts- og alternative datasæt er evnen til hurtigt at analysere, om et nyt datasæt tilføjer ny investeringsindsigt, en konkurrencemæssig differentiator i investeringsforvaltningsindustrien. AWS no-code low-code (LCNC) data og AI-tjenester gør det muligt for ikke-tekniske teams at udføre den indledende datascreening, prioritere data onboarding, fremskynde tid til indsigt og frigøre værdifulde tekniske ressourcer – hvilket skaber en varig konkurrencefordel.

I dette blogindlæg diskuterer vi, hvordan du som institutionel kapitalforvalter kan udnytte AWS LCNC-data og AI-tjenester til at skalere den indledende dataanalyse- og prioriteringsproces ud over tekniske teams og fremskynde din beslutningstagning. Med AWS LCNC-tjenester er du i stand til hurtigt at abonnere på og evaluere forskellige tredjepartsdatasæt, forbehandle data og kontrollere deres forudsigelsesevne ved hjælp af maskinlæringsmodeller (ML) uden at skrive et eneste stykke kode.

Løsningsoversigt

Vores use case er at analysere aktiekursens forudsigelige kraft af et eksternt datasæt og identificere dets funktionsvigtighed - hvilke felter har størst indflydelse på aktiekursens ydeevne. Dette tjener som en first-pass-test for at identificere, hvilke af de mange felter i et datasæt, der bør evalueres nærmere ved hjælp af traditionelle kvantitative metoder for at passe med din investeringsproces. Denne type first-pass test kan udføres hurtigt af analytikere, hvilket sparer tid og giver dig mulighed for hurtigere at prioritere datasæt onboarding. Mens vi bruger aktiekursen som vores måleksempel, kan andre målinger såsom rentabilitet, værdiansættelsesforhold eller handelsvolumener også bruges. Alle datasæt, der bruges til denne use case, er publiceret i AWS dataudveksling.

Følgende diagram forklarer ende-til-ende-arkitekturen og AWS LCNC-tjenesterne, der bruges til at styre beslutningerne:

Vores løsning består af følgende trin og løsninger:

  1. Dataindtagelse: AWS Data Exchange til at abonnere på de offentliggjorte alternative datasæt og downloade dem videre til Amazon Simple Storage Service (Amazon S3) spand.
  2. Datateknik: AWS Glue Data Brew til data engineering og transformation af de data, der er gemt i Amazon S3.
  3. Maskinelæring: Amazon SageMaker lærred til opbygning af en tidsserieprognosemodel til forudsigelse og identifikation af datas indvirkning på prognosen.
  4. Business intelligence: Amazon QuickSight eller Amazon SageMaker Canvas for at gennemgå funktionernes betydning for prognosen for beslutningstagning.

Dataindtagelse

AWS dataudveksling gør det nemt at finde, abonnere på og bruge tredjepartsdata i skyen. Du kan gennemse AWS Data Exchange-kataloget og finde dataprodukter, der er relevante for din virksomhed og Hold mig opdateret til dataene fra udbyderne uden yderligere behandling og intet behov for en ETL-proces. Bemærk, at mange udbydere tilbyder gratis indledende abonnementer, som giver dig mulighed for at analysere deres data uden først at skulle pådrage sig forudgående omkostninger.

For denne brugssag skal du søge og abonnere på nedenstående datasæt i AWS Data Exchange:

  • 20 års aktiedata ved udgangen af ​​dagen for top 10 amerikanske virksomheder efter markedsværdi udgivet af Alpha Vantage. Dette gratis datasæt indeholder 20 års historiske data for de 10 bedste amerikanske aktier efter markedsværdi pr. 5. september 2020. Datasættet indeholder følgende 10 symboler – AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (Klasse A); FB: Facebook, Inc.; GOOG: Alphabet Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; og WMT: Walmart Inc.
  • Nøgledatafelter omfatter
    • Åben: as-traded åbningskurs for dagen
    • Høj: Som handlet høj kurs for dagen
    • Lav: som handlet lav pris for dagen
    • Luk: as-traded lukkekurs for dagen
    • Volumen: handelsvolumen for dagen
    • Justeret Luk: Splittet og udbyttejusteret lukkekurs på dagen
    • Split Ratio: forholdet mellem nyt og gammelt antal aktier på ikrafttrædelsesdatoen
    • Udbytte: kontant udbyttebeløb
  • S3 Kortrente- og værdipapirfinansieringsdata udgivet af S3 partnere. Dette datasæt indeholder følgende felter:
Felt Beskrivelse
Forretningsdato Ikrafttrædelsesdato for kursen
Sikkerheds-id'er Sikkerhedsidentifikatorer indeholder Sedol, ISIN, FIGI, Ticker, Bloomberg ID
Navn Sikkerhedsnavn
Tilbudspris Markedssammensat finansieringsgebyr betalt for eksisterende korte positioner
Bud sats Markedssammensat udlånsgebyr optjent for eksisterende aktier udlånt af lange ejere
Sidste sats Markedssammensat udlånsgebyr optjent for trinvise aktier udlånt på den dato (spotrente)
fortrængning Momentumindikatoren måler daglig shorting og dækker hændelser i forhold til markedets float
Kort rente Kort rente i realtid udtrykt i antal aktier
ShortInterestNotional ShortInterest * Pris (USD)
ShortInterestPct Kort rente i realtid udtrykt som en procentdel af equity float
S3Float Antallet af omsættelige aktier inklusive syntetiske longs skabt ved short selling
S3SIPctFloat Kort rentefremskrivning i realtid divideret med S3-floaten
Vejledende tilgængelighed S3 forventet tilgængelig udlånsmængde
Udnyttelse Kort rente i realtid divideret med det samlede udlånbare udbud
DaytoCover10Dag Det er et likviditetsmål = kort rente / 10-dages gennemsnitlig ADTV
DaytoCover30Dag Det er et likviditetsmål = kort rente / 30-dages gennemsnitlig ADTV
DaytoCover90Dag Det er et likviditetsmål = kort rente / 90-dages gennemsnitlig ADTV
Original SI Tidspunkt kort interesse

For at få dataene skal du først søge efter datasættet i AWS Data Exchange og abonnere på datasættet:

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Når udgiveren af ​​datasættene godkender dine abonnementsanmodninger, vil du have datasættene tilgængelige, som du kan downloade til din S3-bøtte:

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Type Tilføj auto-eksportjobdestination, angiv detaljerne om S3-bøtten, og download datasættet:

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Gentag trinene for at hente Alpha Vantage-datasættet. Når du er færdig, vil du have begge datasæt i din S3-bøtte.

Datateknik

Når datasættet er i dine S3 buckets, kan du bruge AWS Glue Data Brew at transformere dataene. AWS Glue DataBrew tilbyder over 350 forudbyggede transformationer til at automatisere dataforberedelsesopgaver (såsom filtrering af anomalier, standardisering af formater og korrektion af ugyldige værdier), der ellers ville kræve dage eller uger med at skrive håndkodede transformationer.

For at oprette et konsolideret kurateret datasæt til prognose i AWS DataBrew skal du udføre nedenstående trin. For detaljerede oplysninger henvises til denne blog.

  1. Opret DataBrew-datasættene.
  2. Indlæs DataBrew-datasæt i DataBrew-projekter.
  3. Byg DataBrew-opskrifterne.
  4. Kør DataBrew-jobbene.

Opret DataBrew-datasæt: I AWS Glue DataBrew, en datasæt repræsenterer data, der er uploadet fra S3-bøtten. Vi vil oprette to DataBrew-datasæt – både til slutningen af ​​dagen aktiekurs og S3 kort rente. Når du opretter dit datasæt, indtaster du kun S3-forbindelsesdetaljerne én gang. Fra det tidspunkt kan DataBrew få adgang til de underliggende data for dig.

Indlæs DataBrew-datasættene i DataBrew-projekter: I AWS Glue DataBrew, en projekt er omdrejningspunktet i din dataanalyse og transformationsindsats. Et DataBrew-projekt samler DataBrew-datasættene og giver dig mulighed for at udvikle en datatransformation (DataBrew-opskrift). Her vil vi igen oprette to DataBrew-projekter, til slutningen af ​​dagen aktiekurs og S3 kort rente.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Byg DataBrew-opskrifterne: I DataBrew, en opskrift er et sæt af datatransformationstrin. Du kan anvende disse trin på dit datasæt. Til brugssagen vil vi bygge to transformationer. Den første vil ændre formatet for slutningen af ​​dagen aktiekurs tidsstempel kolonne, så datasættet kan føjes til S3 korte rente:

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Den anden transformation kuraterer dataene, og dens sidste trin sikrer, at vi samler datasættene i et enkelt kurateret datasæt. For flere detaljer om opbygning af datatransformationsopskrifter henvises til dette blog.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

DataBrew jobs: Efter oprettelsen af ​​DataBrew-opskrifterne kan du først køre DataBrew-jobbet ved slutningen af ​​dagen efterfulgt af S3-kortrenteopskriften. Henvis til dette blog at oprette et enkelt konsolideret datasæt. Gem det endelige kurerede datasæt i en S3-spand.

End-to-end data engineering workflowet vil se sådan ud:

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Maskinelæring

Med det kuraterede datasæt, der er oprettet post-data engineering, kan du bruge Amazon SageMaker lærred at opbygge din prognosemodel og analysere virkningen af ​​funktioner på prognosen. Amazon SageMaker lærred giver forretningsbrugere en visuel peg-og-klik-grænseflade, der giver dem mulighed for at bygge modeller og generere nøjagtige ML-forudsigelser på egen hånd – uden at kræve nogen ML-erfaring eller at skulle skrive en enkelt linje kode.

For at bygge en tidsserieprognosemodel i Amazon SageMaker Canvas skal du følge nedenstående trin. For detaljerede oplysninger henvises til denne blog:

  1. Vælg det kurerede datasæt i SageMaker Canvas.
  2. Byg tidsserieprognosemodellen.
  3. Analyser resultaterne og træk vigtigheden.

Byg tidsserieprognosemodellen: Når du har valgt datasættet, skal du vælge den målkolonne, der skal forudsiges. I vores tilfælde vil dette være den lukkede kurs på aktiekurset. SageMaker Canvas registrerer automatisk, at dette er en problemformulering med tidsserieprognoser.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Du bliver nødt til at konfigurere modellen som følger for tidsserieprognoser. For vare-id skal du vælge aktieindeksnavnet. Husk, vores datasæt har aktiekurser for de 10 bedste aktier. Vælg tidsstempelkolonnen for tidsstemplet, og indtast til sidst det antal dage, du ønsker at forudsige i fremtiden [Forecast Horizon].

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Nu er du klar til at bygge modellen. SageMaker Canvas giver to muligheder for at bygge modellen: Quick Build og Standard Build. I vores tilfælde vil vi bruge "Standard Build".

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Standard Build tager cirka tre timer at bygge modellen og anvendelser Amazon prognose, en tidsserieprognosetjeneste baseret på ML som den underliggende prognosemotor. Forecast skaber meget nøjagtige prognoser gennem modelsammensætning af traditionelle og deep learning-modeller uden at kræve ML-erfaring.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Når modellen er bygget, kan du nu gennemgå modellens ydeevne (forudsigelsesnøjagtighed) og funktionernes betydning. Som det kan ses af figuren nedenfor, identificerer modellen Crowding og DaysToCover10Day som de to vigtigste funktioner, der driver prognoseværdier. Dette er i tråd med vores markedsintuition, da crowding er en momentumindikator, der måler daglig shorting og dækker begivenheder, og kortsigtet kort rente er et likviditetsmål, der angiver, hvordan investorer er positioneret i en aktie. Både momentum og likviditet kan drive prisvolatilitet.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Dette resultat indikerer, at disse to funktioner (eller felter) har et tæt forhold til aktiekursbevægelser og kan prioriteres højere til onboarding og yderligere analyse.

Forretningsinformation

I forbindelse med tidsserieprognoser er begrebet backtesting refererer til processen med at vurdere nøjagtigheden af ​​en prognosemetode ved hjælp af eksisterende historiske data. Processen er typisk iterativ og gentaget over flere datoer, der er til stede i de historiske data.

Som vi allerede har diskuteret, bruger SageMaker Canvas Amazon Forecast som motoren til tidsserieprognoser. Forecast opretter en backtest som en del af modelopbygningsprocessen. Du kan nu se forudsigelsesdetaljerne ved at logge ind på Amazon Forecast. For en dybere forståelse af modelforklarlighed henvises til dette blog.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Amazon Forecast giver yderligere detaljer om prædiktormålinger som vægtet absolut procentvis fejl (WAPE), root mean square error (RMSE), middel absolut procent fejl (MAPE) og middel absolut skaleret fejl (MASE). Du kan eksportere prædiktorkvalitetsresultater fra Amazon Forecast.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Amazon Forecast kører én backtest for det leverede tidsseriedatasæt. Backtest-resultaterne er tilgængelige for download ved hjælp af Eksporter backtest-resultater knap. Eksporterede backtest-resultater downloades til en S3-bøtte.

Vi vil nu plotte backtest-resultaterne i Amazon QuickSight. For at visualisere backtest-resultaterne i Amazon QuickSight skal du oprette forbindelse til datasættet i Amazon S3 fra QuickSight og oprette en visualisering.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Ryd op

AWS-tjenester, der udnyttes i denne løsning, er administrerede og serverløse. SageMaker Canvas er designet til at køre langløbende ML-træning og vil altid være tændt. Sørg for, at du udtrykkeligt logger af SageMaker Canvas. Vær sød at henvise til dokumenterne for flere detaljer.

Konklusion

I dette blogindlæg diskuterede vi, hvordan du som institutionel asset manager kan udnytte AWS low-code no-code (LCNC) data og AI-tjenester til at fremskynde evalueringen af ​​eksterne datasæt ved at overføre den indledende datasætscreening til ikke-teknisk personale. Denne førstegangsanalyse kan udføres hurtigt for at hjælpe dig med at beslutte, hvilke datasæt der skal prioriteres til onboarding og yderligere analyse.

Vi demonstrerede trin-for-trin, hvordan en dataanalytiker kan erhverve nye tredjepartsdata gennem AWS Data Exchange, bruge AWS Glue DataBrew no-code ETL-tjenester til at forbehandle data og evaluere, hvilke funktioner i et datasæt, der har størst indflydelse på modellens prognose .

Når data er analyseklare, bruger en analytiker SageMaker Canvas til at bygge en forudsigelig model, evaluere dens pasform og identificere væsentlige funktioner. I vores eksempel indikerede modellens MAPE (.05) og WAPE (.045) en god pasform og viste "Crowding" og "DaysToCover10Day" som de signaler i datasættet med den største indvirkning på prognosen. Denne analyse kvantificerede, hvilke data der havde størst indflydelse på modellen og kunne derfor prioriteres til yderligere undersøgelse og potentiel inklusion i dine alfasignaler eller risikostyringsproces. Og lige så vigtigt indikerer forklaringsscore, hvilke data der spiller en relativt lille rolle i at bestemme prognosen og derfor kan være en lavere prioritet for yderligere undersøgelser.

For hurtigere at evaluere tredjeparts finansielle datas evne til at understøtte din investeringsproces, skal du gennemgå Financial Services-datakilder tilgængelige på AWS Data Exchange, og give DataBrew , Lærred et forsøg i dag.


Om forfatterne

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Boris Litvin er Principal Solution Architect, ansvarlig for innovation i branchen for Financial Services. Han er en tidligere Quant og FinTech grundlægger, passioneret omkring systematisk investering.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Meenakshisundaram Thandavarayan er senior AI/ML specialist med AWS. Han hjælper højteknologiske strategiske konti på deres AI- og ML-rejse. Han er meget passioneret omkring datadrevet AI.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Camillo Anania er en Senior Startup Solutions Architect med AWS baseret i Storbritannien. Han er en passioneret teknolog, der hjælper startups af enhver størrelse med at bygge og vokse.

Fremskynd investeringsprocessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Dan Sinnreich er Sr. Product Manager med AWS, fokuseret på at give virksomhederne mulighed for at træffe bedre beslutninger med ML. Han byggede tidligere porteføljeanalyseplatforme og risikomodeller i multi-aktivklasse til store institutionelle investorer.

Tidsstempel:

Mere fra AWS maskinindlæring