Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester

De siste årene har det vært et enormt paradigmeskifte i hvordan institusjonelle kapitalforvaltere henter inn og integrerer flere datakilder i investeringsprosessen. Med hyppige endringer i risikokorrelasjoner, uventede kilder til volatilitet og økende konkurranse fra passive strategier, bruker kapitalforvaltere et bredere sett med tredjeparts datakilder for å oppnå konkurransefortrinn og forbedre risikojustert avkastning. Imidlertid kan prosessen med å trekke ut fordeler fra flere datakilder være ekstremt utfordrende. Kapitalforvalteres dataingeniørteam er overbelastet med datainnsamling og forhåndsbehandling, mens datavitenskapsteam utvinner data for investeringsinnsikt.

Tredjeparts eller alternative data refererer til data som brukes i investeringsprosessen, hentet utenfor de tradisjonelle markedsdataleverandørene. Institusjonelle investorer utvider ofte sine tradisjonelle datakilder med tredjeparts eller alternative data for å få en fordel i investeringsprosessen. Vanlige eksempler inkluderer, men er ikke begrenset til, satellittbilder, kredittkortdata og sosiale medier. Fondsforvaltere investerer nesten 3 milliarder dollar årlig i eksterne datasett, med en årlig vekst på 20–30 prosent.

Med den eksponentielle veksten av tilgjengelige tredjeparts og alternative datasett, er evnen til raskt å analysere om et nytt datasett legger til ny investeringsinnsikt en konkurransedyktig differensiator i investeringsforvaltningsindustrien. AWS no-code low-code (LCNC) data og AI-tjenester gjør det mulig for ikke-tekniske team å utføre den første datascreeningen, prioritere data onboarding, akselerere tid til innsikt og frigjøre verdifulle tekniske ressurser – og skape et varig konkurransefortrinn.

I dette blogginnlegget diskuterer vi hvordan du som institusjonell kapitalforvalter kan utnytte AWS LCNC-data og AI-tjenester for å skalere den innledende dataanalyse- og prioriteringsprosessen utover tekniske team og akselerere beslutningstakingen din. Med AWS LCNC-tjenester kan du raskt abonnere på og evaluere forskjellige tredjepartsdatasett, forhåndsbehandle data og sjekke deres prediktive kraft ved å bruke maskinlæringsmodeller (ML) uten å skrive et eneste stykke kode.

Løsningsoversikt

Vårt bruksområde er å analysere aksjekursprediksjonskraften til et eksternt datasett og identifisere dets funksjonsviktighet – hvilke felt som påvirker aksjekursytelsen mest. Dette fungerer som en førstegangstest for å identifisere hvilke av de flere feltene i et datasett som bør evalueres nærmere ved å bruke tradisjonelle kvantitative metoder for å passe med investeringsprosessen din. Denne typen first-pass test kan utføres raskt av analytikere, noe som sparer tid og lar deg raskere prioritere datasett ombord. Mens vi bruker aksjekurs som måleksempel, kan andre beregninger som lønnsomhet, verdsettelsesforhold eller handelsvolum også brukes. Alle datasett som brukes for denne brukssaken er publisert i AWS datautveksling.

Følgende diagram forklarer ende-til-ende-arkitekturen og AWS LCNC-tjenestene som brukes til å styre beslutningene:

Vår løsning består av følgende trinn og løsninger:

  1. Datainntak: AWS Data Exchange for å abonnere på de publiserte alternative datasettene og laste dem ned til Amazon enkel lagringstjeneste (Amazon S3) bøtte.
  2. Datateknikk: AWS Lim DataBrew for datautvikling og transformasjon av dataene som er lagret i Amazon S3.
  3. Maskinlæring: Amazon SageMaker Canvas for å bygge en tidsserieprognosemodell for prediksjon og identifisering av virkningen av data på prognosen.
  4. Business intelligence: Amazon QuickSight eller Amazon SageMaker Canvas for å vurdere funksjonens betydning for prognosen for beslutningstaking.

Inntak av data

AWS datautveksling gjør det enkelt å finne, abonnere på og bruke tredjepartsdata i skyen. Du kan bla gjennom AWS Data Exchange-katalogen og finne dataprodukter som er relevante for din virksomhet og abonnere til dataene fra leverandørene uten ytterligere behandling, og uten behov for en ETL-prosess. Vær oppmerksom på at mange tilbydere tilbyr gratis førstegangsabonnement, som lar deg analysere dataene deres uten å måtte pådra deg forhåndskostnader.

For denne brukssaken, søk og abonner på datasettene nedenfor i AWS Data Exchange:

  • 20 års aksjedata på slutten av dagen for de 10 beste amerikanske selskapene etter børsverdi publisert av Alpha Vantage. Dette gratis datasettet inneholder 20 år med historiske data for de 10 beste amerikanske aksjene etter markedsverdi per 5. september 2020. Datasettet inneholder følgende 10 symboler—AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (Klasse A); FB: Facebook, Inc.; GOOG: Alphabet Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; og WMT: Walmart Inc.
  • Nøkkeldatafelt inkluderer
    • Åpen: as-traded åpningskurs for dagen
    • Høy: omsatt høy pris for dagen
    • Lav: omsatt lav pris for dagen
    • Lukk: as-traded lukkekurs for dagen
    • Volum: handelsvolum for dagen
    • Justert Close: splitt og utbyttejustert sluttkurs for dagen
    • Split Ratio: forholdet mellom nytt og gammelt antall aksjer på ikrafttredelsesdatoen
    • Utbytte: kontantutbetaling av utbytte
  • S3 Kortrente- og verdipapirfinansieringsdata publisert av S3-partnere. Dette datasettet inneholder følgende felt:
Felt Beskrivelse
Forretningsdato Ikrafttredelsesdato for kursen
Sikkerhets-IDer Sikkerhetsidentifikatorer inneholder Sedol, ISIN, FIGI, Ticker, Bloomberg ID
Navn Sikkerhetsnavn
Tilbudspris Markedssammensatt finansieringsavgift betalt for eksisterende shortposisjoner
Budfrekvens Markedssammensatt utlånsgebyr opptjent for eksisterende aksjer utlånt av lange eiere
Siste pris Markedssammensatt utlånsgebyr opptjent for inkrementelle aksjer utlånt på den datoen (spotrente)
Trengsel Momentumindikatoren måler daglig shorting og dekker hendelser i forhold til markedsflyten
Kort rente Sanntids kort interesse uttrykt i antall aksjer
ShortInterestNotional ShortInterest * Pris (USD)
ShortInterestPct Kort rente i sanntid uttrykt som en prosentandel av flytende egenkapital
S3Fløt Antall omsettelige aksjer inkludert syntetiske longs opprettet ved shortsalg
S3SIPctFloat Sanntidsfremskrivning av korte renter delt på S3-floaten
Veiledende tilgjengelighet S3 anslått tilgjengelig utlånbar mengde
utnyttelse Kort rente i sanntid delt på totalt utlånbart tilbud
DaytoCover10Day Det er et likviditetsmål = kort rente / 10-dagers gjennomsnittlig ADTV
DaytoCover30Day Det er et likviditetsmål = kort rente / 30-dagers gjennomsnittlig ADTV
DaytoCover90Day Det er et likviditetsmål = kort rente / 90-dagers gjennomsnittlig ADTV
Original SI Tidspunkt kort interesse

For å få dataene, vil du først søke etter datasettet i AWS Data Exchange og abonnere på datasettet:

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Når utgiveren av datasettene godkjenner abonnementsforespørslene dine, vil du ha datasettene tilgjengelig for deg å laste ned til S3-bøtten din:

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Plukke ut Legg til jobbdestinasjon for automatisk eksport, oppgi detaljene for S3-bøtten, og last ned datasettet:

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Gjenta trinnene for å få Alpha Vantage-datasettet. Når du er ferdig, vil du ha begge datasettene i S3-bøtten din.

Datateknikk

Når datasettet er i S3-bøttene dine, kan du bruke AWS Lim DataBrew å transformere dataene. AWS Glue DataBrew tilbyr over 350 forhåndsbygde transformasjoner for å automatisere dataforberedelsesoppgaver (som filtrering av anomalier, standardisering av formater og korrigering av ugyldige verdier) som ellers ville kreve dager eller uker med å skrive håndkodede transformasjoner.

For å lage et konsolidert kurert datasett for prognoser i AWS DataBrew, utfør trinnene nedenfor. For detaljert informasjon, se denne blog.

  1. Lag DataBrew-datasettene.
  2. Last DataBrew-datasett inn i DataBrew-prosjekter.
  3. Bygg DataBrew-oppskriftene.
  4. Kjør DataBrew-jobbene.

Lag DataBrew-datasett: I AWS Glue DataBrew, en datasett representerer data som er lastet opp fra S3-bøtten. Vi vil lage to DataBrew-datasett – for både aksjekursen ved slutten av dagen og S3-kortrenten. Når du oppretter datasettet ditt, angir du S3-tilkoblingsdetaljene bare én gang. Fra det tidspunktet kan DataBrew få tilgang til de underliggende dataene for deg.

Last DataBrew-datasettene inn i DataBrew-prosjekter: I AWS Glue DataBrew, en prosjekt er midtpunktet i din dataanalyse og transformasjonsarbeid. Et DataBrew-prosjekt samler DataBrew-datasettene og lar deg utvikle en datatransformasjon (DataBrew-oppskrift). Her vil vi igjen lage to DataBrew-prosjekter, for aksjekurs ved slutten av dagen og S3 kort rente.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Bygg DataBrew-oppskriftene: I DataBrew, en . er et sett med datatransformasjonstrinn. Du kan bruke disse trinnene på datasettet ditt. For brukstilfellet vil vi bygge to transformasjoner. Den første vil endre formatet til tidsstempelkolonnen ved slutten av dagen slik at datasettet kan kobles til S3-kortrenten:

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Den andre transformasjonen kuraterer dataene, og det siste trinnet sikrer at vi slår sammen datasettene til et enkelt kuratert datasett. For flere detaljer om å bygge oppskrifter for datatransformasjon, se denne blog.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

DataBrew-jobber: Etter opprettelsen av DataBrew-oppskriftene, kan du først kjøre DataBrew-jobben ved slutten av dagen etterfulgt av S3-kortrenteoppskriften. Viser til dette blog for å lage et enkelt konsolidert datasett. Lagre det endelige kurerte datasettet i en S3-bøtte.

Arbeidsflyten for datateknikk fra ende til ende vil se slik ut:

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Maskinlæring

Med det kuraterte datasettet opprettet etter datateknikk, kan du bruke Amazon SageMaker Canvas å bygge prognosemodellen din og analysere virkningen av funksjoner på prognosen. Amazon SageMaker Canvas gir bedriftsbrukere et visuelt pek-og-klikk-grensesnitt som lar dem bygge modeller og generere nøyaktige ML-spådommer på egenhånd – uten å kreve noen ML-erfaring eller å måtte skrive en enkelt linje med kode.

For å bygge en tidsserieprognosemodell i Amazon SageMaker Canvas, følg trinnene nedenfor. For detaljert informasjon, se denne blog:

  1. Velg det kurerte datasettet i SageMaker Canvas.
  2. Bygg prognosemodellen for tidsserier.
  3. Analyser resultatene og funksjonens betydning.

Bygg tidsserieprognosemodellen: Når du har valgt datasettet, velg målkolonnen som skal forutsies. I vårt tilfelle vil dette være sluttkursen til aksjekursen. SageMaker Canvas oppdager automatisk at dette er en problemerklæring for tidsserieprognoser.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Du må konfigurere modellen som følger for tidsserieprognoser. For vare-ID, velg aksjekursnavnet. Husk at datasettet vårt har aksjekurser for de 10 beste aksjene. Velg tidsstempelkolonnen for tidsstemplet, og skriv til slutt inn antall dager du vil spå i fremtiden [Forecast Horizon].

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Nå er du klar til å bygge modellen. SageMaker Canvas har to alternativer for å bygge modellen: Quick Build og Standard Build. I vårt tilfelle vil vi bruke "Standard Build".

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Standard Build tar omtrent tre timer å bygge modellen og bruken Amazon Prognose, en tidsserieprognosetjeneste basert på ML som den underliggende prognosemotoren. Forecast skaper svært nøyaktige prognoser gjennom modellsammensetning av tradisjonelle og dyplæringsmodeller uten å kreve ML-erfaring.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Når modellen er bygget, kan du nå gjennomgå modellens ytelse (prediksjonsnøyaktighet) og funksjonens betydning. Som det fremgår av figuren nedenfor, identifiserer modellen Crowding og DaysToCover10Day som de to viktigste funksjonene som driver prognoseverdier. Dette er i tråd med vår markedsintuisjon, ettersom crowding er en momentumindikator som måler daglig shorting og dekker hendelser, og kortsiktig kort rente er et likviditetsmål som indikerer hvordan investorer er posisjonert i en aksje. Både momentum og likviditet kan drive prisvolatilitet.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Dette resultatet indikerer at disse to funksjonene (eller feltene) har et nært forhold til aksjekursbevegelser og kan prioriteres høyere for onboarding og videre analyse.

Business intelligence

I sammenheng med tidsserieprognoser, forestillingen om tilbaketesting refererer til prosessen med å vurdere nøyaktigheten til en prognosemetode ved å bruke eksisterende historiske data. Prosessen er vanligvis iterativ og gjentas over flere datoer som finnes i de historiske dataene.

Som vi allerede har diskutert, bruker SageMaker Canvas Amazon Forecast som motor for tidsserieprognoser. Forecast oppretter en backtest som en del av modellbyggingsprosessen. Du kan nå se prediktordetaljene ved å logge på Amazon Forecast. For en dypere forståelse av modellforklaring, se dette blog.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Amazon Forecast gir ytterligere detaljer om prediktorberegninger som vektet absolutt prosent feil (WAPE), rotmiddelkvadratfeil (RMSE), gjennomsnittlig absolutt prosentfeil (MAPE) og gjennomsnittlig absolutt skalert feil (MASE). Du kan eksportere prediktorkvalitetspoeng fra Amazon Forecast.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Amazon Forecast kjører én tilbaketest for tidsseriedatasettet som er gitt. Tilbaketestresultatene er tilgjengelige for nedlasting ved hjelp av Eksporter resultatene for backtest knapp. Eksporterte tilbaketestresultater lastes ned til en S3-bøtte.

Vi vil nå plotte tilbaketestresultatene i Amazon QuickSight. For å visualisere tilbaketestresultatene i Amazon QuickSight, koble til datasettet i Amazon S3 fra QuickSight og lag en visualisering.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Rydd opp

AWS-tjenester som utnyttes i denne løsningen er administrert og serverløse. SageMaker Canvas er designet for å kjøre langløpende ML-trening og vil alltid være på. Sørg for at du eksplisitt logger av SageMaker Canvas. Vennligst se dokumentene for mer informasjon.

konklusjonen

I dette blogginnlegget diskuterte vi hvordan du som institusjonell kapitalforvalter kan utnytte AWS low-code no-code (LCNC) data og AI-tjenester for å akselerere evalueringen av eksterne datasett ved å overføre den første datasettscreeningen til ikke-teknisk personell. Denne førstegangsanalysen kan gjøres raskt for å hjelpe deg med å bestemme hvilke datasett som skal prioriteres for onboarding og videre analyse.

Vi demonstrerte trinn for trinn hvordan en dataanalytiker kan skaffe nye tredjepartsdata gjennom AWS Data Exchange , bruke AWS Glue DataBrew no-code ETL-tjenester for å forhåndsbehandle data og evaluere hvilke funksjoner i et datasett som har størst innvirkning på modellens prognose .

Når data er analyseklare, bruker en analytiker SageMaker Canvas til å bygge en prediktiv modell, evaluere dens tilpasning og identifisere viktige funksjoner. I vårt eksempel indikerte modellens MAPE (.05) og WAPE (.045) en god passform og viste "Crowding" og "DaysToCover10Day" som signalene i datasettet med størst innvirkning på prognosen. Denne analysen kvantifiserte hvilke data som påvirket modellen mest og kunne derfor prioriteres for videre undersøkelse og potensiell inkludering i alfasignalene eller risikostyringsprosessen. Og like viktig, forklaringsskårer indikerer hvilke data som spiller relativt liten rolle i å bestemme prognosen og derfor kan være en lavere prioritet for videre undersøkelser.

For raskere å evaluere muligheten til tredjeparts finansielle data for å støtte investeringsprosessen din, se gjennom Financial Services-datakilder tilgjengelig på AWS Data Exchange, og gi DataBrew og Lerret et forsøk i dag.


Om forfatterne

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Boris Litvin er Principal Solution Architect, ansvarlig for innovasjon i Financial Services-bransjen. Han er en tidligere Quant- og FinTech-gründer, lidenskapelig opptatt av systematiske investeringer.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Meenakshisundaram Thandavarayan er en senior AI/ML-spesialist med AWS. Han hjelper høyteknologiske strategiske kontoer på deres AI- og ML-reise. Han er veldig lidenskapelig opptatt av datadrevet AI.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Camillo Anania er en Senior Startup Solutions Architect med AWS basert i Storbritannia. Han er en lidenskapelig teknolog som hjelper startups av alle størrelser med å bygge og vokse.

Akselerer investeringsprosessen med AWS Low Code-No Code-tjenester PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Dan Sinnreich er Sr. Product Manager med AWS, fokusert på å gi bedrifter mulighet til å ta bedre beslutninger med ML. Han bygde tidligere porteføljeanalyseplattformer og risikomodeller for flere aktivaklasser for store institusjonelle investorer.

Tidstempel:

Mer fra AWS maskinlæring