Muutaman viime vuoden aikana on tapahtunut valtava paradigman muutos siinä, miten institutionaaliset omaisuudenhoitajat hankkivat ja integroivat useita tietolähteitä sijoitusprosessiinsa. Riskikorrelaatioiden toistuvien muutosten, odottamattomien volatiliteetin lähteiden ja passiivisten strategioiden aiheuttaman kilpailun lisääntyessä omaisuudenhoitajat käyttävät laajempaa joukkoa kolmansien osapuolien tietolähteitä saavuttaakseen kilpailuetua ja parantaakseen riskikorjattua tuottoa. Hyötyjen poimiminen useista tietolähteistä voi kuitenkin olla erittäin haastavaa. Omaisuudenhoitajien tietotekniikkatiimit ovat ylikuormitettuja tiedonkeruulla ja esikäsittelyllä, kun taas datatieteiden tiimit louhivat dataa sijoitusnäkemysten saamiseksi.
Kolmannen osapuolen tai vaihtoehtoisilla tiedoilla tarkoitetaan sijoitusprosessissa käytettyjä tietoja, jotka on hankittu perinteisten markkinatietojen tarjoajien ulkopuolelta. Institutionaaliset sijoittajat täydentävät usein perinteisiä tietolähteitään kolmannen osapuolen tai vaihtoehtoisilla tiedoilla saadakseen etua sijoitusprosessissaan. Tyypillisesti mainittuja esimerkkejä ovat, mutta eivät rajoitu niihin, satelliittikuvat, luottokorttitiedot ja sosiaalisen median mieliala. Rahastonhoitajat sijoittavat vuosittain lähes 3 miljardia dollaria ulkoisiin tietokokonaisuuksiin, ja vuosittaiset menot kasvavat 20–30 prosenttia.
Käytettävissä olevien kolmansien osapuolien ja vaihtoehtoisten tietojoukkojen räjähdysmäisen kasvun myötä kyky analysoida nopeasti, lisääkö uusi tietojoukko uusia sijoitusnäkemyksiä, on kilpailukykyinen erottaja sijoitusten hallintaalalla. AWS-koodittomat LCNC-data- ja tekoälypalvelut antavat ei-teknisille ryhmille mahdollisuuden suorittaa tietojen alustavan seulonnan, priorisoida tietojen käyttöönottoa, nopeuttaa tietoihin kuluvaa aikaa ja vapauttaa arvokkaita teknisiä resursseja, mikä luo kestävän kilpailuedun.
Tässä blogiviestissä keskustelemme siitä, kuinka institutionaalisen omaisuudenhoitajana voit hyödyntää AWS LCNC -tietoja ja tekoälypalveluita skaalataksesi alkuperäisen data-analyysin ja priorisointiprosessin teknisten tiimien ulkopuolelle ja nopeuttaaksesi päätöksentekoasi. AWS LCNC -palveluiden avulla voit nopeasti tilata ja arvioida erilaisia kolmannen osapuolen tietojoukkoja, esikäsitellä tietoja ja tarkistaa niiden ennustevoiman koneoppimismalleilla (ML) kirjoittamatta yhtään koodinpätkää.
Ratkaisun yleiskatsaus
Käyttötapamme on analysoida ulkoisen tietojoukon osakekurssien ennustusvoimaa ja tunnistaa sen ominaisuuksien tärkeys – mitkä kentät vaikuttavat eniten osakekurssin kehitykseen. Tämä toimii ensipassin testinä sen tunnistamiseksi, mitkä tietojoukon useista kentistä tulisi arvioida tarkemmin perinteisillä kvantitatiivisilla menetelmillä, jotta ne sopivat sijoitusprosessiisi. Analyytikot voivat tehdä tämän tyyppisen ensipassin testin nopeasti, mikä säästää aikaa ja antaa sinun priorisoida tietojoukon käyttöönottoa nopeammin. Lisäksi, vaikka käytämme osakekurssia kohdeesimerkkinä, voidaan käyttää myös muita mittareita, kuten kannattavuus, arvostussuhteet tai kaupankäyntivolyymit. Kaikki tähän käyttötapaukseen käytetyt tietojoukot on julkaistu kielellä AWS-tiedonvaihto.
Seuraava kaavio selittää päästä päähän -arkkitehtuurin ja AWS LCNC -palvelut, joita käytetään päätösten tekemiseen:
Ratkaisumme koostuu seuraavista vaiheista ja ratkaisuista:
- Tietojen käsittely: AWS Data Exchange julkaistujen vaihtoehtoisten tietojoukkojen tilaamista ja niiden lataamista varten Amazonin yksinkertainen tallennuspalvelu (Amazon S3)-kauha.
- Tietotekniikka: AWS Liima DataBrew Tietojen suunnitteluun ja Amazon S3:een tallennettujen tietojen muuntamiseen.
- Koneoppiminen: Amazon SageMaker Canvas aikasarjaennustemallin rakentamiseen ennustamista varten ja tietojen vaikutuksen tunnistamiseen ennusteeseen.
- Bisnesvaisto: Amazon QuickSight tai Amazon SageMaker Canvas tarkistaaksesi ominaisuuden tärkeyden ennusteen kannalta päätöksenteossa.
Tietojen nauttiminen
AWS-tiedonvaihto helpottaa kolmannen osapuolen tietojen etsimistä, tilaamista ja käyttämistä pilvessä. Voit selata AWS Data Exchange -luetteloa ja löytää tietotuotteita, jotka ovat tärkeitä yrityksellesi ja merkitä palveluntarjoajien tietoihin ilman jatkokäsittelyä, eikä ETL-prosessia tarvita. Huomaa, että monet palveluntarjoajat tarjoavat ilmaisia alkutilauksia, joiden avulla voit analysoida heidän tietojaan ilman, että sinun tarvitsee ensin aiheutua ennakkokustannuksia.
Tätä käyttötapausta varten etsi ja tilaa alla olevat tietojoukot AWS Data Exchangessa:
- 20 vuoden päivän lopun osaketiedot 10 parhaan yhdysvaltalaisen yrityksen osalta markkina-arvojen mukaan julkaissut Alpha Vantage. Tämä ilmainen tietojoukko sisältää 20 vuoden historialliset tiedot 10 suurimmasta Yhdysvaltain osakkeesta markkina-arvon mukaan 5. syyskuuta 2020. Tietojoukko sisältää seuraavat 10 symbolia – AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (luokka A); FB: Facebook, Inc.; GOOG: Alphabet Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; ja WMT: Walmart Inc.
- Keskeisiä tietokenttiä ovat mm
- Avoinna: päivän kaupankäynnin mukainen avaushinta
- Korkein: päivän korkein kaupankäyntihinta
- Alhainen: kaupankäynnin mukainen alhainen hinta tälle päivälle
- Sulkeminen: päivän kaupankäynnin mukainen sulkemishinta
- Volyymi: päivän kaupankäyntivolyymi
- Adjusted Close: split- ja osinkokorjattu päivän päätöskurssi
- Split Ratio: uusien ja vanhojen osakkeiden suhde voimaantulopäivänä
- Osinko: käteisenä maksettavan osingon määrä
- S3 Lyhytkorko- ja arvopaperirahoitustiedot julkaissut S3 kumppanit. Tämä tietojoukko sisältää seuraavat kentät:
Kenttä | Kuvaus |
Työpäivä | Kurssin voimaantulopäivä |
Turvatunnukset | Suojaustunnisteet sisältävät Sedol-, ISIN-, FIGI-, Ticker-, Bloomberg-tunnuksen |
Nimi | Suojauksen nimi |
Tarjoushinta | Markkinayhdistelmärahoituspalkkio, joka maksetaan olemassa olevista lyhyistä positioista |
Hintatarjous | Markkinayhdistelmälainauspalkkio, joka on ansaittu pitkäaikaisten omistajien lainassa olevista osakkeista |
Viimeinen kurssi | Markkinayhdistelmälainauspalkkio, joka on ansaittu kyseisenä päivänä lainatuista osakkeista (spot-korko) |
syrjäyttämisen | Momentumiindikaattori mittaa päivittäistä oikosulkua ja kattavia tapahtumia suhteessa markkinatilanteeseen |
Lyhyt korko | Reaaliaikainen lyhyt korko ilmaistuna osakkeiden lukumääränä |
ShortInterestEhdollinen | Lyhytkorko * Hinta (USD) |
ShortInterestPct | Reaaliaikainen lyhyt korko ilmaistuna prosentteina oman pääoman kelluvasta |
S3 Float | Vaihdettavien osakkeiden määrä, mukaan lukien lyhyeksi myymisellä syntyneet synteettiset long-osuudet |
S3SIPctFloat | Reaaliaikainen lyhyt korkoennuste jaettuna S3 floatilla |
Ohjeellinen saatavuus | S3 arvioitu käytettävissä oleva lainattavissa oleva määrä |
Käyttö | Reaaliaikainen lyhyt korko jaettuna lainattavissa olevalla kokonaistarjouksella |
DaystoCover10 päivää | Se on likviditeettimittari = lyhyt korko / 10 päivän keskimääräinen ADTV |
DaystoCover30 päivää | Se on likviditeettimittari = lyhyt korko / 30 päivän keskimääräinen ADTV |
DaystoCover90 päivää | Se on likviditeettimittari = lyhyt korko / 90 päivän keskimääräinen ADTV |
Alkuperäinen SI | Ajankohta lyhyt korko |
Saadaksesi tiedot etsimällä ensin tietojoukkoa AWS Data Exchangesta ja tilaamalla tietojoukon:
Kun tietojoukkojen julkaisija on hyväksynyt tilauspyyntösi, voit ladata tietojoukot S3-säilöisi:
valita Lisää automaattisesti vietävän työn kohde, anna S3-ämpäritiedot ja lataa tietojoukko:
Toista vaiheet saadaksesi Alpha Vantage -tietojoukon. Kun olet valmis, sinulla on molemmat tietojoukot S3-säilössäsi.
Tietojen suunnittelu
Kun tietojoukko on S3-säilöissäsi, voit käyttää sitä AWS Liima DataBrew tietojen muuntamiseen. AWS Glue DataBrew tarjoaa yli 350 valmiiksi rakennettua muunnosta tietojen valmistelutehtävien automatisoimiseksi (kuten poikkeamien suodattaminen, muotojen standardointi ja virheellisten arvojen korjaaminen), jotka muuten edellyttäisivät päiviä tai viikkoja käsin koodattujen muunnosten kirjoittamista.
Voit luoda konsolidoidun kuratoidun tietojoukon ennustamista varten AWS DataBrewissa suorittamalla alla olevat vaiheet. Katso tarkemmat tiedot tästä blogi.
- Luo DataBrew-tietojoukot.
- Lataa DataBrew-tietojoukot DataBrew-projekteihin.
- Rakenna DataBrew-reseptejä.
- Suorita DataBrew-työt.
Luo DataBrew-tietojoukkoja: AWS Glue DataBrew:ssa a aineisto edustaa tietoja, jotka ladataan S3-alueesta. Luomme kaksi DataBrew-tietojoukkoa – sekä päivän lopun osakekurssille että S3-lyhyille korkoille. Kun luot tietojoukon, syötät S3-yhteystiedot vain kerran. Siitä lähtien DataBrew voi käyttää taustalla olevia tietoja puolestasi.
Lataa DataBrew-tietojoukot DataBrew-projekteihin: AWS Glue DataBrew:ssa a projekti on data-analyysin ja muunnostoiminnan keskipiste. DataBrew-projekti kokoaa yhteen DataBrew-tietojoukot ja mahdollistaa tietojen muuntamisen (DataBrew-resepti) kehittämisen. Tässäkin luomme kaksi DataBrew-projektia päivän lopun osakekurssille ja S3-lyhyille korkoille.
Rakenna DataBrew-reseptejä: DataBrewissa a resepti on joukko datan muunnosvaiheita. Voit ottaa nämä vaiheet käyttöön tietojoukossasi. Käyttötapausta varten rakennamme kaksi muunnosta. Ensimmäinen muuttaa päivän lopun osakekurssin aikaleimasarakkeen muotoa siten, että tietojoukko voidaan liittää S3-lyhyisiin korkoihin:
Toinen muunnos kuratoi tiedot, ja sen viimeinen vaihe varmistaa, että yhdistämme tietojoukot yhdeksi kuratoiduksi tietojoukoksi. Katso lisätietoja rakennustietojen muunnosresepteistä tästä blogi.
DataBrew työpaikan: DataBrew-reseptien luomisen jälkeen voit suorittaa ensin pörssikurssin DataBrew-työn ja sen jälkeen S3-reseptin. Katso tästä blogi luodaksesi yhden yhdistetyn tietojoukon. Tallenna lopullinen kuratoitu tietojoukko S3-säihöön.
Päästä päähän tietojenkäsittelyn työnkulku näyttää tältä:
Koneen oppiminen
Tietojen suunnittelun jälkeen luodun kuratoidun tietojoukon avulla voit käyttää Amazon SageMaker Canvas luodaksesi ennustemallisi ja analysoidaksesi ominaisuuksien vaikutusta ennusteeseen. Amazon SageMaker Canvas tarjoaa yrityskäyttäjille visuaalisen osoita ja napsauta -käyttöliittymän, jonka avulla he voivat rakentaa malleja ja luoda tarkkoja ML-ennusteita itse – ilman ML-kokemusta tai yhden koodirivin kirjoittamista.
Voit luoda aikasarjan ennustemallin Amazon SageMaker Canvasissa noudattamalla alla olevia ohjeita. Katso tarkemmat tiedot tästä blogi:
- Valitse kuratoitu tietojoukko SageMaker Canvasissa.
- Rakenna aikasarjan ennustemalli.
- Analysoi tulokset ja ominaisuuksien tärkeys.
Rakenna aikasarjan ennustemalli: Kun olet valinnut tietojoukon, valitse ennustettava kohdesarake. Meidän tapauksessamme tämä on osakekurssin lähihinta. SageMaker Canvas havaitsee automaattisesti, että tämä on aikasarjan ennustamisen ongelmalausunto.
Sinun on määritettävä malli seuraavasti aikasarjan ennustamista varten. Valitse tuotetunnukseksi osakekurssin nimi. Muista, että tietojoukossamme on osakekurssit 10 suurimmalle osakkeelle. Valitse aikaleiman aikaleimasarake ja kirjoita lopuksi päivien lukumäärä, jonka haluat ennustaa tulevaisuudessa [Forecast Horizon].
Nyt olet valmis rakentamaan mallin. SageMaker Canvas tarjoaa kaksi vaihtoehtoa mallin rakentamiseen: Quick Build ja Standard Build. Meidän tapauksessamme käytämme "Standard Build".
Standard Build kestää noin kolme tuntia mallin ja käyttötarkoitusten rakentamiseen Amazonin sääennuste, aikasarjaennustepalvelu, joka perustuu ML:ään taustalla olevana ennustemoottorina. Forecast luo erittäin tarkkoja ennusteita yhdistämällä perinteisiä ja syväoppimismalleja ilman ML-kokemusta.
Kun malli on rakennettu, voit nyt tarkastella mallin suorituskykyä (ennustetarkkuus) ja ominaisuuksien tärkeyttä. Kuten alla olevasta kuvasta voidaan nähdä, malli tunnistaa Crowding ja DaysToCover10Day kahdeksi tärkeimmäksi ennustearvoksi. Tämä on markkina-intuitiomme mukaista, sillä tungostaminen on vauhtiindikaattori, joka mittaa päivittäistä oikosulkua ja kattaa tapahtumia, ja lyhyen aikavälin lyhyt korko on likviditeettimittari, joka osoittaa sijoittajien aseman osakkeessa. Sekä vauhti että likviditeetti voivat aiheuttaa hintojen vaihtelua.
Tämä tulos osoittaa, että näillä kahdella ominaisuudella (tai kentällä) on läheinen yhteys osakekurssien liikkeisiin, ja ne voidaan priorisoida korkeammalle käyttöönottoa ja lisäanalyysiä varten.
Business intelligence
Aikasarjaennusteen yhteydessä käsite jälkitestaus viittaa prosessiin, jossa arvioidaan ennustemenetelmän tarkkuutta käyttämällä olemassa olevia historiallisia tietoja. Prosessi on tyypillisesti iteratiivinen ja toistuu useiden historiatiedoissa olevien päivämäärien aikana.
Kuten jo keskustelimme, SageMaker Canvas käyttää Amazon Forecastia aikasarjaennusteiden moottorina. Ennuste luo backtestin osana mallinrakennusprosessia. Voit nyt tarkastella ennustajan tietoja kirjautumalla sisään Amazon Forecastiin. Katso tästä saadaksesi syvemmän ymmärryksen sukelluksen selittävyydestä blogi.
Amazon Forecast tarjoaa lisätietoja ennustajamittareista, kuten painotetusta absoluuttisesta prosenttivirheestä (WAPE), keskimääräisestä neliövirheestä (RMSE), keskimääräisestä absoluuttisesta prosenttivirheestä (MAPE) ja keskimääräisestä absoluuttisesta skaalatusta virheestä (MASE). Voit viedä ennustajien laatupisteitä Amazon Forecastista.
Amazon Forecast suorittaa yhden backtestin toimitetulle aikasarjatietojoukolle. Backtestin tulokset ovat ladattavissa käyttämällä Vie takatestin tulokset -painiketta. Viedyt backtest-tulokset ladataan S3-ämpäriin.
Piirrämme nyt backtest-tulokset Amazon QuickSightissa. Jos haluat visualisoida Amazon QuickSightin backtest-tulokset, muodosta yhteys Amazon S3:n tietojoukkoon QuickSightista ja luo visualisointi.
Puhdistaa
Tässä ratkaisussa hyödynnetyt AWS-palvelut ovat luonteeltaan hallittuja ja palvelimettomia. SageMaker Canvas on suunniteltu juoksemaan pitkiä ML-harjoituksia ja se on aina päällä. Varmista, että kirjaudut ulos SageMaker Canvasista. Katso asiakirjat lisätietoja.
Yhteenveto
Tässä blogiviestissä keskustelimme siitä, kuinka instituution omaisuudenhoitajana voit hyödyntää AWS:n LCNC-dataa ja AI-palveluita nopeuttaaksesi ulkoisten tietojoukkojen arviointia siirtämällä tietojoukon alustava seulonta ei-tekniselle henkilöstölle. Tämä ensikierron analyysi voidaan tehdä nopeasti, jotta voit päättää, mitkä tietojoukot tulisi priorisoida käyttöönottoa ja jatkoanalyysiä varten.
Esitimme vaihe vaiheelta, kuinka dataanalyytikko voi hankkia uutta kolmannen osapuolen dataa AWS Data Exchangen kautta, käyttää AWS Glue DataBrew'n koodittomia ETL-palveluita tietojen esikäsittelyyn ja arvioida, mitkä tietojoukon ominaisuudet vaikuttavat eniten mallin ennusteeseen. .
Kun tiedot ovat valmiita analysointia varten, analyytikko käyttää SageMaker Canvasia ennustavan mallin rakentamiseen, sen sopivuuden arvioimiseen ja merkittävien ominaisuuksien tunnistamiseen. Esimerkissämme mallin MAPE (.05) ja WAPE (.045) osoittivat hyvän istuvuuden ja osoittivat "Crowding" ja "DaysToCover10Day" tietojoukon signaaleina, joilla oli suurin vaikutus ennusteeseen. Tässä analyysissä määritettiin, mitkä tiedot vaikuttivat eniten malliin, ja siksi ne voitiin priorisoida lisätutkimuksia ja mahdollista sisällyttämistä varten alfasignaaleihin tai riskinhallintaprosessiin. Ja aivan yhtä tärkeää, selitettävyyspisteet osoittavat, millä tiedoilla on suhteellisen vähän merkitystä ennusteen määrittämisessä, ja siksi ne voivat olla alhaisempi prioriteetti jatkotutkimuksissa.
Jos haluat arvioida nopeammin kolmannen osapuolen taloustietojen kykyä tukea sijoitusprosessiasi, tarkista Rahoituspalveluiden tietolähteet saatavilla AWS Data Exchangesta, ja antaa DataBrew ja Kangas kokeilu tänään.
Tietoja Tekijät
Boris Litvin on pääratkaisuarkkitehti, joka vastaa rahoituspalvelualan innovaatioista. Hän on entinen Quant- ja FinTech-perustaja, joka on intohimoinen systemaattiseen sijoittamiseen.
Meenakshisundaram Thandavarayan on vanhempi AI/ML-asiantuntija, jolla on AWS. Hän auttaa korkean teknologian strategisia tilejä heidän tekoäly- ja ML-matkallaan. Hän on erittäin intohimoinen tietopohjaiseen tekoälyyn.
Camillo Anania on Senior Startup Solutions -arkkitehti AWS:llä Isossa-Britanniassa. Hän on intohimoinen teknologi, joka auttaa kaikenkokoisia startup-yrityksiä rakentamaan ja kasvamaan.
Dan Sinnreich on AWS:n vanhempi tuotepäällikkö, jonka tehtävänä on antaa yrityksille mahdollisuus tehdä parempia päätöksiä ML:n avulla. Hän rakensi aiemmin salkkuanalytiikkaalustoja ja usean omaisuusluokan riskimalleja suurille institutionaalisille sijoittajille.
- AI
- ai taide
- ai taiteen generaattori
- ai robotti
- Amazonin sääennuste
- Amazonin koneoppiminen
- Amazon QuickSight
- Amazon SageMaker Canvas
- tekoäly
- tekoälyn sertifiointi
- tekoäly pankkitoiminnassa
- tekoäly robotti
- tekoälyrobotit
- tekoälyohjelmisto
- AWS Liima DataBrew
- AWS-koneoppiminen
- blockchain
- blockchain-konferenssi ai
- coingenius
- keskustelullinen tekoäly
- kryptokonferenssi ai
- Asiakasratkaisut
- dall's
- syvä oppiminen
- rahoituspalvelut
- google ai
- Keskitaso (200)
- koneoppiminen
- Platon
- plato ai
- Platonin tietotieto
- Platon peli
- PlatonData
- platopeliä
- mittakaava ai
- syntaksi
- zephyrnet