Bitemporality, hjelper lavere kostnader for finansielle tjenester brukssaker

Bitemporality, hjelper lavere kostnader for finansielle tjenester brukssaker

Jeg var på et «all things data and analytics benchmarking»-arrangement forrige uke. Det var fabelaktig, de fleste store banker var representert, også de hotteste av hete hedgefond, en del børser og noen ikke-vanlige leverandører.

Jeg syntes det var forfriskende, som de fleste arrangementer der konkrete analyser blir diskutert. Min tidlige karriere var kvant/datavitenskap/analytikk-fokusert, men nå er jeg i, ahem,
«Data»-yrket, som består av en forvirrende rekke (for det meste) kommersielle produkter som ligger til grunn for «datavarehus», «data lakes» og «data mesh», «datastoff», «datasump»-infrastrukturer, som utgjør $ billioner i utgifter og opprettholde noen svært store organisasjoner. Jeg personlig finner språket, sjargongen og økosystemet i denne bransjen abstrahert fra virkeligheten, men det hjelper til med å opprettholde kommersielle leverandører med vakre navngitte produkter og kategorier. Følg pengene, som de sier: en "kompleks" dataplattform har en mye høyere pris enn et modelleringsverktøy som enhver MSC-student kan bruke.

Dataindustrien var bakgrunnen for den svært pragmatiske hendelsen, men ble diskutert, morsomt og eksplisitt, i et panel om såkalte «datalinje." Dataavstamning er en overveiende en sekvensiell lineær prosess som fanger opp datatransformasjon fra inntak til bruk og hjelper til med å underbygge såkalt datastyring som driver med mye kostbart lagerverktøy. I sky-æraen er skydatavarehus på topp, spesielt ett. Men her er saken. Datatransformasjon er faktisk ikke lineær, spesielt når det er nyttig. Det er komplekst, syklisk, forandrer seg som Doctor Who og tardisene, og reiser gjennom tid og på tvers av galakser. Bortsett fra pseudofilosofi og populær fysikk kan de samme dataene, når de tilpasses, transformeres og analyseres, tjene mange forskjellige brukstilfeller, også på tvers av tid og sted. Videre ber regulatorer oss om å dokumentere endring, være transparente om hva vi gjorde når, hvorfor og hva som endret seg. Du kan si, "det er datastyring de ber om". På en måte. Men regulatorer ber faktisk om rapportering av handlingsdyktige beslutninger som krever modeller, engasjement og som resulterer i handlinger som har innvirkning. Det involverer mennesker, beslutninger og konkrete brukssaker, ikke bare data.

Paneldebatten introduserte og diskuterte grundig begrepet bitemporalitet, en praktisk datahåndteringstaktikk som betjener økonomiske brukssaker og regulatoriske prosesser pent. En paneldeltaker fra en (veldig) regulert tier 1-bank berømmet bitemporalitet kraftig. Arkitekturen hans brukte bitemporalitet for å justere gjennom tid og spille av dataendringer. La oss si at du ønsker å gjenskape en gammel finansiell rapport eller derivathandel slik den så ut på opprettelsestidspunktet, og deretter slik den burde ha sett ut gitt senere rettelser/tilføyelser/utbetalinger, for eksempel i en samsvarsrapport. Med bitemporalitet i hans tilfelle informerer en enkelt datakilde flere (validerte) synspunkter på data, når det skjedde og senere, med "visdom". Det er enkelt å implementere, ikke kostbart, og her er det du trenger å vite om det.

  • En datamodell bør lagre og forenkle analyse av data på tvers av to tidsdimensjoner – en bitemporal datamodell, dvs. en modell som tar vare på data ved oppstart og på ethvert tidspunkt i fremtiden når revisjoner av dens tilstand forekommer og kan representeres "som -av” en gitt tid. 
  • Denne modellen lagrer mer enn ett tidsstempel for hver egenskap, objekt og verdi.
  • Datapunkter kan kobles sammen og kobles sammen - en "som-av"-kobling 

Som Av Data

I en tradisjonell datavarehus-arkitektur kan en slik avstamning bety kostbare datakopier og utidig ineffektivitet og kompleksitet ved henting. Dette er én måte leverandører av skydatavarehus tjener penger på, flere kopier av data som administreres, en sløv tilnærming.

Et enkelt alternativ er bare enkle datamønstre med en støttende lagrings-/minneprosess. Det kan og bør være billig, Python-sentrert. Bare bruk tidsstempler (med dataene dine) og as-of joins (i kode) for å gjøre prosessen enkel, med en evne til å dykke dypt inn i individuelle poster etter behov.

For å spare kostnader på datavarehuset ditt, konstruer med en enkel Python, og vær oppmerksom på ytelsen i minnet. Det er mindre behov for å konstruere i en kostbar datavarehusprosess.

Hvor bruker du bitemporalitet i finans? Vel, overholdelse er en åpenbar sak. Ta for eksempel

spoofing
. Nå er forfalskning i hjertet et handelshensiktsmønster, om enn et uredelig mønster der bestemte typer handler plasseres, men ikke følges opp. Årsaken til dypdykkingsspoofs er først og fremst compliance, men mønsteret med dypdykkingshandler, vellykkede, mislykkede, uredelige eller rett og slett bra, kommer også frontkontoret til gode. Dette i sin tur informerer om back-testing og strategiutvikling, som også kan inkludere forestillinger om tid. Dette er fordi strategier, når de går inn i produksjonshandel, risiko- eller porteføljestyringssystemer, bare vet hva som er foran dem, men baktesten kan prøve å innlemme kjente forutsetninger for å redusere risiko. Eksempler inkluderer å sammenligne kortsiktige transaksjonskostnader i motsetning til estimerte, sammenligne reelle og forventede kortsiktige parkorrelasjoner, mellomlangsiktige utbetalinger for for eksempel derivater og renteinstrumenter, utbytte i aksjer, aksje/sektorkorrelasjoner i porteføljeforvaltning, og langsiktige "makro" markeds-/risikoregimer elsket av økonomer. Tid – og bitemporalitet – betyr noe. Brukstilfellene som påvirkes gjør teknikken mye mer verdifull enn å bare være en enkel datateknisk manøver.

Utover kapitalmarkedene, vurder betalinger. For eksempel vil handlinger på en betalingsenhet rapportere transaksjoner sentralt. Det som er kjent på tidspunktet for transaksjonen, blir deretter oppdatert med informasjon, for eksempel kundens. Svindeloppdagelse er en åpenbar brukssak for dette, og det må skje i tide. Smart betalingsdata blir behandlet på et tidspunkt, men justert for å forbedre datakvaliteten og informere nedstrømshendelser. Bruken av en bitemporal datamodell på master- og tidsseriedata hjelper til med å administrere punkt-i-tidsaktiviteter.

Avslutningsvis kan det som potensielt kan være en kostbar, "høyt styrt" lineær lager-avstamningstransformasjon forenkles med litt sunn fornuftsanalyse og en empati med brukssaker i den virkelige verden. Bitemporalitet er vel verdt en titt.

Tidstempel:

Mer fra Fintextra