Bitemporalitet, hjælper med at sænke omkostningerne til anvendelsessager for finansielle tjenester

Bitemporalitet, hjælper med at sænke omkostningerne til anvendelsessager for finansielle tjenester

Jeg var til et "all things data and analytics benchmarking"-arrangement i sidste uge. Det var fabelagtigt, de fleste større banker var repræsenteret, også de hotteste af hotte hedgefonde, en del børser og nogle af de ikke-sædvanlige leverandører.

Jeg fandt det forfriskende, ligesom de fleste begivenheder, hvor håndgribelige analyser bliver diskuteret. Min tidlige karriere var kvant/data science/analytics-fokuseret, men nu er jeg i, ahem,
"Data"-profession, som består af en forvirrende række af (for det meste) kommercielle produkter, der understøtter "datavarehuse", "datasøer" og "datamesh", "datastof", "datasump"-infrastrukturer, svarende til $ billioner i udgifter og opretholdelse af nogle meget store organisationer. Jeg finder personligt sproget, jargonen og økosystemet i denne industri abstraheret fra virkeligheden, men det hjælper med at opretholde kommercielle udbydere med smukt navngivne produkter og kategorier. Følg pengene, som de siger: en "kompleks" dataplatform har en meget højere pris billet end et modelleringsværktøj, som enhver MSC-studerende kan bruge.

Dataindustrien var baggrunden for den meget pragmatiske begivenhed, men blev diskuteret, sjovt og eksplicit, i et panel om såkaldt "data afstamning." Dataafstamning er en overvejende en sekventiel lineær proces, der fanger datatransformation fra indtagelse til udnyttelse og hjælper med at understøtte den såkaldte datastyring, som driver en pokkers meget kostbart lagerværktøj. I cloud-æraen er cloud-datavarehuse i højsædet, især én. Men her er sagen. Datatransformation er faktisk ikke lineær, især når det er nyttigt. Det er komplekst, cyklisk, omdannes ligesom Doctor Who og tardis, der rejser gennem tiden og på tværs af galakser. Bortset fra pseudofilosofi og populær fysik kan de samme data, når de finpudses, transformeres og analyseres, tjene mange forskellige use cases, også på tværs af tid og sted. Desuden beder regulatorer os om at dokumentere ændringer, være gennemsigtige om, hvad vi gjorde hvornår, hvorfor og hvad der ændrede sig. Du kan sige, "det er datastyring, de beder om". En slags. Men regulatorer beder faktisk om rapportering af handlingsrettede beslutninger, der kræver modeller, engagement og resulterer i handlinger, der har indflydelse. Det involverer mennesker, beslutninger og håndgribelige use cases, ikke kun data.

Paneldebatten introducerede og diskuterede indgående begrebet bitemporalitet, en praktisk datahåndteringstaktik, der servicerer økonomiske brugssager og regulatoriske processer pænt. En paneldeltager fra en (meget) reguleret tier 1-bank roste overstrømmende bitemporalitet. Hans arkitektur brugte bitemporalitet til at tilpasse sig gennem tid og afspille dataændringer. Lad os sige, at du vil genskabe en gammel finansiel rapport eller derivathandel, som den så ud på oprettelsestidspunktet, og så som den burde have set ud givet senere rettelser/tilføjelser/payoffs, for eksempel i en compliance-rapport. Med bitemporalitet i hans tilfælde informerer en enkelt datakilde flere (validerede) visninger af data, hvornår det skete og senere, med "visdom". Det er nemt at implementere, ikke dyrt, og her er hvad du behøver at vide om det.

  • En datamodel bør lagre og lette analyse af data på tværs af to dimensioner af tid – en bitemporal datamodel, dvs. en model, der tager højde for data ved begyndelsen og på ethvert tidspunkt i fremtiden, når revisioner af deres tilstand forekommer og kan repræsenteres "som -af” et givet tidspunkt. 
  • Denne model gemmer mere end ét tidsstempel for hver egenskab, objekt og værdi.
  • Datapunkter kan forbindes og forbindes - en "som-of" join 

Som Af Data

I en traditionel datavarehustypearkitektur kan en sådan afstamning betyde dyre datakopier og utidig ineffektivitet og kompleksitet ved hentning. Dette er en måde, hvorpå cloud-datavarehusudbydere tjener penge, adskillige kopier af data administreret, en afstumpet tilgang.

Et simpelt alternativ er blot simple datamønstre med en understøttende lagrings-/in-memory-proces. Det kan og skal være billigt, Python-centreret. Du skal blot bruge tidsstempler (med dine data) og as-of joins (i kode) for at gøre processen ligetil, med en evne til at dykke dybt ned i individuelle poster efter behov.

For at spare omkostninger på dit datavarehus, så konstruer med en simpel Python, og vær opmærksom på ydeevnen i hukommelsen. Der er mindre behov for at udvikle en dyr datavarehusproces.

Hvor bruger du bitemporalitet i finans? Godt, overholdelse er et oplagt tilfælde. Tag for eksempel

spoofing
. Nu er spoofing i bund og grund et handelshensigtsmønster, omend et svigagtigt mønster, hvor bestemte typer handler placeres, men ikke følges op. Årsagen til dyb-dykning-spoofs er primært compliance, men mønsteret af dyb-dykning-handler, succesrige, mislykkede, svigagtige eller bare gode, gavner også frontkontoret. Dette informerer igen om back-testing og strategiudvikling, som også kan omfatte forestillinger om tid. Dette skyldes, at strategier, når de går ind i produktionshandel, risiko- eller porteføljestyringssystemer, kun ved, hvad der er foran dem, men back-testen kan forsøge at inkorporere kendte antagelser for at afbøde risici. Eksempler omfatter sammenligning af kortsigtede transaktionsomkostninger i modsætning til estimerede, sammenligning af reelle og forventede kortsigtede par-korrelationer, mellemfristede pay-offs for f.eks. derivater og renteinstrumenter, udbytte i aktier, aktie/sektor-korrelationer i porteføljestyring og langsigtede "makro"-markeds-/risikoregimer elsket af økonomer. Tid – og bitemporalitet – betyder noget. De berørte use cases gør teknikken meget mere værdifuld end blot at være en simpel dataingeniørmanøvre.

Ud over kapitalmarkederne, overvej betalinger. For eksempel vil handlinger på en betalingsenhed rapportere transaktioner centralt. Det, der er kendt på tidspunktet for transaktionen, bliver derefter opdateret af oplysninger, for eksempel kundens. Detektion af svindel er en oplagt brugssag til dette, og det skal være rettidigt. Smart betalingsdata bliver behandlet på et tidspunkt, men justeret for at forbedre datakvaliteten og informere downstream-begivenheder. Brugen af ​​en bitemporal datamodel på master- og tidsseriedata hjælper med at administrere punkt-i-tidsaktiviteter.

Som konklusion, hvad der potentielt kan være en kostbar, "højt styret" lineær lager-afstamningstransformation kan forenkles med nogle sunde fornuftsanalyser og en indlevelse i den virkelige verden. Bitemporalitet er et kig værd.

Tidsstempel:

Mere fra Fintextra