Bitemporalitet, hjälper till att sänka kostnaderna för användningsfall för finansiella tjänster

Bitemporalitet, hjälper till att sänka kostnaderna för användningsfall för finansiella tjänster

Jag var på ett "all things data and analytics benchmarking"-evenemang förra veckan. Det var fantastiskt, de flesta storbanker var representerade, även de hetaste av heta hedgefonder, en del börser och några av de onormala leverantörerna.

Jag tyckte att det var uppfriskande, som de flesta evenemang där konkreta analyser diskuteras. Min tidiga karriär var kvant/datavetenskap/analytikfokuserad, men nu är jag i, ahem,
"Data"-yrket, som består av en förvirrande uppsättning (främst) kommersiella produkter som ligger till grund för "datalager", "datasjöar" och "datanät", "dataväv", "dataträsk" infrastrukturer, uppgående till $ biljoner i utgifter och upprätthålla några mycket stora organisationer. Jag tycker personligen att språket, jargongen och ekosystemet i den här branschen är abstraherat från verkligheten, men det hjälper till att upprätthålla kommersiella leverantörer med vackert namngivna produkter och kategorier. Följ pengarna, som de säger: en "komplex" dataplattform har ett mycket högre pris än ett modelleringsverktyg som alla MSC-studenter kan använda.

Dataindustrin var bakgrunden till den mycket pragmatiska händelsen, men diskuterades, roligt och tydligt, i en panel om så kallade ”data härstamning.” Datalinje är en övervägande en sekventiell linjär process som fångar datatransformation från intag till användning och hjälper till att underbygga så kallad datastyrning som driver en jäkla massa kostsamma lagerverktyg. I molntiden är molndatalager på modet, särskilt ett. Men här är grejen. Datatransformation är faktiskt inte linjär, särskilt när det är användbart. Det är komplext, cykliskt, förvandlas som Doctor Who och tardis, som reser genom tiden och över galaxer. Bortsett från pseudofilosofi och populär fysik kan samma data, när den justeras, transformeras och analyseras, tjäna många olika användningsfall, även över tid och plats. Dessutom ber tillsynsmyndigheter oss att dokumentera förändringar och vara transparenta med vad vi gjorde när, varför och vad som förändrades. Du kan säga, "det är datastyrning de efterfrågar". Ungefär. Men tillsynsmyndigheter ber faktiskt om rapportering av handlingsbara beslut som kräver modeller, engagemang och resulterar i åtgärder som har effekt. Det handlar om människor, beslut och konkreta användningsfall, inte bara data.

Paneldiskussionen introducerade och diskuterade utförligt konceptet bitemporalitet, en praktisk datahanteringstaktik som servar ekonomiskt bruksfall och regulatoriska processer snyggt. En paneldeltagare från en (mycket) reglerad nivå 1-bank berömde bitemporalitet ivrigt. Hans arkitektur använde bitemporalitet för att anpassa sig genom tid och spela upp dataförändringar. Låt oss säga att du vill återskapa en gammal finansiell rapport eller derivathandel som den såg ut när den skapades, och sedan som den borde ha sett ut med senare korrigeringar/tillägg/utbetalningar, till exempel i en efterlevnadsrapport. Med bitemporalitet i hans fall informerar en enda datakälla flera (validerade) synpunkter på data, när det hände och senare, med "visdom". Det är enkelt att implementera, inte dyrt, och här är vad du behöver veta om det.

  • En datamodell bör lagra och underlätta analys av data över två tidsdimensioner – en bitemporal datamodell, det vill säga en modell som tillgodoser data vid inledning och när som helst tidpunkter i framtiden när revisioner av dess tillstånd inträffar och kan representeras "som -av” en given tid. 
  • Denna modell lagrar mer än en tidsstämpel för varje egenskap, objekt och värde.
  • Datapunkter kan sammanfogas och anslutas – en "som-of"-koppling 

Som Av Data

I en traditionell data warehouse-arkitektur kan en sådan härstamning innebära kostsamma datakopior och tidig ineffektivitet och komplexitet för hämtning. Detta är ett sätt för leverantörer av molndatalager att tjäna pengar, flera kopior av data hanteras, en trubbig strategi.

Ett enkelt alternativ är bara enkla datamönster med en stödjande lagrings-/minnesprocess. Det kan och borde vara billigt, Python-centrerat. Använd helt enkelt tidsstämplar (med dina data) och as-of joins (i kod) för att göra processen enkel, med en förmåga att dyka djupt in i individuella poster efter behov.

För att spara kostnader på ditt datalager, konstruera då med en enkel Python och uppmärksamma prestanda i minnet. Det finns mindre behov av att konstruera i en dyr datalagerprocess.

Var använder du bitemporalitet i ekonomi? Tja, efterlevnad är ett uppenbart fall. Ta till exempel

spoofing
. Nu är spoofing i grunden ett handelsavsiktsmönster, om än ett bedrägligt sådant där särskilda typer av affärer placeras men inte följs igenom. Anledningen till djupdykningspoofs är i första hand efterlevnad, men mönstret av djupdykningsaffärer, framgångsrika, misslyckade, bedrägliga eller helt enkelt bra, gynnar frontkontoret också. Detta informerar i sin tur om back-testing och strategiutveckling, som också kan innefatta föreställningar om tid. Detta beror på att strategier, när de går in i produktionshandel, risk- eller portföljhanteringssystem, bara vet vad som finns framför dem, men backtestet kan försöka införliva kända antaganden för att minska riskerna. Exempel inkluderar att jämföra kortsiktiga transaktionskostnader i motsats till uppskattade, jämföra verkliga och förväntade kortsiktiga parkorrelationer, medellång sikt pay-offs för till exempel derivat och ränteinstrument, utdelningar i aktier, aktie/sektorkorrelationer i portföljförvaltning och långsiktiga "makro"-marknads-/riskregimer som är älskade av ekonomer. Tid – och bitemporalitet – spelar roll. Användningsfallen som påverkas gör tekniken mycket mer värdefull än att bara vara en enkel datateknikmanöver.

Utöver kapitalmarknaderna, överväg betalningar. Till exempel kommer åtgärder på en betalningsenhet att rapportera transaktioner centralt. Det som är känt vid transaktionstillfället uppdateras sedan med information, till exempel kundens. Bedrägeriupptäckt är ett uppenbart användningsfall för detta, och det måste komma i tid. Smart betalningsdata bearbetas vid tidpunkten, men justeras för att förbättra datakvaliteten och informera nedströmshändelser. Användningen av en bitemporal datamodell på master- och tidsseriedata hjälper till att hantera tidpunktsaktiviteter.

Sammanfattningsvis, vad som potentiellt kan vara en kostsam, "högt styrd" linjär transformation av lager-härstamning kan förenklas med lite sunt förnuftsanalys och en empati med verkliga användningsfall. Bitemporalitet är väl värt att titta på.

Tidsstämpel:

Mer från Fintextra