Bitemporalidad, que ayuda a reducir los costos de los casos de uso de servicios financieros

Bitemporalidad, que ayuda a reducir los costos de los casos de uso de servicios financieros

La semana pasada estuve en un evento sobre “evaluación comparativa de todo lo relacionado con datos y análisis”. Fue fabuloso, la mayoría de los bancos importantes estaban representados, también los fondos de cobertura más populares, una gran cantidad de bolsas y algunos proveedores no habituales.

Lo encontré refrescante, como la mayoría de los eventos donde se discuten análisis tangibles. Mi carrera inicial estuvo centrada en la ciencia de datos/cuantitativa/análisis, pero ahora estoy en, ejem,
Profesión de “datos”, que se compone de una confusa variedad de productos (en su mayoría) comerciales que sustentan las infraestructuras de “almacenes de datos”, “lagos de datos” y “malla de datos”, “tejido de datos”, “pantano de datos”, que ascienden a $ billones en gastos y sostener algunas organizaciones muy grandes. Personalmente, considero que el lenguaje, la jerga y el ecosistema de esta industria están abstraídos de la realidad, pero ayudan a sostener a los proveedores comerciales con productos y categorías con nombres hermosos. Siga el dinero, como dicen: una plataforma de datos “compleja” tiene un precio mucho más alto que una herramienta de modelado que cualquier estudiante de MSC pueda utilizar.

La industria de los datos fue el telón de fondo de este evento muy pragmático, pero fue discutida, de manera amena y explícita, en un panel sobre el llamado “linaje de datos.” El linaje de datos es predominantemente un proceso lineal secuencial que captura la transformación de los datos desde la ingesta hasta la utilización y ayuda a sustentar la llamada gobernanza de datos, que impulsa una gran cantidad de costosas herramientas de almacén. En la era de la nube, los almacenes de datos en la nube están de moda, uno en particular. Pero aquí está la cuestión. En realidad, la transformación de datos no es lineal, especialmente cuando es útil. Es complejo, cíclico, transformándose como Doctor Who y la tardis, viajando a través del tiempo y a través de galaxias. Dejando a un lado la pseudofilosofía y la física popular, en las finanzas los mismos datos, cuando se modifican, transforman y analizan, pueden servir para muchos casos de uso diferentes, también en diferentes momentos y lugares. Además, los reguladores nos piden que documentemos los cambios, siendo transparentes sobre qué hicimos, cuándo, por qué y qué cambió. Se podría decir: "eso es el gobierno de datos que están pidiendo". Un poco. Pero los reguladores en realidad están pidiendo informes sobre decisiones viables que requieren modelos, compromiso y resultados en acciones que tengan impacto. Implica personas, decisiones y casos de uso tangibles, no solo datos.

El panel de discusión introdujo y discutió extensamente el concepto de bitemporalidad, una táctica práctica de gestión de datos que atiende muy bien los casos de uso financieros y los procesos regulatorios. Un panelista de un banco de nivel 1 (muy) regulado elogió efusivamente la bitemporalidad. Su arquitectura utilizó la bitemporalidad para ajustarse a través del tiempo y reproducir los cambios de datos. Supongamos que desea recrear un informe financiero antiguo o una operación de derivados tal como se veía en el momento de su creación y luego como debería haberse visto con las correcciones, adiciones o pagos posteriores, por ejemplo, en un informe de cumplimiento. En su caso, con la bitemporalidad, una única fuente de datos informa múltiples vistas (validadas) de los datos, cuándo sucedió y después, con “sabiduría”. Es sencillo de implementar, no es costoso y esto es lo que necesita saber al respecto.

  • Un modelo de datos debe almacenar y facilitar el análisis de datos en dos dimensiones de tiempo: un modelo de datos bitemporal, es decir, un modelo que atiende a los datos desde el inicio y en cualquier momento futuro en el que se produzcan revisiones de su estado y pueda representarse “como -de” un tiempo determinado. 
  • Este modelo almacena más de una marca de tiempo para cada propiedad, objeto y valor.
  • Los puntos de datos se pueden unir y conectar: ​​una unión "desde el momento" 

A partir de datos

En una arquitectura tradicional de tipo almacén de datos, dicho linaje puede significar copias de datos costosas e ineficiencias inoportunas y complejidades de recuperación. Esta es una de las formas en que los proveedores de almacenamiento de datos en la nube ganan dinero: administrar múltiples copias de datos, un enfoque contundente.

Una alternativa simple son simplemente patrones de datos simples con un proceso de almacenamiento/en memoria de soporte. Eso puede y debe ser barato y centrado en Python. Simplemente use marcas de tiempo (con sus datos) y uniones al momento (en código) para simplificar el proceso, con la capacidad de profundizar en registros individuales según sea necesario.

Para ahorrar costos en su almacén de datos, diseñe con Python simple, prestando atención al rendimiento en memoria. Hay menos necesidad de ingeniería dentro de un costoso proceso de almacenamiento de datos.

¿Dónde se utiliza la bitemporalidad en las finanzas? Bueno, el cumplimiento es un caso obvio. Toma por ejemplo

spoofing
. Ahora bien, la suplantación de identidad es en el fondo un patrón de intención comercial, aunque fraudulento, en el que se realizan determinados tipos de transacciones pero no se llevan a cabo. La razón de las parodias profundas es principalmente el cumplimiento, pero el patrón de operaciones profundas, exitosas, fallidas, fraudulentas o simplemente geniales, también beneficia a la oficina principal. Esto, a su vez, sirve de base para las pruebas retrospectivas y el desarrollo de estrategias, que también pueden incluir nociones de tiempo. Esto se debe a que las estrategias, cuando entran en sistemas de gestión de cartera, riesgo o producción, solo saben lo que tienen delante, pero la prueba retrospectiva puede intentar incorporar suposiciones conocidas para mitigar los riesgos. Los ejemplos incluyen comparar costos de transacción a corto plazo con respecto a los estimados, comparar correlaciones de pares reales y anticipadas a corto plazo, pagos a mediano plazo para, por ejemplo, derivados e instrumentos de renta fija, dividendos en acciones, correlaciones entre acciones y sectores en la gestión de carteras, y regímenes “macro” de mercado/riesgo a largo plazo amados por los economistas. El tiempo –y la bitemporalidad– importan. Los casos de uso afectados hacen que la técnica sea mucho más valiosa que una simple maniobra de ingeniería de datos.

Más allá de los mercados de capitales, consideremos los pagos. Por ejemplo, las acciones en un dispositivo de pago informarán las transacciones de forma centralizada. Lo que se sabe en el momento de la transacción se actualiza con información, por ejemplo la del cliente. La detección de fraude es un caso de uso obvio para esto y debe realizarse en el momento oportuno. Los datos de pagos inteligentes se procesan en un momento determinado, pero se ajustan para mejorar la calidad de los datos e informar sobre eventos posteriores. El uso de un modelo de datos bitemporal en los datos maestros y de series de tiempo ayuda a gestionar actividades puntuales.

En conclusión, lo que potencialmente puede ser una transformación lineal del linaje del almacén costosa y “altamente gobernada” se puede simplificar con algunos análisis de sentido común y empatía con los casos de uso del mundo real. Vale la pena echarle un vistazo a la bitemporalidad.

Sello de tiempo:

Mas de fintextra