Tres términos GenAI que los profesionales financieros aprenderán en 2023

Tres términos GenAI que los profesionales financieros aprenderán en 2023

Tres términos GenAI que los profesionales financieros aprendieron en 2023 PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

2023 fue un año problemático para muchos en nuestro planeta: guerras, violencia, desplazamientos de población, catástrofes, extremismo, mayores costos de vida y pobreza. Las personas que trabajan en nuestra industria fueron comparativamente afortunadas, algunos de nosotros fortalecidos por el emocionante tornado GenerativeAI. Así como HFT transformó el vocabulario de los mercados de capitales en la década de 2000, y la digitalización transformó el vocabulario de los servicios bancarios y financieros en la década de 2010, GenAI nos ha traído un nuevo léxico de IA, también a bastante velocidad.

Con él, nos encontramos con muchos términos, muchos de ellos apenas utilizados en 2022 pero que ahora tienen significados nuevos o muy diferentes. Yo y muchos otros en Servicios Financieros los usamos intradía todos los días. Si eres uno de los pocos (des)afortunados que no lo hace, ¡aquí tienes un repaso rápido de mis tres favoritos!

Término 1: La base de datos de vectores

La llamada base de datos vectorial se ha convertido en el núcleo de muchas pilas de GenAI empresariales, como un medio para mejorar la calidad de las respuestas a las solicitudes. Las alternativas, por ejemplo, “afinar” modelos de lenguajes grandes [LLM] sin una base de datos que los acompañe, son costosas y están plagadas de riesgos y gastos generales de cumplimiento. Una base de datos vectorial captura información empresarial patentada, aporta rentabilidad y proporciona control comparativo. Las empresas de servicios financieros ciertamente están en la cola para utilizar bases de datos vectoriales.

Irónicamente, en las finanzas, los vectores han sido durante años parte integral del álgebra matricial predominante en el comercio y la gestión de riesgos. El almacenamiento de datos de dichos “vectores” y matrices también existe desde hace décadas, generalmente en bases de datos en columnas, o como tablas o marcos de datos utilizados en lenguajes como Python (Pandas), R, MATLAB y SAS. Cuando se recuperan y utilizan, por ejemplo como series de tiempo financieras y datos de panel, junto con técnicas como regresiones lineales y de series de tiempo, impulsan el análisis predictivo, la detección de anomalías y la econometría. También ayudan a fundamentar las pruebas retrospectivas, en particular de negociación, gestión de carteras y estrategias de riesgo. Si bien los mercados de capitales (el front y middle office) lideraron la carga del álgebra matricial, los casos de uso cada vez más centrados en el análisis, como el marketing, la detección de fraude y la digitalización, generalmente tomaron la ciencia de datos (y los vectores) en todas las organizaciones financieras.

Por eso me fascinó cuando un antiguo colega se puso a trabajar en una nueva empresa de “bases de datos vectoriales” en junio de 2021. Su artículo sobre

Resolver problemas complejos con bases de datos vectoriales
de marzo de 2022 anterior a ChatGPT me llamó la atención porque destacó tipos de vectores muy específicos (incrustaciones de vectores), vectores navegables codificados y de fácil búsqueda que capturan conocimiento a partir de información no estructurada como palabras, imágenes, etc. Cuando ChatGPT se lanzó más tarde ese año, los almacenes de vectores de tales Los tipos de incrustación fueron elevados a ser vehículos clave para la gestión del significado semántico. Lo más común es que las tiendas sean bases de datos vectoriales, de las cuales

ahora hay muchos
. Ya impulsan aplicaciones de servicios financieros y mercados de capitales, más comúnmente

casos de uso de procesamiento del lenguaje natural
, por ejemplo, resumir documentos legales e informes financieros, o capturar opiniones de las redes sociales y fuentes de noticias. Sin embargo, también están abordando más

aplicaciones involucradas
, aumentando los conocimientos sobre comercio y gestión de riesgos, por ejemplo, a menudo junto con estadísticas tradicionales y aprendizaje automático.

Por cierto, la empresa a la que se unió mi antiguo colega se convirtió en un unicornio GenAI, valorado en unos saludables 750 millones de dólares. ¡Buen trabajo si puedes conseguirlo!

Término 2: RAG, Aka Recuperación Generación Aumentada

RAG apenas era una palabra en boca de nadie en la primavera de 2023, al menos en el sentido del término RAG en mayúsculas “Generación Aumentada de Recuperación”. Las estadísticas de búsqueda de Google para los términos se aceleraron aproximadamente desde julio de 2023 y, en otoño/otoño, RAG estaba en todas partes, el enfoque de canalización predominante mediante el cual las bases de datos vectoriales ayudan a domesticar los “loros estocásticos” del modelo de lenguaje grande. Por un lado, RAG encapsula canales para proporcionar flujos de trabajo de datos empresariales y, por otro, ayuda pragmáticamente a las empresas financieras a reducir las alucinaciones y adaptarse a los procesos internos (y externos) de gestión de riesgos y cumplimiento de la IA.  

Existen
muchos tipos de RAG
oleoductos, y pueden parecer intimidantemente complejos. Sin embargo, piense en RAG simplemente como un canal de datos entre las indicaciones, los datos de su empresa y los grandes modelos de lenguaje. Para obtener más información y ver cómo afecta a las finanzas, lea mi

blog finextra
o vea
este gran webcast
resumiendo las oportunidades de gestión de riesgos de RAG. Si comienza a implementarlos en cualquier etapa, probablemente explorará entornos "compatibles con RAG" como LangChain y
LlamaIndex.

Término 3: Alucinaciones

Utilicé el término "alucinaciones" en mi sección anterior, planteándolo como un problema resuelto por RAG y, a su vez, por las bases de datos vectoriales. Con GenAI, las alucinaciones ya no son simplemente desencadenantes de una creatividad que estimula la mente, como en el caso de Sergeant Pepper's Lonely Hearts Club Band de los Beatles, inspirado en las drogas, o Good Vibrations de los Beachboys. Tampoco son el dominio exclusivo de los sueños chamánicos practicados por muchos pueblos, por ejemplo
Pueblos chukchi del este de Siberia, ni actividades físicas que utilicen técnicas que alteren la mente, como el yoga, los masajes y el sexo tántrico. La palabra "alucinación" ahora también se aplica a las fallas de los LLM para navegar por información a la que los modelos no tienen acceso o hacer mal uso de la información existente. Se hizo muy obvio muy rápidamente que

ChatGPT, Bard y sistemas similares eran propensos a respuestas "alucinatorias" fabricadas
, y esto trajo consigo riesgos cuando se produjeron acciones mal informadas. 

Aquí está el giro. El inversor en IA Marc Andreessen sugiere que, si bien la mayoría ve las alucinaciones como errores, pueden ser útiles como características cuando se utiliza la IA como herramienta. cocreador, sugerente y adivinador. Como ayuda para la lluvia de ideas, sus conjeturas inventadas pueden alimentar la creatividad humana. Andreessen, por ejemplo, destaca cómo los abogados utilizan las sugerencias “inventadas” de AI durante la preparación de casos para imaginar estrategias legales novedosas. En los servicios financieros, los operadores de Wall Street ya están utilizando inteligencia artificial generativa y bases de datos vectoriales para encontrar oportunidades comerciales, para zigzaguear cuando las masas lo hacen.

Independientemente de lo que piense sobre GenAI, ¡sin duda nos ha brindado un léxico nuevo y encantador!

Sello de tiempo:

Mas de fintextra