Três termos GenAI que os profissionais financeiros aprenderam em 2023

Três termos GenAI que os profissionais financeiros aprenderam em 2023

Três termos GenAI que os profissionais financeiros aprenderam em 2023 PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

2023 foi um ano problemático para muitos no nosso planeta – guerras, violência, deslocamento populacional, catástrofes, extremismo, custos de vida mais elevados e pobreza. As pessoas que trabalham em nosso setor tiveram relativa sorte, alguns de nós revigorados pelo emocionante tornado GenerativeAI. Tal como o HFT transformou o vocabulário dos mercados de capitais na década de 2000, e a digitalização transformou o vocabulário dos serviços bancários e financeiros na década de 2010, a GenAI trouxe-nos um novo léxico de IA, também a uma certa velocidade.

Com ele, encontramos muitos termos, muitos pouco usados ​​em 2022, mas que agora carregam significados novos ou muito diferentes. Eu e muitos outros profissionais de serviços financeiros os usamos intradiariamente todos os dias. Se você é um dos poucos (in) sortudos que não o faz, aqui está uma rápida atualização dos meus três favoritos!

Termo 1: O banco de dados de vetores

O chamado banco de dados vetorial tornou-se essencial para muitas pilhas GenAI empresariais, como meio de melhorar a qualidade das respostas aos prompts. As alternativas, por exemplo, “ajustar” grandes modelos de linguagem [LLM] sem um banco de dados acompanhante, são caras e repletas de riscos e sobrecargas de conformidade. Um banco de dados vetorial captura informações corporativas proprietárias, traz economia e fornece controle comparativo. As empresas de serviços financeiros estão certamente na fila para utilizar bases de dados vetoriais.

Ironicamente, nas finanças, os vetores têm sido parte integrante da álgebra matricial predominante na negociação e no gerenciamento de risco há anos. O armazenamento de dados de tais “vetores” e matrizes também existe há décadas, normalmente em bancos de dados colunares ou como tabelas ou dataframes usados ​​em linguagens como Python (Pandas), R, MATLAB e SAS. Quando recuperados e usados, por exemplo, como séries temporais financeiras e dados de painel, em conjunto com técnicas como regressões lineares e de séries temporais, eles impulsionam análises preditivas, detecção de anomalias e econometria. Eles também ajudam a informar backtesting, principalmente sobre negociação, gestão de portfólio e estratégias de risco. Embora os mercados de capitais – o front e o middle office – liderassem a álgebra matricial, os casos de utilização cada vez mais centrados na análise, como o marketing, a deteção de fraudes e a digitalização, geralmente levaram a ciência de dados – e os vetores – a todas as organizações financeiras.

Fiquei fascinado, portanto, quando um ex-colega foi trabalhar para uma start-up de “banco de dados de vetores” em junho de 2021. Seu artigo sobre

Resolvendo problemas complexos com bancos de dados vetoriais
do pré-ChatGPT, março de 2022, chamou minha atenção porque ele destacou tipos de vetores muito específicos - embeddings de vetores - vetores navegáveis ​​codificados e de fácil pesquisa, capturando conhecimento de informações não estruturadas, como palavras, imagens, etc. os tipos de incorporação foram elevados a veículos-chave de gerenciamento do significado semântico. Mais comumente, os armazenamentos são bancos de dados vetoriais, dos quais

agora há muitos
. Eles já alimentam aplicativos de serviços financeiros e mercados de capitais, mais comumente

casos de uso de processamento de linguagem natural
, por exemplo, resumindo documentos legais e relatórios financeiros ou capturando sentimentos de mídias sociais e feeds de notícias. No entanto, eles também estão enfrentando mais

aplicações envolvidas
, aumentando os insights de negociação e gerenciamento de risco, por exemplo, muitas vezes junto com estatísticas tradicionais e aprendizado de máquina.

Aliás, a empresa em que meu ex-colega ingressou tornou-se um unicórnio GenAI, avaliado em saudáveis ​​US$ 750 milhões. Bom trabalho se você conseguir!

Termo 2: RAG, aka Geração Aumentada de Recuperação

RAG mal era uma palavra na boca de alguém na primavera de 2023, pelo menos no sentido RAG “Retrieval Augmented Generation” em maiúscula do termo. As estatísticas de pesquisa do Google para os termos aceleraram a partir de julho de 2023 e, no outono/outono, o RAG estava em toda parte, a abordagem de pipeline predominante pela qual os bancos de dados vetoriais ajudam a domar os “papagaios estocásticos” do Modelo de Linguagem Grande. Por um lado, o RAG encapsula pipelines para provisionar fluxos de trabalho de dados empresariais e, por outro lado, ajuda pragmaticamente as empresas financeiras a reduzir as alucinações e a acomodar processos internos – e externos – de gestão de riscos e de conformidade de IA.  

Tem
muitos tipos de RAG
pipelines, e eles podem parecer intimidantemente complexos. No entanto, pense no RAG simplesmente como um fornecimento de um pipeline de dados entre prompts, os dados da sua empresa e grandes modelos de linguagem. Para saber mais e ver como isso afeta as finanças, leia meu

blog finextra
ou assistir
este ótimo webcast
resumindo as oportunidades de gestão de risco do RAG. Se você começar a implementá-los em qualquer estágio, provavelmente explorará ambientes “amigáveis ​​ao RAG”, como LangChain &
LhamaIndex.

Termo 3: Alucinações

Usei o termo “alucinações” na seção anterior, apresentando-o como um problema resolvido pelo RAG e, por sua vez, por bancos de dados vetoriais. Com a GenAI, as alucinações não são mais simplesmente gatilhos de criatividade que estimula a mente, como a Sergeant Pepper’s Lonely Hearts Club Band dos Beatles, inspirada em drogas, ou a Good Vibrations dos Beachboys. Nem são domínio dos sonhos xamânicos praticados por muitos povos, por ex.
povos Chukchi da Sibéria Oriental, nem atividades físicas que utilizem técnicas de alteração da mente, como ioga, massagem e sexo tântrico. A palavra “alucinação” também se aplica agora às falhas dos LLMs em navegar por informações às quais os modelos não têm acesso ou em usar indevidamente as informações existentes. Tornou-se muito óbvio muito rapidamente que

ChatGPT, Bard e sistemas similares eram propensos a respostas “alucinatórias” fabricadas
, e estes trouxeram riscos quando se seguiram ações mal informadas. 

Aqui está a reviravolta. O investidor em IA Marc Andreessen sugere que, embora a maioria veja as alucinações como bugs, elas podem ser úteis como recursos quando a IA é usada como um recurso. co-criador, um sugestionador e um adivinhador. Como auxílio ao brainstorming, suas suposições inventadas podem estimular a criatividade humana. Andreessen, por exemplo, destaca como os advogados usam as sugestões “inventadas” da IA ​​durante a preparação do caso para imaginar novas estratégias jurídicas. Nos serviços financeiros, os traders de Wall Street já utilizam IA generativa e bases de dados vetoriais para encontrar oportunidades de negociação – para ziguezaguear quando as massas zagueiam.

O que quer que você pense sobre GenAI, certamente nos trouxe um novo léxico encantador!

Carimbo de hora:

Mais de Fintextra