Tre GenAI-termer som finansutövare lärde sig 2023

Tre GenAI-termer som finansutövare lärde sig 2023

Tre GenAI-termer som finansiärer lärde sig under 2023 PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

2023 var ett besvärligt år för många på vår planet – krig, våld, befolkningsflykt, katastrofer, extremism, högre levnadskostnader och fattigdom. Folk som arbetade i vår bransch hade förhållandevis tur, några av oss stärktes av den spännande GenerativeAI-tornadon. Precis som HFT förvandlade kapitalmarknadernas ordförråd på 2000-talet, och digitaliseringen förvandlade ordförrådet för banker och finansiella tjänster på 2010-talet, har GenAI gett oss ett nytt AI-lexikon, i ganska hög hastighet också.

Med den stötte vi på många termer, många knappt använda 2022 men som nu har nya eller helt andra innebörder. Jag och många andra inom Financial Services använder dem dagligen varje dag. Om du är en av de få (o)turliga som inte gör det, kommer här en snabb uppfräschning av mina tre favoriter!

Term 1: Vektordatabasen

Den så kallade vektordatabasen har blivit kärnan i många företags GenAI-stackar, som ett sätt att förbättra kvaliteten på svar på uppmaningar. Alternativen, t.ex. att "finjustera" stora språkmodeller [LLM] utan en medföljande databas, är dyra och fyllda med risker och omkostnader för efterlevnad. En vektordatabas fångar upp egen företagsinformation, ger kostnadseffektivitet och ger jämförande kontroll. Finansiella tjänsteföretag står verkligen i kö för att använda vektordatabaser.

Ironiskt nog inom finans har vektorer i åratal varit en integrerad del av matrisalgebra som dominerar inom handel och riskhantering. Datalagring av sådana "vektorer" och matriser har också funnits i årtionden, vanligtvis i kolumnära databaser, eller som tabeller eller dataramar som används i språk som Python (Pandas), R, MATLAB och SAS. När de hämtas och används, till exempel som finansiella tidsserier och paneldata, i kombination med tekniker som linjära och tidsserieregressioner, driver de prediktiv analys, anomalidetektering och ekonometri. De hjälper också till att informera om backtesting, framför allt om handel, portföljförvaltning och riskstrategier. Medan kapitalmarknaderna – front- och middle office – ledde anklagelsen om matrisalgebra, tog allt mer analytiskt centrerade användningsfall som marknadsföring, bedrägeriupptäckt och digitalisering i allmänhet datavetenskap – och vektorer – över de finansiella organisationerna.

Jag blev därför fascinerad när en före detta kollega gick till jobbet för en start-up "vektordatabas" i juni 2021. Hans artikel om

Lösa komplexa problem med vektordatabaser
från pre-ChatGPT mars 2022 fångade mitt öga eftersom han lyfte fram mycket specifika vektortyper – vektorinbäddningar – kodade lättsökta navigerbara vektorer som fångar kunskap från ostrukturerad information som ord, bilder etc. När ChatGPT lanserades senare samma år, vektorbutiker av sådana inbäddningstyper upphöjdes till att vara nyckelredskap för att hantera semantisk mening. Vanligast är butiker vektordatabaser, varav

det finns nu många
. Redan nu driver de appar för finansiella tjänster och kapitalmarknader, oftast

användningsfall för behandling av naturligt språk
t.ex. sammanfatta juridiska dokument och finansiella rapporter, eller fånga känslor från sociala medier och nyhetsflöden. Men de tacklar också mer

inblandade ansökningar
, förstärkning av handels- och riskhanteringsinsikter till exempel, ofta tillsammans med traditionell statistik och maskininlärning.

För övrigt blev företaget som min tidigare kollega gick för att gå med i en GenAI-enhörning, värderad till 750 miljoner dollar. Bra jobbat om du kan få det!

Termin 2: RAG, aka Retrieval Augmented Generation

RAG var knappt ett ord på någons läppar under våren 2023, åtminstone i RAG-bemärkelsen "Retrieval Augmented Generation" med stora bokstäver. Googles sökstatistik för termerna accelererade från omkring juli 2023 och till hösten/hösten var RAG överallt, den dominerande strategin genom vilken vektordatabaser hjälper till att tämja Large Language Models "stokastiska papegojor". Å ena sidan kapslar RAG in pipelines för att tillhandahålla företagsdataarbetsflöden och å andra sidan hjälper det pragmatiskt finansföretag att minska hallucinationer och hantera intern – och extern – riskhantering och AI-efterlevnadsprocesser.  

Det finns
många typer av trasor
rörledningar, och de kan verka skrämmande komplexa. Tänk dock på RAG helt enkelt som att tillhandahålla en datapipeline mellan uppmaningar, din företagsdata och stora språkmodeller. För att lära dig mer och se hur det påverkar ekonomin, läs min

finextra blogg
eller titta
denna fantastiska webbsändning
sammanfattar riskhanteringsmöjligheterna för RAG. Om du börjar implementera dem i något skede kommer du sannolikt att utforska "RAG-vänliga" miljöer som LangChain &
LamaIndex.

Termin 3: Hallucinationer

Jag använde termen "hallucinationer" i mitt tidigare avsnitt, och utgjorde det som ett problem löst av RAG, och i sin tur av vektordatabaser. Med GenAI är hallucinationer inte längre bara utlösare av sinnesstimulerande kreativitet, som det droginspirerade Sergeant Pepper's Lonely Hearts Club Band av Beatles, eller Beachboys' Good Vibrations. De är inte heller förbehållna shamanistiska drömmar som utövas av många folk, t.ex
östsibiriska tjukchifolken, inte heller fysiska aktiviteter som använder sinnesförändrande tekniker, såsom yoga, massage och tantriskt sex. Ordet "hallucination" gäller nu också för LLM:ers misslyckanden att navigera i information som modellerna inte har tillgång till, eller missbruka befintlig information. Det blev väldigt uppenbart väldigt snabbt

ChatGPT, Bard och liknande system var benägna att tillverka "hallucinatoriska" svar
, och dessa medförde risker när dåligt informerade handlingar följde. 

Här är twisten. AI-investerare Marc Andreessen föreslår att även om de flesta ser hallucinationer som buggar, kan de vara användbara som funktioner när AI används som en medskapare, en förslagsställare och en gissare. Som ett brainstorminghjälpmedel kan deras påhittade gissningar underblåsa mänsklig kreativitet. Andreessen belyser till exempel hur advokater använder AI:s "påhittade" förslag under ärendeförberedelser för att föreställa sig nya juridiska strategier. Inom finansiella tjänster använder handlare på Wall Street redan generativa AI- och vektordatabaser för att hitta handelsmöjligheter – att sickra när massorna sackar.

Vad du än tycker om GenAI så har det verkligen gett oss ett härligt nytt lexikon!

Tidsstämpel:

Mer från Fintextra