Tre GenAI-begreber, som finansielle praktikere lærte i 2023

Tre GenAI-begreber, som finansielle praktikere lærte i 2023

Tre GenAI-termer, finansiel praktikere lærte i 2023 PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

2023 var et besværligt år for mange på vores planet – krige, vold, befolkningsfordrivelse, katastrofer, ekstremisme, højere leveomkostninger og fattigdom. Folk, der arbejder i vores branche, var forholdsvis heldige, nogle af os blev styrket af den spændende GenerativeAI-tornado. Ligesom HFT forvandlede kapitalmarkedernes ordforråd i 2000'erne, og digitaliseringen transformerede ordforrådet for banker og finansielle tjenester i 2010'erne, har GenAI også bragt os et nyt AI-leksikon med en vis hastighed.

Med den stødte vi på mange udtryk, mange knap brugt i 2022, men som nu har nye eller meget anderledes betydninger. Jeg og mange andre i Financial Services bruger dem dagligt hver dag. Hvis du er en af ​​de få (u)heldige, der ikke gør, er her en hurtig genopfriskning af mine tre yndlings!

Term 1: Vektordatabasen

Den såkaldte vektordatabase er blevet kernen i mange virksomheders GenAI-stacke, som et middel til at forbedre kvaliteten af ​​svar på prompter. Alternativerne, f.eks. "finjustering" af store sprogmodeller [LLM] uden en medfølgende database, er dyre og fyldt med risiko- og overholdelsesomkostninger. En vektordatabase fanger proprietære virksomhedsoplysninger, giver omkostningseffektivitet og giver sammenlignende kontrol. Finansielle servicevirksomheder står bestemt i køen for at bruge vektordatabaser.

Ironisk nok inden for finans har vektorer i årevis været en integreret del af matrixalgebraen, der er fremherskende inden for handel og risikostyring. Datalagring af sådanne "vektorer" og matricer har også eksisteret i årtier, typisk i søjleformede databaser eller som tabeller eller datarammer brugt i sprog som Python (Pandas), R, MATLAB og SAS. Når de hentes og bruges, for eksempel som finansielle tidsserier og paneldata, sammen med teknikker som lineære og tidsserieregressioner, driver de forudsigende analyser, anomalidetektion og økonometri. De hjælper også med at informere om backtesting, især om handel, porteføljestyring og risikostrategier. Mens kapitalmarkederne – front- og middle office – førte matrix-algebra-anklagen, tog stadig mere analytisk-centrerede brugssager såsom markedsføring, afsløring af svindel og digitalisering generelt datavidenskab – og vektorer – på tværs af de finansielle organisationer.

Jeg var derfor fascineret, da en tidligere kollega gik på arbejde for en "vektordatabase"-opstart i juni 2021. Hans artikel om

Løsning af komplekse problemer med vektordatabaser
fra præ-ChatGPT marts 2022  fangede mit øje, fordi han fremhævede meget specifikke vektortyper – vektorindlejringer – kodede let-søgebare navigerbare vektorer, der fanger viden fra ustruktureret information såsom ord, billeder osv. Da ChatGPT blev lanceret senere samme år, blev vektorlagre af f.eks. indlejringstyper blev ophøjet til at være nøgleredskaber til at styre semantisk betydning. Oftest er butikker vektordatabaser, hvoraf

der er nu mange
. Allerede nu driver de oftest apps til finansielle tjenester og kapitalmarkeder

brugssager til behandling af naturligt sprog
, f.eks. opsummering af juridiske dokumenter og økonomiske rapporter eller indfangning af følelser fra sociale medier og nyhedsfeeds. De tager dog også fat på mere

involverede ansøgninger
, som for eksempel øger indsigt i handel og risikostyring, ofte sammen med traditionel statistik og maskinlæring.

I øvrigt blev det firma, min tidligere kollega gik for at slutte sig til, en GenAI-enhjørning til en værdi af sunde $750 mio. Godt arbejde, hvis du kan få det!

Termin 2: RAG, alias Retrieval Augmented Generation

RAG var knap et ord på nogens læber i foråret 2023, i det mindste i RAG's "Retrieval Augmented Generation" betydning af ordet med stort bogstav. Googles søgestatistikker for termerne accelererede fra omkring juli 2023 og i efteråret/efteråret var RAG overalt, den fremherskende pipeline-tilgang, hvormed vektordatabaser hjælper med at tæmme Large Language Model "stokastiske papegøjer". På den ene side indkapsler RAG pipelines for at levere virksomhedsdataarbejdsgange og hjælper på den anden pragmatisk finansielle virksomheder med at reducere hallucinationer og imødekomme interne – og eksterne – risikostyrings- og AI-overholdelsesprocesser.  

Der er
mange typer RAG
rørledninger, og de kan virke skræmmende komplekse. Tænk dog på RAG blot som at levere en datapipeline mellem prompter, dine virksomhedsdata og store sprogmodeller. For at lære mere og se hvordan det påvirker økonomien, læs min

finextra blog
eller se
denne fantastiske webcast
opsummering af risikostyringsmulighederne i RAG. Hvis du begynder at implementere dem på et hvilket som helst tidspunkt, vil du sandsynligvis udforske "RAG-venlige" miljøer som LangChain &
Lamaindeks.

Term 3: Hallucinationer

Jeg brugte udtrykket "hallucinationer" i mit tidligere afsnit, og stillede det som et problem løst af RAG, og til gengæld af vektordatabaser. Med GenAI er hallucinationer ikke længere blot udløsere af sindstimulerende kreativitet, såsom det stofinspirerede Sergeant Pepper's Lonely Hearts Club Band af Beatles eller Beachboys' Good Vibrations. De er heller ikke forbeholdt shamanistiske drømme, som praktiseres af mange folk, f.eks.
østlige sibiriske tjukchi-folk, eller fysiske aktiviteter, der bruger sindændrende teknikker, såsom yoga, massage og tantrisk sex. Ordet "hallucination" gælder nu også for LLM'ers mangler ved at navigere i information, som modellerne ikke har adgang til, eller misbruge eksisterende information. Det blev meget tydeligt meget hurtigt

ChatGPT, Bard og lignende systemer var tilbøjelige til at fremstille "hallucinatoriske" reaktioner
, og disse medførte risiko, når dårligt informerede handlinger fulgte. 

Her er twist. AI-investor Marc Andreessen foreslår, at selvom de fleste ser hallucinationer som bugs, kan de være nyttige som funktioner, når AI bruges som en medskaber, en forslagsstiller og en gætter. Som en brainstorming-hjælp kan deres opdigtede gæt sætte skub i menneskelig kreativitet. Andreessen fremhæver for eksempel, hvordan advokater bruger AI's "opbyggede" forslag under sagsforberedelsen til at forestille sig nye juridiske strategier. Inden for finansielle tjenesteydelser bruger handlende på Wall Street allerede generative AI- og vektordatabaser til at finde handelsmuligheder - at zigke, når masserne zagger.

Uanset hvad du synes om GenAI, har det bestemt bragt os et dejligt nyt leksikon!

Tidsstempel:

Mere fra Fintextra