Trije izrazi GenAI so se jih finančniki naučili leta 2023

Trije izrazi GenAI so se jih finančniki naučili leta 2023

Three GenAI Terms Financial Practitioners Learnt in 2023 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Leto 2023 je bilo za mnoge na našem planetu težavno leto – vojne, nasilje, razseljevanje prebivalstva, katastrofe, ekstremizem, višji življenjski stroški in revščina. Ljudje, ki delajo v naši panogi, so imeli sorazmerno srečo, nekatere od nas je spodbudil vznemirljivi tornado GenerativeAI. Tako kot je HFT preoblikoval besednjak kapitalskih trgov v 2000-ih in je digitalizacija preoblikovala besednjak bančništva in finančnih storitev v 2010-ih, nam je GenAI prinesel nov leksikon AI, prav tako zelo hitro.

Pri njem smo naleteli na številne izraze, od katerih so bili mnogi leta 2022 komaj uporabljeni, zdaj pa imajo nove ali zelo drugačne pomene. Jaz in mnogi drugi v finančnih storitvah jih uporabljamo znotraj dneva vsak dan. Če ste eden izmed redkih (ne)srečnežev, ki tega ne počnejo, je tukaj kratka osvežitev treh mojih najljubših!

Izraz 1: Vektorska zbirka podatkov

Tako imenovana vektorska podatkovna baza je postala jedro številnih skladov GenAI v podjetjih kot sredstvo za izboljšanje kakovosti odzivov na pozive. Alternative, npr. »natančna nastavitev« velikih jezikovnih modelov [LLM] brez priložene podatkovne baze, so drage in polne tveganja in režijskih stroškov skladnosti. Vektorska zbirka podatkov zajema lastniške podatke podjetja, prinaša stroškovno učinkovitost in omogoča primerjalni nadzor. Podjetja za finančne storitve so zagotovo v čakalni vrsti za uporabo vektorskih baz podatkov.

Ironično je, da so v financah vektorji že leta sestavni del matrične algebre, ki prevladuje pri trgovanju in obvladovanju tveganj. Shranjevanje podatkov takšnih »vektorjev« in matrik je prav tako prisotno že desetletja, običajno v stolpčnih bazah podatkov ali kot tabele ali podatkovni okviri, ki se uporabljajo v jezikih, kot so Python (Pandas), R, MATLAB in SAS. Ko so pridobljeni in uporabljeni, na primer kot finančni časovni nizi in panelni podatki, v povezavi s tehnikami, kot so linearne in časovne regresije, poganjajo napovedno analitiko, odkrivanje anomalij in ekonometrijo. Pomagajo tudi pri testiranju za nazaj, predvsem trgovanja, upravljanja portfelja in strategij tveganja. Medtem ko so kapitalski trgi – sprednji in srednji urad – vodili obremenitev matrične algebre, so vedno bolj analitično osredotočeni primeri uporabe, kot so trženje, odkrivanje goljufij in digitalizacija, na splošno uporabljali podatkovno znanost – in vektorje – po finančnih organizacijah.

I was fascinated, therefore, when a former colleague went to work for a “vector database” start-up in June 2021. His article on

Reševanje kompleksnih problemov z vektorskimi bazami podatkov
iz pred ChatGPT marca 2022 mi je pritegnil pozornost, ker je izpostavil zelo specifične vektorske vrste – vektorske vdelave – kodirane navigacijske vektorje, ki jih je mogoče preprosto iskati in zajemajo znanje iz nestrukturiranih informacij, kot so besede, slike itd. tipi vdelave so bili povzdignjeni v ključna sredstva za upravljanje semantičnega pomena. Najpogosteje so trgovine vektorske baze podatkov, od katerih

zdaj jih je veliko
. Najpogosteje že poganjajo finančne storitve in aplikacije kapitalskih trgov

primeri uporabe obdelave naravnega jezika
, npr. povzemanje pravnih dokumentov in finančnih poročil ali zajemanje občutkov iz družbenih medijev in virov novic. Vendar se lotevajo tudi več

vključenih aplikacij
, na primer izboljšanje vpogledov v trgovanje in obvladovanje tveganj, pogosto poleg tradicionalne statistike in strojnega učenja.

Incidentally, the company my former colleague went to join became a GenAI unicorn, valued at a healthy $750m. Nice work if you can get it!

2. termin: RAGaka Povečana generacija pridobivanja

Spomladi 2023 je bila beseda RAG komaj kdo na ustih, vsaj v pomenu izraza RAG z veliko začetnico »Retrieval Augmented Generation«. Googlova statistika iskanja za izraze se je pospešila približno od julija 2023 in do jeseni/jeseni je bil RAG povsod, prevladujoč cevovodni pristop, s katerim vektorske baze podatkov pomagajo krotiti »stohastične papige« velikega jezikovnega modela. Po eni strani RAG zajema cevovode za zagotavljanje podatkovnih tokov podjetja, po drugi strani pa pragmatično pomaga finančnim podjetjem zmanjšati halucinacije in prilagoditi notranje – in zunanje – obvladovanje tveganja in postopke skladnosti z umetno inteligenco.  

obstajajo
veliko vrst RAG
cevovodov in se lahko zdijo zastrašujoče zapleteni. Vendar si RAG predstavljajte preprosto kot zagotavljanje podatkovnega cevovoda med pozivi, podatki vašega podjetja in velikimi jezikovnimi modeli. Če želite izvedeti več in videti, kako to vpliva na finance, preberite moje

blog finextra
ali gledati
ta odličen spletni prenos
povzemanje priložnosti RAG za obvladovanje tveganja. Če jih začnete izvajati na kateri koli stopnji, boste verjetno raziskali »RAG prijazna« okolja, kot sta LangChain in
LlamaIndex.

3. izraz: Halucinacije

Izraz "halucinacije" sem uporabil v svojem prejšnjem razdelku in ga predstavil kot problem, ki ga rešuje RAG in posledično vektorske zbirke podatkov. Z GenAI halucinacije niso več le sprožilci kreativnosti, ki spodbuja um, kot je na primer Lonely Hearts Club Band narednika Pepperja skupine Beatles, ki ga je navdihnila droga, ali Good Vibrations skupine Beachboys. Prav tako niso rezervat šamanskih sanj, ki jih izvajajo številna ljudstva, npr
vzhodnosibirska ljudstva Čukči, niti telesne dejavnosti, ki uporabljajo tehnike spreminjanja uma, kot so joga, masaža in tantrični seks. Beseda "halucinacija" se zdaj uporablja tudi za napake LLM pri krmarjenju po informacijah, do katerih modeli nimajo dostopa, ali zlorabi obstoječih informacij. Zelo hitro je postalo očitno, da

ChatGPT, Bard in podobni sistemi so bili nagnjeni k izdelanim "halucinatornim" odzivom
, in ti so prinesli tveganje, ko so sledila slabo obveščena dejanja. 

Tukaj je preobrat. Investitor v umetno inteligenco Marc Andreessen meni, da čeprav večina vidi halucinacije kot hrošče, so lahko koristne kot funkcije, če se umetna inteligenca uporablja kot soustvarjalec, predlagatelj in ugibalec. Kot pomoč pri nevihti možganov lahko njihova izmišljena ugibanja spodbujajo človeško ustvarjalnost. Andreessen na primer poudarja, kako odvetniki med pripravo primera uporabljajo "izmišljene" predloge AI, da si zamislijo nove pravne strategije. Na področju finančnih storitev trgovci na Wall Streetu že uporabljajo generativno umetno inteligenco in vektorske podatkovne baze, da bi našli priložnosti za trgovanje – za cik, ko množice zahajajo.

Karkoli si mislite o GenAI, zagotovo nam je prinesel čudovit nov leksikon!

Časovni žig:

Več od Fintextra