Trei termeni GenAI Practicieni financiari au învățat în 2023

Trei termeni GenAI Practicieni financiari au învățat în 2023

Three GenAI Terms Financial Practitioners Learnt in 2023 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

2023 a fost un an supărător pentru mulți de pe planeta noastră – războaie, violență, strămutarea populației, catastrofe, extremism, costuri mai mari ale vieții și sărăcie. Oamenii care lucrează în industria noastră au fost relativ norocoși, unii dintre noi revigorați de tornada incitantă GenerativeAI. Așa cum HFT a transformat vocabularul piețelor de capital în anii 2000, iar digitalizarea a transformat vocabularul bancar și al serviciilor financiare în anii 2010, GenAI ne-a adus un nou lexicon AI, cu o oarecare viteză.

Cu ea, am întâlnit mulți termeni, mulți abia utilizați în 2022, dar care au acum semnificații noi sau foarte diferite. Eu și mulți alții din Serviciile financiare, le folosim zilnic în fiecare zi. Dacă ești unul dintre puținii (ne)norocoși care nu o fac, iată o reîmprospătare rapidă a celor trei preferate ale mele!

Termenul 1: Baza de date Vector

Așa-numita bază de date vectorială a devenit nucleul multor stive GenAI de întreprindere, ca mijloc de îmbunătățire a calității răspunsurilor la solicitări. Alternativele, de exemplu, „ajustarea fină” modelelor de limbaj mari [LLM] fără o bază de date însoțitoare, sunt costisitoare și pline de riscuri și costuri generale de conformitate. O bază de date vectorială captează informații proprietare ale întreprinderii, aduce rentabilitate și oferă control comparativ. Firmele de servicii financiare sunt cu siguranță la coadă pentru a utiliza baze de date vectoriale.

În mod ironic, în domeniul financiar, vectorii au fost de ani de zile parte integrantă a algebrei matriceale predominante în tranzacționare și managementul riscurilor. Stocarea de date a unor astfel de „vectori” și matrice există, de asemenea, de zeci de ani, de obicei în baze de date coloane sau ca tabele sau cadre de date utilizate în limbaje precum Python (Pandas), R, MATLAB și SAS. Atunci când sunt preluate și utilizate, de exemplu, ca serii de timp financiare și date de panou, împreună cu tehnici precum regresiile liniare și seriale de timp, ele conduc analitica predictivă, detectarea anomaliilor și econometria. De asemenea, ajută la informarea backtesting-ului, în special a tranzacționării, managementului portofoliului și strategiilor de risc. În timp ce piețele de capital – front și middle office – au condus taxa de algebră matriceală, cazuri de utilizare din ce în ce mai centrate pe analiză, cum ar fi marketingul, detectarea fraudelor și digitalizarea, au luat în general știința datelor – și vectori – în cadrul organizațiilor financiare.

I was fascinated, therefore, when a former colleague went to work for a “vector database” start-up in June 2021. His article on

Rezolvarea problemelor complexe cu baze de date vectoriale
de la pre-ChatGPT martie 2022  mi-a atras atenția pentru că a evidențiat tipuri de vectori foarte specifice – înglobări de vectori – au codificat vectori navigabili ușor de căutat, care captează cunoștințe din informații nestructurate, cum ar fi cuvinte, imagini etc. Când ChatGPT a fost lansat mai târziu în acel an, magazinele de vectori de astfel de Tipurile de încorporare au fost ridicate la a fi vehicule cheie ale gestionării semnificației semantice. Cel mai frecvent, magazinele sunt baze de date vectoriale, dintre care

acum sunt multe
. Deja, ele alimentează serviciile financiare și aplicațiile pentru piețele de capital, cel mai frecvent

cazuri de utilizare a procesării limbajului natural
, de exemplu, rezumarea documentelor juridice și a rapoartelor financiare sau captarea sentimentelor din rețelele sociale și fluxurile de știri. Cu toate acestea, ei abordează și mai mult

aplicațiile implicate
, sporind informațiile despre tranzacționare și managementul riscurilor, de exemplu, adesea alături de statisticile tradiționale și de învățare automată.

Incidentally, the company my former colleague went to join became a GenAI unicorn, valued at a healthy $750m. Nice work if you can get it!

Termenul 2: RAG, alias Recuperare Augmented Generation

RAG abia era un cuvânt pe buzele cuiva în primăvara anului 2023, cel puțin în sensul RAG cu majuscule „Retrieval Augmented Generation” al termenului. Statisticile de căutare Google pentru termeni s-au accelerat din aproximativ iulie 2023, iar până în toamnă/toamnă, RAG era peste tot, abordarea predominantă prin care bazele de date vectoriale ajută la îmblânzirea modelului de limbaj mare „papagalii stocastici”. Pe de o parte, RAG încapsulează conducte pentru a furniza fluxuri de lucru de date ale întreprinderii și, pe de altă parte, ajută în mod pragmatic firmele financiare să reducă halucinațiile și să se adapteze la procesele interne – și externe – de gestionare a riscurilor și de conformitate cu inteligența artificială.  

Sunt
multe tipuri de RAG
conducte și pot părea intimidant de complexe. Cu toate acestea, gândiți-vă la RAG pur și simplu ca oferind o conductă de date între solicitări, datele companiei dvs. și modele mari de limbă. Pentru a afla mai multe și pentru a vedea cum afectează finanțele, citiți-mi

blogul finextra
sau ceas
acest webcast grozav
rezumând oportunitățile de management al riscului ale RAG. Dacă începeți să le implementați în orice etapă, probabil că veți explora medii „prietenoase cu RAG”, precum LangChain și
LlamaIndex.

Termenul 3: Halucinații

Am folosit termenul „halucinații” în secțiunea mea anterioară, prezentând-o ca o problemă rezolvată de RAG și, la rândul său, de baze de date vectoriale. Cu GenAI, halucinațiile nu mai sunt pur și simplu declanșatoare ale creativității care stimulează mintea, cum ar fi Lonely Hearts Club Band de Sergeant Pepper, inspirată de droguri, de la Beatles sau Good Vibrations a Beachboys. Nici ele nu sunt rezerva visului şamanic practicat de multe popoare, de ex.
popoarele Chukchi din Siberia de Est, nici activitățile fizice care utilizează tehnici de modificare a minții, cum ar fi yoga, masajul și sexul tantric. Cuvântul „halucinație” se aplică acum și eșecurilor LLM-urilor de a naviga în informații la care modelele nu au acces sau la care nu folosesc informațiile existente. A devenit foarte evident foarte repede că

ChatGPT, Bard și sisteme similare au fost predispuse la răspunsuri „halucinatorii” fabricate
, iar acestea au adus riscuri atunci când au urmat acțiuni neinformate. 

Iată răsucirea. Investitorul în inteligența artificială Marc Andreessen sugerează că, deși majoritatea văd halucinațiile ca bunuri, ele pot fi utile ca funcții atunci când IA este folosită ca un cocreator, un sugerător și un ghicitor. Ca ajutor pentru brainstorming, presupunerile lor inventate pot alimenta creativitatea umană. Andreessen, de exemplu, subliniază modul în care avocații folosesc sugestiile „inventate” ale AI în timpul pregătirii cazului pentru a-și imagina strategii juridice noi. În serviciile financiare, comercianții de pe Wall Street folosesc deja baze de date generative de inteligență artificială și vector pentru a găsi oportunități de tranzacționare - pentru a merge în zig când masele fac zag.

Orice ați crede despre GenAI, cu siguranță ne-a adus un lexic nou încântător!

Timestamp-ul:

Mai mult de la Fintextra