Trzech terminów GenAI, których nauczyli się praktycy finansowi w 2023 r

Trzech terminów GenAI, których nauczyli się praktycy finansowi w 2023 r

Trzy terminy GenAI, których praktycy finansowi nauczyli się w 2023 r. PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Rok 2023 był rokiem kłopotliwym dla wielu mieszkańców naszej planety – wojnami, przemocą, przesiedleniami ludności, katastrofami, ekstremizmem, wyższymi kosztami życia i ubóstwem. Ludzie pracujący w naszej branży mieli stosunkowo szczęście, a niektórych z nas ożywiło ekscytujące tornado GenerativeAI. Tak jak HFT zmieniło słownictwo dotyczące rynków kapitałowych w pierwszej dekadzie XXI wieku, a cyfryzacja przekształciła słownictwo związane z bankowością i usługami finansowymi w 2000 roku, GenAI dostarczyło nam nowy leksykon sztucznej inteligencji, również w dość szybkim tempie.

Dzięki niemu zetknęliśmy się z wieloma terminami, z których wiele było ledwo używanych w 2022 r., ale które obecnie mają nowe lub zupełnie inne znaczenia. Ja i wielu innych pracowników usług finansowych korzystamy z nich codziennie. Jeśli należysz do nielicznych (nie)szczęśliwców, którzy tego nie robią, oto szybkie przypomnienie moich trzech ulubionych!

Termin 1: Baza danych wektorów

Tak zwana baza danych wektorowych stała się podstawą wielu korporacyjnych stosów GenAI w celu poprawy jakości odpowiedzi na podpowiedzi. Alternatywy, np. „dostrajanie” dużych modeli językowych [LLM] bez towarzyszącej bazy danych, są drogie i obarczone dodatkowymi kosztami związanymi z ryzykiem i zgodnością. Wektorowa baza danych przechwytuje zastrzeżone informacje przedsiębiorstwa, zapewnia opłacalność i kontrolę porównawczą. Firmy świadczące usługi finansowe z pewnością stoją w kolejce do korzystania z wektorowych baz danych.

Jak na ironię, w finansach wektory od lat stanowią integralną część algebry macierzy dominującej w handlu i zarządzaniu ryzykiem. Przechowywanie danych takich „wektorów” i macierzy również istnieje od dziesięcioleci, zazwyczaj w kolumnowych bazach danych lub w postaci tabel lub ramek danych używanych w językach takich jak Python (Pandas), R, MATLAB i SAS. Pozyskane i wykorzystane, na przykład jako finansowe szeregi czasowe i dane panelowe, w połączeniu z technikami takimi jak regresje liniowe i szeregi czasowe, wspomagają analitykę predykcyjną, wykrywanie anomalii i ekonometrię. Pomagają także w przeprowadzaniu weryfikacji historycznej, w szczególności w zakresie handlu, zarządzania portfelem i strategii ryzyka. Podczas gdy rynki kapitałowe – centrala i biuro średnie – wiodły za algebrę macierzową, przypadki użycia w coraz większym stopniu analityczne, takie jak marketing, wykrywanie oszustw i cyfryzacja, generalnie dotyczyły nauki o danych – i wektorów – w organizacjach finansowych.

Dlatego byłem zafascynowany, gdy w czerwcu 2021 r. mój były kolega podjął pracę w start-upie zajmującym się „wektorową bazą danych”. Jego artykuł nt.

Rozwiązywanie złożonych problemów z wektorowymi bazami danych
z marca 2022 r. przed wprowadzeniem ChatGPT  przykuł moją uwagę, ponieważ podkreślił bardzo specyficzne typy wektorów – osadzania wektorów – zakodowane, łatwe do przeszukiwania wektory nawigacyjne, przechwytujące wiedzę z nieustrukturyzowanych informacji, takich jak słowa, obrazy itp. Kiedy ChatGPT został uruchomiony pod koniec tego roku, przechowuje wektory takich typy osadzania zostały wyniesione do rangi kluczowych narzędzi zarządzania znaczeniem semantycznym. Najczęściej sklepy są bazami wektorowymi, m.in

jest ich teraz wielu
. Już teraz obsługują najczęściej aplikacje związane z usługami finansowymi i rynkiem kapitałowym

przypadki użycia przetwarzania języka naturalnego
, np. podsumowując dokumenty prawne i raporty finansowe lub rejestrując nastroje z mediów społecznościowych i kanałów informacyjnych. Jednak zajmują się także czymś więcej

zaangażowanych aplikacji
, poszerzając na przykład wiedzę dotyczącą handlu i zarządzania ryzykiem, często obok tradycyjnych statystyk i uczenia maszynowego.

Nawiasem mówiąc, firma, do której dołączył mój były kolega, stała się jednorożcem GenAI, wycenianym na solidne 750 milionów dolarów. Dobra robota, jeśli możesz ją zdobyć!

Termin 2: RAG, znany jako Odzyskanie Augmented Generation

Wiosną 2023 r. nikt nie wypowiadał słowa o RAG na ustach, przynajmniej w znaczeniu tego słowa pisanym wielką literą przez RAG „Retrieval Augmented Generation”. Statystyki wyszukiwania terminów w Google przyspieszyły od około lipca 2023 r., a jesienią/jesienią RAG było już wszędzie, co stanowiło dominujące podejście potokowe, dzięki któremu wektorowe bazy danych pomagają oswoić „papugi stochastyczne” w dużym modelu językowym. Z jednej strony RAG hermetyzuje potoki zapewniające przepływ danych w przedsiębiorstwie, a z drugiej pragmatycznie pomaga firmom finansowym redukować halucynacje i dostosowywać wewnętrzne – i zewnętrzne – procesy zarządzania ryzykiem i zgodności z AI.  

Tam są
wiele rodzajów RAG
rurociągów i mogą wydawać się zastraszająco złożone. Jednak pomyśl o RAG po prostu jako o potoku danych pomiędzy monitami, danymi przedsiębiorstwa i dużymi modelami językowymi. Aby dowiedzieć się więcej i zobaczyć, jak wpływa to na finanse, przeczytaj mój

blogu Finextra
lub obejrzeć
tę wspaniałą transmisję internetową
podsumowując możliwości zarządzania ryzykiem przez RAG. Jeśli zaczniesz je wdrażać na dowolnym etapie, prawdopodobnie odkryjesz środowiska „przyjazne RAG”, takie jak LangChain i
Indeks Lamy.

Termin 3: Halucynacje

W poprzedniej części użyłem terminu „halucynacje”, traktując go jako problem rozwiązany przez RAG i, z kolei, wektorowe bazy danych. Dzięki GenAI halucynacje nie są już po prostu wyzwalaczami kreatywności stymulującej umysł, jak na przykład inspirowany narkotykami zespół The Beatles Sergeant Pepper’s Lonely Hearts Club Band czy Good Vibrations Beachboys. Nie są też domeną szamańskich snów praktykowanych przez wiele ludów, m.in.
ludy Czukczów ze wschodniej Syberiiani aktywności fizycznej wykorzystującej techniki zmieniające umysł, takie jak joga, masaż i seks tantryczny. Słowo „halucynacja” odnosi się teraz również do niepowodzeń LLM w zakresie poruszania się po informacjach, do których modelki nie mają dostępu, lub do niewłaściwego wykorzystywania istniejących informacji. Bardzo szybko stało się to oczywiste

ChatGPT, Bard i podobne systemy były podatne na sztuczne reakcje „halucynacyjne”.
, co wiązało się z ryzykiem, gdy doszło do niewłaściwie poinformowanych działań. 

Oto zwrot akcji. Inwestor AI, Marc Andreessen, sugeruje, że choć większość postrzega halucynacje jako błędy, mogą one być pomocne jako funkcje, gdy sztuczna inteligencja jest wykorzystywana jako współtwórca, osoba sugerująca i zgadująca. Ich zmyślone domysły mogą pobudzić ludzką kreatywność jako pomoc w burzy mózgów. Andreessen podkreśla na przykład, jak prawnicy wykorzystują „wymyślone” sugestie sztucznej inteligencji podczas przygotowywania sprawy, aby wyobrazić sobie nowatorskie strategie prawne. W usługach finansowych inwestorzy na Wall Street korzystają już z generatywnej sztucznej inteligencji i wektorowych baz danych, aby znaleźć możliwości handlowe – idą w górę, gdy poruszają się masy.

Cokolwiek myślisz o GenAI, z pewnością przyniosło nam to nowy, wspaniały leksykon!

Znak czasu:

Więcej z Fintextra