Три терміни GenAI, які фінансові практики вивчили у 2023 році

Перевидано Платоном

читають: 0

Три терміни GenAI, які фінансові практики вивчили в 2023 PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

2023 рік був важким для багатьох людей на нашій планеті – війни, насильство, переміщення населення, катастрофи, екстремізм, подорожчання життя та бідність. Людям, які працюють у нашій галузі, порівняно пощастило, декому з нас підбадьорив захоплюючий торнадо GenerativeAI. Подібно до того, як HFT змінив лексику ринків капіталу в 2000-х роках, а цифровізація трансформувала лексику банківських і фінансових послуг у 2010-х роках, GenAI приніс нам новий лексикон штучного інтелекту, але також досить швидко.

З ним ми зіткнулися з багатьма термінами, багато з яких майже не використовувалися в 2022 році, але тепер мають нове або зовсім інше значення. Я та багато інших у сфері фінансових послуг користуюся ними щодня протягом дня. Якщо ви один із небагатьох (не)щасливих, хто цього не робить, ось коротко оновлюю мої улюблені три!

Термін 1: Векторна база даних

Так звана векторна база даних стала основою багатьох корпоративних стеків GenAI як засіб покращення якості відповідей на підказки. Альтернативи, наприклад, «точне налаштування» великих мовних моделей [LLM] без супровідної бази даних, є дорогими та пов’язані з ризиком і накладними витратами на відповідність. Векторна база даних фіксує власну корпоративну інформацію, забезпечує економічну ефективність і забезпечує порівняльний контроль. Фірми, що надають фінансові послуги, звичайно, стоять у черзі на використання векторних баз даних.

За іронією долі у фінансах, вектори протягом багатьох років були невід’ємною частиною матричної алгебри, що домінувала в торгівлі та управлінні ризиками. Зберігання даних у таких «векторах» і матрицях також існує протягом десятиліть, як правило, у стовпчастих базах даних або у вигляді таблиць чи фреймів даних, що використовуються в таких мовах, як Python (Pandas), R, MATLAB і SAS. Коли вони отримані та використовуються, наприклад, як фінансові часові ряди та панельні дані, у поєднанні з такими методами, як лінійна регресія та регресія часових рядів, вони керують прогнозною аналітикою, виявленням аномалій та економетрикою. Вони також допомагають проводити ретроспективне тестування, особливо щодо торгівлі, управління портфелем і стратегій ризику. У той час як ринки капіталу (фронт-офіс і мідл-офіс) очолювали матричну алгебру, все більш аналітичні випадки використання, такі як маркетинг, виявлення шахрайства та цифровізація, загалом використовували науку про дані та вектори – у фінансових організаціях.

Тому я був зачарований, коли в червні 2021 року колишній колега пішов працювати в стартап із створення «векторної бази даних». Його стаття про

Розв’язування складних задач із векторними базами даних з pre-ChatGPT березня 2022 року привернув мою увагу, тому що він виділив дуже конкретні типи векторів – векторні вбудовування – закодовані вектори з легкою навігацією, які дають змогу отримати знання з неструктурованої інформації, такої як слова, зображення тощо. Коли ChatGPT було запущено пізніше того ж року, векторні сховища таких типи вкладення були піднесені до ключових засобів управління семантичним значенням. Найчастіше сховища являють собою векторні бази даних, з яких

зараз їх багато. Вони вже використовують додатки для фінансових послуг і ринків капіталу, найчастіше

випадки використання обробки природної мови, наприклад, узагальнення юридичних документів і фінансових звітів або фіксація настроїв із соціальних мереж і стрічок новин. Однак вони також вирішують більше

залучених додатків, наприклад, доповнюючи інформацію про торгівлю та управління ризиками, часто разом із традиційною статистикою та машинним навчанням.

До речі, компанія, до якої пішов мій колишній колега, стала єдинорогом GenAI, оціненим у здорових 750 мільйонів доларів. Гарна робота, якщо ви можете її отримати!

Термін 2: RAG, інакше Доповнена генерація пошуку

Навесні 2023 року слово RAG майже не було в когось на вустах, принаймні в значенні цього терміна, написаного великими літерами RAG «Retrieval Augmented Generation». Приблизно з липня 2023 року статистика пошуку Google для термінів прискорилася, а до осені/осені всюди з’явився RAG — переважаючий конвеєрний підхід, за допомогою якого векторні бази даних допомагають приборкати «стохастичних папуг» великої мовної моделі. З одного боку, RAG інкапсулює конвеєри для забезпечення робочих процесів корпоративних даних, а з іншого – прагматично допомагає фінансовим компаніям зменшити галюцинації та адаптувати внутрішні – і зовнішні – процеси управління ризиками та відповідності ШІ.

Існує
багато видів RAG трубопроводів, і вони можуть здаватися надзвичайно складними. Однак думайте про RAG просто як про забезпечення конвеєра даних між підказками, вашими корпоративними даними та великими мовними моделями. Щоб дізнатися більше та побачити, як це впливає на фінанси, прочитайте мій

блог finextra або дивитися
ця чудова веб-трансляція узагальнення можливостей управління ризиками RAG. Якщо ви почнете впроваджувати їх на будь-якому етапі, ви, ймовірно, дослідите «RAG-дружні» середовища, такі як LangChain і
LlamaIndex.

Термін 3: Галюцинації

Я використав термін «галюцинації» у попередньому розділі, представивши його як проблему, яку вирішує RAG і, у свою чергу, векторні бази даних. Завдяки GenAI галюцинації більше не є просто тригерами для стимулювання розуму творчості, як, наприклад, натхненний наркотиками Sergeant Pepper’s Lonely Hearts Club Band Beatles або Beachboys Good Vibrations. Вони також не є заповідником шаманських сновидінь, практикуваних багатьма народами, напр.
східно-сибірські чукчі, а також фізичні навантаження, які використовують методи зміни свідомості, такі як йога, масаж і тантричний секс. Слово «галюцинація» тепер також застосовується до невдач LLM у навігації в інформації, до якої моделі не мають доступу, або неправомірному використанні існуючої інформації. Дуже швидко це стало очевидно

ChatGPT, Bard і подібні системи були схильні до вигаданих «галюцинаторних» реакцій, і вони становили ризик, коли виникали непродумані дії.

Ось поворот. Інвестор зі штучного інтелекту Марк Андріссен припускає, що хоча більшість сприймає галюцинації як помилки, вони можуть бути корисними як функції, коли ШІ використовується як співтворець, навіювач і вгадувач. Як допомога в мозковому штурмі, їхні вигадані припущення можуть стимулювати людську творчість. Андріссен, наприклад, підкреслює, як юристи використовують «вигадані» пропозиції ШІ під час підготовки справи, щоб уявити собі нові правові стратегії. У сфері фінансових послуг трейдери на Уолл-стріт уже використовують генеративний штучний інтелект і векторні бази даних, щоб знаходити можливості для торгівлі — бігти, коли маси йдуть.

Що б ви не думали про GenAI, він точно приніс нам чудовий новий лексикон!