Три термина GenAI, которые финансовые практики выучили в 2023 году

Три термина GenAI, которые финансовые практики выучили в 2023 году

Три термина GenAI, которые финансовые практики изучили в 2023 году PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

2023 год был трудным для многих на нашей планете – войны, насилие, перемещение населения, катастрофы, экстремизм, рост стоимости жизни и бедность. Людям, работающим в нашей отрасли, сравнительно повезло, некоторых из нас воодушевил захватывающий торнадо GenerativeAI. Точно так же, как HFT изменил словарь рынков капитала в 2000-х годах, а цифровизация изменил словарь банковских и финансовых услуг в 2010-х годах, GenAI принес нам новый словарь ИИ, причем довольно быстро.

При этом мы столкнулись со многими терминами, многие из которых почти не использовались в 2022 году, но теперь имеют новые или совсем другие значения. Я и многие другие специалисты в сфере финансовых услуг пользуемся ими каждый день. Если вы один из немногих (не)счастливчиков, которые этого не делают, вот краткий обзор моих любимых трех!

Термин 1: База данных векторов

Так называемая база данных векторов стала основой многих корпоративных стеков GenAI как средство повышения качества ответов на запросы. Альтернативы, например, «точная настройка» больших языковых моделей [LLM] без сопутствующей базы данных, являются дорогостоящими и сопряжены с риском и накладными расходами на соблюдение требований. База данных векторов собирает конфиденциальную корпоративную информацию, повышает экономическую эффективность и обеспечивает сравнительный контроль. Фирмы финансовых услуг, безусловно, стоят в очереди на использование векторных баз данных.

По иронии судьбы, в финансах векторы на протяжении многих лет были неотъемлемой частью матричной алгебры, преобладающей в трейдинге и управлении рисками. Хранение данных таких «векторов» и матриц также существует уже несколько десятилетий, обычно в столбчатых базах данных или в виде таблиц или фреймов данных, используемых в таких языках, как Python (Pandas), R, MATLAB и SAS. При извлечении и использовании, например, в виде финансовых временных рядов и панельных данных, в сочетании с такими методами, как линейная регрессия и регрессия временных рядов, они способствуют прогнозному анализу, обнаружению аномалий и эконометрике. Они также помогают проводить тестирование на исторических данных, особенно в области торговли, управления портфелем и стратегий управления рисками. В то время как рынки капитала – фронтальный и мидл-офис – возглавляли задачу матричной алгебры, все более аналитически ориентированные сценарии использования, такие как маркетинг, обнаружение мошенничества и цифровизация, обычно охватывали науку о данных – и векторы – во всех финансовых организациях.

Поэтому я был очарован, когда в июне 2021 года мой бывший коллега приступил к работе в стартапе по созданию «векторной базы данных». Его статья о

Решение сложных задач с векторными базами данных
из pre-ChatGPT, март 2022 года, привлек мое внимание, потому что он выделил очень специфические типы векторов — векторные встраивания — закодированные легко находимые для навигации векторы, собирающие знания из неструктурированной информации, такой как слова, изображения и т. д. Когда позже в том же году был запущен ChatGPT, векторные хранилища таких типы встраивания были повышены до уровня ключевых средств управления семантическим значением. Чаще всего хранилища представляют собой векторные базы данных, из которых

сейчас их много
. Они уже используются в приложениях финансовых услуг и рынков капитала, чаще всего

варианты использования обработки естественного языка
, например, обобщение юридических документов и финансовых отчетов или сбор настроений из социальных сетей и новостных лент. Однако они также решают более

задействованные приложения
, расширяя, например, понимание торговли и управления рисками, часто наряду с традиционной статистикой и машинным обучением.

Между прочим, компания, в которую пришел мой бывший коллега, стала «единорогом GenAI» стоимостью 750 миллионов долларов. Хорошая работа, если вы можете ее получить!

Термин 2: ТРЯПКА, Ака Извлечение дополненной генерации

Весной 2023 года RAG почти не звучало ни у кого на устах, по крайней мере, в смысле этого термина, написанном RAG с заглавной буквы «Поиск дополненной генерации». Статистика поиска в Google по терминам ускорилась примерно с июля 2023 года, и к осени/осени RAG был повсюду, преобладающий подход к конвейеру, с помощью которого векторные базы данных помогают приручить «стохастических попугаев» Большой языковой модели. С одной стороны, RAG инкапсулирует конвейеры для обеспечения рабочих процессов с корпоративными данными, а с другой — прагматично помогает финансовым фирмам уменьшить галлюцинации и адаптировать внутренние и внешние процессы управления рисками и соответствия требованиям ИИ.  

Существуют
многие виды тряпок
трубопроводы, и они могут оказаться пугающе сложными. Однако думайте о RAG просто как о конвейере данных между подсказками, корпоративными данными и большими языковыми моделями. Чтобы узнать больше и увидеть, как это влияет на финансы, прочитайте мой

прекрасный блог
или смотреть
эта замечательная веб-трансляция
обобщение возможностей РАГ по управлению рисками. Если вы начнете внедрять их на любом этапе, вы, скорее всего, изучите «RAG-дружественные» среды, такие как LangChain и
ЛамаИндекс.

Термин 3: Галлюцинации

В предыдущем разделе я использовал термин «галлюцинации», представляя его как проблему, решаемую RAG и, в свою очередь, векторными базами данных. Благодаря GenAI галлюцинации больше не являются просто триггерами стимулирующего разум творчества, как, например, вдохновленная наркотиками группа «Sergeant Pepper's Lonely Hearts Club Band» группы «Битлз» или «Good Vibrations» группы Beachboys. Они также не являются заповедником шаманских сновидений, практикуемых многими народами, напр.
восточносибирские чукчи, а также физические занятия, в которых используются методы изменения сознания, такие как йога, массаж и тантрический секс. Слово «галлюцинация» теперь также применяется к неспособности LLM ориентироваться в информации, к которой модели не имеют доступа, или неправильно использовать существующую информацию. Очень быстро стало очевидно, что

ChatGPT, Bard и подобные системы были склонны к искусственным «галлюцинаторным» реакциям.
, и это влекло за собой риск, когда последовали неосведомленные действия. 

Вот в чем поворот. Инвестор в области ИИ Марк Андриссен предполагает, что, хотя большинство считают галлюцинации жуками, они могут быть полезны в качестве функций, когда ИИ используется в качестве сотворец, предлагающий и догадывающийся. Их выдуманные предположения в качестве помощи в мозговом штурме могут стимулировать человеческое творчество. Андриссен, например, показывает, как юристы используют «придуманные» предложения ИИ во время подготовки дела, чтобы придумать новые правовые стратегии. В сфере финансовых услуг трейдеры на Уолл-стрит уже используют генеративный искусственный интеллект и векторные базы данных для поиска торговых возможностей — чтобы двигаться по зигзагу, когда массы идут по зигзагу.

Что бы вы ни думали о GenAI, он определенно принес нам новый восхитительный лексикон!

Отметка времени:

Больше от Финтекстра