Ba thuật ngữ GenAI mà các nhà thực hành tài chính đã học vào năm 2023

Ba thuật ngữ GenAI mà các nhà thực hành tài chính đã học vào năm 2023

Ba thuật ngữ GenAI mà các nhà thực hành tài chính đã học vào năm 2023 Trí tuệ dữ liệu PlatoBlockchain. Tìm kiếm dọc. Ái.

Năm 2023 là một năm rắc rối đối với nhiều người trên hành tinh của chúng ta – chiến tranh, bạo lực, di dời dân số, thảm họa, chủ nghĩa cực đoan, chi phí sinh hoạt cao hơn và nghèo đói. Những người làm việc trong ngành của chúng tôi tương đối may mắn, một số người trong chúng tôi đã được tiếp thêm sinh lực nhờ cơn lốc xoáy GenerativeAI thú vị. Giống như HFT đã biến đổi vốn từ vựng của thị trường vốn vào những năm 2000 và quá trình số hóa đã biến đổi từ vựng về dịch vụ tài chính ngân hàng trong những năm 2010, GenAI cũng đã mang đến cho chúng ta một từ vựng AI mới với tốc độ khá nhanh.

Với nó, chúng tôi đã gặp nhiều thuật ngữ, nhiều thuật ngữ hầu như không được sử dụng vào năm 2022 nhưng hiện mang những ý nghĩa mới hoặc rất khác. Tôi và nhiều người khác trong lĩnh vực Dịch vụ Tài chính sử dụng chúng hàng ngày. Nếu bạn là một trong số ít (không) may mắn không làm được điều đó, thì đây là phần giới thiệu nhanh về ba câu chuyện yêu thích của tôi!

Học kỳ 1: Cơ sở dữ liệu Vector

Cái gọi là cơ sở dữ liệu vectơ đã trở thành cốt lõi của nhiều hệ thống GenAI doanh nghiệp, như một phương tiện để cải thiện chất lượng phản hồi cho các lời nhắc. Các lựa chọn thay thế, ví dụ: “tinh chỉnh” các mô hình ngôn ngữ lớn [LLM] không có cơ sở dữ liệu đi kèm, rất tốn kém và có nhiều rủi ro cũng như chi phí tuân thủ. Cơ sở dữ liệu vectơ nắm bắt thông tin độc quyền của doanh nghiệp, mang lại hiệu quả về mặt chi phí và mang lại khả năng kiểm soát so sánh. Các công ty dịch vụ tài chính chắc chắn đang xếp hàng sử dụng cơ sở dữ liệu vector.

Trớ trêu thay trong lĩnh vực tài chính, các vectơ trong nhiều năm đã được tích hợp vào đại số ma trận chiếm ưu thế trong giao dịch và quản lý rủi ro. Việc lưu trữ dữ liệu của các “vectơ” và ma trận như vậy cũng đã xuất hiện trong nhiều thập kỷ, thường là trong cơ sở dữ liệu cột hoặc dưới dạng bảng hoặc khung dữ liệu được sử dụng trong các ngôn ngữ như Python (Pandas), R, MATLAB và SAS. Khi được truy xuất và sử dụng, chẳng hạn như dữ liệu bảng và chuỗi thời gian tài chính, kết hợp với các kỹ thuật như hồi quy tuyến tính và chuỗi thời gian, chúng sẽ thúc đẩy phân tích dự đoán, phát hiện bất thường và kinh tế lượng. Chúng cũng giúp cung cấp thông tin cho việc kiểm tra ngược, đặc biệt là về giao dịch, quản lý danh mục đầu tư và chiến lược rủi ro. Trong khi thị trường vốn – văn phòng trung gian và trung gian – dẫn đầu về phí đại số ma trận, thì các trường hợp sử dụng ngày càng tập trung vào phân tích như tiếp thị, phát hiện gian lận và số hóa thường sử dụng khoa học dữ liệu – và vectơ – trong các tổ chức tài chính.

Do đó, tôi rất thích thú khi một đồng nghiệp cũ đến làm việc cho một công ty khởi nghiệp về “cơ sở dữ liệu vectơ” vào tháng 2021 năm XNUMX. Bài báo của anh ấy về

Giải quyết các vấn đề phức tạp với cơ sở dữ liệu vectơ
từ trước ChatGPT, tháng 2022 năm XNUMX đã thu hút sự chú ý của tôi vì anh ấy đã nêu bật các loại vectơ rất cụ thể – nhúng vectơ – các vectơ điều hướng được mã hóa dễ dàng tìm kiếm, nắm bắt kiến ​​thức từ thông tin phi cấu trúc như từ ngữ, hình ảnh, v.v. Khi ChatGPT ra mắt vào cuối năm đó, các cửa hàng vectơ như vậy các kiểu nhúng được nâng lên thành phương tiện chính để quản lý ý nghĩa ngữ nghĩa. Thông thường nhất, các cửa hàng là cơ sở dữ liệu vector, trong đó

bây giờ có rất nhiều
. Hiện tại, chúng đã cung cấp năng lượng cho các dịch vụ tài chính và ứng dụng thị trường vốn, phổ biến nhất là

trường hợp sử dụng xử lý ngôn ngữ tự nhiên
, ví dụ: tóm tắt các tài liệu pháp lý và báo cáo tài chính hoặc nắm bắt cảm xúc từ mạng xã hội và nguồn cấp tin tức. Tuy nhiên, họ cũng đang giải quyết nhiều hơn

các ứng dụng liên quan
, chẳng hạn như tăng cường hiểu biết sâu sắc về giao dịch và quản lý rủi ro, thường đi kèm với số liệu thống kê truyền thống và học máy.

Tình cờ thay, công ty mà đồng nghiệp cũ của tôi gia nhập đã trở thành kỳ lân GenAI, trị giá 750 triệu USD. Làm tốt lắm nếu bạn có thể có được nó!

Học kỳ 2: RAG, aka Truy xuất thế hệ tăng cường

RAG hầu như không xuất hiện trên môi bất kỳ ai vào mùa xuân năm 2023, ít nhất là theo nghĩa viết hoa của thuật ngữ “Thế hệ tăng cường truy xuất” RAG. Số liệu thống kê tìm kiếm của Google cho các cụm từ được tăng tốc từ khoảng tháng 2023 năm XNUMX và đến Mùa Thu/Mùa Thu, RAG có mặt ở khắp mọi nơi, phương pháp tiếp cận quy trình chiếm ưu thế mà qua đó cơ sở dữ liệu vectơ giúp chế ngự “những con vẹt ngẫu nhiên” trong Mô hình Ngôn ngữ Lớn. Một mặt, RAG đóng gói các đường dẫn để cung cấp quy trình làm việc dữ liệu doanh nghiệp, mặt khác giúp các công ty tài chính giảm ảo giác và điều chỉnh các quy trình tuân thủ AI và quản lý rủi ro bên trong và bên ngoài.  


nhiều loại RAG
đường ống và chúng có thể có vẻ phức tạp đến mức đáng sợ. Tuy nhiên, hãy nghĩ RAG đơn giản là cung cấp đường dẫn dữ liệu giữa các lời nhắc, dữ liệu doanh nghiệp của bạn và các mô hình ngôn ngữ lớn. Để tìm hiểu thêm và xem nó ảnh hưởng đến tài chính như thế nào, hãy đọc

blog bổ sung
hoặc xem
webcast tuyệt vời này
tóm tắt các cơ hội quản lý rủi ro của RAG. Nếu bạn bắt đầu triển khai chúng ở bất kỳ giai đoạn nào, bạn có thể sẽ khám phá các môi trường “thân thiện với RAG” như LangChain &
Chỉ số Llama.

Kỳ 3: Ảo giác

Tôi đã sử dụng thuật ngữ “ảo giác” trong phần trước của mình, coi đó là một vấn đề được giải quyết bằng RAG và sau đó là bằng cơ sở dữ liệu vectơ. Với GenAI, ảo giác không còn đơn giản là tác nhân kích thích khả năng sáng tạo, chẳng hạn như Ban nhạc Câu lạc bộ những trái tim cô đơn của Trung sĩ Pepper lấy cảm hứng từ ma túy của The Beatles hay Good Vibrations của Beachboys. Chúng cũng không phải là nơi bảo tồn giấc mơ pháp sư được nhiều người thực hiện, ví dụ như
người Chukchi miền đông Siberia, cũng như các hoạt động thể chất sử dụng các kỹ thuật thay đổi tâm trí, chẳng hạn như yoga, xoa bóp và quan hệ tình dục mật tông. Từ “ảo giác” hiện cũng áp dụng cho những lỗi của LLM trong việc điều hướng thông tin mà các mô hình không có quyền truy cập hoặc sử dụng sai thông tin hiện có. Nó trở nên rất rõ ràng rất nhanh chóng rằng

ChatGPT, Bard và các hệ thống tương tự có xu hướng tạo ra phản hồi “ảo giác”
, và những điều này mang lại rủi ro khi xảy ra những hành động thiếu hiểu biết. 

Đây là bước ngoặt. Nhà đầu tư AI Marc Andreessen gợi ý rằng mặc dù hầu hết mọi người coi ảo giác là lỗi nhưng chúng có thể hữu ích như một tính năng khi AI được sử dụng làm công cụ hỗ trợ. người đồng sáng tạo, người gợi ý và người đoán. Là một công cụ hỗ trợ động não, những phỏng đoán bịa đặt của họ có thể thúc đẩy khả năng sáng tạo của con người. Ví dụ, Andreessen nhấn mạnh cách các luật sư sử dụng các đề xuất “tự tạo” của AI trong quá trình chuẩn bị vụ việc để tưởng tượng ra các chiến lược pháp lý mới. Trong các dịch vụ Tài chính, các nhà giao dịch ở Phố Wall đã sử dụng cơ sở dữ liệu vectơ và AI tổng hợp để tìm cơ hội giao dịch - để di chuyển theo đường ngoằn ngoèo khi quần chúng đi ngoằn ngoèo.

Dù bạn nghĩ gì về GenAI, nó chắc chắn đã mang đến cho chúng ta một từ vựng mới thú vị!

Dấu thời gian:

Thêm từ tài chính