Tiga Istilah GenAI yang Dipelajari Praktisi Keuangan pada tahun 2023

Tiga Istilah GenAI yang Dipelajari Praktisi Keuangan pada tahun 2023

Tiga Istilah GenAI yang Dipelajari Praktisi Keuangan pada tahun 2023 PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Tahun 2023 adalah tahun yang penuh tantangan bagi banyak orang di planet kita – perang, kekerasan, perpindahan penduduk, bencana alam, ekstremisme, biaya hidup yang lebih tinggi, dan kemiskinan. Orang-orang yang bekerja di industri kami relatif beruntung, beberapa dari kami disemangati oleh tornado GenerativeAI yang menarik. Sama seperti HFT yang mentransformasi kosakata pasar modal pada tahun 2000an, dan digitalisasi mentransformasi kosakata perbankan dan jasa keuangan pada tahun 2010an, GenAI telah menghadirkan leksikon AI baru, dengan kecepatan yang cukup tinggi.

Bersamaan dengan itu, kami menemukan banyak istilah, banyak di antaranya yang jarang digunakan pada tahun 2022 tetapi kini memiliki arti baru atau sangat berbeda. Saya dan banyak orang lain di Jasa Keuangan, menggunakannya setiap hari setiap hari. Jika Anda salah satu dari sedikit (yang) beruntung yang tidak beruntung, inilah penyegaran singkat dari tiga favorit saya!

Istilah 1: Basis Data Vektor

Apa yang disebut database vektor telah menjadi inti bagi banyak tumpukan GenAI perusahaan, sebagai sarana untuk meningkatkan kualitas respons terhadap perintah. Alternatifnya, misalnya, “menyempurnakan” model bahasa besar [LLM] tanpa database yang menyertainya, memakan biaya yang mahal, dan penuh dengan risiko dan biaya tambahan kepatuhan. Basis data vektor menangkap informasi milik perusahaan, memberikan efektivitas biaya, dan memberikan kontrol komparatif. Perusahaan jasa keuangan tentu saja sedang antri untuk menggunakan database vektor.

Ironisnya di bidang keuangan, vektor selama bertahun-tahun telah menjadi bagian integral dari aljabar matriks yang dominan dalam perdagangan dan manajemen risiko. Penyimpanan data “vektor” dan matriks juga telah ada selama beberapa dekade, biasanya dalam database kolom, atau sebagai tabel atau kerangka data yang digunakan dalam bahasa seperti Python (Pandas), R, MATLAB, dan SAS. Ketika diambil dan digunakan, misalnya sebagai data deret waktu keuangan dan data panel, bersama dengan teknik seperti regresi linier dan deret waktu, keduanya akan mendorong analitik prediktif, deteksi anomali, dan ekonometrik. Mereka juga membantu menginformasikan backtesting, terutama mengenai perdagangan, manajemen portofolio, dan strategi risiko. Meskipun pasar modal – kantor depan dan tengah – memimpin dalam hal aljabar matriks, kasus-kasus penggunaan yang semakin bersifat analitik seperti pemasaran, deteksi penipuan, dan digitalisasi umumnya melibatkan ilmu data – dan vektor – di seluruh organisasi keuangan.

Oleh karena itu, saya terpesona ketika seorang mantan kolega bekerja di perusahaan rintisan “database vektor” pada bulan Juni 2021. Artikelnya tentang

Memecahkan Masalah Kompleks dengan Database Vektor
dari pra-ChatGPT Maret 2022  menarik perhatian saya karena dia menyoroti jenis vektor yang sangat spesifik – penyematan vektor – vektor berkode yang dapat dinavigasi dengan mudah dan menangkap pengetahuan dari informasi tidak terstruktur seperti kata, gambar, dll. Saat ChatGPT diluncurkan pada akhir tahun itu, penyimpanan vektor semacam itu tipe penyematan diangkat menjadi sarana utama untuk mengelola makna semantik. Paling umum, penyimpanan adalah database vektor, di antaranya

sekarang ada banyak
. Mereka sudah mendukung aplikasi layanan keuangan dan pasar modal, yang paling umum

kasus penggunaan pemrosesan bahasa alami
, misalnya, merangkum dokumen hukum dan laporan keuangan, atau menangkap sentimen dari media sosial dan berita. Namun, mereka juga melakukan lebih banyak penanganan

aplikasi yang terlibat
, misalnya, menambah wawasan perdagangan dan manajemen risiko, sering kali bersamaan dengan statistik tradisional dan pembelajaran mesin.

Kebetulan, perusahaan tempat mantan rekan saya bergabung menjadi unicorn GenAI, bernilai $750 juta. Kerja bagus jika Anda bisa mendapatkannya!

Istilah 2: RAG, alias Pengambilan Augmented Generation

RAG hampir tidak menjadi kata-kata yang terucap di bibir siapa pun pada Musim Semi 2023, setidaknya dalam arti istilah RAG “Retrieval Augmented Generation” yang menggunakan huruf kapital. Statistik penelusuran Google untuk istilah tersebut dipercepat mulai sekitar Juli 2023 dan pada Musim Gugur/Musim Gugur, RAG ada di mana-mana, pendekatan saluran utama yang digunakan database vektor untuk membantu menjinakkan Model Bahasa Besar “stochastic parrots”. Di satu sisi, RAG merangkum saluran untuk menyediakan alur kerja data perusahaan dan di sisi lain secara pragmatis membantu perusahaan keuangan mengurangi halusinasi dan mengakomodasi manajemen risiko internal – dan eksternal – serta proses kepatuhan AI.  

Ada
banyak jenis RAG
saluran pipa, dan hal ini bisa tampak sangat rumit. Namun, bayangkan RAG hanya sebagai penyedia saluran data antara perintah, data perusahaan Anda, dan model bahasa besar. Untuk mempelajari lebih lanjut, dan melihat pengaruhnya terhadap keuangan, baca artikel saya

blog ekstra baik
atau menonton
webcast yang hebat ini
merangkum peluang manajemen risiko RAG. Jika Anda mulai menerapkannya pada tahap mana pun, kemungkinan besar Anda akan menjelajahi lingkungan “ramah RAG” seperti LangChain &
Indeks Llama.

Istilah 3: Halusinasi

Saya menggunakan istilah "halusinasi" di bagian saya sebelumnya, menyatakannya sebagai masalah yang diselesaikan oleh RAG, dan, pada gilirannya, oleh database vektor. Dengan GenAI, halusinasi tidak lagi sekadar memicu kreativitas yang merangsang pikiran, seperti Lonely Hearts Club Band karya Sersan Pepper yang diilhami oleh narkoba, atau Good Vibrations dari Beachboys. Ini juga bukan merupakan pelestarian mimpi perdukunan yang dipraktikkan oleh banyak orang, misalnya.
suku Chukchi di Siberia bagian timur, maupun aktivitas fisik yang menggunakan teknik mengubah pikiran, seperti yoga, pijat, dan seks tantra. Kata “halusinasi” sekarang juga berlaku untuk kegagalan LLM dalam menavigasi informasi yang tidak dapat diakses oleh model, atau menyalahgunakan informasi yang ada. Hal itu menjadi sangat jelas dengan sangat cepat

ChatGPT, Bard, dan sistem serupa rentan terhadap respons “halusinasi” yang dibuat-buat
, dan hal ini membawa risiko ketika terjadi tindakan yang kurang informasi. 

Inilah twistnya. Investor AI Marc Andreessen berpendapat bahwa meskipun sebagian besar orang menganggap halusinasi sebagai bug, halusinasi dapat berguna sebagai fitur saat AI digunakan sebagai cocreator, pemberi saran, dan penebak. Sebagai alat bantu brainstorming, tebakan mereka yang dibuat-buat dapat memicu kreativitas manusia. Andreessen misalnya menyoroti bagaimana pengacara menggunakan saran AI yang “dibuat-buat” selama persiapan kasus untuk membayangkan strategi hukum baru. Di sektor jasa keuangan, para pedagang di Wall Street sudah menggunakan AI generatif dan basis data vektor untuk menemukan peluang perdagangan — untuk melakukan zig ketika massa bergerak zag.

Apa pun pendapat Anda tentang GenAI, GenAI tentu saja memberi kita leksikon baru yang menyenangkan!

Stempel Waktu:

Lebih dari Fintextra