שלושה מונחי GenAI פיננסיים למדו בשנת 2023

שלושה מונחי GenAI פיננסיים למדו בשנת 2023

שלושה מונחי GenAI פיננסיים למדו ב-2023 PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

שנת 2023 הייתה שנה בעייתית עבור רבים על הפלנטה שלנו - מלחמות, אלימות, עקירת אוכלוסין, אסונות, קיצוניות, עלויות מחיה גבוהות יותר ועוני. אנשים שעבדו בתעשייה שלנו היו ברי מזל יחסית, חלקנו התחדשו מהטורנדו המרגש של GenerativeAI. בדיוק כפי ש-HFT שינתה את אוצר המילים של שוקי ההון בשנות ה-2000, והדיגיטליזציה שינתה את אוצר המילים של בנקאות ושירותים פיננסיים בשנות ה-2010, GenAI הביאה לנו לקסיקון בינה מלאכותית חדשה, גם במהירות מסוימת.

עם זה, נתקלנו במונחים רבים, רבים מהם בקושי השתמשו ב-2022, אך כעת נושאים משמעויות חדשות או שונות מאוד. אני ורבים אחרים בשירותים פיננסיים, משתמשים בהם תוך יום מדי יום. אם אתם מהבודדים (חסרי) המזל שלא, הנה רענון מהיר של השלושה האהובים עליי!

מונח 1: מסד הנתונים הוקטוריים

מה שנקרא מסד הנתונים הווקטורי הפך לליבה בערימות GenAI ארגוניות רבות, כאמצעי לשיפור איכות התגובות להנחיות. האלטרנטיבות, למשל, "כוונן עדין" של מודלים של שפות גדולות [LLM] ללא מסד נתונים נלווה, הן יקרות ועתירות סיכונים ותקורות תאימות. מסד נתונים וקטורי לוכד מידע ארגוני קנייני, מביא ליעילות עלות ונותן שליטה השוואתית. חברות שירותים פיננסיים בהחלט עומדות בתור לשימוש במאגרי מידע וקטורים.

באופן אירוני בתחום הפיננסים, וקטורים היו חלק בלתי נפרד מהאלגברה המטריצה ​​השולטת במסחר ובניהול סיכונים. אחסון נתונים של "וקטורים" ומטריצות כאלה קיים גם במשך עשרות שנים, בדרך כלל במסדי נתונים עמודים, או כטבלאות או מסגרות נתונים המשמשים בשפות כמו Python (Pandas), R, MATLAB ו-SAS. כשהם מאוחזרים ומשמשים אותם, למשל כסדרות זמן פיננסיות ונתוני פאנל, בשילוב עם טכניקות כמו רגרסיות ליניאריות וסדרות זמן, הם מניעים ניתוח חיזוי, זיהוי אנומליות ואקונומטריה. הם גם עוזרים ליידע בדיקות לאחור, בעיקר לגבי מסחר, ניהול תיקים ואסטרטגיות סיכונים. בעוד ששוקי ההון - המשרד הקדמי והאמצעי - הובילו את מטען האלגברה המטריצת, מקרי שימוש יותר ויותר ממוקדים באנליטיות כמו שיווק, גילוי הונאה ודיגיטליזציה בדרך כלל לקחו את מדע הנתונים - והווקטורים - על פני הארגונים הפיננסיים.

הייתי מוקסם, אם כן, כאשר עמית לשעבר הלך לעבוד בסטארט-אפ "מסד נתונים וקטור" ביוני 2021. המאמר שלו על

פתרון בעיות מורכבות עם מסדי נתונים וקטוריים
ממרץ טרום-ChatGPT מרץ 2022 משך את עיני כי הוא הדגיש סוגי וקטורים מאוד ספציפיים - הטמעות וקטוריות - וקטורים מקודדים הניתנים לניווט בקלות, הלוכדים ידע ממידע לא מובנה כגון מילים, תמונות וכו'. כאשר ChatGPT הושק מאוחר יותר באותה שנה, חנויות וקטורים של כאלה סוגי הטבעה הועלו להיות כלי מפתח לניהול משמעות סמנטית. לרוב, חנויות הן מסדי נתונים וקטוריים, מתוכם

יש עכשיו הרבה
. כבר עכשיו, הם מחזקים אפליקציות לשירותים פיננסיים ושוק ההון, לרוב

מקרי שימוש בעיבוד שפה טבעית
, למשל, סיכום מסמכים משפטיים ודוחות כספיים, או לכידת סנטימנטים ממדיה חברתית ומעדכוני חדשות. עם זאת, הם גם מתמודדים עם יותר

יישומים מעורבים
, הגדלת תובנות מסחר וניהול סיכונים למשל, לעתים קרובות לצד סטטיסטיקה מסורתית ולמידת מכונה.

אגב, החברה שעמיתי לשעבר הלך להצטרף אליה הפכה לחד קרן GenAI, בשווי של 750 מיליון דולר בריא. עבודה יפה אם אתה יכול להשיג את זה!

מונח 2: RAG, aka אחזור דור מוגבר

RAG בקושי הייתה מילה על השפתיים של אף אחד באביב 2023, לפחות במובן ה-RAG האותיות "אחזור מוגבר" של המונח. הנתונים הסטטיסטיים של החיפוש בגוגל עבור המונחים הואצו בערך מיולי 2023 ועד לסתיו/סתיו, RAG היה בכל מקום, גישת הצינור השלטת שבאמצעותה מסדי נתונים וקטוריים עוזרים לאלף "תוכים סטוכסטיים" של מודל השפה הגדול. מצד אחד, RAG מטמיעה צינורות לאספקת זרימות עבודה של נתונים ארגוניים, ומצד שני עוזרת באופן פרגמטי לחברות פיננסיות להפחית הזיות ולהתאים לתהליכי ניהול סיכונים פנימיים - וחיצוניים ותאימות בינה מלאכותית.  

יש
סוגים רבים של RAG
צינורות, והם יכולים להיראות מורכבים בצורה מאיימת. עם זאת, תחשוב על RAG פשוט כעל מתן צינור נתונים בין הנחיות, הנתונים הארגוניים שלך ומודלים של שפות גדולות. כדי ללמוד עוד ולראות כיצד זה משפיע על הכספים, קרא את שלי

בלוג finextra
או לצפות ב
שידור האינטרנט הנהדר הזה
סיכום הזדמנויות ניהול הסיכונים של RAG. אם תתחיל ליישם אותם בכל שלב, סביר להניח שתחקור סביבות "ידידותיות ל-RAG" כמו LangChain &
לאמה אינדקס.

שלב 3: הזיות

השתמשתי במונח "הזיות" בסעיף הקודם שלי, והצבתי אותו כבעיה שנפתרה על ידי RAG, ובתמורה, על ידי מסדי נתונים וקטוריים. עם GenAI, הזיות כבר לא רק טריגרים של יצירתיות מעוררת תודעה, כמו להקת מועדון ה-Lonely Hearts של Sergeant Pepper בהשראת הסמים של הביטלס, או Good Vibrations של הביצ'בויס. הם גם לא נחלתם של חלומות שמאניים המתורגלים על ידי עמים רבים, למשל
עמי צ'וקצ'י מזרח סיבירי, וגם לא פעילויות גופניות המשתמשות בטכניקות משנות נפש, כגון יוגה, עיסוי ומין טנטרי. המילה "הזיה" חלה כעת גם על הכשלים של LLMs בניווט מידע שאין למודלים גישה אליו, או שימוש לרעה במידע קיים. זה נהיה מאוד ברור מהר מאוד

ChatGPT, בארד ומערכות דומות היו מועדות לתגובות "הזויות" מיוצרות
, ואלה הביאו סיכון כאשר התפתחו פעולות לא מושכלות. 

הנה הטוויסט. משקיע בינה מלאכותית מארק אנדריסן מציע כי בעוד שרובם רואים בהזיות באגים, הן יכולות להיות מועילות כתכונות כאשר נעשה שימוש בבינה מלאכותית כ יוצר משותף, מציע ומנחש. כעזר לסיעור מוחות, הניחושים המומצאים שלהם יכולים לתדלק את היצירתיות האנושית. אנדריסן, למשל, מדגישה כיצד עורכי דין משתמשים בהצעות "המורכבות" של AI במהלך הכנת התיק כדי לדמיין אסטרטגיות משפטיות חדשות. בשירותים פיננסיים, סוחרים בוול סטריט כבר משתמשים ב-AI ומסדי נתונים וקטוריים כדי למצוא הזדמנויות מסחר - לזגוג כשההמונים מזדהים.

מה שלא תחשוב על GenAI, זה בהחלט הביא לנו לקסיקון חדש ומענג!

בול זמן:

עוד מ פינקסטרה