בשנים האחרונות חל שינוי פרדיגמה אדיר באופן שבו מנהלי נכסים מוסדיים מוצאים ומשלבים מקורות נתונים מרובים בתהליך ההשקעה שלהם. עם שינויים תכופים במתאמי סיכון, מקורות בלתי צפויים לתנודתיות ותחרות גוברת מאסטרטגיות פסיביות, מנהלי נכסים מעסיקים מערך רחב יותר של מקורות נתונים של צד שלישי כדי להשיג יתרון תחרותי ולשפר תשואות מותאמות לסיכון. עם זאת, תהליך הפקת היתרונות ממקורות נתונים מרובים יכול להיות מאתגר ביותר. צוותי הנדסת הנתונים של מנהלי נכסים עמוסים ברכישת נתונים ועיבוד מקדים, בעוד שצוותי מדעי הנתונים כורים נתונים לתובנות השקעה.
נתונים של צד שלישי או חלופיים מתייחסים לנתונים המשמשים בתהליך ההשקעה, שמקורם מחוץ לספקי נתוני השוק המסורתיים. משקיעים מוסדיים מגדילים לעתים קרובות את מקורות הנתונים המסורתיים שלהם בנתונים של צד שלישי או חלופיים כדי להשיג יתרון בתהליך ההשקעה שלהם. הדוגמאות המצוטטות בדרך כלל כוללות, בין היתר, הדמיית לוויין, נתוני כרטיסי אשראי וסנטימנט מדיה חברתית. מנהלי קרנות משקיעים כמעט 3 מיליארד דולר בשנה במערכים חיצוניים, כאשר ההוצאה השנתית גדלה ב-20-30 אחוזים.
עם הגידול האקספוננציאלי של מערכי נתונים זמינים של צד שלישי ואלטרנטיביים, היכולת לנתח במהירות אם מערך נתונים חדש מוסיף תובנות השקעה חדשות מהווה גורם מבדל תחרותי בתעשיית ניהול ההשקעות. נתונים ושירותי בינה מלאכותית של AWS ללא קוד קוד נמוך (LCNC) מאפשרים לצוותים לא טכניים לבצע את בדיקת הנתונים הראשונית, לתעדף את כניסת הנתונים, להאיץ את הזמן עד לתובנות ולפנות משאבים טכניים יקרי ערך - מה שיוצר יתרון תחרותי מתמשך.
בפוסט זה בבלוג, אנו דנים כיצד, כמנהל נכסים מוסדיים, אתה יכול למנף את נתוני AWS LCNC ושירותי AI כדי להגדיל את תהליך ניתוח הנתונים הראשוני ותעדוף מעבר לצוותים טכניים ולהאיץ את קבלת ההחלטות שלך. עם שירותי AWS LCNC, אתה יכול להירשם במהירות ולהעריך מערכי נתונים מגוונים של צד שלישי, לעבד נתונים מראש ולבדוק את כוח הניבוי שלהם באמצעות מודלים של למידת מכונה (ML) מבלי לכתוב פיסת קוד אחת.
סקירת פתרונות
מקרה השימוש שלנו הוא לנתח את כוח הניבוי של מחיר המניה של מערך נתונים חיצוני ולזהות את חשיבות התכונה שלו - אילו תחומים משפיעים ביותר על ביצועי מחיר המניה. זה משמש כמבחן מעבר ראשון כדי לזהות אילו מהשדות המרובים במערך נתונים צריכים להיות מוערכים יותר באמצעות מתודולוגיות כמותיות מסורתיות כדי להתאים לתהליך ההשקעה שלך. סוג זה של בדיקת מעבר ראשון יכול להיעשות במהירות על ידי אנליסטים, חוסך זמן ומאפשר לך לתעדף מהר יותר את כניסת הנתונים למערכת. כמו כן, בזמן שאנו משתמשים במחיר המניה כדוגמה ליעד שלנו, ניתן להשתמש גם במדדים אחרים כגון רווחיות, יחסי הערכה או מחזורי מסחר. כל מערכי הנתונים המשמשים למקרה שימוש זה מתפרסמים ב חילופי נתונים AWS.
התרשים הבא מסביר את הארכיטקטורה מקצה לקצה ואת שירותי ה-AWS LCNC המשמשים להנעת ההחלטות:
הפתרון שלנו מורכב מהשלבים והפתרונות הבאים:
- קליטת נתונים: AWS Data Exchange להרשמה למערכי הנתונים החלופיים שפורסמו והורדתם אליהם שירות אחסון פשוט של אמזון (אמזון S3) דלי.
- הנדסת נתונים: AWS דבק DataBrew להנדסת נתונים וטרנספורמציה של הנתונים המאוחסנים באמזון S3.
- למידת מכונה: אמזון SageMaker Canvas לבניית מודל חיזוי סדרות זמן לחיזוי וזיהוי השפעת הנתונים על התחזית.
- מודיעין עסקי: אמזון קוויקסייט או Amazon SageMaker Canvas כדי לסקור את חשיבות התכונה לתחזית לקבלת החלטות.
בליעת נתונים
חילופי נתונים AWS מאפשר למצוא, להירשם ולהשתמש בנתונים של צד שלישי בענן בקלות. אתה יכול לדפדף בקטלוג AWS Data Exchange ולמצוא מוצרי נתונים הרלוונטיים לעסק שלך הירשמו לנתונים מהספקים ללא כל עיבוד נוסף וללא צורך בתהליך ETL. שים לב שספקים רבים מציעים מנויים ראשוניים בחינם, המאפשרים לך לנתח את הנתונים שלהם מבלי שתצטרך לשאת תחילה בעלויות מראש.
למקרה שימוש זה, חפש והירשם למערכי הנתונים הבאים ב-AWS Data Exchange:
- 20 שנים של נתוני מניות סוף היום עבור 10 החברות המובילות בארה"ב לפי שווי שוק פורסם על ידי אלפא וונטאז'. מערך הנתונים החינמי הזה מכיל 20 שנים של נתונים היסטוריים עבור 10 המניות המובילות בארה"ב לפי שווי שוק נכון ל-5 בספטמבר 2020. מערך הנתונים מכיל את 10 הסמלים הבאים - AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (Class A); FB: Facebook, Inc.; GOOG: Alphabet Inc.; JNJ: ג'ונסון אנד ג'ונסון; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; ו-WMT: Walmart Inc.
- שדות נתונים מרכזיים כוללים
- פתיחה: מחיר פתיחה נסחר ליום
- גבוה: מחיר גבוה ליום המסחר
- נמוך: מחיר נמוך ליום המסחר
- סגירה: מחיר סגירה נסחר ליום
- נפח: נפח מסחר ביום
- סגירה מותאמת: מחיר הסגירה של היום מפוצל ומותאם דיבידנד
- יחס פיצול: יחס בין מספר מניות חדשות לישנות בתאריך התוקף
- דיבידנד: סכום תשלום דיבידנד במזומן
- S3 נתוני ריבית קצרה ומימון ניירות ערך פורסם על ידי שותפים S3. מערך נתונים זה מכיל את השדות הבאים:
שדה | תיאור |
תאריך עסקים | תאריך תוקף של התעריף |
מזהי אבטחה | מזהי אבטחה מכילים Sedol, ISIN, FIGI, Ticker, Bloomberg ID |
שם | שם אבטחה |
תעריף הצעה | עמלת מימון מורכבת בשוק המשולמת עבור פוזיציות שורט קיימות |
שיעור הצעת מחיר | עמלת הלוואות מרוכבת בשוק שהושגה עבור מניות קיימות בהשאלה על ידי מחזיקי לונג |
שיעור אחרון | עמלת הלוואות מורכבת בשוק שנצברו עבור מניות מצטברות שהולוו באותו תאריך (שער ספוט) |
צפוף | אינדיקטור המומנטום מודד שורט יומי וכיסוי אירועים ביחס לצוף בשוק |
ריבית קצרה | ריבית קצרה בזמן אמת מבוטאת במספר מניות |
ShortInterestNotional | ריבית קצרה * מחיר (דולר ארה"ב) |
ShortInterestPct | ריבית קצרה בזמן אמת מבוטאת כאחוז מההון העצמי |
S3Float | מספר המניות הסחירות כולל לונג סינטטי שנוצר על ידי מכירה בחסר |
S3SIPctFloat | תחזית ריבית קצרה בזמן אמת חלקי ה-S3 float |
אינדיקטיבי זמינות | S3 צפויה כמות זמינה להשאלה |
שימוש | ריבית קצרה בזמן אמת חלקי ההיצע הכולל להשאלה |
יום לכיסוי 10 יום | זהו מדד נזילות = ריבית קצרה / ADTV ממוצע של 10 ימים |
יום לכיסוי 30 יום | זהו מדד נזילות = ריבית קצרה / ADTV ממוצע של 30 ימים |
יום לכיסוי 90 יום | זהו מדד נזילות = ריבית קצרה / ADTV ממוצע של 90 ימים |
SI מקורי | עניין קצר בנקודת זמן |
כדי לקבל את הנתונים, תחילה תחפש את מערך הנתונים ב-AWS Data Exchange ולהירשם למערך הנתונים:
לאחר שהמפרסם של מערכי הנתונים יאשר את בקשות ההרשמה שלך, יהיו לך מערכי הנתונים הזמינים להורדה לדלי S3 שלך:
בחר הוסף יעד עבודה לייצוא אוטומטי, ספק את הפרטים של דלי S3, והורד את מערך הנתונים:
חזור על השלבים כדי לקבל את מערך הנתונים של Alpha Vantage. לאחר השלמתו, יהיו לך שני מערכי הנתונים בדלי S3 שלך.
הנדסת נתונים
ברגע שמערך הנתונים נמצא בדלי S3 שלך, אתה יכול להשתמש AWS דבק DataBrew כדי להפוך את הנתונים. AWS Glue DataBrew מציעה למעלה מ-350 טרנספורמציות מובנות מראש כדי להפוך משימות הכנת נתונים לאוטומטיות (כגון סינון חריגות, סטנדרטיזציה של פורמטים ותיקון ערכים לא חוקיים) שאחרת ידרשו ימים או שבועות של כתיבת טרנספורמציות מקודדות ביד.
כדי ליצור מערך נתונים מאוחד עבור חיזוי ב-AWS DataBrew, בצע את השלבים הבאים. למידע מפורט, אנא עיין בזה בלוג.
- צור את מערכי הנתונים של DataBrew.
- טען מערכי נתונים של DataBrew לפרויקטים של DataBrew.
- בנה את מתכוני DataBrew.
- הפעל את משימות DataBrew.
צור מערכי נתונים של DataBrew: ב-AWS Glue DataBrew, א מערך נתונים מייצג נתונים שהועלו מדלי S3. ניצור שני מערכי נתונים של DataBrew - הן עבור מחיר המניה של סוף היום והן עבור ריבית שורט S3. כאשר אתה יוצר את מערך הנתונים שלך, אתה מזין את פרטי החיבור של S3 פעם אחת בלבד. מנקודה זו, DataBrew יכולה לגשת לנתונים הבסיסיים עבורך.
טען את מערכי הנתונים של DataBrew לפרויקטים של DataBrew: ב-AWS Glue DataBrew, א פּרוֹיֶקט הוא החלק המרכזי של מאמצי ניתוח הנתונים והטרנספורמציה שלך. פרויקט DataBrew מפגיש את מערכי הנתונים של DataBrew ומאפשר לך לפתח טרנספורמציה של נתונים (מתכון DataBrew). כאן שוב, ניצור שני פרויקטים של DataBrew, עבור מחיר המניה של סוף היום וריבית S3 בחסר.
בנה את מתכוני DataBrew: ב- DataBrew, א מתכון הוא קבוצה של שלבים לשינוי נתונים. אתה יכול להחיל את השלבים האלה על מערך הנתונים שלך. למקרה השימוש, נבנה שתי טרנספורמציות. הראשון ישנה את הפורמט של עמודת חותמת הזמן של מחיר המניה של סוף היום כך שניתן יהיה לצרף את מערך הנתונים לריבית השורט S3:
הטרנספורמציה השנייה אוצרת את הנתונים, והשלב האחרון שלה מבטיח שנחבר את מערכי הנתונים למערך נתונים אחד אוצר. לפרטים נוספים על בניית מתכונים לשינוי נתונים, עיין בזה בלוג.
משרות DataBrew: לאחר יצירת מתכוני DataBrew, אתה יכול להפעיל תחילה את עבודת DataBrew מחיר המניה בסוף היום ולאחריה את מתכון הריבית הקצרה של S3. עיין בזה בלוג כדי ליצור מערך נתונים מאוחד אחד. שמור את מערך הנתונים הסופי שנאסף בדלי S3.
זרימת העבודה של הנדסת נתונים מקצה לקצה תיראה כך:
למידת מכונה
עם מערך הנתונים האצור שנוצר לאחר הנדסת נתונים, אתה יכול להשתמש אמזון SageMaker Canvas לבנות את מודל החיזוי שלך ולנתח את ההשפעה של תכונות על התחזית. אמזון SageMaker Canvas מספק למשתמשים עסקיים ממשק חזותי של הצבע ולחיצה המאפשר להם לבנות מודלים ולייצר תחזיות ML מדויקות בעצמם - מבלי לדרוש ניסיון ב-ML או צורך לכתוב שורת קוד אחת.
כדי לבנות מודל חיזוי של סדרות זמן ב- Amazon SageMaker Canvas, בצע את השלבים הבאים. למידע מפורט, עיין בזה בלוג:
- בחר את מערך הנתונים האצור ב- SageMaker Canvas.
- בנה את מודל חיזוי סדרת הזמן.
- נתח את התוצאות וחשיבות התכונה.
בנה את מודל חיזוי סדרת הזמן: לאחר שבחרת את מערך הנתונים, בחר את עמודת היעד לניבוי. במקרה שלנו, זה יהיה המחיר הסגור של טיקר המניה. SageMaker Canvas מזהה אוטומטית שזוהי הצהרת בעיה של חיזוי סדרת זמן.
תצטרך להגדיר את המודל באופן הבא עבור חיזוי סדרות זמן. עבור מזהה פריט, בחר את שם המניה. זכור, במערך הנתונים שלנו יש מחירי טיקר מניות עבור 10 המניות המובילות. בחר את עמודת חותמת הזמן עבור חותמת הזמן, ולבסוף, הזן את מספר הימים שברצונך לחזות בעתיד [Forecast Horizon].
עכשיו אתה מוכן לבנות את המודל. SageMaker Canvas מספקת שתי אפשרויות לבניית הדגם: בנייה מהירה ובנייה רגילה. במקרה שלנו, נשתמש ב-"Standard Build".
בנייה רגילה לוקחת כשלוש שעות לבנות את הדגם והשימושים תחזית אמזון, שירות חיזוי סדרות זמן המבוסס על ML כמנוע החיזוי הבסיסי. Forecast יוצר תחזיות מדויקות ביותר באמצעות הרכבת מודלים של מודלים מסורתיים ולמידה עמוקה ללא צורך בניסיון ב-ML.
לאחר בניית המודל, כעת תוכל לסקור את ביצועי המודל (דיוק חיזוי) ואת חשיבות התכונה. כפי שניתן לראות מהאיור שלהלן, המודל מזהה Crowding ו-DaysToCover10Day כשני התכונות המובילות המניעות ערכי תחזית. זה עולה בקנה אחד עם האינטואיציה שלנו בשוק, שכן צפיפות היא אינדיקטור מומנטום שמודד שורט יומי ומכסה אירועים, וריבית קצרה לטווח קצר היא מדד נזילות, המציין כיצד המשקיעים ממוקמים במניה. גם מומנטום וגם נזילות יכולים להניע את תנודתיות המחירים.
תוצאה זו מצביעה על כך שלשתי התכונות (או השדות) הללו יש קשר הדוק עם תנועות מחירי המניות וניתן לתעדף גבוה יותר לכניסה למטוס ולניתוח נוסף.
מודיעין עסקי
בהקשר של חיזוי סדרות זמן, הרעיון של backtesting מתייחס לתהליך הערכת הדיוק של שיטת חיזוי תוך שימוש בנתונים היסטוריים קיימים. התהליך הוא בדרך כלל איטרטיבי וחוזר על פני מספר תאריכים הנמצאים בנתונים ההיסטוריים.
כפי שכבר דיברנו, SageMaker Canvas משתמש ב- Amazon Forecast כמנוע לחיזוי סדרות זמן. תחזית יוצרת מבחן אחורי כחלק מתהליך בניית המודל. כעת אתה יכול לראות את פרטי החזוי על ידי כניסה ל- Amazon Forecast. להבנה עמוקה יותר של הסבר מודל, עיין בזה בלוג.
Amazon Forecast מספקת פרטים נוספים על מדדי מנבא כמו שגיאת אחוז אבסולוטי משוקלל (WAPE), שגיאה ממוצעת מרובעת (RMSE), שגיאה ממוצעת של אחוז אבסולוטי (MAPE) ושגיאה ממוצעת בקנה מידה מוחלט (MASE). אתה יכול לייצא ציוני איכות מנבאים מ- Amazon Forecast.
Amazon Forecast מפעילה מבחן אחורי אחד עבור מערך הנתונים של סדרת הזמן שסופק. תוצאות הבדיקה האחורית זמינות להורדה באמצעות ה ייצא תוצאות בדיקת backtest לַחְצָן. תוצאות הבדיקה האחורית המיוצאות יורדות לדלי S3.
כעת נשרטט את תוצאות הבדיקה האחורית באמזון QuickSight. כדי להמחיש את תוצאות הבדיקה האחורית באמזון QuickSight, התחבר למערך הנתונים ב-Amazon S3 מ-QuickSight וצור הדמיה.
לנקות את
שירותי AWS הממונפים בפתרון זה מנוהלים וללא שרת באופיים. SageMaker Canvas נועד להריץ אימוני ML בריצה ארוכה ויהיה פועל תמיד. ודא שאתה מתנתק באופן מפורש מ- SageMaker Canvas. בבקשה התייחס ל המסמכים לקבלת פרטים נוספים.
סיכום
בפוסט זה בבלוג, דנו כיצד, כמנהל נכסים מוסדיים, אתה יכול למנף את נתוני AWS בקוד נמוך ללא קוד (LCNC) ושירותי AI כדי להאיץ את ההערכה של מערכי נתונים חיצוניים על ידי הורדת הסינון הראשוני של מערך הנתונים לצוותים שאינם טכניים. ניתן לבצע ניתוח מעבר ראשון זה במהירות כדי לעזור לך להחליט אילו מערכי נתונים יש לתת עדיפות לכניסה וניתוח נוסף.
הדגמנו שלב אחר שלב כיצד מנתח נתונים יכול לרכוש נתונים חדשים של צד שלישי באמצעות AWS Data Exchange , להשתמש בשירותי ETL ללא קוד של AWS Glue DataBrew ללא קוד כדי לעבד נתונים ולהעריך אילו תכונות במערך הנתונים המשפיעות ביותר על תחזית המודל .
ברגע שהנתונים מוכנים לניתוח, אנליסט משתמש ב- SageMaker Canvas כדי לבנות מודל חיזוי, להעריך את התאמתו ולזהות תכונות משמעותיות. בדוגמה שלנו, MAPE (.05) ו-WAPE (.045) של המודל ציינו התאמה טובה והראו "Crowding" ו-"DaysToCover10Day" כאותות במערך הנתונים עם ההשפעה הגדולה ביותר על התחזית. ניתוח זה כימת אילו נתונים הכי השפיעו על המודל ולכן ניתן יהיה לתעדף אותם לחקירה נוספת והכללה פוטנציאלית לאותות האלפא או בתהליך ניהול הסיכונים שלך. וחשוב לא פחות, ציוני ההסבר מצביעים על אילו נתונים ממלאים תפקיד מועט יחסית בקביעת התחזית ולכן יכולים להיות בעדיפות נמוכה יותר לחקירה נוספת.
כדי להעריך מהר יותר את היכולת של נתונים פיננסיים של צד שלישי לתמוך בתהליך ההשקעה שלך, עיין ב- מקורות נתונים של שירותים פיננסיים זמינים ב-AWS Data Exchange, ולתת DataBrew ו בד ניסיון היום.
על הכותבים
בוריס ליטווין הוא אדריכל פתרונות ראשי, אחראי על חדשנות בענף השירותים הפיננסיים. הוא מייסד קוונט ופינטק לשעבר, נלהב מהשקעות שיטתיות.
Meenakshisundaram Thandavarayan הוא מומחה בכיר בינה מלאכותית/ML עם AWS. הוא עוזר לחשבונות אסטרטגיים בהייטק במסע ה-AI וה-ML שלהם. הוא מאוד נלהב מבינה מלאכותית מונעת נתונים.
קמילו אנאניה הוא ארכיטקט פתרונות סטארט-אפ בכיר עם AWS שבסיסו בבריטניה. הוא טכנולוג נלהב שעוזר לסטארטאפים בכל גודל לבנות ולצמוח.
דן סינרייך הוא מנהל מוצר אב עם AWS, המתמקד בהעצמת חברות לקבל החלטות טובות יותר עם ML. בעבר הוא בנה פלטפורמות לניתוח תיקים ומודלי סיכון של קבוצות ריבוי נכסים עבור משקיעים מוסדיים גדולים.
- AI
- איי אמנות
- מחולל אמנות ai
- איי רובוט
- תחזית אמזון
- למידת מכונת אמזון
- אמזון קוויקסייט
- אמזון SageMaker Canvas
- בינה מלאכותית
- הסמכת בינה מלאכותית
- בינה מלאכותית בבנקאות
- רובוט בינה מלאכותית
- רובוטים של בינה מלאכותית
- תוכנת בינה מלאכותית
- AWS דבק DataBrew
- למידת מכונות AWS
- blockchain
- blockchain conference ai
- קוינגניוס
- בינה מלאכותית של שיחה
- קריפטו כנס ai
- פתרונות ללקוח
- של דאל
- למידה עמוקה
- שירותים פיננסיים
- גוגל איי
- בינוני (200)
- למידת מכונה
- אפלטון
- plato ai
- מודיעין אפלטון
- משחק אפלטון
- אפלטון נתונים
- פלטוגיימינג
- סולם ai
- תחביר
- זפירנט