در چند سال گذشته شاهد تغییر الگوی فوق العاده ای در نحوه منبع یابی و ادغام منابع داده های متعدد توسط مدیران دارایی در فرآیند سرمایه گذاری خود بوده ایم. با تغییرات مکرر در همبستگی ریسک، منابع غیرمنتظره نوسانات، و افزایش رقابت از راهبردهای غیرفعال، مدیران دارایی از مجموعه گسترده تری از منابع داده شخص ثالث برای به دست آوردن مزیت رقابتی و بهبود بازدهی تعدیل شده بر اساس ریسک استفاده می کنند. با این حال، فرآیند استخراج منافع از منابع داده های متعدد می تواند بسیار چالش برانگیز باشد. تیم های مهندسی داده مدیران دارایی مملو از جمع آوری و پیش پردازش داده ها هستند، در حالی که تیم های علم داده در حال استخراج داده ها برای بینش سرمایه گذاری هستند.
دادههای شخص ثالث یا دادههای جایگزین به دادههایی اشاره دارد که در فرآیند سرمایهگذاری استفاده میشوند و خارج از ارائهدهندگان سنتی دادههای بازار منبع میشوند. سرمایه گذاران نهادی اغلب منابع داده سنتی خود را با داده های شخص ثالث یا جایگزین تقویت می کنند تا در فرآیند سرمایه گذاری خود برتری پیدا کنند. نمونههای ذکر شده معمولاً شامل تصویربرداری ماهوارهای، دادههای کارت اعتباری و احساسات رسانههای اجتماعی است، اما محدود به آنها نیست. مدیران صندوق سالانه نزدیک به 3 میلیارد دلار در مجموعه داده های خارجی سرمایه گذاری می کنند که هزینه های سالانه آن 20 تا 30 درصد افزایش می یابد.
با رشد تصاعدی مجموعه داده های شخص ثالث و جایگزین موجود، توانایی تجزیه و تحلیل سریع اینکه آیا یک مجموعه داده جدید بینش سرمایه گذاری جدیدی را اضافه می کند یا خیر، یک تمایز رقابتی در صنعت مدیریت سرمایه گذاری است. دادههای بدون کد AWS (LCNC) و سرویسهای هوش مصنوعی تیمهای غیرفنی را قادر میسازد تا غربالگری دادههای اولیه را انجام دهند، دادهها را اولویتبندی کنند، زمان رسیدن به بینش را تسریع کنند و منابع فنی ارزشمند را آزاد کنند و مزیت رقابتی پایدار ایجاد کنند.
در این پست وبلاگ، ما در مورد اینکه چگونه به عنوان یک مدیر دارایی سازمانی، میتوانید از دادههای AWS LCNC و خدمات هوش مصنوعی استفاده کنید تا فرآیند تجزیه و تحلیل دادههای اولیه و اولویتبندی فراتر از تیمهای فنی را افزایش دهید و تصمیمگیری خود را تسریع کنید. با خدمات AWS LCNC، میتوانید به سرعت در مجموعه دادههای شخص ثالث مختلف مشترک شوید و آنها را ارزیابی کنید، دادهها را پیش پردازش کنید، و قدرت پیشبینی آنها را با استفاده از مدلهای یادگیری ماشین (ML) بدون نوشتن یک قطعه کد بررسی کنید.
بررسی اجمالی راه حل
مورد استفاده ما این است که قدرت پیشبینی قیمت سهام یک مجموعه داده خارجی را تجزیه و تحلیل کنیم و اهمیت ویژگی آن را شناسایی کنیم - کدام زمینهها بیشتر بر عملکرد قیمت سهام تأثیر میگذارند. این به عنوان یک آزمون قبولی اول عمل می کند تا مشخص کند کدام یک از فیلدهای چندگانه در یک مجموعه داده باید با استفاده از روش های کمی سنتی برای تناسب با فرآیند سرمایه گذاری شما دقیق تر ارزیابی شوند. این نوع از تست گذر اول را میتوان به سرعت توسط تحلیلگران انجام داد و در زمان صرفهجویی کرد و به شما امکان میدهد سریعتر اولویتبندی مجموعه دادهها را در اختیار داشته باشید. همچنین، در حالی که از قیمت سهام به عنوان نمونه هدف خود استفاده می کنیم، معیارهای دیگری مانند سودآوری، نسبت های ارزش گذاری یا حجم معاملات نیز می توانند مورد استفاده قرار گیرند. تمام مجموعه داده های مورد استفاده برای این مورد استفاده در منتشر شده است تبادل داده AWS.
نمودار زیر معماری end-to-end و سرویس های AWS LCNC مورد استفاده برای تصمیم گیری را توضیح می دهد:
راه حل ما شامل مراحل و راه حل های زیر است:
- جذب داده: AWS Data Exchange برای اشتراک در مجموعه داده های جایگزین منتشر شده و دانلود آنها در سرویس ذخیره سازی ساده آمازون سطل (Amazon S3).
- مهندسی داده: AWS Glue Data Brew برای مهندسی داده و تبدیل داده های ذخیره شده در آمازون S3.
- فراگیری ماشین: آمازون SageMaker Canvas برای ساخت یک مدل پیشبینی سری زمانی برای پیشبینی و شناسایی تأثیر دادهها بر پیشبینی.
- هوش تجاری: آمازون QuickSight یا Amazon SageMaker Canvas برای بررسی اهمیت ویژگی برای پیش بینی برای تصمیم گیری.
بلع داده ها
تبادل داده AWS یافتن، اشتراک و استفاده از داده های شخص ثالث در فضای ابری را آسان می کند. میتوانید از طریق کاتالوگ تبادل داده AWS مرور کنید و محصولات دادهای را پیدا کنید که مرتبط با کسب و کار شما هستند مشترک به داده های ارائه دهندگان بدون پردازش بیشتر و بدون نیاز به فرآیند ETL. توجه داشته باشید که بسیاری از ارائه دهندگان اشتراک های اولیه رایگان را ارائه می دهند که به شما امکان می دهد داده های آنها را بدون نیاز به هزینه های اولیه تجزیه و تحلیل کنید.
برای این مورد استفاده، مجموعه داده های زیر را در AWS Data Exchange جستجو و مشترک شوید:
- 20 سال اطلاعات سهام پایان روز برای 10 شرکت برتر ایالات متحده بر اساس ارزش بازار منتشر شده توسط برتری آلفا. این مجموعه داده رایگان شامل 20 سال داده تاریخی برای 10 سهام برتر ایالات متحده بر اساس ارزش بازار تا 5 سپتامبر 2020 است. مجموعه داده شامل 10 نماد زیر است—AAPL: Apple Inc.; AMZN: Amazon.com, Inc. BRK-A: Berkshire Hathaway Inc. (کلاس A)؛ FB: Facebook, Inc. GOOG: Alphabet Inc. JNJ: جانسون و جانسون; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; و WMT: Walmart Inc.
- فیلدهای داده های کلیدی شامل
- باز: قیمت افتتاحیه معامله شده برای روز
- بالا: قیمت بالای معامله شده برای روز
- پایین: به عنوان قیمت پایین معامله شده برای روز
- بسته شدن: قیمت بسته به صورت معامله شده برای روز
- حجم: حجم معاملات در روز
- تعدیل بسته: قیمت بسته شدن روز تقسیم و تعدیل شده بر اساس سود سهام
- نسبت تقسیم: نسبت تعداد سهام جدید به قدیم در تاریخ لازمالاجرا شدن
- سود سهام: مبلغ پرداخت سود نقدی
- S3 Short Interest و داده های مالی اوراق بهادار منتشر شده توسط شرکای S3. این مجموعه داده شامل فیلدهای زیر است:
میدان | توضیحات: |
تاریخ کسب و کار | تاریخ لازم الاجرا برای نرخ |
شناسه های امنیتی | شناسه های امنیتی حاوی Sedol، ISIN، FIGI، Ticker، Bloomberg ID هستند |
نام | نام امنیتی |
نرخ پیشنهادی | کارمزد تامین مالی مرکب بازار برای پوزیشن های فروش موجود |
نرخ پیشنهاد | کارمزد وام ترکیبی بازار که برای سهام موجود به صورت وام توسط دارندگان طولانی مدت به دست می آید |
آخرین نرخ | کارمزد وام ترکیبی بازار که برای سهام افزایشی وام داده شده در آن تاریخ به دست می آید (نرخ نقطه ای) |
کلاغ سازی | اندیکاتور مومنتوم کوتاهی روزانه و پوشش رویدادها را نسبت به شناور بازار اندازه گیری می کند |
علاقه کوتاه | سود کوتاه زمان واقعی به تعداد سهام بیان شده است |
ShortInterestNotional | سود کوتاه * قیمت (دلار آمریکا) |
ShortInterestPct | سود کوتاه مدت زمان واقعی به عنوان درصدی از سهام شناور بیان می شود |
S3Float | تعداد سهام قابل مبادله شامل خریدهای بلند مصنوعی ایجاد شده توسط فروش کوتاه مدت |
S3SIPctFloat | پیش بینی بهره کوتاه در زمان واقعی تقسیم بر شناور S3 |
IndicativeAvailability | S3 مقدار قابل وام قابل دسترس را پیش بینی کرده است |
بهره برداری | بهره کوتاه زمان واقعی تقسیم بر کل عرضه قابل وام |
DaystoCover10Day | این یک معیار نقدینگی = بهره کوتاه / میانگین ADTV 10 روزه است |
DaystoCover30Day | این یک معیار نقدینگی = بهره کوتاه / میانگین ADTV 30 روزه است |
DaystoCover90Day | این یک معیار نقدینگی = بهره کوتاه / میانگین ADTV 90 روزه است |
SI اصلی | نقطه در زمان بهره کوتاه |
برای دریافت داده ها، ابتدا مجموعه داده را در AWS Data Exchange جستجو کرده و در مجموعه داده مشترک می شوید:
هنگامی که ناشر مجموعههای داده درخواستهای اشتراک شما را تأیید کرد، مجموعه دادهها را برای دانلود در سطل S3 خود در دسترس خواهید داشت:
انتخاب کنید مقصد شغلی صادرات خودکار را اضافه کنید، جزئیات سطل S3 را ارائه دهید و مجموعه داده را دانلود کنید:
برای دریافت مجموعه داده Alpha Vantage مراحل را تکرار کنید. پس از تکمیل، هر دو مجموعه داده را در سطل S3 خود خواهید داشت.
مهندسی داده
هنگامی که مجموعه داده در سطل های S3 شما قرار دارد، می توانید استفاده کنید AWS Glue Data Brew برای تبدیل داده ها AWS Glue DataBrew بیش از 350 تبدیل از پیش ساخته شده را برای خودکارسازی وظایف آماده سازی داده ها (مانند فیلتر کردن ناهنجاری ها، استانداردسازی فرمت ها و اصلاح مقادیر نامعتبر) ارائه می دهد که در غیر این صورت به روزها یا هفته ها نوشتن تبدیل های کدگذاری شده دستی نیاز دارند.
برای ایجاد یک مجموعه داده هماهنگ تلفیقی برای پیشبینی در AWS DataBrew، مراحل زیر را انجام دهید. برای اطلاعات دقیق لطفا به این مطلب مراجعه کنید وبلاگ.
- مجموعه داده های DataBrew را ایجاد کنید.
- مجموعه داده های DataBrew را در پروژه های DataBrew بارگذاری کنید.
- دستور العمل های DataBrew را بسازید.
- کارهای DataBrew را اجرا کنید.
DataBrew Datasets را ایجاد کنید: در AWS Glue DataBrew، a مجموعه داده نشان دهنده داده هایی است که از سطل S3 آپلود می شوند. ما دو مجموعه داده DataBrew را ایجاد خواهیم کرد - هم برای قیمت سهام آخر روز و هم برای بهره کوتاه S3. هنگامی که مجموعه داده خود را ایجاد می کنید، جزئیات اتصال S3 را فقط یک بار وارد می کنید. از آن نقطه، DataBrew می تواند به داده های اساسی برای شما دسترسی داشته باشد.
مجموعه داده های DataBrew را در پروژه های DataBrew بارگذاری کنید: در AWS Glue DataBrew، a پروژه مرکز تجزیه و تحلیل داده ها و تلاش های تحول است. یک پروژه DataBrew مجموعه داده های DataBrew را گرد هم می آورد و شما را قادر می سازد یک تبدیل داده (دستور العمل DataBrew) ایجاد کنید. در اینجا دوباره، ما دو پروژه DataBrew را برای قیمت سهام در پایان روز و بهره کوتاه S3 ایجاد خواهیم کرد.
دستور العمل های DataBrew را بسازید: در DataBrew، a دستور العمل مجموعه ای از مراحل تبدیل داده است. می توانید این مراحل را در مجموعه داده خود اعمال کنید. برای مورد استفاده، ما دو تبدیل خواهیم ساخت. اولین مورد، قالب ستون مهر زمانی قیمت سهام پایان روز را تغییر میدهد تا مجموعه دادهها را بتوان به بهره کوتاه S3 ملحق کرد:
تبدیل دوم دادهها را مدیریت میکند، و آخرین مرحله آن تضمین میکند که مجموعههای داده را به یک مجموعه داده منفرد میپیوندیم. برای جزئیات بیشتر در مورد دستور العمل های تبدیل داده های ساختمان، به این مراجعه کنید وبلاگ.
مشاغل DataBrew: پس از ایجاد دستور العمل های DataBrew، می توانید ابتدا کار DataBrew قیمت سهام پایان روز را اجرا کنید و سپس دستور S3 را با بهره کوتاه اجرا کنید. رجوع به این شود وبلاگ برای ایجاد یک مجموعه داده تلفیقی. مجموعه داده نهایی انتخاب شده را در یک سطل S3 ذخیره کنید.
گردش کار مهندسی داده انتها به انتها به شکل زیر خواهد بود:
فراگیری ماشین
با مجموعه داده انتخاب شده ایجاد شده از مهندسی پس از داده، می توانید استفاده کنید آمازون SageMaker Canvas برای ساخت مدل پیش بینی خود و تجزیه و تحلیل تأثیر ویژگی ها بر پیش بینی. آمازون SageMaker Canvas به کاربران تجاری یک رابط بصری نقطه و کلیک ارائه می دهد که به آنها اجازه می دهد مدل هایی بسازند و پیش بینی های دقیق ML را به تنهایی تولید کنند - بدون نیاز به تجربه ML یا نیاز به نوشتن یک خط کد.
برای ساخت یک مدل پیشبینی سری زمانی در آمازون SageMaker Canvas، مراحل زیر را دنبال کنید. برای اطلاعات دقیق به این مطلب مراجعه کنید وبلاگ:
- مجموعه داده انتخاب شده را در SageMaker Canvas انتخاب کنید.
- ساخت مدل پیشبینی سری زمانی
- نتایج و اهمیت ویژگی را تجزیه و تحلیل کنید.
ساخت مدل پیشبینی سری زمانی: پس از انتخاب مجموعه داده، ستون مورد نظر را برای پیش بینی انتخاب کنید. در مورد ما، این قیمت بسته شدن قیمت سهام خواهد بود. SageMaker Canvas به طور خودکار تشخیص می دهد که این بیانیه مشکل پیش بینی سری زمانی است.
برای پیش بینی سری های زمانی باید مدل را به صورت زیر پیکربندی کنید. برای شناسه کالا، نام نماد سهام را انتخاب کنید. به یاد داشته باشید، مجموعه داده ما دارای قیمت های شاخص سهام برای 10 سهام برتر است. ستون مهر زمانی را برای مهر زمانی انتخاب کنید، و در نهایت، تعداد روزهایی را که می خواهید در آینده پیش بینی کنید، وارد کنید [Forecast Horizon].
اکنون شما آماده ساخت مدل هستید. SageMaker Canvas دو گزینه برای ساخت مدل ارائه می دهد: ساخت سریع و ساخت استاندارد. در مورد ما، از "ساخت استاندارد" استفاده خواهیم کرد.
استاندارد بیلد تقریباً سه ساعت طول می کشد تا مدل و استفاده شود پیش بینی آمازون، یک سرویس پیش بینی سری زمانی مبتنی بر ML به عنوان موتور پیش بینی اساسی. Forecast پیشبینیهای بسیار دقیقی را از طریق ترکیب مدلهای مدلهای یادگیری عمیق و سنتی بدون نیاز به تجربه ML ایجاد میکند.
هنگامی که مدل ساخته شد، اکنون می توانید عملکرد مدل (دقت پیش بینی) و اهمیت ویژگی را بررسی کنید. همانطور که در شکل زیر مشاهده می شود، مدل Crowding و DaysToCover10Day را به عنوان دو ویژگی برتر محرک مقادیر پیش بینی شناسایی می کند. این با شهود بازار ما مطابقت دارد، زیرا ازدحام یک شاخص حرکتی است که کوتاهمدت روزانه را اندازهگیری میکند و رویدادها را پوشش میدهد، و بهره کوتاهمدت یک معیار نقدشوندگی است که نشاندهنده نحوه موقعیت سرمایهگذاران در سهام است. هم حرکت و هم نقدینگی میتوانند باعث نوسان قیمت شوند.
این نتیجه نشان میدهد که این دو ویژگی (یا فیلد) رابطه نزدیکی با حرکات قیمت سهام دارند و میتوانند برای ورود و تحلیل بیشتر اولویتبندی شوند.
هوش تجاری
در زمینه پیش بینی سری های زمانی، مفهوم تسلیم شدن به فرآیند ارزیابی دقت یک روش پیشبینی با استفاده از دادههای تاریخی موجود اشاره دارد. این فرآیند معمولاً تکراری است و در چندین تاریخ موجود در دادههای تاریخی تکرار میشود.
همانطور که قبلاً بحث کردیم، SageMaker Canvas از پیشبینی آمازون به عنوان موتور پیشبینی سریهای زمانی استفاده میکند. Forecast یک بک تست را به عنوان بخشی از فرآیند ساخت مدل ایجاد می کند. اکنون می توانید با ورود به Amazon Forecast جزئیات پیش بینی را مشاهده کنید. برای درک عمیق تر در مورد مدل توضیح پذیری، به این مراجعه کنید وبلاگ.
آمازون پیش بینی جزئیات بیشتری را در مورد معیارهای پیش بینی کننده مانند خطای درصد مطلق وزنی (WAPE)، ریشه میانگین مربعات خطا (RMSE)، میانگین درصد مطلق خطا (MAPE) و میانگین خطای مقیاس مطلق (MASE) ارائه می دهد. شما می توانید نمرات کیفیت پیش بینی کننده را از Amazon Forecast صادر کنید.
پیشبینی آمازون یک بکآست برای مجموعه دادههای سری زمانی ارائه شده اجرا میکند. نتایج بکآست برای دانلود با استفاده از نتایج بک تست را صادر کنید دکمه. نتایج بک تست صادر شده در یک سطل S3 دانلود می شود.
اکنون نتایج بک تست را در آمازون QuickSight رسم خواهیم کرد. برای تجسم نتایج بک تست در آمازون QuickSight، از QuickSight به مجموعه داده در Amazon S3 متصل شده و تصویرسازی ایجاد کنید.
پاک کردن
خدمات AWS استفاده شده در این راه حل، ماهیت مدیریت شده و بدون سرور دارند. SageMaker Canvas برای اجرای طولانی مدت آموزش ML طراحی شده است و همیشه فعال خواهد بود. مطمئن شوید که به صراحت از SageMaker Canvas خارج شده اید. مراجعه فرمایید اسناد برای جزئیات بیشتر.
نتیجه
در این پست وبلاگ، ما بحث کردیم که چگونه، به عنوان یک مدیر دارایی سازمانی، میتوانید از دادههای بدون کد با کد پایین (LCNC) AWS و خدمات هوش مصنوعی برای تسریع ارزیابی مجموعه دادههای خارجی با بارگذاری غربالگری مجموعه داده اولیه برای پرسنل غیر فنی استفاده کنید. این تجزیه و تحلیل گذر اول را می توان به سرعت انجام داد تا به شما کمک کند تصمیم بگیرید کدام مجموعه داده باید برای نصب و تجزیه و تحلیل بیشتر اولویت بندی شود.
ما گام به گام نشان دادیم که چگونه یک تحلیلگر داده میتواند دادههای شخص ثالث جدیدی را از طریق AWS Data Exchange به دست آورد، از خدمات ETL بدون کد AWS Glue DataBrew برای پیش پردازش دادهها و ارزیابی اینکه کدام ویژگیها در یک مجموعه داده بیشترین تأثیر را بر پیشبینی مدل دارند، استفاده کند. .
هنگامی که داده ها آماده تجزیه و تحلیل هستند، یک تحلیلگر از SageMaker Canvas برای ساخت یک مدل پیش بینی، ارزیابی تناسب آن و شناسایی ویژگی های مهم استفاده می کند. در مثال ما، MAPE مدل (05) و WAPE (045) تناسب خوبی را نشان دادند و "Crowding" و "DaysToCover10Day" را به عنوان سیگنالهای مجموعه داده با بیشترین تأثیر بر پیشبینی نشان دادند. این تجزیه و تحلیل کمیت داده است که چه داده هایی بیشتر بر مدل تأثیر می گذارد و بنابراین می تواند برای تحقیقات بیشتر و گنجاندن احتمالی در سیگنال های آلفا یا فرآیند مدیریت ریسک شما اولویت بندی شود. و به همان اندازه مهم، نمرات توضیح پذیری نشان می دهد که چه داده هایی نقش نسبتا کمی در تعیین پیش بینی ایفا می کنند و بنابراین می توانند اولویت کمتری برای تحقیقات بیشتر باشند.
برای ارزیابی سریعتر توانایی دادههای مالی شخص ثالث برای پشتیبانی از فرآیند سرمایهگذاری، موارد را مرور کنید منابع داده خدمات مالی موجود در AWS Data Exchange، و بده DataBrew و نقاشی یک امتحان امروز
درباره نویسنده
بوریس لیتوین معمار راه حل اصلی، مسئول نوآوری صنعت خدمات مالی است. او بنیانگذار سابق کوانت و فینتک است و علاقه زیادی به سرمایهگذاری سیستماتیک دارد.
میناکشیسوندارام تانداوارایان یک متخصص ارشد AI/ML با AWS است. او به حسابهای استراتژیک با فناوری پیشرفته در سفر هوش مصنوعی و ML کمک میکند. او علاقه زیادی به هوش مصنوعی مبتنی بر داده دارد.
کامیلو آنانیا یک معمار ارشد راهحلهای راهاندازی با AWS مستقر در بریتانیا است. او یک فنشناس پرشور است که به استارتآپها با هر اندازهای کمک میکند تا بسازند و رشد کنند.
دن سین رایش یک مدیر محصول پدر با AWS است که بر توانمندسازی شرکتها برای تصمیمگیری بهتر با ML تمرکز دارد. او قبلاً پلتفرمهای تجزیه و تحلیل پورتفولیو و مدلهای ریسک طبقه چند دارایی را برای سرمایهگذاران نهادی بزرگ ساخته بود.
- AI
- آی هنر
- مولد هنر ai
- ربات ai
- پیش بینی آمازون
- آموزش ماشین آمازون
- آمازون QuickSight
- آمازون SageMaker Canvas
- هوش مصنوعی
- گواهی هوش مصنوعی
- هوش مصنوعی در بانکداری
- ربات هوش مصنوعی
- ربات های هوش مصنوعی
- نرم افزار هوش مصنوعی
- AWS Glue Data Brew
- آموزش ماشین AWS
- بلاکچین
- کنفرانس بلاک چین ai
- coingenius
- هوش مصنوعی محاوره ای
- کنفرانس کریپتو ai
- راه حل های مشتری
- دل-ه
- یادگیری عمیق
- خدمات مالی
- گوگل ai
- متوسط (200)
- فراگیری ماشین
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- بازی افلاطون
- PlatoData
- بازی پلاتو
- مقیاس Ai
- نحو
- زفیرنت