Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code

Opublikowane ponownie przez Plato

Obserwuje: 0

W ciągu ostatnich kilku lat nastąpiła ogromna zmiana paradygmatu w sposobie, w jaki zarządzający aktywami instytucjonalni pozyskują i integrują wiele źródeł danych w swoim procesie inwestycyjnym. Przy częstych zmianach w korelacjach ryzyka, nieoczekiwanych źródłach zmienności i rosnącej konkurencji ze strony strategii pasywnych, zarządzający aktywami wykorzystują szerszy zestaw zewnętrznych źródeł danych, aby uzyskać przewagę konkurencyjną i poprawić zwroty skorygowane o ryzyko. Jednak proces wydobywania korzyści z wielu źródeł danych może być niezwykle trudny. Zespoły ds. inżynierii danych zarządzających aktywami są przeciążone pozyskiwaniem i wstępnym przetwarzaniem danych, podczas gdy zespoły zajmujące się analizą danych eksplorują dane w celu uzyskania wglądu w inwestycje.

Dane stron trzecich lub dane alternatywne odnoszą się do danych wykorzystywanych w procesie inwestycyjnym, pochodzących spoza tradycyjnych dostawców danych rynkowych. Inwestorzy instytucjonalni często uzupełniają swoje tradycyjne źródła danych o dane zewnętrzne lub alternatywne, aby uzyskać przewagę w procesie inwestycyjnym. Zazwyczaj cytowane przykłady obejmują między innymi zdjęcia satelitarne, dane kart kredytowych i nastroje w mediach społecznościowych. Zarządzający funduszami inwestują prawie 3 miliardy dolarów rocznie w zewnętrzne zbiory danych, a roczne wydatki rosną o 20–30 procent.

Przy wykładniczym wzroście dostępnych zewnętrznych i alternatywnych zestawów danych możliwość szybkiego analizowania, czy nowy zestaw danych dodaje nowe spostrzeżenia dotyczące inwestycji, jest konkurencyjnym wyróżnikiem w branży zarządzania inwestycjami. Dane AWS bez kodu i z niskim kodem (LCNC) oraz usługi sztucznej inteligencji umożliwiają zespołom nietechnicznym przeprowadzanie wstępnego sprawdzania danych, ustalanie priorytetów wdrażania danych, przyspieszanie czasu uzyskiwania wglądu i uwalnianie cennych zasobów technicznych — tworząc trwałą przewagę konkurencyjną.

W tym poście na blogu omawiamy, w jaki sposób jako zarządzający aktywami instytucjonalnymi możesz wykorzystać dane AWS LCNC i usługi AI do skalowania początkowej analizy danych i procesu ustalania priorytetów poza zespoły techniczne i przyspieszenia podejmowania decyzji. Dzięki usługom AWS LCNC możesz szybko subskrybować i oceniać różne zestawy danych innych firm, wstępnie przetwarzać dane i sprawdzać ich moc predykcyjną za pomocą modeli uczenia maszynowego (ML) bez pisania ani jednego fragmentu kodu.

Omówienie rozwiązania

Naszym przypadkiem użycia jest analiza mocy predykcyjnej cen akcji zewnętrznego zbioru danych i określenie ważności jego funkcji — które pola mają największy wpływ na wyniki cen akcji. Służy to jako test pierwszego przejścia w celu określenia, które z wielu pól w zbiorze danych należy dokładniej ocenić przy użyciu tradycyjnych metod ilościowych, aby dopasować je do procesu inwestycyjnego. Analitycy mogą szybko przeprowadzić ten rodzaj testu pierwszego przejścia, oszczędzając czas i umożliwiając szybsze ustalanie priorytetów wdrażania zestawu danych. Ponadto, chociaż używamy ceny akcji jako naszego docelowego przykładu, można również wykorzystać inne wskaźniki, takie jak rentowność, wskaźniki wyceny lub wolumen obrotu. Wszystkie zbiory danych użyte w tym przypadku użycia są publikowane w Wymiana danych AWS.

Poniższy diagram wyjaśnia kompleksową architekturę i usługi AWS LCNC używane do podejmowania decyzji:

Nasze rozwiązanie składa się z następujących kroków i rozwiązań:

Pozyskiwanie danych: AWS Data Exchange do subskrybowania opublikowanych alternatywnych zestawów danych i pobierania ich na Usługa Amazon Simple Storage Łyżka (Amazon S3).
Inżynieria danych: DataBrew kleju AWS do inżynierii danych i transformacji danych przechowywanych w Amazon S3.
Nauczanie maszynowe: Płótno Amazon SageMaker do budowy modelu prognozowania szeregów czasowych do predykcji i identyfikacji wpływu danych na prognozę.
Wywiad biznesowy: Amazon QuickSight lub Amazon SageMaker Canvas, aby sprawdzić znaczenie funkcji dla prognozy w celu podejmowania decyzji.

Pozyskiwanie danych

Wymiana danych AWS ułatwia znajdowanie, subskrybowanie i korzystanie z danych innych firm w chmurze. Możesz przeglądać katalog AWS Data Exchange i znaleźć produkty związane z danymi, które są odpowiednie dla Twojej firmy i subskrybuj do danych od dostawców bez dalszego przetwarzania i bez konieczności stosowania procesu ETL. Należy pamiętać, że wielu dostawców oferuje bezpłatne początkowe subskrypcje, które umożliwiają analizę ich danych bez konieczności ponoszenia kosztów z góry.

W tym przypadku wyszukaj i zasubskrybuj poniższe zestawy danych w AWS Data Exchange:

20-letnie dane giełdowe na koniec dnia dla 10 największych amerykańskich firm według kapitalizacji rynkowej opublikowane przez Alfa Vantage. Ten bezpłatny zestaw danych zawiera dane historyczne z 20 lat dla 10 największych amerykańskich spółek giełdowych według kapitalizacji rynkowej na dzień 5 września 2020 r. Zestaw danych zawiera 10 następujących symboli — AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (klasa A); FB: Facebook, Inc.; GOOG: Alphabet Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; i WMT: Walmart Inc.
Kluczowe pola danych obejmują
- Otwarte: kurs otwarcia zgodnie z rynkami w ciągu dnia
- Wysoka: najwyższa cena notowana w ciągu dnia
- Niska: niska cena notowana w ciągu dnia
- Close: aktualna cena zamknięcia na dany dzień
- Wolumen: wolumen obrotu na dany dzień
- Skorygowane zamknięcie: cena zamknięcia dnia po podziale i skorygowana o dywidendę
- Współczynnik podziału: stosunek nowej do starej liczby akcji w dniu wejścia w życie
- Dywidenda: kwota wypłaty dywidendy pieniężnej
S3 Krótkie dane finansowe dotyczące odsetek i papierów wartościowych opublikowane przez Partnerzy S3. Ten zestaw danych zawiera następujące pola:

Pole	Opis
Data biznesowa	Data wejścia w życie stawki
Identyfikatory zabezpieczeń	Identyfikatory bezpieczeństwa zawierają Sedol, ISIN, FIGI, Ticker, Bloomberg ID
Imię	Nazwa bezpieczeństwa
Cena oferty	Opłata za złożone finansowanie rynkowe płacona za istniejące krótkie pozycje
Stawka stawki	Rynkowa złożona opłata pożyczkowa uzyskana za istniejące akcje pożyczone przez długich posiadaczy
Ostatni kurs	Rynkowa złożona prowizja pożyczkowa uzyskana za dodatkowe udziały pożyczone w tym dniu (kurs spot)
Gromadzenie się	Wskaźnik momentum mierzy codzienne krótkie i pokrywające wydarzenia w stosunku do rynku
Krótkie zainteresowanie	Krótkie zainteresowanie w czasie rzeczywistym wyrażone w liczbie akcji
Oprocentowanie krótkoterminowe	Krótkie oprocentowanie * Cena (USD)
Krótkie oprocentowaniePct	Krótkoterminowe oprocentowanie w czasie rzeczywistym wyrażone jako procent kapitału własnego
S3Float	Liczba zbywalnych akcji, w tym syntetycznych pozycji długich utworzonych w wyniku krótkiej sprzedaży
S3SIPctFloat	Projekcja krótkiego oprocentowania w czasie rzeczywistym podzielona przez zmiennoprzecinkową S3
Orientacyjna dostępność	S3 przewidywana dostępna ilość pożyczalna
Wykorzystanie	Krótkoterminowe oprocentowanie w czasie rzeczywistym podzielone przez całkowitą podaż pożyczkową
Dni do pokrycia 10 dni	Jest to miara płynności = krótkie oprocentowanie / 10-dniowa średnia ADTV
Dni do pokrycia 30 dni	Jest to miara płynności = krótkie oprocentowanie / 30-dniowa średnia ADTV
Dni do pokrycia 90 dni	Jest to miara płynności = krótkie oprocentowanie / 90-dniowa średnia ADTV
Oryginalny SI	Krótkie zainteresowanie w określonym czasie

Aby uzyskać dane, najpierw wyszukasz zestaw danych w AWS Data Exchange i zasubskrybujesz zestaw danych:

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Gdy wydawca zestawów danych zatwierdzi Twoje prośby o subskrypcję, będziesz mieć dostępne zestawy danych do pobrania do zasobnika S3:

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Wybierz Dodaj miejsce docelowe zadania automatycznego eksportu, podaj szczegóły zasobnika S3 i pobierz zestaw danych:

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Powtórz kroki, aby uzyskać zestaw danych Alpha Vantage. Po zakończeniu będziesz mieć oba zestawy danych w swoim zasobniku S3.

Inżynieria danych

Gdy zestaw danych znajdzie się w twoich zasobnikach S3, możesz użyć DataBrew kleju AWS aby przekształcić dane. AWS Glue DataBrew oferuje ponad 350 gotowych transformacji do automatyzacji zadań przygotowania danych (takich jak filtrowanie anomalii, standaryzacja formatów i poprawianie nieprawidłowych wartości), które w innym przypadku wymagałyby dni lub tygodni pisania ręcznie kodowanych transformacji.

Aby utworzyć skonsolidowany, wyselekcjonowany zestaw danych do prognozowania w AWS DataBrew, wykonaj poniższe kroki. Aby uzyskać szczegółowe informacje, zapoznaj się z tym blog.

Utwórz zestawy danych DataBrew.
Załaduj zestawy danych DataBrew do projektów DataBrew.
Twórz receptury DataBrew.
Uruchom zadania DataBrew.

Twórz zestawy danych DataBrew: W AWS Glue DataBrew, a zestaw danych reprezentuje dane, które są przesyłane z zasobnika S3. Stworzymy dwa zestawy danych DataBrew — zarówno dla ceny akcji na koniec dnia, jak i krótkiej stopy procentowej S3. Podczas tworzenia zestawu danych szczegóły połączenia S3 wprowadzasz tylko raz. Od tego momentu DataBrew może uzyskać dla Ciebie dostęp do podstawowych danych.

Załaduj zestawy danych DataBrew do projektów DataBrew: W AWS Glue DataBrew, a projekt jest centralnym elementem Twoich wysiłków związanych z analizą i transformacją danych. Projekt DataBrew łączy zestawy danych DataBrew i umożliwia opracowanie transformacji danych (przepis DataBrew). Tutaj ponownie utworzymy dwa projekty DataBrew, dla ceny akcji na koniec dnia i krótkiego oprocentowania S3.

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Twórz receptury DataBrew: W DataBrew a Przepis to zestaw kroków transformacji danych. Możesz zastosować te kroki do swojego zestawu danych. Dla przypadku użycia zbudujemy dwie transformacje. Pierwszy z nich zmieni format kolumny znacznika czasu ceny akcji na koniec dnia, aby zestaw danych można było dołączyć do krótkiego zainteresowania S3:

Druga transformacja obejmuje dane, a jej ostatni krok gwarantuje, że połączymy zestawy danych w jeden wybrany zestaw danych. Aby uzyskać więcej informacji na temat tworzenia receptur transformacji danych, zapoznaj się z tym blog.

Zadania DataBrew: Po utworzeniu receptur DataBrew można najpierw uruchomić zadanie DataBrew dotyczące cen akcji na koniec dnia, a następnie recepturę krótkiego oprocentowania S3. Odnieś się do tego blog aby utworzyć jeden skonsolidowany zestaw danych. Zapisz ostateczny wyselekcjonowany zestaw danych w zasobniku S3.

Kompleksowy przepływ pracy inżynierii danych będzie wyglądał następująco:

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Nauczanie maszynowe

Możesz użyć wyselekcjonowanego zestawu danych utworzonego po inżynierii danych Płótno Amazon SageMaker aby zbudować model prognostyczny i przeanalizować wpływ funkcji na prognozę. Płótno Amazon SageMaker zapewnia użytkownikom biznesowym wizualny interfejs typu „wskaż i kliknij”, który pozwala im samodzielnie budować modele i generować dokładne prognozy uczenia maszynowego — bez konieczności posiadania doświadczenia w zakresie uczenia maszynowego lub pisania choćby jednego wiersza kodu.

Aby zbudować model prognozowania szeregów czasowych w Amazon SageMaker Canvas, wykonaj poniższe kroki. Aby uzyskać szczegółowe informacje, zapoznaj się z tym blog:

Wybierz wyselekcjonowany zestaw danych w SageMaker Canvas.
Zbuduj model prognozowania szeregów czasowych.
Przeanalizuj wyniki i ważność funkcji.

Zbuduj model prognozowania szeregów czasowych: Po wybraniu zestawu danych wybierz kolumnę docelową do prognozowania. W naszym przypadku będzie to cena zamknięcia paska giełdowego. SageMaker Canvas automatycznie wykrywa, że jest to stwierdzenie problemu z prognozowaniem szeregów czasowych.

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Będziesz musiał skonfigurować model w następujący sposób na potrzeby prognozowania szeregów czasowych. Jako identyfikator pozycji wybierz nazwę giełdy. Pamiętaj, że nasz zestaw danych zawiera ceny giełdowe dla 10 najlepszych akcji. Wybierz kolumnę znacznika czasu dla znacznika czasu, a na koniec wprowadź liczbę dni, które chcesz prognozować w przyszłości [Horyzont prognozy].

Teraz jesteś gotowy do zbudowania modelu. SageMaker Canvas zapewnia dwie opcje budowania modelu: Szybka budowa i Standardowa budowa. W naszym przypadku użyjemy „Standardowej kompilacji”.

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Budowa standardowa trwa około trzech godzin, aby zbudować model i użyć Prognoza Amazon, usługa prognozowania szeregów czasowych oparta na ML jako bazowym silniku prognozowania. Forecast tworzy bardzo dokładne prognozy poprzez łączenie modeli tradycyjnych i głębokich modeli uczenia się bez konieczności posiadania doświadczenia w uczeniu maszynowym.

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Po zbudowaniu modelu można teraz przejrzeć wydajność modelu (dokładność przewidywania) i ważność funkcji. Jak widać na poniższym rysunku, model identyfikuje Crowding i DaysToCover10Day jako dwie najważniejsze cechy kształtujące wartości prognozy. Jest to zgodne z naszą intuicją rynkową, ponieważ zatłoczenie jest wskaźnikiem impetu mierzącym codzienne krótkie pozycje i obejmujące wydarzenia, a krótkoterminowe krótkie zainteresowanie jest miarą płynności, wskazującą, w jaki sposób inwestorzy są pozycjonowani w akcjach. Zarówno impet, jak i płynność mogą napędzać zmienność cen.

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Wynik ten wskazuje, że te dwie cechy (lub pola) mają ścisły związek z ruchami cen akcji i mogą mieć wyższy priorytet we wdrażaniu i dalszej analizie.

Business Intelligence

W kontekście prognozowania szeregów czasowych pojęcie tzw weryfikacja historyczna odnosi się do procesu oceny dokładności metody prognozowania przy użyciu istniejących danych historycznych. Proces jest zwykle iteracyjny i powtarzany w wielu datach obecnych w danych historycznych.

Jak już omówiliśmy, SageMaker Canvas wykorzystuje Amazon Forecast jako silnik do prognozowania szeregów czasowych. Forecast tworzy test historyczny jako część procesu budowania modelu. Możesz teraz wyświetlić szczegóły predyktora, logując się do Amazon Forecast. Aby uzyskać głębsze zrozumienie wyjaśnialności modelu, zapoznaj się z tym blog.

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Amazon Forecast zapewnia dodatkowe szczegóły dotyczące metryk predykcyjnych, takich jak ważony bezwzględny błąd procentowy (WAPE), pierwiastek średniokwadratowy błędu (RMSE), średni bezwzględny błąd procentowy (MAPE) i średni bezwzględny błąd skalowany (MASE). Możesz eksportować wyniki jakości predyktorów z Amazon Forecast.

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Amazon Forecast przeprowadza jeden test wsteczny dla dostarczonego zestawu danych szeregów czasowych. Wyniki testu wstecznego są dostępne do pobrania za pomocą Eksportuj wyniki testów historycznych przycisk. Wyeksportowane wyniki analizy historycznej są pobierane do zasobnika S3.

Teraz wykreślimy wyniki testu historycznego w Amazon QuickSight. Aby zwizualizować wyniki testu wstecznego w Amazon QuickSight, połącz się z zestawem danych w Amazon S3 z QuickSight i utwórz wizualizację.

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Sprzątać

Usługi AWS wykorzystywane w tym rozwiązaniu są z natury zarządzane i bezserwerowe. SageMaker Canvas został zaprojektowany do prowadzenia długotrwałych szkoleń ML i będzie zawsze włączony. Upewnij się, że wyraźnie wylogowałeś SageMaker Canvas. Należy zapoznać się dokumenty by uzyskać więcej szczegółów.

Wnioski

W tym poście na blogu omówiliśmy, w jaki sposób, jako zarządzający aktywami instytucjonalnymi, możesz wykorzystać dane AWS w trybie low-code no-code (LCNC) i usługi sztucznej inteligencji, aby przyspieszyć ocenę zewnętrznych zestawów danych poprzez przekazanie wstępnej kontroli zestawu danych personelowi nietechnicznemu. Tę analizę pierwszego przejścia można przeprowadzić szybko, aby pomóc Ci zdecydować, które zestawy danych powinny być traktowane priorytetowo podczas wdrażania i dalszej analizy.

Pokazaliśmy krok po kroku, w jaki sposób analityk danych może pozyskiwać nowe dane stron trzecich za pośrednictwem AWS Data Exchange, korzystać z usług ETL bez kodu AWS Glue DataBrew do wstępnego przetwarzania danych i oceniać, które funkcje w zbiorze danych mają największy wpływ na prognozę modelu .

Gdy dane są gotowe do analizy, analityk wykorzystuje SageMaker Canvas do zbudowania modelu predykcyjnego, oceny jego dopasowania i zidentyfikowania istotnych cech. W naszym przykładzie MAPE (05) i WAPE (045) modelu wykazały dobre dopasowanie i pokazały „Crowding” i „DaysToCover10Day” jako sygnały w zbiorze danych o największym wpływie na prognozę. W tej analizie określono ilościowo, które dane miały największy wpływ na model i dlatego można je potraktować priorytetowo w celu dalszego zbadania i potencjalnego włączenia do sygnałów alfa lub procesu zarządzania ryzykiem. Co równie ważne, wyniki wyjaśnialności wskazują, jakie dane odgrywają stosunkowo niewielką rolę w określaniu prognozy i dlatego mogą mieć niższy priorytet w dalszych badaniach.

Aby szybciej ocenić zdolność zewnętrznych danych finansowych do wspierania procesu inwestycyjnego, przejrzyj Źródła danych Financial Services dostępne na AWS Data Exchange, i dać DataBrew i Brezentowy spróbuj dzisiaj.

O autorach

Borys Litwin jest głównym architektem rozwiązań, odpowiedzialnym za innowacje w branży usług finansowych. Jest byłym założycielem Quant i FinTech, pasjonatem systematycznego inwestowania.

Meenakshisundaram Tandavarayan jest starszym specjalistą AI/ML w AWS. Pomaga zaawansowanym technologicznie strategicznym klientom w ich podróży AI i ML. Jest pasjonatem sztucznej inteligencji opartej na danych.

Kamil Anania jest starszym architektem rozwiązań startowych w AWS z siedzibą w Wielkiej Brytanii. Jest pasjonatem technologii pomagającym budować i rozwijać startupy każdej wielkości.

Dana Sinnreicha jest Starszym Menedżerem Produktu w AWS, koncentrującym się na wspieraniu firm w podejmowaniu lepszych decyzji dzięki ML. Wcześniej budował platformy analizy portfela i modele ryzyka wielu klas aktywów dla dużych inwestorów instytucjonalnych.

Znak czasu: 20 grudnia 2022 r.23 grudnia 2022 r.

Znak czasu: Jan 17, 2024

Przyspiesz proces inwestycyjny dzięki usługom AWS Low Code-No Code

Opublikowane ponownie przez Plato

Omówienie rozwiązania

Pozyskiwanie danych

Inżynieria danych

Nauczanie maszynowe

Business Intelligence

Sprzątać

Wnioski

O autorach

Więcej z Uczenie maszynowe AWS

Dopasuj wytrenowane parametry w dużych zbiorach danych za pomocą Amazon SageMaker Data Wrangler

Wykrywaj wzorce w danych tekstowych za pomocą Amazon SageMaker Data Wrangler

Oficjalny dokument: Najlepsze praktyki uczenia maszynowego w opiece zdrowotnej i naukach przyrodniczych

Uzyskaj hosting o niskich opóźnieniach dla modeli ML opartych na drzewie decyzyjnym na serwerze NVIDIA Triton Inference Server na Amazon SageMaker

Jak firma Amp na Amazon wykorzystała dane, aby zwiększyć zaangażowanie klientów, część 1: Budowa platformy do analizy danych

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto