Accelera il processo di investimento con i servizi AWS Low Code-No Code

Ripubblicato da Platone

Seguaci: 0

Gli ultimi anni hanno visto un enorme cambiamento di paradigma nel modo in cui i gestori patrimoniali istituzionali si procurano e integrano più fonti di dati nel loro processo di investimento. Con i frequenti cambiamenti nelle correlazioni di rischio, le fonti impreviste di volatilità e la crescente concorrenza delle strategie passive, i gestori patrimoniali stanno impiegando una serie più ampia di fonti di dati di terze parti per ottenere un vantaggio competitivo e migliorare i rendimenti aggiustati per il rischio. Tuttavia, il processo di estrazione dei vantaggi da più origini dati può essere estremamente impegnativo. I team di ingegneria dei dati dei gestori di asset sono sovraccarichi di acquisizione e pre-elaborazione dei dati, mentre i team di data science stanno estraendo i dati per approfondimenti sugli investimenti.

I dati di terze parti o alternativi si riferiscono ai dati utilizzati nel processo di investimento, provenienti al di fuori dei tradizionali fornitori di dati di mercato. Gli investitori istituzionali stanno spesso aumentando le loro fonti di dati tradizionali con dati di terze parti o alternativi per ottenere un vantaggio nel loro processo di investimento. Gli esempi tipicamente citati includono, ma non sono limitati a, immagini satellitari, dati di carte di credito e sentiment sui social media. I gestori di fondi investono quasi 3 miliardi di dollari all'anno in set di dati esterni, con una spesa annua in crescita del 20-30%.

Con la crescita esponenziale dei set di dati di terze parti e alternativi disponibili, la capacità di analizzare rapidamente se un nuovo set di dati aggiunge nuove informazioni sugli investimenti è un fattore di differenziazione competitivo nel settore della gestione degli investimenti. I dati AWS no-code low-code (LCNC) e i servizi AI consentono ai team non tecnici di eseguire lo screening iniziale dei dati, dare priorità all'onboarding dei dati, accelerare il time-to-insight e liberare preziose risorse tecniche, creando un vantaggio competitivo duraturo.

In questo post del blog, discutiamo di come, in qualità di gestore patrimoniale istituzionale, puoi sfruttare i dati AWS LCNC e i servizi di intelligenza artificiale per ridimensionare l'analisi iniziale dei dati e il processo di definizione delle priorità oltre i team tecnici e accelerare il tuo processo decisionale. Con i servizi AWS LCNC, puoi sottoscrivere rapidamente e valutare diversi set di dati di terze parti, preelaborare i dati e verificarne il potere predittivo utilizzando modelli di machine learning (ML) senza scrivere un singolo pezzo di codice.

Panoramica della soluzione

Il nostro caso d'uso consiste nell'analizzare il potere predittivo del prezzo delle azioni di un set di dati esterno e identificarne l'importanza delle caratteristiche, ovvero quali campi incidono maggiormente sull'andamento del prezzo delle azioni. Questo serve come test di primo passaggio per identificare quale dei molteplici campi in un set di dati dovrebbe essere valutato più da vicino utilizzando metodologie quantitative tradizionali per adattarsi al processo di investimento. Questo tipo di test di primo passaggio può essere eseguito rapidamente dagli analisti, risparmiando tempo e consentendoti di assegnare più rapidamente la priorità all'onboarding dei set di dati. Inoltre, mentre utilizziamo il prezzo delle azioni come esempio target, potrebbero essere utilizzate anche altre metriche come la redditività, i rapporti di valutazione o i volumi di scambio. Tutti i set di dati utilizzati per questo caso d'uso sono pubblicati in Scambio di dati AWS.

Il diagramma seguente illustra l'architettura end-to-end e i servizi AWS LCNC utilizzati per guidare le decisioni:

La nostra soluzione consiste nei seguenti passaggi e soluzioni:

Importazione dei dati: AWS Data Exchange per la sottoscrizione ai set di dati alternativi pubblicati e il loro download Servizio di archiviazione semplice Amazon (Amazon S3) secchio.
Ingegneria dei dati: DataBrew di AWS Glue per il data engineering e la trasformazione dei dati archiviati in Amazon S3.
Apprendimento automatico: Tela di Amazon SageMaker per la creazione di un modello di previsione delle serie temporali per la previsione e l'identificazione dell'impatto dei dati sulla previsione.
Intelligenza aziendale: Amazon QuickSight o Amazon SageMaker Canvas per rivedere l'importanza delle funzionalità per le previsioni per il processo decisionale.

Importazione dei dati

Scambio di dati AWS semplifica la ricerca, la sottoscrizione e l'utilizzo di dati di terze parti nel cloud. Puoi sfogliare il catalogo AWS Data Exchange e trovare prodotti di dati rilevanti per la tua attività e sottoscrivi ai dati dai fornitori senza ulteriori elaborazioni e senza necessità di un processo ETL. Tieni presente che molti provider offrono abbonamenti iniziali gratuiti, che ti consentono di analizzare i loro dati senza dover prima sostenere costi anticipati.

Per questo caso d'uso, cerca e iscriviti ai seguenti set di dati in AWS Data Exchange:

20 anni di dati azionari di fine giornata per le prime 10 società statunitensi per capitalizzazione di mercato pubblicato da Vantaggio alfa. Questo set di dati gratuito contiene 20 anni di dati storici per i primi 10 titoli azionari statunitensi per capitalizzazione di mercato al 5 settembre 2020. Il set di dati contiene i seguenti 10 simboli: AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (Classe A); Facebook: Facebook, Inc.; GOOG: Alfabeto Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; e WMT: Walmart Inc.
I campi dati chiave includono
- Open: prezzo di apertura della giornata come negoziato
- Alto: prezzo alto come scambiato per il giorno
- Minimo: prezzo minimo della giornata
- Chiusura: prezzo di chiusura della giornata come negoziato
- Volume: volume degli scambi della giornata
- Chiusura rettificata: prezzo di chiusura del giorno frazionato e aggiustato per il dividendo
- Split Ratio: rapporto tra numero di azioni nuove e vecchie alla data di entrata in vigore
- Dividendo: importo del pagamento del dividendo in contanti
S3 Short Interest e dati finanziari su titoli pubblicato da partner S3. Questo set di dati contiene i seguenti campi:

Settore	Descrizione
Data di lavoro	Data di decorrenza della tariffa
ID di sicurezza	Gli identificatori di sicurezza contengono Sedol, ISIN, FIGI, Ticker, Bloomberg ID
Nome	Nome di sicurezza
Tariffa offerta	Commissioni di finanziamento composite di mercato pagate per posizioni corte esistenti
Tasso di offerta	Commissione di prestito composita di mercato guadagnata per azioni esistenti in prestito da detentori lunghi
Ultima tariffa	Commissione di prestito composita di mercato guadagnata per azioni incrementali prestate in quella data (tasso spot)
Affollamento	L'indicatore di momentum misura gli eventi giornalieri di shorting e copertura relativi al flottante del mercato
Breve interesse	Short interest in tempo reale espresso in numero di azioni
ShortInterestNozionale	ShortInterest * Prezzo (USD)
ShortInterestPct	Interessi short in tempo reale espressi in percentuale del flottante azionario
S3 Galleggiante	Il numero di azioni negoziabili, comprese le posizioni lunghe sintetiche create dalla vendita allo scoperto
S3SIPctFloat	Proiezione degli interessi short in tempo reale divisa per il float S3
Disponibilità indicativa	S3 quantità prestabile disponibile prevista
utilizzo	Interesse breve in tempo reale diviso per l'offerta totale prestabile
DaytoCover10Day	È una misura di liquidità = breve interesse / ADTV media di 10 giorni
DaytoCover30Day	È una misura di liquidità = breve interesse / ADTV media di 30 giorni
DaytoCover90Day	È una misura di liquidità = breve interesse / ADTV media di 90 giorni
SI originale	Point in time breve interesse

Per ottenere i dati, devi prima cercare il set di dati in AWS Data Exchange e iscriverti al set di dati:

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Una volta che l'editore dei set di dati avrà approvato le tue richieste di sottoscrizione, avrai i set di dati disponibili per il download nel tuo bucket S3:

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Seleziona Aggiungi la destinazione del lavoro di esportazione automatica, fornisci i dettagli del bucket S3 e scarica il set di dati:

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Ripeti i passaggi per ottenere il set di dati Alpha Vantage. Una volta completato, avrai entrambi i set di dati nel tuo bucket S3.

Ingegneria dei dati

Una volta che il set di dati è nei tuoi bucket S3, puoi utilizzare DataBrew di AWS Glue per trasformare i dati. AWS Glue DataBrew offre oltre 350 trasformazioni predefinite per automatizzare le attività di preparazione dei dati (come filtrare le anomalie, standardizzare i formati e correggere i valori non validi) che altrimenti richiederebbero giorni o settimane di scrittura di trasformazioni codificate a mano.

Per creare un set di dati curato consolidato per la previsione in AWS DataBrew, esegui i passaggi seguenti. Per informazioni dettagliate, fare riferimento a questo blog.

Crea i set di dati DataBrew.
Carica set di dati DataBrew nei progetti DataBrew.
Costruisci le ricette DataBrew.
Eseguire i processi DataBrew.

Crea set di dati DataBrew: In AWS Glue DataBrew, a dataset rappresenta i dati caricati dal bucket S3. Creeremo due set di dati DataBrew, sia per il prezzo delle azioni di fine giornata che per l'interesse allo scoperto S3. Quando crei il tuo set di dati, inserisci i dettagli della connessione S3 solo una volta. Da quel momento, DataBrew può accedere ai dati sottostanti per te.

Carica i set di dati DataBrew nei progetti DataBrew: In AWS Glue DataBrew, a progetto è il fulcro dei tuoi sforzi di analisi e trasformazione dei dati. Un progetto DataBrew riunisce i set di dati DataBrew e consente di sviluppare una trasformazione dei dati (ricetta DataBrew). Anche in questo caso, creeremo due progetti DataBrew, per il prezzo delle azioni di fine giornata e l'interesse allo scoperto S3.

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Costruisci le ricette DataBrew: In DataBrew, un file ricetta è un insieme di passaggi di trasformazione dei dati. Puoi applicare questi passaggi al tuo set di dati. Per il caso d'uso, costruiremo due trasformazioni. Il primo cambierà il formato della colonna timestamp del prezzo delle azioni di fine giornata in modo che il set di dati possa essere unito all'interesse breve S3:

La seconda trasformazione cura i dati e il suo ultimo passaggio garantisce che uniamo i set di dati in un unico set di dati curato. Per ulteriori dettagli sulla creazione di formule di trasformazione dei dati, fare riferimento a questo blog.

Job DataBrew: dopo la creazione delle ricette DataBrew, è possibile eseguire prima il processo DataBrew del prezzo delle azioni di fine giornata seguito dalla ricetta S3 short interest. Fare riferimento a questo blog per creare un singolo set di dati consolidato. Salva il set di dati curato finale in un bucket S3.

Il flusso di lavoro di ingegneria dei dati end-to-end sarà simile al seguente:

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

apprendimento automatico

Con il set di dati curato creato dopo l'ingegneria dei dati, puoi utilizzare Tela di Amazon SageMaker per creare il modello di previsione e analizzare l'impatto delle funzionalità sulla previsione. Tela di Amazon SageMaker fornisce agli utenti aziendali un'interfaccia visiva point-and-click che consente loro di creare modelli e generare previsioni ML accurate in autonomia, senza richiedere alcuna esperienza di ML o dover scrivere una singola riga di codice.

Per creare un modello di previsione delle serie temporali in Amazon SageMaker Canvas, segui i passaggi seguenti. Per informazioni dettagliate, fare riferimento a questo blog:

Seleziona il set di dati curato in SageMaker Canvas.
Crea il modello di previsione delle serie temporali.
Analizzare i risultati e l'importanza delle funzionalità.

Crea il modello di previsione delle serie temporali: dopo aver selezionato il set di dati, selezionare la colonna di destinazione da prevedere. Nel nostro caso, questo sarà il prezzo di chiusura del ticker di borsa. SageMaker Canvas rileva automaticamente che si tratta di una dichiarazione del problema di previsione di serie temporali.

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Dovrai configurare il modello come segue per la previsione delle serie temporali. Per l'ID articolo, seleziona il nome del titolo di borsa. Ricorda, il nostro set di dati ha i prezzi dei ticker di borsa per i primi 10 titoli. Seleziona la colonna timestamp per il timestamp e, infine, inserisci il numero di giorni che desideri prevedere in futuro [Forecast Horizon].

Ora sei pronto per costruire il modello. SageMaker Canvas offre due opzioni per costruire il modello: Quick Build e Standard Build. Nel nostro caso, useremo "Standard Build".

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Standard Build richiede circa tre ore per costruire il modello e gli usi Previsioni Amazon, un servizio di previsione di serie temporali basato su ML come motore di previsione sottostante. Forecast crea previsioni altamente accurate attraverso l'assemblaggio di modelli di modelli tradizionali e di deep learning senza richiedere esperienza di machine learning.

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Una volta creato il modello, è ora possibile esaminare le prestazioni del modello (precisione della previsione) e l'importanza delle funzionalità. Come si può vedere dalla figura seguente, il modello identifica Crowding e DaysToCover10Day come le due funzionalità principali che guidano i valori di previsione. Ciò è in linea con la nostra intuizione di mercato, poiché l'affollamento è un indicatore di momentum che misura gli eventi di shorting e copertura giornalieri e l'interesse a breve termine è una misura di liquidità, che indica come gli investitori sono posizionati in un titolo. Sia lo slancio che la liquidità possono guidare la volatilità dei prezzi.

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Questo risultato indica che queste due caratteristiche (o campi) hanno una stretta relazione con i movimenti dei prezzi delle azioni e possono avere una priorità più alta per l'onboarding e ulteriori analisi.

business intelligence

Nel contesto della previsione delle serie temporali, la nozione di backtesting si riferisce al processo di valutazione dell'accuratezza di un metodo di previsione utilizzando dati storici esistenti. Il processo è tipicamente iterativo e ripetuto su più date presenti nei dati storici.

Come abbiamo già discusso, SageMaker Canvas utilizza Amazon Forecast come motore per le previsioni di serie temporali. Forecast crea un backtest come parte del processo di creazione del modello. Ora puoi visualizzare i dettagli del predittore accedendo ad Amazon Forecast. Per una comprensione approfondita della spiegazione del modello, fare riferimento a questo blog.

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Amazon Forecast fornisce ulteriori dettagli sui parametri predittivi come l'errore percentuale assoluta ponderata (WAPE), l'errore quadratico medio (RMSE), l'errore percentuale assoluto medio (MAPE) e l'errore in scala assoluto medio (MASE). Puoi esportare i punteggi di qualità dei predittori da Amazon Forecast.

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Amazon Forecast esegue un backtest per il set di dati delle serie temporali fornito. I risultati del backtest sono disponibili per il download utilizzando il Esporta i risultati del backtest pulsante. I risultati dei backtest esportati vengono scaricati in un bucket S3.

Tracciamo ora i risultati del backtest in Amazon QuickSight. Per visualizzare i risultati del backtest in Amazon QuickSight, connettiti al set di dati in Amazon S3 da QuickSight e crea una visualizzazione.

Accelera il processo di investimento con i servizi AWS Low Code-No Code PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

ripulire

I servizi AWS sfruttati in questa soluzione sono gestiti e senza server. SageMaker Canvas è progettato per eseguire corsi di formazione ML di lunga durata e sarà sempre attivo. Assicurati di disconnetterti esplicitamente da SageMaker Canvas. Per favore riferisci a i documenti per ulteriori dettagli.

Conclusione

In questo post del blog, abbiamo discusso di come, in qualità di gestore patrimoniale istituzionale, puoi sfruttare i dati AWS low-code no-code (LCNC) e i servizi AI per accelerare la valutazione dei set di dati esterni scaricando lo screening iniziale del set di dati al personale non tecnico. Questa analisi di primo passaggio può essere eseguita rapidamente per aiutarti a decidere quali set di dati dovrebbero avere la priorità per l'onboarding e ulteriori analisi.

Abbiamo dimostrato passo dopo passo come un analista di dati può acquisire nuovi dati di terze parti tramite AWS Data Exchange, utilizzare i servizi ETL senza codice AWS Glue DataBrew per pre-elaborare i dati e valutare quali funzionalità in un set di dati hanno il maggiore impatto sulla previsione del modello .

Una volta che i dati sono pronti per l'analisi, un analista utilizza SageMaker Canvas per creare un modello predittivo, valutarne l'adattamento e identificare le caratteristiche significative. Nel nostro esempio, MAPE (.05) e WAPE (.045) del modello hanno indicato un buon adattamento e hanno mostrato "Crowding" e "DaysToCover10Day" come segnali nel set di dati con il maggiore impatto sulla previsione. Questa analisi ha quantificato quali dati hanno maggiormente influenzato il modello e potrebbero quindi essere prioritari per ulteriori indagini e potenziale inclusione nei segnali alfa o nel processo di gestione del rischio. E, cosa altrettanto importante, i punteggi di spiegabilità indicano quali dati svolgono un ruolo relativamente limitato nel determinare la previsione e quindi possono essere una priorità inferiore per ulteriori indagini.

Per valutare più rapidamente la capacità dei dati finanziari di terze parti di supportare il tuo processo di investimento, esamina il Fonti di dati sui servizi finanziari disponibili su AWS Data Exchange, e dare DataBrew ed Canvas una prova oggi.

Informazioni sugli autori

Boris Litvin è Principal Solution Architect, responsabile dell'innovazione nel settore dei servizi finanziari. È un ex fondatore di Quant e FinTech, appassionato di investimenti sistematici.

Meenakshisundaram Tandavarayan è uno specialista senior di AI/ML con AWS. Aiuta gli account strategici high-tech nel loro percorso di AI e ML. È molto appassionato di IA basata sui dati.

Camillo Anania è Senior Startup Solutions Architect presso AWS con sede nel Regno Unito. È un tecnologo appassionato che aiuta le startup di qualsiasi dimensione a costruire e crescere.

Dan Sinnreich è un Sr. Product Manager con AWS, focalizzato sul consentire alle aziende di prendere decisioni migliori con ML. In precedenza ha creato piattaforme di analisi di portafoglio e modelli di rischio multi-asset class per grandi investitori istituzionali.