Acelere el proceso de inversión con los servicios Low Code-No Code de AWS

Reeditado por Platón

seguidores: 0

Los últimos años han visto un cambio de paradigma tremendo en la forma en que los administradores de activos institucionales obtienen e integran múltiples fuentes de datos en su proceso de inversión. Con cambios frecuentes en las correlaciones de riesgo, fuentes inesperadas de volatilidad y una competencia cada vez mayor de las estrategias pasivas, los administradores de activos están empleando un conjunto más amplio de fuentes de datos de terceros para obtener una ventaja competitiva y mejorar los rendimientos ajustados al riesgo. Sin embargo, el proceso de extraer beneficios de múltiples fuentes de datos puede ser extremadamente desafiante. Los equipos de ingeniería de datos de los administradores de activos están sobrecargados con la adquisición y el preprocesamiento de datos, mientras que los equipos de ciencia de datos extraen datos para obtener información sobre inversiones.

Los datos de terceros o alternativos se refieren a los datos utilizados en el proceso de inversión, obtenidos fuera de los proveedores de datos de mercado tradicionales. Los inversores institucionales aumentan con frecuencia sus fuentes de datos tradicionales con datos alternativos o de terceros para obtener una ventaja en su proceso de inversión. Los ejemplos que se suelen citar incluyen, entre otros, imágenes satelitales, datos de tarjetas de crédito y sentimiento en las redes sociales. Los gestores de fondos invierten casi 3 millones de dólares al año en conjuntos de datos externos, y el gasto anual crece entre un 20 y un 30 por ciento.

Con el crecimiento exponencial de conjuntos de datos alternativos y de terceros disponibles, la capacidad de analizar rápidamente si un nuevo conjunto de datos agrega nuevos conocimientos de inversión es un diferenciador competitivo en la industria de gestión de inversiones. Los servicios de IA y datos sin código y código bajo (LCNC) de AWS permiten que los equipos no técnicos realicen la evaluación inicial de datos, prioricen la incorporación de datos, aceleren el tiempo de obtención de conocimientos y liberen valiosos recursos técnicos, lo que crea una ventaja competitiva duradera.

En esta publicación de blog, analizamos cómo, como administrador de activos institucionales, puede aprovechar los datos de LCNC de AWS y los servicios de IA para escalar el proceso inicial de priorización y análisis de datos más allá de los equipos técnicos y acelerar su toma de decisiones. Con los servicios LCNC de AWS, puede suscribirse y evaluar rápidamente diversos conjuntos de datos de terceros, preprocesar datos y verificar su poder predictivo mediante modelos de aprendizaje automático (ML) sin escribir una sola pieza de código.

Resumen de la solución

Nuestro caso de uso es analizar el poder predictivo del precio de las acciones de un conjunto de datos externo e identificar la importancia de sus características: qué campos afectan más el rendimiento del precio de las acciones. Esto sirve como una prueba de primer paso para identificar cuál de los múltiples campos en un conjunto de datos debe evaluarse más de cerca utilizando metodologías cuantitativas tradicionales para adaptarse a su proceso de inversión. Los analistas pueden realizar rápidamente este tipo de prueba de primer paso, lo que ahorra tiempo y le permite priorizar más rápidamente la incorporación de conjuntos de datos. Además, mientras usamos el precio de las acciones como nuestro ejemplo objetivo, también podrían usarse otras métricas como la rentabilidad, los índices de valoración o los volúmenes de negociación. Todos los conjuntos de datos utilizados para este caso de uso se publican en Intercambio de datos de AWS.

El siguiente diagrama explica la arquitectura integral y los servicios LCNC de AWS utilizados para impulsar las decisiones:

Nuestra solución consta de los siguientes pasos y soluciones:

Ingestión de datos: AWS Data Exchange para suscribirse a los conjuntos de datos alternativos publicados y descargarlos en Servicio de almacenamiento simple de Amazon (Amazon S3) cubo.
Ingeniería de datos: Elaboración de datos de AWS Glue para ingeniería de datos y transformación de los datos almacenados en Amazon S3.
Aprendizaje automático: Lienzo de Amazon SageMaker para construir un modelo de pronóstico de series temporales para predecir e identificar el impacto de los datos en el pronóstico.
Inteligencia de negocios: Amazon QuickSight o Amazon SageMaker Canvas para revisar la importancia de las características para el pronóstico para la toma de decisiones.

Ingestión de datos

Intercambio de datos de AWS facilita la búsqueda, la suscripción y el uso de datos de terceros en la nube. Puede navegar por el catálogo de AWS Data Exchange y encontrar productos de datos que sean relevantes para su negocio y Suscríbase a los datos de los proveedores sin más procesamiento y sin necesidad de un proceso ETL. Tenga en cuenta que muchos proveedores ofrecen suscripciones iniciales gratuitas, que le permiten analizar sus datos sin tener que incurrir en costos iniciales.

Para este caso de uso, busque y suscríbase a los siguientes conjuntos de datos en AWS Data Exchange:

20 años de datos de existencias al final del día para las 10 principales empresas de EE. UU. por capitalización de mercado publicado por Alpha Vantage. Este conjunto de datos gratuito contiene 20 años de datos históricos para las 10 principales acciones de EE. UU. por capitalización de mercado al 5 de septiembre de 2020. El conjunto de datos contiene los siguientes 10 símbolos: AAPL: Apple Inc.; AMZN: Amazon.com, Inc.; BRK-A: Berkshire Hathaway Inc. (Clase A); Facebook: Facebook, Inc.; GOOG: Alfabeto Inc.; JNJ: Johnson & Johnson; MA: Mastercard Incorporated; MSFT: Microsoft Corporation V: Visa Inc.; y WMT: Walmart Inc.
Los campos de datos clave incluyen
- Apertura: precio de apertura de cotización del día
- Alto: precio alto de cotización para el día
- Bajo: precio bajo de negociación del día
- Cierre: precio de cierre como cotizado para el día
- Volumen: volumen de operaciones del día
- Cierre ajustado: precio de cierre del día ajustado por división y dividendo
- Ratio de división: relación entre el número de acciones nuevas y las antiguas en la fecha de entrada en vigor
- Dividendo: monto de pago de dividendos en efectivo
S3 Interés corto y datos de financiación de valores publicado por socios de S3. Este conjunto de datos contiene los siguientes campos:

Campo	Descripción
Fecha comercial	Fecha de vigencia de la tasa
ID de seguridad	Los identificadores de seguridad contienen Sedol, ISIN, FIGI, Ticker, Bloomberg ID
Nombre	Nombre de seguridad
Tarifa de oferta	Comisión de financiación compuesta de mercado pagada por posiciones cortas existentes
Tasa de puja	Comisión de préstamo compuesta de mercado ganada por acciones existentes en préstamo por tenedores largos
Última tarifa	Comisión de préstamo compuesta de mercado ganada por acciones incrementales prestadas en esa fecha (tasa al contado)
Apiñamiento	El indicador de impulso mide eventos diarios de cobertura y de posiciones cortas en relación con la flotación del mercado.
Interés corto	Interés corto en tiempo real expresado en número de acciones
ShortInterestNocional	Interés Corto * Precio (USD)
% de interés corto	Interés a corto plazo en tiempo real expresado como porcentaje del capital flotante
S3Flotar	El número de acciones negociables, incluidos los largos sintéticos creados por la venta en corto.
S3SIPctFlotante	Proyección de interés corto en tiempo real dividida por el flotador S3
IndicativoDisponibilidad	Cantidad prestable disponible proyectada de S3
Utilización	Interés a corto plazo en tiempo real dividido por la oferta prestable total
DaystoCover10Day	Es una medida de liquidez = interés corto / ADTV promedio de 10 días
DaystoCover30Day	Es una medida de liquidez = interés corto / ADTV promedio de 30 días
DaystoCover90Day	Es una medida de liquidez = interés corto / ADTV promedio de 90 días
SI original	Punto en el tiempo de interés corto

Para obtener los datos, primero buscará el conjunto de datos en AWS Data Exchange y se suscribirá al conjunto de datos:

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Una vez que el editor de los conjuntos de datos apruebe sus solicitudes de suscripción, tendrá los conjuntos de datos disponibles para que los descargue en su depósito S3:

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Seleccione Agregar destino de trabajo de exportación automática, proporcione los detalles del depósito S3 y descargue el conjunto de datos:

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Repita los pasos para obtener el conjunto de datos Alpha Vantage. Una vez completado, tendrá ambos conjuntos de datos en su depósito S3.

Ingeniería de datos

Una vez que el conjunto de datos está en sus cubos S3, puede usar Elaboración de datos de AWS Glue para transformar los datos. AWS Glue DataBrew ofrece más de 350 transformaciones prediseñadas para automatizar las tareas de preparación de datos (como el filtrado de anomalías, la estandarización de formatos y la corrección de valores no válidos) que, de lo contrario, requerirían días o semanas para escribir transformaciones codificadas a mano.

Para crear un conjunto de datos curado consolidado para realizar pronósticos en AWS DataBrew, realice los pasos a continuación. Para obtener información detallada, consulte este blog.

Cree los conjuntos de datos de DataBrew.
Cargue conjuntos de datos de DataBrew en proyectos de DataBrew.
Cree las recetas de DataBrew.
Ejecute los trabajos de DataBrew.

Crear conjuntos de datos de DataBrew: En AWS Glue DataBrew, un datos representa los datos que se cargan desde el depósito S3. Crearemos dos conjuntos de datos de DataBrew, tanto para el precio de las acciones al final del día como para el interés corto de S3. Cuando crea su conjunto de datos, ingresa los detalles de la conexión S3 solo una vez. A partir de ese momento, DataBrew puede acceder a los datos subyacentes por usted.

Cargue los conjuntos de datos de DataBrew en proyectos de DataBrew: En AWS Glue DataBrew, un proyecto es la pieza central de sus esfuerzos de transformación y análisis de datos. Un proyecto de DataBrew reúne los conjuntos de datos de DataBrew y le permite desarrollar una transformación de datos (receta de DataBrew). Nuevamente, crearemos dos proyectos DataBrew, para el precio de las acciones al final del día y el interés corto de S3.

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Cree las recetas de DataBrew: En DataBrew, un recetas es un conjunto de pasos de transformación de datos. Puede aplicar estos pasos a su conjunto de datos. Para el caso de uso, construiremos dos transformaciones. El primero cambiará el formato de la columna de marca de tiempo del precio de las acciones al final del día para que el conjunto de datos se pueda unir al interés corto de S3:

La segunda transformación selecciona los datos y su último paso garantiza que unimos los conjuntos de datos en un único conjunto de datos seleccionados. Para obtener más detalles sobre la creación de recetas de transformación de datos, consulte este blog.

Empleos de DataBrew: Después de la creación de las recetas de DataBrew, puede ejecutar primero el trabajo de DataBrew del precio de las acciones al final del día, seguido de la receta de interés corto de S3. Consulte esto blog para crear un único conjunto de datos consolidado. Guarde el conjunto de datos curado final en un depósito S3.

El flujo de trabajo de ingeniería de datos de extremo a extremo se verá así:

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Aprendizaje automático

Con el conjunto de datos curado creado después de la ingeniería de datos, puede usar Lienzo de Amazon SageMaker para construir su modelo de pronóstico y analizar el impacto de las características en el pronóstico. Lienzo de Amazon SageMaker proporciona a los usuarios comerciales una interfaz visual de apuntar y hacer clic que les permite crear modelos y generar predicciones precisas de ML por su cuenta, sin necesidad de experiencia en ML ni tener que escribir una sola línea de código.

Para crear un modelo de previsión de series temporales en Amazon SageMaker Canvas, siga los pasos que se indican a continuación. Para obtener información detallada, consulte este blog:

Seleccione el conjunto de datos seleccionado en SageMaker Canvas.
Cree el modelo de pronóstico de series de tiempo.
Analizar los resultados y la importancia de las características.

Cree el modelo de pronóstico de series temporales: una vez que haya seleccionado el conjunto de datos, seleccione la columna de destino que desea predecir. En nuestro caso, este será el precio de cierre del ticker de acciones. SageMaker Canvas detecta automáticamente que se trata de una declaración de problema de previsión de series temporales.

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Tendrá que configurar el modelo de la siguiente manera para la previsión de series temporales. Para el ID del artículo, seleccione el nombre del tablero de cotizaciones. Recuerde, nuestro conjunto de datos tiene cotizaciones bursátiles para las 10 principales acciones. Seleccione la columna de marca de tiempo para la marca de tiempo y, finalmente, ingrese la cantidad de días que desea pronosticar en el futuro [Forecast Horizon].

Ahora está listo para construir el modelo. SageMaker Canvas ofrece dos opciones para crear el modelo: Creación rápida y Creación estándar. En nuestro caso, usaremos "Edición estándar".

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

La construcción estándar tarda aproximadamente tres horas en construir el modelo y utiliza Pronóstico del Amazonas, un servicio de pronóstico de series temporales basado en ML como motor de pronóstico subyacente. Forecast crea pronósticos altamente precisos a través del ensamblaje de modelos de modelos tradicionales y de aprendizaje profundo sin necesidad de experiencia en ML.

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Una vez que se crea el modelo, ahora puede revisar el rendimiento del modelo (precisión de predicción) y la importancia de las características. Como se puede ver en la figura a continuación, el modelo identifica la aglomeración y DaysToCover10Day como las dos características principales que impulsan los valores de pronóstico. Esto está en consonancia con nuestra intuición del mercado, ya que el hacinamiento es un indicador de impulso que mide eventos diarios de cobertura y cortos, y el interés corto a corto plazo es una medida de liquidez, que indica cómo se posicionan los inversionistas en una acción. Tanto el impulso como la liquidez pueden impulsar la volatilidad de los precios.

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Este resultado indica que estas dos características (o campos) tienen una estrecha relación con los movimientos del precio de las acciones y se les puede dar mayor prioridad para la incorporación y el análisis posterior.

Inteligencia de Negocio

En el contexto del pronóstico de series de tiempo, la noción de backtesting se refiere al proceso de evaluar la precisión de un método de pronóstico utilizando datos históricos existentes. El proceso suele ser iterativo y se repite en varias fechas presentes en los datos históricos.

Como ya comentamos, SageMaker Canvas utiliza Amazon Forecast como motor para la previsión de series temporales. Forecast crea un backtest como parte del proceso de construcción del modelo. Ahora puede ver los detalles del predictor iniciando sesión en Amazon Forecast. Para una comprensión más profunda de la explicación del modelo, consulte este blog.

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Amazon Forecast proporciona detalles adicionales sobre las métricas de predicción, como el error porcentual absoluto ponderado (WAPE), el error cuadrático medio (RMSE), el error porcentual absoluto medio (MAPE) y el error escalado absoluto medio (MASE). Puede exportar puntajes de calidad del predictor desde Amazon Forecast.

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Amazon Forecast ejecuta una prueba retrospectiva para el conjunto de datos de serie temporal proporcionado. Los resultados del backtest están disponibles para su descarga mediante el Exportar resultados de backtest botón. Los resultados de backtest exportados se descargan a un depósito S3.

Ahora trazaremos los resultados del backtest en Amazon QuickSight. Para visualizar los resultados del backtest en Amazon QuickSight, conéctese al conjunto de datos en Amazon S3 desde QuickSight y cree una visualización.

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Limpiar

Los servicios de AWS aprovechados en esta solución son de naturaleza administrada y sin servidor. SageMaker Canvas está diseñado para ejecutar entrenamientos de aprendizaje automático de larga duración y siempre estará activo. Asegúrese de cerrar sesión explícitamente en SageMaker Canvas. Por favor refiérase a los docs para más información.

Conclusión

En esta publicación de blog, discutimos cómo, como administrador de activos institucionales, puede aprovechar los servicios de inteligencia artificial y los datos de bajo código sin código (LCNC) de AWS para acelerar la evaluación de conjuntos de datos externos al descargar la evaluación inicial del conjunto de datos al personal no técnico. Este análisis de primer paso se puede realizar rápidamente para ayudarlo a decidir qué conjuntos de datos se deben priorizar para la incorporación y el análisis posterior.

Demostramos paso a paso cómo un analista de datos puede adquirir nuevos datos de terceros a través de AWS Data Exchange, usar los servicios ETL sin código de AWS Glue DataBrew para preprocesar datos y evaluar qué características de un conjunto de datos tienen el mayor impacto en el pronóstico del modelo. .

Una vez que los datos están listos para el análisis, un analista utiliza SageMaker Canvas para crear un modelo predictivo, evaluar su ajuste e identificar características significativas. En nuestro ejemplo, MAPE (.05) y WAPE (.045) del modelo indicaron un buen ajuste y mostraron "Hacinamiento" y "DaysToCover10Day" como las señales en el conjunto de datos con el mayor impacto sobre el pronóstico. Este análisis cuantificó qué datos influyeron más en el modelo y, por lo tanto, podrían priorizarse para una mayor investigación y posible inclusión en sus señales alfa o proceso de gestión de riesgos. Y lo que es igualmente importante, los puntajes de explicabilidad indican qué datos juegan un papel relativamente pequeño en la determinación del pronóstico y, por lo tanto, pueden tener una prioridad menor para una mayor investigación.

Para evaluar más rápidamente la capacidad de los datos financieros de terceros para respaldar su proceso de inversión, revise el Fuentes de datos de servicios financieros disponibles en AWS Data Exchange, y dar elaboración de datos y Canvas un intento hoy.

Acerca de los autores

Boris Litvin es Principal Solution Architect, responsable de la innovación en la industria de servicios financieros. Es un ex fundador de Quant y FinTech, apasionado por la inversión sistemática.

Meenakshisundaram Thandavarayan es un especialista sénior en IA/ML de AWS. Ayuda a las cuentas estratégicas de alta tecnología en su viaje de IA y ML. Es un apasionado de la IA basada en datos.

camilo anania es Arquitecto sénior de soluciones para empresas emergentes de AWS con sede en el Reino Unido. Es un tecnólogo apasionado que ayuda a las empresas emergentes de cualquier tamaño a construir y crecer.

dan sinnreich es gerente sénior de productos con AWS, enfocado en capacitar a las empresas para que tomen mejores decisiones con ML. Anteriormente, creó plataformas de análisis de carteras y modelos de riesgo de clases de múltiples activos para grandes inversores institucionales.

Sello de tiempo: 20 de diciembre de 202223 de diciembre de 2022

Sello de tiempo: 28 de septiembre de 2022

Acelere el proceso de inversión con los servicios de AWS Low Code-No Code

Reeditado por Platón

Resumen de la solución

Ingestión de datos

Ingeniería de datos

Aprendizaje automático

Inteligencia de Negocio

Limpiar

Conclusión

Acerca de los autores

Mas de Aprendizaje automático de AWS

Cree resúmenes de grabaciones utilizando IA generativa con Amazon Bedrock y Amazon Transcribe | Servicios web de Amazon

Reduzca los costos y el tiempo de desarrollo con el modo local de Amazon SageMaker Pipelines

Protección de datos fundamental para la aceleración de LLM empresarial con Protopia AI | Servicios web de Amazon

Parte 3: cómo NatWest Group creó modelos de aprendizaje automático auditables, reproducibles y explicables con Amazon SageMaker

AlexaTM 20B ya está disponible en Amazon SageMaker JumpStart

Cómo Prodege ahorró $ 1.5 millones en costos anuales de revisión humana utilizando IA de visión por computadora de código bajo

Realice un seguimiento de sus experimentos de ML de principio a fin con Data Version Control y Amazon SageMaker Experiments

Recomendación de poder y búsqueda usando un gráfico de conocimiento de IMDb – Parte 1

Cree un agente virtual impulsado por IA para Genesys Cloud utilizando QnABot y Amazon Lex

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta