Con una multitud de artículos, videos, grabaciones de audio y otros medios creados diariamente en las empresas de medios de noticias, los lectores de todo tipo (consumidores individuales, suscriptores corporativos y más) a menudo tienen dificultades para encontrar el contenido de noticias que sea más relevante para ellos. Ofrecer noticias y experiencias personalizadas a los lectores puede ayudar a resolver este problema y crear experiencias más atractivas. Sin embargo, ofrecer recomendaciones verdaderamente personalizadas presenta varios desafíos clave:
- Captar diversos intereses de los usuarios – Las noticias pueden abarcar muchos temas e incluso dentro de temas específicos, los lectores pueden tener intereses variados.
- Abordar el historial de lectura limitado – Muchos lectores de noticias tienen escasos historiales de actividad. Los recomendadores deben aprender rápidamente las preferencias a partir de datos limitados para proporcionar valor.
- Oportunidad y tendencias – Los ciclos de noticias diarios implican que las recomendaciones deben equilibrar el contenido personalizado con el descubrimiento de historias nuevas y populares.
- Intereses cambiantes – Los intereses de los lectores pueden evolucionar con el tiempo. Los sistemas deben detectar cambios y adaptar las recomendaciones en consecuencia.
- Explicabilidad – Proporcionar transparencia sobre por qué se recomiendan determinadas historias genera confianza en el usuario. El sistema de recomendación de noticias ideal comprende al individuo y responde al clima y a la audiencia de noticias más amplios. Abordar estos desafíos es clave para conectar de manera efectiva a los lectores con contenido que les resulte informativo y atractivo.
En este post, describimos cómo Amazon Personalize puede impulsar una aplicación de recomendación de noticias escalable. Esta solución se implementó en un cliente de medios de Fortune 500 en el primer semestre de 1 y puede reutilizarse para otros clientes interesados en crear recomendadores de noticias.
Resumen de la solución
Amazon Personalize es ideal para impulsar un motor de recomendación de noticias debido a su capacidad para proporcionar recomendaciones personalizadas en tiempo real y por lotes a escala. Amazon Personalize ofrece una variedad de recetas de recomendación (algoritmos), como las recetas de Personalización del usuario y Trending Now, que son particularmente adecuadas para entrenar modelos de recomendación de noticias. La receta de Personalización del usuario analiza las preferencias de cada usuario en función de su interacción con el contenido a lo largo del tiempo. Esto da como resultado fuentes de noticias personalizadas que muestran los temas y fuentes más relevantes para un usuario individual. La receta Trending Now complementa esto al detectar tendencias crecientes y noticias populares en tiempo real entre todos los usuarios. La combinación de recomendaciones de ambas recetas permite que el motor de recomendaciones equilibre la personalización con el descubrimiento de historias oportunas y de alto interés.
El siguiente diagrama ilustra la arquitectura de una aplicación de recomendación de noticias impulsada por Amazon Personalize y compatible con los servicios de AWS.
Esta solución tiene las siguientes limitaciones:
- Proporcionar recomendaciones personalizadas para artículos recién publicados (artículos publicados hace unos minutos) puede resultar un desafío. Describimos cómo mitigar esta limitación más adelante en esta publicación.
- Amazon Personalize tiene una cantidad fija de interacciones y características de conjunto de datos de elementos que se pueden utilizar para entrenar un modelo.
- Al momento de escribir este artículo, Amazon Personalize no proporciona explicaciones de recomendaciones a nivel de usuario.
Repasemos cada uno de los componentes principales de la solución.
Requisitos previos
Para implementar esta solución, necesita lo siguiente:
- Datos de clics de usuario históricos y en tiempo real para el
interactions
datos - Metadatos de artículos de noticias históricos y en tiempo real para el
items
datos
Ingerir y preparar los datos.
Para entrenar un modelo en Amazon Personalize, debe proporcionar datos de entrenamiento. En esta solución, utiliza dos tipos de conjuntos de datos de entrenamiento de Amazon Personalize: el conjunto de datos de interacciones y conjunto de datos de elementos. interactions
conjunto de datos contiene datos sobre las interacciones usuario-elemento-marca de tiempo, y el items
El conjunto de datos contiene características de los artículos recomendados.
Puede adoptar dos enfoques diferentes para ingerir datos de entrenamiento:
- Ingestión de lotes - Puedes usar Pegamento AWS para transformar e ingerir interacciones y datos de elementos que residen en un Servicio de almacenamiento simple de Amazon (Amazon S3) en conjuntos de datos de Amazon Personalize. AWS Glue realiza operaciones de extracción, transformación y carga (ETL) para alinear los datos con el esquema de conjuntos de datos de Amazon Personalize. Cuando se completa el proceso ETL, el archivo de salida se vuelve a colocar en Amazon S3, listo para ser ingerido en Amazon Personalize a través de un trabajo de importación de conjunto de datos.
- Ingestión en tiempo real - Puedes usar Secuencias de datos de Amazon Kinesis y AWS Lambda para ingerir datos en tiempo real de forma incremental. Una función Lambda realiza las mismas operaciones de transformación de datos que el trabajo de ingesta por lotes a nivel de registro individual e ingiere los datos en Amazon Personalize mediante el Poner eventos y Poner artículos APIs
En esta solución, también puede ingerir ciertos elementos y atributos de datos de interacciones en Amazon DynamoDB. Puede utilizar estos atributos durante la inferencia en tiempo real para filtrar recomendaciones por reglas comerciales. Por ejemplo, los metadatos del artículo pueden contener nombres de empresas e industrias en el artículo. Para recomendar de forma proactiva artículos sobre empresas o industrias sobre las que los usuarios están leyendo, puede registrar la frecuencia con la que los lectores interactúan con artículos sobre empresas e industrias específicas y utilizar estos datos con Amazon Personaliza filtros para adaptar aún más el contenido recomendado. Analizaremos más sobre cómo usar atributos de datos de elementos e interacciones en DynamoDB más adelante en esta publicación.
El siguiente diagrama ilustra la arquitectura de ingesta de datos.
Entrenar a la modelo
La mayor parte del esfuerzo de capacitación del modelo debe centrarse en el modelo de personalización del usuario, porque puede utilizar los tres conjuntos de datos de Amazon Personalize (mientras que el modelo Trending Now solo utiliza el interactions
conjunto de datos). Recomendamos realizar experimentos que varíen sistemáticamente diferentes aspectos del proceso de capacitación. Para el cliente que implementó esta solución, el equipo realizó más de 30 experimentos. Esto incluyó la modificación del interactions
y items
características del conjunto de datos, ajustando la duración del historial de interacciones proporcionado al modelo, ajustando los hiperparámetros de Amazon Personalize y evaluando si el conjunto de datos de un usuario explícito mejoró el rendimiento fuera de línea (en relación con el aumento en el tiempo de entrenamiento).
Cada variación del modelo se evaluó en función de las métricas informadas por Amazon Personalize en los datos de entrenamiento, así como en métricas personalizadas fuera de línea en un conjunto de datos de prueba reservados. Las métricas estándar a considerar incluyen precisión promedio promedio (MAP) @ K (donde K es el número de recomendaciones presentadas a un lector), ganancia acumulada descontada normalizada, rango recíproco medio y cobertura. Para obtener más información sobre estas métricas, consulte Evaluación de una versión de solución con métricas. Recomendamos priorizar MAP @ K de estas métricas, que captura la cantidad promedio de artículos en los que un lector hizo clic entre los K artículos principales que les recomendaron, porque la métrica MAP es un buen indicador de las tasas de clics de artículos (reales). K debe seleccionarse en función de la cantidad de artículos que un lector puede ver en una página web de escritorio o móvil sin tener que desplazarse, lo que le permite evaluar la efectividad de las recomendaciones con un mínimo esfuerzo del lector. La implementación de métricas personalizadas, como la unicidad de la recomendación (que describe qué tan único fue el resultado de la recomendación entre el grupo de usuarios candidatos), también puede proporcionar información sobre la efectividad de la recomendación.
Con Amazon Personalize, el proceso experimental le permite determinar el conjunto óptimo de características del conjunto de datos tanto para el modelo de personalización del usuario como para el de tendencias actuales. El modelo Trending Now existe dentro del mismo Amazon Personalize grupo de conjunto de datos como el modelo de personalización del usuario, por lo que utiliza el mismo conjunto de interactions
características del conjunto de datos.
Genera recomendaciones en tiempo real
Cuando un lector visita la página web de una empresa de noticias, se realizará una llamada API al recomendador de noticias a través de Puerta de enlace API de Amazon. Esto activa una función Lambda que llama a los puntos finales de los modelos de Amazon Personalize para obtener recomendaciones en tiempo real. Durante la inferencia, puedes usar filtros para filtrar el resultado de la recomendación inicial según los atributos de interacción del artículo o del lector. Por ejemplo, si "Tema de noticias" (como deportes, estilo de vida o política) es un atributo de artículo, puede restringir las recomendaciones a temas de noticias específicos si ese es un requisito del producto. De manera similar, puede utilizar filtros en eventos de interacción con el lector, como excluir artículos que un lector ya haya leído.
Un desafío clave con las recomendaciones en tiempo real es incluir de manera efectiva artículos recién publicados (también llamados elementos fríos) en el resultado de la recomendación. Los artículos recién publicados no tienen datos de interacción históricos en los que normalmente se basan los recomendadores, y los sistemas de recomendación necesitan suficiente tiempo de procesamiento para evaluar qué tan relevantes son los artículos recién publicados para un usuario específico (incluso si solo usan señales de relación usuario-elemento).
Amazon Personalize puede detectar y recomendar automáticamente de forma nativa nuevos artículos incorporados en el items
conjunto de datos cada 2 horas. Sin embargo, debido a que este caso de uso se centra en recomendaciones de noticias, necesita una forma de recomendar nuevos artículos tan pronto como se publiquen y estén listos para el consumo de los lectores.
Una forma de resolver este problema es diseñar un mecanismo para insertar aleatoriamente artículos recién publicados en la recomendación final para cada lector. Puede agregar una función para controlar qué porcentaje de artículos en el conjunto de recomendaciones final eran artículos recién publicados y, de manera similar al resultado de recomendación original de Amazon Personalize, puede filtrar artículos recién publicados por atributos del artículo (como "Tema de noticias"). ) si es un requisito del producto. Puede realizar un seguimiento de las interacciones en artículos recién publicados en DynamoDB a medida que comienzan a llegar al sistema, y priorizar los artículos recién publicados más populares durante el posprocesamiento de recomendaciones, hasta que los modelos de Amazon Personalize detecten y procesen los artículos recién publicados.
Una vez que tenga el conjunto final de artículos recomendados, este resultado se envía a otra función Lambda de posprocesamiento que verifica el resultado para ver si se alinea con las reglas comerciales preespecificadas. Estos pueden incluir comprobar si los artículos recomendados cumplen con las especificaciones de diseño de la página web, si las recomendaciones se ofrecen en la interfaz de un navegador web, por ejemplo. Si es necesario, los artículos se pueden reclasificar para garantizar que se cumplan las reglas comerciales. Recomendamos reclasificar implementando una función que permita que los artículos con una clasificación más alta solo bajen de clasificación un lugar a la vez hasta que se cumplan todas las reglas comerciales, lo que proporciona una pérdida mínima de relevancia para los lectores. La lista final de artículos posprocesados se devuelve al servicio web que inició la solicitud de recomendaciones.
El siguiente diagrama ilustra la arquitectura de este paso de la solución.
Generar recomendaciones por lotes
Los paneles de noticias personalizados (a través de recomendaciones en tiempo real) requieren que el lector busque noticias activamente, pero en nuestras ocupadas vidas actuales, a veces es más fácil recibir las noticias más importantes. Para entregar artículos de noticias personalizados como un resumen por correo electrónico, puede utilizar un Funciones de paso de AWS flujo de trabajo para generar recomendaciones por lotes. El flujo de trabajo de recomendación por lotes recopila y posprocesa recomendaciones de nuestro modelo de personalización del usuario o de los puntos finales del modelo Trending Now, lo que brinda flexibilidad para seleccionar qué combinación de artículos personalizados y de tendencia los equipos desean enviar a sus lectores. Los desarrolladores también tienen la opción de utilizar Amazon Personalize inferencia por lotes característica; sin embargo, al momento de escribir este artículo, la creación de un trabajo de inferencia por lotes de Amazon Personalize no admite la inclusión de elementos ingeridos después de que se haya entrenado un modelo personalizado de Amazon Personalize y no admite la receta Trending Now.
Durante un flujo de trabajo de Step Functions de inferencia por lotes, la lista de lectores se divide en lotes, se procesa en paralelo y se envía a una capa de posprocesamiento y validación antes de enviarse al servicio de generación de correo electrónico. El siguiente diagrama ilustra este flujo de trabajo.
Escalar el sistema de recomendación
Para escalar de manera efectiva, también necesita que el recomendador de noticias se adapte a un número cada vez mayor de usuarios y un mayor tráfico sin degradar la experiencia del lector. Puntos de enlace del modelo Amazon Personalize de forma nativa auto escala para hacer frente al aumento del tráfico. Los ingenieros solo necesitan configurar y monitorear una variable de transacciones por segundo (TPS) aprovisionadas mínimas para cada punto final de Amazon Personalize.
Más allá de Amazon Personalize, la aplicación de recomendación de noticias que se presenta aquí se creó utilizando servicios de AWS sin servidor, lo que permite a los equipos de ingeniería concentrarse en brindar la mejor experiencia de lectura sin preocuparse por el mantenimiento de la infraestructura.
Conclusión
En esta economía de la atención, se ha vuelto cada vez más importante ofrecer contenido relevante y oportuno a los consumidores. En esta publicación, analizamos cómo puede utilizar Amazon Personalize para crear un recomendador de noticias escalable y las estrategias que las organizaciones pueden implementar para abordar los desafíos únicos de entregar recomendaciones de noticias.
Para obtener más información sobre Amazon Personalize y cómo puede ayudar a su organización a crear sistemas de recomendación, consulte el Guía para desarrolladores de Amazon Personalize.
Edificio feliz!
Acerca de los autores
Bala Krishna Moorthy es científico de datos sénior en AWS Professional Services, donde ayuda a los clientes a crear e implementar soluciones impulsadas por IA para resolver sus desafíos comerciales. Ha trabajado con clientes de diversos sectores, incluidos medios y entretenimiento, servicios financieros, atención médica y tecnología. En su tiempo libre, le gusta pasar tiempo con familiares y amigos, mantenerse activo, probar nuevos restaurantes, viajar y comenzar el día con una taza de café humeante.
Rishi Jala es un arquitecto de datos NoSQL con servicios profesionales de AWS. Se centra en diseñar y crear aplicaciones altamente escalables utilizando bases de datos NoSQL como Amazon DynamoDB. Apasionado por resolver los problemas de los clientes, ofrece soluciones personalizadas para impulsar el éxito en el panorama digital.
- Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
- PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
- PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
- PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
- PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
- Fuente: https://aws.amazon.com/blogs/machine-learning/build-a-news-recommender-application-with-amazon-personalize/
- :posee
- :es
- :dónde
- 100
- 2023
- 30
- 500
- 7
- 98
- a
- capacidad
- Nuestra Empresa
- acomodar
- en consecuencia
- a través de
- lector activo
- activamente
- actividad
- adaptar
- add
- dirección
- el ajuste
- Después
- .
- Alimentado por IA
- algoritmos
- alinear
- Alinea
- Todos
- Permitir
- permite
- ya haya utilizado
- también
- Amazon
- Amazon Personalize
- Amazon Web Services
- an
- análisis
- y
- Otra
- cualquier
- abejas
- API
- Aplicación
- aplicaciones
- enfoques
- arquitectura
- somos
- artículo
- AS
- aspectos
- evaluar
- At
- atributos
- las ventas
- audio
- auto
- promedio
- AWS
- Pegamento AWS
- Servicios profesionales de AWS
- Atrás
- Balance
- basado
- BE
- porque
- a las que has recomendado
- esto
- antes
- "Ser"
- MEJOR
- ambas
- más amplio
- cada navegador
- build
- Construir la
- construye
- construido
- ocupado
- pero
- by
- llamar al
- , que son
- Calls
- PUEDEN
- candidato
- capturas
- case
- a ciertos
- Reto
- retos
- desafiante
- comprobar
- comprobación
- Cheques
- clic
- Clima
- CAFÉ
- frío
- combinación
- combinar
- Empresas
- compañía
- De la empresa
- completar
- componentes
- Conectándote
- Considerar
- Clientes
- consumo
- que no contengo
- contiene
- contenido
- control
- Sector empresarial
- cobertura
- Para crear
- creado
- Creamos
- Vaso
- personalizado
- cliente
- Clientes
- se adaptan
- de ciclos
- todos los días
- Noticias diarias
- de los tableros
- datos
- científico de datos
- bases de datos
- conjuntos de datos
- día
- entregamos
- entregar
- entrega
- desplegar
- describir
- describe
- diseño
- computadora de escritorio
- detectar
- detectado
- Determinar
- Developer
- desarrolladores
- diagrama
- una experiencia diferente
- difícil
- Digest
- digital
- descuento
- descubrimiento
- discutir
- discutido
- diverso
- dividido
- No
- No
- DE INSCRIPCIÓN
- el lado de la transmisión
- durante
- cada una
- más fácil
- economia
- de manera eficaz
- eficacia
- esfuerzo
- Punto final
- de su negocio.
- interactuando
- Motor
- Ingeniería
- certificados
- garantizar
- Entretenimiento
- evaluar
- evaluado
- evaluación
- Incluso
- Eventos
- Cada
- evoluciona
- ejemplo
- excluyendo
- existe
- experience
- Experiencias
- experimental
- experimentos
- explicaciones
- extraerlos
- Otoño
- Feature
- Caracteristicas
- pocos
- Archive
- filtrar
- filtros
- final
- financiero
- servicios financieros
- Encuentre
- cómodo
- fijas
- Flexibilidad
- Focus
- centrado
- se centra
- siguiendo
- Para consumidores
- Fortune
- Gratuito
- frecuentemente
- Desde
- Frontend
- función
- funciones
- promover
- Obtén
- generar
- generación de AHSS
- obtener
- Diezmos y Ofrendas
- candidato
- maravillosa
- Creciendo
- Tienen
- es
- he
- la salud
- ayuda
- ayuda
- esta página
- altamente
- su
- histórico
- historias
- historia
- HOT
- HORAS
- Cómo
- Como Hacer
- Sin embargo
- HTML
- http
- HTTPS
- ideal
- if
- ilustra
- implementar
- implementado
- implementación
- importar
- importante
- mejorado
- in
- incluir
- incluido
- Incluye
- aumente
- aumentado
- cada vez más
- INSTRUMENTO individual
- industrias
- energético
- información
- informativo
- EN LA MINA
- inicial
- iniciado
- penetración
- interacción
- interacciones
- interesado
- intereses
- dentro
- IT
- artículos
- SUS
- Trabajos
- jpg
- solo
- Clave
- paisaje
- luego
- .
- Disposición
- APRENDE:
- Longitud Mínima
- Nivel
- estilo de vida
- la limitación
- limitaciones
- Limitada
- Lista
- Vidas
- carga
- de
- hecho
- Inicio
- un mejor mantenimiento.
- muchos
- mapa
- Puede..
- personalizado
- mecanismo
- Medios
- Conoce a
- las etiquetas
- metadatos
- métrico
- Métrica
- mínimo
- mínimo
- Min
- Mitigar las
- Móvil
- modelo
- modelos
- Monitorear
- más,
- MEJOR DE TU
- Más popular
- multitud
- debe
- nombres
- nativamente
- ¿ Necesita ayuda
- Nuevo
- noticias
- normalmente
- ahora
- número
- of
- Ofertas
- digital fuera de línea.
- on
- ONE
- , solamente
- Operaciones
- óptimo
- Optión
- or
- organización
- para las fiestas.
- reconocida por
- Otro
- nuestros
- salir
- salida
- Más de
- Paralelo
- particularmente
- apasionado
- para
- por ciento
- actuación
- realiza
- personalización
- personalizar
- Personalizado
- Colocar
- Platón
- Inteligencia de datos de Platón
- PlatónDatos
- política
- alberca
- Popular
- Publicación
- industria
- alimentado
- Precisión
- preferencias
- Preparar
- presentó
- regalos
- priorizar
- priorización
- Problema
- problemas
- Procesado
- tratamiento
- Producto
- Profesional
- proporcionar
- previsto
- proporcionando
- apoderado
- publicado
- Push
- con rapidez
- clasificar
- Clasificación
- Tarifas
- Leer
- Testimoniales
- lectores
- Reading
- ready
- real
- en tiempo real
- datos en tiempo real
- recetas
- recomiendan
- Recomendación
- recomendaciones
- recomendado
- grabar
- relación
- relativo
- confiar
- reportado
- solicita
- exigir
- requisito
- Restaurantes
- restringir
- Resultados
- creciente
- reglas
- correr
- mismo
- escalable
- Escala
- Científico
- mover
- Buscar
- Segundo
- Sectores
- ver
- selecciona
- seleccionado
- mayor
- expedido
- servido
- Sin servidor
- de coches
- Servicios
- set
- Varios
- Turnos
- tienes
- señales
- similares
- Del mismo modo
- sencillos
- So
- a medida
- Soluciones
- RESOLVER
- Resolver
- a veces
- pronto
- Fuentes
- lapso
- soluciones y
- Especificaciones
- Gastos
- Deportes
- estándar
- comienzo
- quedarse
- paso
- STORAGE
- Historias
- estrategias
- Subido
- suscriptores
- comercial
- tal
- suficiente
- adecuado
- SOPORTE
- Apoyar
- Superficie
- te
- sistemáticamente
- Todas las funciones a su disposición
- abordando
- Sastre
- adaptado
- ¡Prepárate!
- equipo
- equipos
- Tecnología
- test
- esa
- El
- su
- Les
- Estas
- ellos
- así
- Tres
- A través de esta formación, el personal docente y administrativo de escuelas y universidades estará preparado para manejar los recursos disponibles que derivan de la diversidad cultural de sus estudiantes. Además, un mejor y mayor entendimiento sobre estas diferencias y similitudes culturales permitirá alcanzar los objetivos de inclusión previstos.
- equipo
- oportuno
- a
- hoy
- parte superior
- Temas
- TPS
- seguir
- tráfico
- Entrenar
- entrenado
- Formación
- Noticias de entrenamiento
- Transacciones
- Transformar
- Transparencia
- viajes
- tendencias
- Tendencias
- verdaderamente
- Confía en
- tratando de
- sintonización
- dos
- tipos
- entiende
- único
- unicidad
- hasta
- utilizan el
- caso de uso
- usado
- Usuario
- usuarios
- usos
- usando
- validación
- propuesta de
- variable
- variado
- variedad
- variará
- versión
- vía
- Videos
- Ver
- Visitas
- caminar
- quieres
- fue
- Camino..
- we
- web
- navegador web
- servicios web
- WELL
- tuvieron
- ¿
- cuando
- mientras
- sean
- que
- porque
- seguirá
- dentro de
- sin
- trabajado
- flujo de trabajo
- preocupante
- la escritura
- Usted
- tú
- zephyrnet