Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Servicios web de Amazon

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Servicios web de Amazon

Las empresas buscan aprovechar el potencial del aprendizaje automático (ML) para resolver problemas complejos y mejorar los resultados. Hasta hace poco, crear e implementar modelos de ML requería profundos niveles de habilidades técnicas y de codificación, incluido el ajuste de los modelos de ML y el mantenimiento de canales operativos. Desde su introducción en 2021, Lienzo de Amazon SageMaker ha permitido a los analistas de negocios crear, implementar y utilizar una variedad de modelos de aprendizaje automático, incluidos tabulares, visión por computadora y procesamiento de lenguaje natural, sin escribir una línea de código. Esto ha acelerado la capacidad de las empresas para aplicar ML a casos de uso como pronóstico de series temporales, predicción de abandono de clientes, análisis de sentimientos, detección de defectos industriales y muchos otros.

Como se anunció el 5 de Octubre de 2023, SageMaker Canvas amplió su soporte de modelos a modelos básicos (FM): modelos de lenguaje grandes utilizados para generar y resumir contenido. Con el Lanzamiento del 12 de octubre de 2023, SageMaker Canvas permite a los usuarios hacer preguntas y obtener respuestas basadas en los datos de su empresa. Esto garantiza que los resultados sean específicos del contexto, lo que abre casos de uso adicionales en los que se puede aplicar el aprendizaje automático sin código para resolver problemas empresariales. Por ejemplo, los equipos de negocios ahora pueden formular respuestas consistentes con el vocabulario y los principios específicos de una organización, y pueden consultar más rápidamente documentos extensos para obtener respuestas específicas y basadas en el contenido de esos documentos. Todo este contenido se realiza de manera privada y segura, garantizando que se acceda a todos los datos confidenciales con la gobernanza y las salvaguardias adecuadas.

Para comenzar, un administrador de la nube configura y completa amazona kendra índices con datos empresariales como fuentes de datos para SageMaker Canvas. Los usuarios de Canvas seleccionan el índice donde están sus documentos y pueden idear, investigar y explorar sabiendo que el resultado siempre estará respaldado por sus fuentes de verdad. SageMaker Canvas utiliza FM de última generación de lecho rocoso del amazonas y JumpStart de Amazon SageMaker. Se pueden iniciar conversaciones con varios FM uno al lado del otro, comparando los resultados y haciendo que la IA generativa sea realmente accesible para todos.

En esta publicación, revisaremos la función lanzada recientemente, analizaremos la arquitectura y presentaremos una guía paso a paso para permitir que SageMaker Canvas consulte documentos de su base de conocimientos, como se muestra en la siguiente captura de pantalla.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Resumen de la solución

Los modelos básicos pueden producir alucinaciones: respuestas genéricas, vagas, no relacionadas o objetivamente incorrectas. Recuperación de Generación Aumentada (RAG) Es un enfoque utilizado con frecuencia para reducir las alucinaciones. Las arquitecturas RAG se utilizan para recuperar datos desde fuera de un FM, que luego se utilizan para realizar un aprendizaje en contexto para responder a la consulta del usuario. Esto garantiza que el FM pueda utilizar datos de una base de conocimientos confiable y utilizar ese conocimiento para responder las preguntas de los usuarios, reduciendo el riesgo de alucinaciones.

Con RAG, los datos externos al FM y utilizados para aumentar las indicaciones del usuario pueden provenir de múltiples fuentes de datos diferentes, como repositorios de documentos, bases de datos o API. El primer paso es convertir sus documentos y las consultas de los usuarios a un formato compatible para realizar una búsqueda semántica de relevancia. Para que los formatos sean compatibles, una colección de documentos o biblioteca de conocimientos y las consultas enviadas por los usuarios se convierten en representaciones numéricas mediante modelos de incrustación.

Con esta versión, la funcionalidad RAG se proporciona sin código y de manera fluida. Las empresas pueden enriquecer la experiencia de chat en Canvas con Amazon Kendra como sistema de gestión del conocimiento subyacente. El siguiente diagrama ilustra la arquitectura de la solución.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Conectar SageMaker Canvas a Amazon Kendra requiere una configuración única. Describimos el proceso de configuración en detalle en Configuración de Canvas para consultar documentos. Si aún no ha configurado su dominio SageMaker, consulte Incorporación al dominio de Amazon SageMaker.

Como parte de la configuración del dominio, un administrador de la nube puede elegir uno o más índices de Kendra que el analista de negocios puede consultar al interactuar con el FM a través de SageMaker Canvas.

Una vez hidratados y configurados los índices de Kendra, los analistas de negocios los usan con SageMaker Canvas iniciando un nuevo chat y seleccionando la opción "Consultar documentos". Luego, SageMaker Canvas administrará la comunicación subyacente entre Amazon Kendra y el FM elegido para realizar las siguientes operaciones:

  1. Consulta los índices de Kendra con la pregunta del usuario.
  2. Recupere los fragmentos (y las fuentes) de los índices de Kendra.
  3. Diseñe el mensaje con los fragmentos de la consulta original para que el modelo básico pueda generar una respuesta a partir de los documentos recuperados.
  4. Proporcione la respuesta generada al usuario, junto con referencias a las páginas/documentos que se utilizaron para formular la respuesta.

Configurar Canvas para consultar documentos

En esta sección, lo guiaremos a través de los pasos para configurar Canvas para consultar documentos entregados a través de índices de Kendra. Debe tener los siguientes requisitos previos:

Ahora puedes actualizar el Dominio para que pueda acceder a los índices deseados. En la consola de SageMaker, para el dominio determinado, seleccione Editar en la pestaña Configuración del dominio. Habilite la opción "Habilitar consultar documentos con Amazon Kendra" que se puede encontrar en el paso Configuración del lienzo. Una vez activado, elija uno o más índices de Kendra que desee utilizar con Canvas.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Eso es todo lo que se necesita para configurar la función de consulta de documentos de Canvas. Los usuarios ahora pueden ingresar a un chat dentro de Canvas y comenzar a utilizar las bases de conocimiento que se han adjuntado al dominio a través de los índices de Kendra. Los mantenedores de la base de conocimientos pueden continuar actualizando la fuente de la verdad y con la capacidad de sincronización en Kendra, los usuarios del chat podrán usar automáticamente la información actualizada de manera fluida.

Uso de la función Consultar documentos para chatear

Como usuario de SageMaker Canvas, se puede acceder a la función Consultar documentos desde un chat. Para iniciar la sesión de chat, haga clic o busque el botón "Generar, extraer y resumir contenido" en la pestaña Modelos listos para usar en SageMaker Canvas.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Una vez allí, puede activar y desactivar Consultar documentos con el interruptor en la parte superior de la pantalla. Consulte el mensaje de información para obtener más información sobre la función.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Cuando Consultar documentos está habilitado, puede elegir entre una lista de índices de Kendra habilitados por el administrador de la nube.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Puede seleccionar un índice al iniciar un nuevo chat. Luego puede hacer una pregunta en la UX y el conocimiento se obtiene automáticamente del índice seleccionado. Tenga en cuenta que una vez iniciada una conversación con un índice específico, no es posible cambiar a otro índice.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Para las preguntas formuladas, el chat mostrará la respuesta generada por el FM junto con los documentos fuente que contribuyeron a generar la respuesta. Al hacer clic en cualquiera de los documentos de origen, Canvas abre una vista previa del documento, resaltando el extracto utilizado por el FM.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.

Conclusión

La IA conversacional tiene un inmenso potencial para transformar la experiencia de clientes y empleados al proporcionar un asistente humano con interacciones naturales e intuitivas como:

  • Realizar una investigación sobre un tema o buscar y explorar la base de conocimientos de la organización.
  • Resumir volúmenes de contenido para recopilar información rápidamente
  • Búsqueda de entidades, sentimientos, PII y otros datos útiles, y aumento del valor comercial del contenido no estructurado.
  • Generación de borradores para documentos y correspondencia comercial.
  • Crear artículos de conocimiento a partir de fuentes internas dispares (incidentes, registros de chat, wikis)

La integración innovadora de interfaces de chat, recuperación de conocimientos y FM permite a las empresas proporcionar respuestas precisas y relevantes a las preguntas de los usuarios utilizando su conocimiento de dominio y fuentes de verdad.

Al conectar SageMaker Canvas a las bases de conocimiento en Amazon Kendra, las organizaciones pueden mantener sus datos propietarios dentro de su propio entorno y al mismo tiempo beneficiarse de las capacidades de lenguaje natural de última generación de los FM. Con el lanzamiento de la función Consulta de documentos de SageMaker Canvas, facilitamos a cualquier empresa el uso de LLM y su conocimiento empresarial como fuente de verdad para impulsar una experiencia de chat segura. Toda esta funcionalidad está disponible en un formato sin código, lo que permite a las empresas evitar realizar tareas repetitivas y no especializadas.

Para obtener más información sobre SageMaker Canvas y cómo ayuda a que a todos les resulte más fácil comenzar con el aprendizaje automático, consulte el Anuncio de lienzo de SageMaker. Obtenga más información sobre cómo SageMaker Canvas ayuda a fomentar la colaboración entre científicos de datos y analistas de negocios leyendo el Crear, compartir e implementar publicación. Finalmente, para aprender cómo crear su propio flujo de trabajo de generación aumentada de recuperación, consulte SageMaker JumpStart RAG.

Referencias

Lewis, P., Pérez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S., Kiela, D. (2020). Generación de recuperación aumentada para tareas de PNL intensivas en conocimiento. Avances en los sistemas de procesamiento de información neuronal, 33, 9459-9474.


Acerca de los autores

Foto de Davidedavid gallitelli es un arquitecto senior de soluciones especializado en IA/ML. Tiene su sede en Bruselas y trabaja en estrecha colaboración con clientes de todo el mundo que buscan adoptar tecnologías de aprendizaje automático Low-Code/No-Code e IA generativa. Ha sido desarrollador desde muy joven y comenzó a codificar a los 7 años. Comenzó a aprender AI/ML en la universidad y se ha enamorado de ello desde entonces.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.Bilal Alam es arquitecto de soluciones empresariales en AWS con especialización en la industria de servicios financieros. La mayoría de los días, Bilal ayuda a los clientes a crear, mejorar y proteger su entorno de AWS para implementar sus cargas de trabajo más críticas. Tiene amplia experiencia en Telco, redes y desarrollo de software. Más recientemente, ha estado investigando el uso de AI/ML para resolver problemas comerciales.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.misterio pashmeen es gerente sénior de productos en AWS. Fuera del trabajo, Pashmeen disfruta de caminatas aventureras, fotografía y pasar tiempo con su familia.

Capacite a sus usuarios empresariales para extraer información de los documentos de la empresa mediante la IA generativa de Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Inteligencia de datos. Búsqueda vertical. Ai.dan sinnreich es gerente senior de productos en AWS y ayuda a democratizar el aprendizaje automático con código bajo o sin código. Antes de AWS, Dan creó y comercializó plataformas SaaS empresariales y modelos de series temporales utilizados por inversores institucionales para gestionar el riesgo y construir carteras óptimas. Fuera del trabajo, se le puede encontrar jugando hockey, buceando y leyendo ciencia ficción.

Sello de tiempo:

Mas de Aprendizaje automático de AWS