La IA conversacional puede ofrecer experiencias potentes, automatizadas e interactivas a través de voz y texto. Amazon lex es un servicio que combina tecnologías de reconocimiento de voz automático y comprensión del lenguaje natural, para que pueda crear estas experiencias de conversación sofisticadas. Una aplicación común de la IA conversacional se encuentra en los centros de contacto: agentes virtuales de autoservicio. Nos complace anunciar que ahora puede utilizar SDK de Amazon Chime Audio de red telefónica pública conmutada (PSTN) para permitir que las aplicaciones de autoservicio conversacional reduzcan los tiempos de resolución de llamadas y automaticen las respuestas informativas.
El SDK de Amazon Chime es un conjunto de componentes de comunicaciones en tiempo real que los desarrolladores pueden usar para agregar audio, mensajería, video y uso compartido de pantalla a sus aplicaciones web y móviles. La integración de audio PSTN de Amazon Chime SDK con Amazon Lex permite a los constructores desarrollar interfaces conversacionales para llamadas hacia o desde la red telefónica pública. Ahora puede crear aplicaciones de autoservicio impulsadas por IA, como conversacionales sistemas de respuesta de voz interactivos (IVR), agentes virtuales y otras aplicaciones de telefonía que utilizan el Protocolo de inicio de sesión (SIP) para las comunicaciones de voz.
Además, hemos lanzado varias funciones nuevas. Foco de voz de Amazon para PSTN proporciona supresión de ruido basada en aprendizaje profundo para reducir el ruido no deseado en las llamadas. Ahora también puede usar texto a voz basado en aprendizaje automático (ML) en su aplicación a través de nuestra integración nativa para Amazon Polly. Todas las funciones ahora están directamente integradas con el audio PSTN de Amazon Chime SDK.
En este post te enseñamos cómo construir un sistema IVR conversacional para un servicio de viajes ficticio que acepta reservas por teléfono usando Amazon Lex.
Resumen de la solución
Amazon Chime SDK PSTN audio facilita a los desarrolladores la creación de aplicaciones de telefonía personalizadas utilizando la agilidad y la simplicidad operativa de la tecnología sin servidor AWS Lambda funciones.
Para esta solución, utilizamos los siguientes componentes:
- Audio PSTN del SDK de Amazon Chime
- AWS Lambda
- Amazon lex
- Amazon Polly
Amazon Lex se integra de forma nativa con Amazon Polly para proporcionar capacidades de texto a voz. En esta publicación, también habilitamos Amazon Voice Focus para reducir el ruido de fondo en las llamadas telefónicas. en un Publicación anterior, mostramos cómo integrarse con Amazon Lex v1 mediante la interfaz API. Eso ya no es necesario. El trabajo pesado de trabajar con Amazon Lex y Amazon Polly ahora se reemplaza por unas pocas llamadas de funciones simples.
El siguiente diagrama ilustra el diseño de alto nivel del sistema de chatbot Amazon Lex SDK de Amazon Chime.
Para ayudarlo a aprender a compilar con el servicio de audio PSTN SDK de Amazon Chime, hemos publicado un repositorio de código fuente y documentación explicando cómo funciona ese código fuente. El código fuente está en formato de taller, y cada programa de ejemplo se basa en la lección anterior. La lección final es cómo construir un chatbot completo basado en Amazon Lex por teléfono. Esa es la lección en la que nos enfocamos en este post.
Como parte de esta solución, crea los siguientes recursos:
- aplicación de medios SIP – Un objeto administrado que especifica una función de Lambda para invocar.
- regla SIP – Un objeto administrado que especifica un número de teléfono para activar y qué objeto administrado de aplicación de medios SIP usar para invocar una función Lambda.
- Número de teléfono – Un número de teléfono PSTN de Amazon Chime SDK provisto para recibir llamadas telefónicas.
- función lambda – Una función escrita en mecanografiado que se integra con el servicio de audio PSTN. Recibe invocaciones de la aplicación de medios SIP y devuelve acciones que le indican a la aplicación de medios SIP que realice tareas de Amazon Polly y Amazon Lex.
El código de demostración se implementa en dos partes. El ejemplo del chatbot de Amazon Lex es uno de una serie de ejemplos de talleres que enseñan cómo usar el audio PSTN del SDK de Amazon Chime. Para esta publicación, complete los siguientes pasos de alto nivel para implementar el chatbot:
- Configure el chatbot de Amazon Lex.
- Clona el código del repositorio de GitHub.
- Implemente los recursos comunes para el taller (incluido un número de teléfono).
- Implemente la función Lambda que conecta Amazon Lex con el número de teléfono.
Pasamos por cada paso en detalle.
Requisitos previos
Debes tener los siguientes requisitos previos:
- nodo V12+/npm instalado
- La interfaz de línea de comandos de AWS (AWS CLI) instalada
- Node Version Manager (nvm) instalado
- Los módulos del nodo mecanografiaron aws-sdk (usando nvm) instalados
- Credenciales de AWS configuradas para la cuenta y la región que utiliza para esta demostración
- Permisos para crear números de teléfono y aplicaciones de medios SIP de Amazon Chime (asegúrese de que su cuota de servicio en
us-east-1
orus-west-2
para números de teléfono, conectores de voz, aplicaciones multimedia SIP y reglas SIP) - El despliegue debe hacerse en
us-east-1
orus-west-2
para alinearse con los recursos de audio PSTN
Para obtener instrucciones de instalación detalladas, incluido un script que puede automatizar la instalación y un proyecto de AWS Cloud Development Kit (AWS CDK) para crear fácilmente un entorno de desarrollo de Amazon Elastic Compute Cloud (Amazon EC2), consulte el instrucciones de taller.
Configurar el chatbot de Amazon Lex
Puede crear un bot de voz conversacional completo con Amazon Lex. En este ejemplo, utiliza la consola de Amazon Lex para crear un bot. Omitimos los pasos en los que crea la función Lambda para Amazon Lex. El enfoque aquí es cómo conectar el audio PSTN de Amazon Chime a Amazon Lex. Para obtener instrucciones sobre cómo crear bots de Amazon Lex personalizados, consulte Amazon Lex: cómo funciona. En este ejemplo, usamos el ejemplo de "viaje de libro" preconstruido.
crear un bot
Para crear tu chatbot, completa los siguientes pasos:
- Inicie sesión en la consola de Amazon Lex en la misma región en la que implementó los recursos del SDK de Amazon Chime.
Esto debe estar en cualquiera us-east-1
or us-west-2
, según dónde haya implementado los recursos del SDK de Amazon Chime mediante AWS CDK.
- En el panel de navegación, elija Motores de búsqueda.
- Elige Crear bot.
- Seleccione Comience con un ejemplo.
- Nombre del bot, introduzca un nombre (por ejemplo, BookTrip).
- Descripción, ingrese una descripción opcional.
- under permisos de gestión de identidades y accesos, seleccione Cree un rol con permisos básicos de Amazon Lex.
- under Ley de protección de la privacidad en línea para niños, seleccione No.
Este ejemplo no necesita esa protección, pero para la creación de su propio bot, debe seleccionar esta opción en consecuencia.
- under Tiempo de espera de la sesión inactiva¸ establezca el tiempo de espera de la sesión en 1 minuto.
- Puedes saltearte Configuración avanzada .
- Elige Siguiente.
- Seleccione Idioma, elija su idioma preferido (para esta publicación, elegimos inglés (EE. UU.)).
- Interacción de voz, elija la voz que desea utilizar.
- Puede introducir una muestra de voz y elegir Jugar para probar la frase y confirmar que la voz es de su agrado.
- Deje otras configuraciones en sus valores predeterminados.
- Elige Terminado.
- En Cumplimiento sección, ingrese el siguiente texto para el cumplimiento exitoso:
- under Respuestas de cierre, ingrese el siguiente texto para Mensaje:
Goodbye!
- Elige Guardar intento.
- Elige Construcción.
El proceso de compilación tarda unos minutos en completarse. Cuando haya terminado, puede probar el bot en la consola de Amazon Lex.
Crear una versión
Ahora ha construido el bot. A continuación, creamos una versión.
- Navegue hasta la Source-Connect página de su bot (bajo el nombre del bot en el panel de navegación).
- Elige Crear versión.
- Acepte todos los valores predeterminados y elija Crear.
Su nueva versión ahora aparece en la Source-Connect .
Crea un alias
A continuación, creamos un alias.
- En el panel de navegación, elija Alias.
- Elige Crear alias.
- alias nombre, ingrese un nombre (por ejemplo, producción).
- under Consejos con una versión, elija Versión 1 en el menú desplegable.
Si tenía más de una versión del bot, podía elegir la versión adecuada aquí.
- Elige Crear.
El alias ahora aparece en la Alias .
- En Alias página, elija el alias que acaba de crear.
- under Política basada en recursos, escoger Editar.
- Agregue la siguiente política, que permite que el audio PSTN del SDK de Amazon Chime invoque Amazon Lex por usted:
En el código anterior, proporcione el ARN del recurso (ubicado directamente encima del cuadro de texto), que es el ARN para el alias del bot. Proporcione también su número de cuenta y especifique la región en la que se está implementando (us-east-1
or us-west-2
). Eso define el ARN del plano de control de audio PSTN en su cuenta.
- Elige Guardar para almacenar la política.
- Elige Copiar junto al ARN del recurso para usar en un paso posterior.
¡Felicidades! ¡Ha configurado un bot de Amazon Lex!
En una aplicación de chatbot real, es casi seguro que implementaría una función Lambda para procesar las intenciones. Este programa de demostración se centra en explicar cómo conectarse al audio PSTN del SDK de Amazon Chime, por lo que no entraremos en ese nivel de detalle. Para más información, consulte Agregar la función Lambda como un enlace de código.
Clonar el repositorio de GitHub
Puede obtener el código de todo el taller clonando el repositorio:
Desplegar los recursos comunes para el taller.
Este taller utiliza AWS CDK para automatizar la implementación de todos los recursos necesarios (excepto el bot de Amazon Lex, que ya hizo). Para implementar, ejecute el siguiente código desde su terminal:
AWS CDK implementa los recursos. Realizamos el paso de arranque para asegurarnos de que AWS CDK se inicialice correctamente en la región en la que se está implementando. Tenga en cuenta que estos ejemplos utilizan AWS CDK versión 2.
El repositorio tiene una serie de lecciones diseñadas para explicar cómo desarrollar aplicaciones de audio PSTN. Recomendamos revisar estos documentos para comprender los conceptos básicos utilizando los primeros programas de muestra. A continuación, puede revisar la carpeta del programa de ejemplo de Lambda. Por último, siga los pasos para configurar y luego implementar su código. En la terminal, ingresa el siguiente comando:
Configure su función Lambda para usar el ARN del bot de Amazon Lex
Abra la src/index.ts
archivo de código fuente para la función Lambda y edite la variable botAlias
cerca de la parte superior del archivo (proporcione el ARN que copió anteriormente):
Ahora puede implementar el bot con yarn deployment e intercambiar la nueva función Lambda en audio PSTN con yarn swap. También puede observar el texto de bienvenida en el startBotConversationAction
:
Amazon Lex inicia el bot y usa Amazon Polly para leer ese texto. Esto le da un saludo a la persona que llama y le dice lo que debe hacer a continuación.
Cómo funciona
El siguiente ejemplo agrega más acciones a lo que aprendimos en el Lección de llamadas y llamadas en puente. NEW_INBOUND_CALL
evento llega y se procesa de la misma manera. Habilitamos Amazon Voice Focus (que mejora la capacidad de Amazon Lex para comprender palabras) y luego entregamos inmediatamente la llamada entrante al bot con un StartBotConversation
acción. Un ejemplo de esa acción se parece al siguiente objeto:
Cuando el bot devuelve un ACTION_SUCCESSFUL
evento, los datos recopilados por el bot de Amazon Lex se incluyen en el evento. Se incluyen los datos recopilados del bot y su función Lambda puede usar esos datos si es necesario. Sin embargo, una práctica común para crear aplicaciones de Amazon Lex es procesar los datos con la función asociada con el bot de Amazon Lex. Se proporcionan ejemplos del evento y la acción devuelta en el documentación del taller para esta sesión.
Diagrama de secuencia
El siguiente diagrama muestra la secuencia de llamadas realizadas entre el audio PSTN y la función Lambda:
Para una explicación más detallada de la operación, consulte la documentación del taller.
Limpiar
Para limpiar los recursos utilizados en esta demostración y evitar incurrir en cargos adicionales, complete los siguientes pasos:
- En la terminal, ingrese el siguiente código:
- Volver a la carpeta del taller (
cd ../../
) e ingrese el siguiente código:
La pila de AWS CloudFormation creada por AWS CDK se destruye y se eliminan todos los recursos asignados.
Conclusión
En esta publicación, aprendiste cómo construir un respuesta de voz interactiva conversacional (IVR) que utiliza Amazon Lex y Amazon Chime SDK PSTN audio. Puede usar estas técnicas para construir su propio sistema para reducir los tiempos de resolución de llamadas de sus propios clientes y automatizar las respuestas informativas en las llamadas de sus clientes.
Para obtener más información, consulte la sección de repositorio del proyecto GitHub y Uso del servicio de audio PSTN SDK de Amazon Chime.
Sobre la autora
greg herlein ha liderado equipos de software durante más de 25 años en empresas grandes y pequeñas, incluidas varias nuevas empresas. Actualmente es el evangelista principal del servicio SDK de Amazon Chime, donde le apasiona cómo ayudar a los clientes a crear software de comunicaciones avanzado.
- Coinsmart. El mejor intercambio de Bitcoin y criptografía de Europa.
- Platoblockchain. Inteligencia del Metaverso Web3. Conocimiento amplificado. ACCESO LIBRE.
- CriptoHawk. Radar de altcoins. Prueba gratis.
- Fuente: https://aws.amazon.com/blogs/machine-learning/enable-conversational-chatbots-for-telephony-using-amazon-lex-and-the-amazon-chime-sdk/
- "
- 100
- 9
- Sobre
- Mi Cuenta
- la columna Acción
- acciones
- adición
- avanzado
- agentes
- AI
- Todos
- ya haya utilizado
- Amazon
- Anunciar
- abejas
- Aplicación
- aplicaciones
- audio
- Confirmación de Viaje
- AWS
- fondo
- conceptos básicos
- frontera
- Bot
- los robots
- Box
- PUENTE
- build
- Construir la
- llamar al
- Puede conseguir
- capacidades
- de
- CD
- cargos
- Soluciones
- código
- Algunos
- Comunicaciónes
- Empresas
- Calcular
- condición
- Configuración
- Consola
- contenido
- control
- podría
- creación
- Referencias
- personalizado
- Clientes
- datos
- desplegar
- Desplegando
- despliegue
- despliega
- Diseño
- destruido
- detalle
- desarrollar
- desarrolladores
- Desarrollo
- HIZO
- documentos
- No
- pasan fácilmente
- efecto
- Inglés
- Entorno
- Evento
- ejemplo
- Excepto
- Experiencias
- Caracteristicas
- Nombre
- Focus
- seguir
- siguiendo
- formato
- encontrado
- función
- GitHub
- ayuda
- esta página
- Cómo
- Como Hacer
- HTTPS
- implementar
- incluido
- Incluye
- información
- integrar
- COMPLETAMENTE
- integración
- interactivo
- Interfaz
- IT
- idioma
- large
- APRENDE:
- aprendido
- aprendizaje
- LED
- Nivel
- línea
- Listado
- máquina
- máquina de aprendizaje
- gestionado
- gerente
- Medios
- mensajería
- ML
- Móvil
- Aplicaciones para móviles
- más,
- Natural
- Navegación
- Cerca
- del sistema,
- Nuevas características
- ruido
- número
- números
- en línea
- privacidad en línea
- Optión
- solicite
- Otro
- política
- poderoso
- Director de la escuela
- política de privacidad
- Producción
- Programa
- Programas
- proyecto
- Protección
- protocolo
- proporcionar
- proporciona un
- público
- en tiempo real
- recomiendan
- reducir
- Renta
- reemplazados
- repositorio
- Requisitos
- Recurso
- Recursos
- respuesta
- devoluciones
- una estrategia SEO para aparecer en las búsquedas de Google.
- reglas
- Ejecutar
- Sdk
- Serie
- Sin servidor
- de coches
- set
- sencillos
- chica
- So
- Software
- a medida
- sofisticado
- código fuente
- montón
- comienza
- Startups
- Posicionamiento
- tienda
- exitosos
- te
- tareas
- técnicas
- Tecnologías
- decirles
- terminal
- test
- Lo esencial
- La Fuente
- A través de esta formación, el personal docente y administrativo de escuelas y universidades estará preparado para manejar los recursos disponibles que derivan de la diversidad cultural de sus estudiantes. Además, un mejor y mayor entendimiento sobre estas diferencias y similitudes culturales permitirá alcanzar los objetivos de inclusión previstos.
- parte superior
- viajes
- entender
- us
- utilizan el
- Video
- Virtual
- Voz
- web
- bienvenido
- ¿
- palabras
- trabajando
- funciona
- años