L'IA conversationnelle peut offrir des expériences puissantes, automatisées et interactives par le biais de la voix et du texte. Amazon Lex est un service qui combine les technologies de reconnaissance automatique de la parole et de compréhension du langage naturel, afin que vous puissiez créer ces expériences conversationnelles sophistiquées. Une application courante de l'IA conversationnelle se trouve dans les centres de contact : les agents virtuels en libre-service. Nous sommes ravis de vous annoncer que vous pouvez désormais utiliser Kit de développement logiciel Amazon Chime Audio du réseau téléphonique public commuté (PSTN) pour permettre aux applications conversationnelles en libre-service de réduire les temps de résolution des appels et d'automatiser les réponses informationnelles.
Le kit SDK Amazon Chime est un ensemble de composants de communication en temps réel que les développeurs peuvent utiliser pour ajouter de l'audio, de la messagerie, de la vidéo et du partage d'écran à vos applications Web et mobiles. L'intégration audio Amazon Chime SDK PSTN avec Amazon Lex permet aux constructeurs de développer des interfaces conversationnelles pour les appels vers ou depuis le réseau téléphonique public. Vous pouvez désormais créer des applications en libre-service alimentées par l'IA, telles que des applications conversationnelles systèmes de réponse vocale interactifs (SVI), agents virtuels et autres applications de téléphonie qui utilisent le protocole SIP (Session Initiation Protocol) pour les communications vocales.
De plus, nous avons lancé plusieurs nouvelles fonctionnalités. Amazon Voice Focus pour le RTPC fournit une suppression du bruit basée sur l'apprentissage en profondeur pour réduire les bruits indésirables lors des appels. Vous pouvez également désormais utiliser la synthèse vocale basée sur l'apprentissage automatique (ML) dans votre application grâce à notre intégration native pour Amazon Polly. Toutes les fonctionnalités sont désormais directement intégrées à l'audio Amazon Chime SDK PSTN.
Dans cet article, nous vous apprenons à construire un système IVR conversationnel pour un service de voyage fictif qui accepte les réservations par téléphone via Amazon Lex.
Vue d'ensemble de la solution
L'audio Amazon Chime SDK PSTN permet aux développeurs de créer facilement des applications de téléphonie personnalisées en utilisant l'agilité et la simplicité opérationnelle du sans serveur. AWS Lambda fonctions.
Pour cette solution, nous utilisons les composants suivants :
- Amazon Chime SDK audio PSTN
- AWS Lambda
- Amazon Lex
- Amazon Polly
Amazon Lex s'intègre nativement à Amazon Polly pour fournir des capacités de synthèse vocale. Dans cet article, nous permettons également à Amazon Voice Focus de réduire le bruit de fond lors des appels téléphoniques. Dans un post précédent, nous avons montré comment intégrer Amazon Lex v1 à l'aide de l'interface API. Ce n'est plus nécessaire. La lourde tâche de travailler avec Amazon Lex et Amazon Polly est désormais remplacée par quelques appels de fonction simples.
Le diagramme suivant illustre la conception de haut niveau du système de chatbot Amazon Chime SDK Amazon Lex.
Pour vous aider à apprendre à construire à l'aide du service audio Amazon Chime SDK PSTN, nous avons publié un référentiel de code source et de documentation expliquant comment ce code source fonctionne. Le code source est sous forme d'atelier, chaque exemple de programme s'appuyant sur la leçon précédente. La dernière leçon est de savoir comment créer un chatbot complet piloté par Amazon Lex par téléphone. C'est la leçon sur laquelle nous nous concentrons dans cet article.
Dans le cadre de cette solution, vous créez les ressources suivantes :
- Application média SIP – Un objet géré qui spécifie une fonction Lambda à appeler.
- Règle SIP – Un objet géré qui spécifie un numéro de téléphone sur lequel déclencher et quel objet géré d'application multimédia SIP utiliser pour appeler une fonction Lambda.
- Téléphone – Un numéro de téléphone Amazon Chime SDK PSTN provisionné pour recevoir des appels téléphoniques.
- Fonction Lambda – Une fonction écrite en Typescript qui est intégrée au service audio PSTN. Il reçoit des appels de l'application multimédia SIP et renvoie des actions qui demandent à l'application multimédia SIP d'effectuer des tâches Amazon Polly et Amazon Lex.
Le code de démonstration est déployé en deux parties. L'exemple de chatbot Amazon Lex fait partie d'une série d'exemples d'ateliers qui enseignent comment utiliser l'audio PSTN du SDK Amazon Chime. Pour cet article, vous suivez les étapes de haut niveau suivantes pour déployer le chatbot :
- Configurez le chatbot Amazon Lex.
- Clonez le code du référentiel GitHub.
- Déployer les ressources communes pour l'atelier (y compris un numéro de téléphone).
- Déployez la fonction Lambda qui connecte Amazon Lex au numéro de téléphone.
Nous passons en revue chaque étape en détail.
Pré-requis
Vous devez avoir les prérequis suivants :
- nœud V12+/npm installé
- L'interface de ligne de commande AWS (AWS CLI) installée
- Node Version Manager (nvm) installé
- Les modules de nœud typescript aws-sdk (à l'aide de nvm) installés
- Informations d'identification AWS configurées pour le compte et la région que vous utilisez pour cette démo
- Autorisations pour créer des applications multimédias Amazon Chime SIP et des numéros de téléphone (assurez-vous que votre quota de service dans
us-east-1
orus-west-2
pour les numéros de téléphone, les connecteurs vocaux, les applications multimédias SIP et les règles SIP n'ont pas été atteints) - Le déploiement doit se faire en
us-east-1
orus-west-2
pour s'aligner sur les ressources audio PSTN
Pour obtenir des instructions d'installation détaillées, y compris un script qui peut automatiser l'installation et un projet AWS Cloud Development Kit (AWS CDK) pour créer facilement un environnement de développement Amazon Elastic Compute Cloud (Amazon EC2), consultez le consignes d'atelier.
Configurer le chatbot Amazon Lex
Vous pouvez créer un bot vocal conversationnel complet à l'aide d'Amazon Lex. Dans cet exemple, vous utilisez la console Amazon Lex pour créer un bot. Nous ignorons les étapes de création de la fonction Lambda pour Amazon Lex. L'objectif ici est de savoir comment connecter l'audio Amazon Chime PSTN à Amazon Lex. Pour obtenir des instructions sur la création de bots Amazon Lex personnalisés, reportez-vous à Amazon Lex : comment ça marche. Dans cet exemple, nous utilisons l'exemple prédéfini "réserver un voyage".
Créer un robot
Pour créer votre chatbot, procédez comme suit :
- Connectez-vous à la console Amazon Lex dans la même région que celle dans laquelle vous avez déployé les ressources du kit SDK Amazon Chime.
Cela doit être soit dans us-east-1
or us-west-2
, selon l'endroit où vous avez déployé les ressources du kit SDK Amazon Chime à l'aide d'AWS CDK.
- Dans le volet de navigation, choisissez Moteurs de recherche.
- Selectionnez Créer un bot.
- Sélectionnez Commencez par un exemple.
- Pour Nom du robot, entrez un nom (par exemple, BookTrip).
- Pour Description, entrez une description facultative.
- Sous Autorisations IAM, sélectionnez Créer un rôle avec des autorisations Amazon Lex de base.
- Sous Loi sur la protection de la vie privée des enfants en ligne, sélectionnez Non.
Cet exemple n'a pas besoin de cette protection, mais pour la création de votre propre bot, vous devez sélectionner cette option en conséquence.
- Sous Délai d'expiration de la session inactive¸ définissez le délai d'expiration de la session sur 1 minute.
- Vous pouvez ignorer le paramètres avancés .
- Selectionnez Suivant.
- Pour Choisir la langue, choisissez votre langue préférée (pour ce post, nous choisissons l'anglais (US)).
- Pour Interaction vocale, choisissez la voix que vous souhaitez utiliser.
- Vous pouvez entrer un échantillon de voix et choisir Jouez pour tester la phrase et confirmer que la voix vous convient.
- Laissez les autres paramètres à leur valeur par défaut.
- Selectionnez OK.
- Dans le Accomplissement , saisissez le texte suivant pour En cas d'exécution réussie :
- Sous Réponses de clôture, saisissez le texte suivant pour Message :
Goodbye!
- Selectionnez Enregistrer l'intention.
- Selectionnez Développer.
Le processus de construction prend quelques instants. Une fois terminé, vous pouvez tester le bot sur la console Amazon Lex.
Créer une version
Vous avez maintenant construit le bot. Ensuite, nous créons une version.
- Accédez à la versions page de votre bot (sous le nom du bot dans le volet de navigation).
- Selectionnez Créer une version.
- Acceptez toutes les valeurs par défaut et choisissez Création.
Votre nouvelle version est désormais répertoriée sur le versions .
Créer un alias
Ensuite, nous créons un alias.
- Dans le volet de navigation, choisissez Alias.
- Selectionnez Créer un alias.
- Pour Alias nom, entrez un nom (par exemple, production).
- Sous Associé(e) avec une version, choisissez Version 1 dans le menu déroulant.
Si vous aviez plus d'une version du bot, vous pouvez choisir la version appropriée ici.
- Selectionnez Création.
L'alias est maintenant listé sur le Alias .
- Sur le Alias page, choisissez l'alias que vous venez de créer.
- Sous Politique basée sur les ressources, choisissez Modifier.
- Ajoutez la stratégie suivante, qui permet à l'audio Amazon Chime SDK PSTN d'appeler Amazon Lex pour vous :
Dans le code précédent, fournissez l'ARN de la ressource (situé directement au-dessus de la zone de texte), qui est l'ARN de l'alias du bot. Indiquez également votre numéro de compte et spécifiez la région dans laquelle vous vous déployez (us-east-1
or us-west-2
). Cela définit l'ARN du plan de contrôle audio PSTN dans votre compte.
- Selectionnez Épargnez pour stocker la stratégie.
- Selectionnez Copier à côté de l'ARN de ressource à utiliser dans une étape ultérieure.
Toutes nos félicitations! Vous avez configuré un bot Amazon Lex !
Dans une véritable application de chatbot, vous implémenteriez presque certainement une fonction Lambda pour traiter les intentions. Ce programme de démonstration se concentre sur l'explication de la connexion à l'audio Amazon Chime SDK PSTN, nous n'entrerons donc pas dans ce niveau de détail. Pour plus d'informations, reportez-vous à Ajouter la fonction Lambda en tant que crochet de code.
Cloner le dépôt GitHub
Vous pouvez obtenir le code de l'ensemble de l'atelier en clonant le référentiel :
Déployer les ressources communes pour l'atelier
Cet atelier utilise AWS CDK pour automatiser le déploiement de toutes les ressources nécessaires (à l'exception du bot Amazon Lex, que vous avez déjà fait). Pour déployer, exécutez le code suivant depuis votre terminal :
Le CDK AWS déploie les ressources. Nous effectuons l'étape d'amorçage pour nous assurer qu'AWS CDK est correctement initialisé dans la région dans laquelle vous vous déployez. Notez que ces exemples utilisent AWS CDK version 2.
Le référentiel contient une série de leçons conçues pour expliquer comment développer des applications audio PSTN. Nous vous recommandons de consulter ces documents pour comprendre les bases en utilisant les premiers exemples de programmes. Vous pouvez ensuite consulter le dossier de l'exemple de programme Lambda. Enfin, suivez les étapes pour configurer puis déployer votre code. Dans le terminal, saisissez la commande suivante :
Configurez votre fonction Lambda pour utiliser l'ARN du bot Amazon Lex
Ouvrez le src/index.ts
fichier de code source pour la fonction Lambda et modifiez la variable botAlias
en haut du fichier (fournissez l'ARN que vous avez copié précédemment) :
Vous pouvez maintenant déployer le bot avec le déploiement de fil et échanger la nouvelle fonction Lambda en audio PSTN avec le changement de fil. Vous pouvez également noter le texte de bienvenue dans le startBotConversationAction
objet:
Amazon Lex démarre le bot et utilise Amazon Polly pour lire ce texte. Cela donne à l'appelant un message d'accueil et lui indique ce qu'il doit faire ensuite.
Comment ça marche
L'exemple suivant ajoute plus d'actions à ce que nous avons appris dans le Leçon d'appel et d'appel de pontL’ NEW_INBOUND_CALL
événement arrive et est traité de la même manière. Nous activons Amazon Voice Focus (qui améliore la capacité d'Amazon Lex à comprendre les mots), puis transmettons immédiatement l'appel entrant au bot avec un StartBotConversation
action. Un exemple de cette action ressemble à l'objet suivant :
Lorsque le bot renvoie un ACTION_SUCCESSFUL
événement, les données collectées par le bot Amazon Lex sont incluses dans l'événement. Les données collectées à partir du bot sont incluses et votre fonction Lambda peut utiliser ces données si nécessaire. Cependant, une pratique courante pour créer des applications Amazon Lex consiste à traiter les données avec la fonction associée au bot Amazon Lex. Des exemples de l'événement et de l'action renvoyée sont fournis dans le documentation de l'atelier pour cette session.
Diagramme de séquençage
Le schéma suivant montre la séquence d'appels effectués entre l'audio PSTN et la fonction Lambda :
Pour une explication plus détaillée du fonctionnement, reportez-vous au documents d'atelier.
Nettoyer
Pour nettoyer les ressources utilisées dans cette démo et éviter des frais supplémentaires, procédez comme suit :
- Dans le terminal, entrez le code suivant:
- Revenir au dossier de l'atelier (
cd ../../
) et saisissez le code suivant :
La pile AWS CloudFormation créée par AWS CDK est détruite, supprimant toutes les ressources allouées.
Conclusion
Dans cet article, vous avez appris à créer un réponse vocale interactive conversationnelle (IVR) utilisant Amazon Lex et Amazon Chime SDK PSTN audio. Vous pouvez utiliser ces techniques pour créer votre propre système afin de réduire vos propres délais de résolution des appels clients et automatiser les réponses informatives sur les appels de vos clients.
Pour plus d'informations, consultez le référentiel GitHub du projet ainsi que Utilisation du service Amazon Chime SDK PSTN Audio.
À propos de l’auteur
Greg Herlein a dirigé des équipes de logiciels pendant plus de 25 ans dans de grandes et petites entreprises, dont plusieurs startups. Il est actuellement le principal évangéliste du service Amazon Chime SDK, où il se passionne pour aider les clients à créer des logiciels de communication avancés.
- Coinsmart. Le meilleur échange Bitcoin et Crypto d'Europe.
- Platoblockchain. Intelligence métaverse Web3. Connaissance amplifiée. ACCÈS LIBRE.
- CryptoHawk. Radar Altcoins. Essai gratuit.
- Source : https://aws.amazon.com/blogs/machine-learning/enable-conversational-chatbots-for-telephony-using-amazon-lex-and-the-amazon-chime-sdk/
- "
- 100
- 9
- Description
- Compte
- Action
- actes
- ajout
- Avancée
- agents
- AI
- Tous
- déjà
- Amazon
- Annoncer
- api
- Candidature
- applications
- acoustique
- Automatisation
- AWS
- fond
- Basics
- frontière
- Bot
- les robots
- Box
- PONT
- construire
- Développement
- Appelez-nous
- Peut obtenir
- capacités
- fournisseur
- CD
- des charges
- le cloud
- code
- Commun
- Les communications
- Sociétés
- calcul
- condition
- configuration
- Console
- contenu
- des bactéries
- pourriez
- création
- Lettres de créance
- Customiser
- Clients
- données
- déployer
- déployer
- déploiement
- déploie
- Conception
- détruit
- détail
- développer
- mobiles
- Développement
- DID
- INSTITUTIONNELS
- Ne fait pas
- même
- effet
- Anglais
- Environment
- événement
- exemple
- Sauf
- Expériences
- Fonctionnalités:
- Prénom
- Focus
- suivre
- Abonnement
- le format
- trouvé
- fonction
- GitHub
- aider
- ici
- Comment
- How To
- HTTPS
- Mettre en oeuvre
- inclus
- Y compris
- d'information
- intégrer
- des services
- l'intégration
- Interactif
- Interfaces
- IT
- langue
- gros
- APPRENTISSAGE
- savant
- apprentissage
- LED
- Niveau
- Gamme
- Listé
- click
- machine learning
- gérés
- manager
- Médias
- messagerie
- ML
- Breeze Mobile
- Applications mobiles
- PLUS
- Nature
- Navigation
- Près
- réseau et
- Nouvelles fonctionnalités
- Bruit
- nombre
- numéros
- en ligne
- la vie privée en ligne
- Option
- de commander
- Autre
- politique
- solide
- pratique
- Directeur
- la confidentialité
- processus
- Vidéo
- Programme
- Programmes
- Projet
- protection
- protocole
- fournir
- fournit
- public
- en temps réel
- recommander
- réduire
- Location
- remplacé
- dépôt
- conditions
- ressource
- Ressources
- réponse
- Retours
- Avis
- Courir
- Sdk
- Série
- Sans serveur
- service
- set
- étapes
- petit
- So
- Logiciels
- sur mesure
- sophistiqué
- code source
- empiler
- départs
- Startups
- Déclaration
- Boutique
- réussi
- combustion propre
- tâches
- techniques
- Les technologies
- raconte
- terminal
- tester
- Les bases
- La Source
- Avec
- top
- Voyage
- comprendre
- us
- utilisé
- Vidéo
- Salle de conférence virtuelle
- Voix
- web
- bienvenu
- Quoi
- des mots
- de travail
- vos contrats
- années