Conversational AI kann leistungsstarke, automatisierte, interaktive Erlebnisse über Sprache und Text liefern. Amazon Lex ist ein Dienst, der Technologien zur automatischen Spracherkennung und zum Verstehen natürlicher Sprache kombiniert, damit Sie diese anspruchsvollen Gesprächserlebnisse aufbauen können. Eine gängige Anwendung von Conversational AI findet sich in Contact Centern: virtuelle Self-Service-Agenten. Wir freuen uns, Ihnen mitteilen zu können, dass Sie es jetzt verwenden können Amazon Chime-SDK PSTN-Audio (Public Switched Telephone Network), um Konversations-Self-Service-Anwendungen zu ermöglichen, um die Anrufauflösungszeiten zu verkürzen und Informationsantworten zu automatisieren.
Das Amazon Chime SDK ist eine Reihe von Echtzeit-Kommunikationskomponenten, die Entwickler verwenden können, um Audio, Messaging, Video und Bildschirmfreigabe zu Ihren Web- und Mobilanwendungen hinzuzufügen. Die PSTN-Audiointegration von Amazon Chime SDK mit Amazon Lex ermöglicht Entwicklern die Entwicklung von Konversationsschnittstellen für Anrufe in das oder aus dem öffentlichen Telefonnetz. Sie können jetzt KI-gestützte Self-Service-Anwendungen wie z. B. Conversational erstellen interaktive Sprachantwortsysteme (IVRs), virtuelle Agenten und andere Telefonieanwendungen, die das Session Initiation Protocol (SIP) für die Sprachkommunikation verwenden.
Darüber hinaus haben wir mehrere neue Funktionen eingeführt. Amazon Voice Focus für PSTN bietet auf Deep Learning basierende Rauschunterdrückung, um unerwünschte Geräusche bei Anrufen zu reduzieren. Sie können jetzt auch durch maschinelles Lernen (ML) gesteuertes Text-to-Speech in Ihrer Anwendung über unsere native Integration in verwenden Amazonas Polly. Alle Funktionen sind jetzt direkt in Amazon Chime SDK PSTN-Audio integriert.
In diesem Beitrag zeigen wir Ihnen, wie es geht Aufbau eines Konversations-IVR-Systems für einen fiktiven Reisedienst, der telefonische Reservierungen mit Amazon Lex entgegennimmt.
Lösungsüberblick
Amazon Chime SDK PSTN Audio macht es Entwicklern leicht, benutzerdefinierte Telefonieanwendungen zu erstellen, indem sie die Agilität und operative Einfachheit von Serverless nutzen AWS Lambda Funktionen.
Für diese Lösung verwenden wir folgende Komponenten:
- Amazon Chime SDK PSTN-Audio
- AWS Lambda
- Amazon Lex
- Amazonas Polly
Amazon Lex lässt sich nativ in Amazon Polly integrieren, um Text-to-Speech-Funktionen bereitzustellen. In diesem Beitrag aktivieren wir auch Amazon Voice Focus, um Hintergrundgeräusche bei Telefonaten zu reduzieren. In einem previous posthaben wir gezeigt, wie die Integration mit Amazon Lex v1 über die API-Schnittstelle erfolgt. Das ist nicht mehr erforderlich. Das schwere Heben der Arbeit mit Amazon Lex und Amazon Polly wird jetzt durch ein paar einfache Funktionsaufrufe ersetzt.
Das folgende Diagramm veranschaulicht das High-Level-Design des Amazon Lex-Chatbot-Systems Amazon Chime SDK.
Um Ihnen beim Erlernen des Erstellens mit dem PSTN-Audiodienst Amazon Chime SDK zu helfen, haben wir eine veröffentlicht Repository von Quellcode und Dokumentation erklärt, wie dieser Quellcode funktioniert. Der Quellcode liegt im Workshop-Format vor, wobei jedes Beispielprogramm auf der vorherigen Lektion aufbaut. Die letzte Lektion ist, wie man einen vollständigen Amazon Lex-gesteuerten Chatbot über das Telefon erstellt. Das ist die Lektion, auf die wir uns in diesem Beitrag konzentrieren.
Als Teil dieser Lösung erstellen Sie die folgenden Ressourcen:
- SIP-Medienanwendung – Ein verwaltetes Objekt, das eine aufzurufende Lambda-Funktion angibt.
- SIP-Regel – Ein verwaltetes Objekt, das eine auszulösende Telefonnummer und das verwaltete Objekt der SIP-Medienanwendung zum Aufrufen einer Lambda-Funktion angibt.
- Telefonnummer – Eine Amazon Chime SDK PSTN-Telefonnummer, die für den Empfang von Telefonanrufen bereitgestellt wird.
- Lambda-Funktion – Eine in Typoskript geschriebene Funktion, die in den PSTN-Audiodienst integriert ist. Es empfängt Aufrufe von der SIP-Medienanwendung und sendet Aktionen zurück, die die SIP-Medienanwendung anweisen, Amazon Polly- und Amazon Lex-Aufgaben auszuführen.
Der Democode wird in zwei Teilen bereitgestellt. Das Amazon Lex-Chatbot-Beispiel ist eines aus einer Reihe von Workshop-Beispielen, die die Verwendung von Amazon Chime SDK PSTN-Audio lehren. Für diesen Beitrag führen Sie die folgenden allgemeinen Schritte aus, um den Chatbot bereitzustellen:
- Konfigurieren Sie den Amazon Lex-Chatbot.
- Klonen Sie den Code aus dem GitHub-Repository.
- Stellen Sie die gemeinsamen Ressourcen für den Workshop bereit (einschließlich einer Telefonnummer).
- Stellen Sie die Lambda-Funktion bereit, die Amazon Lex mit der Telefonnummer verbindet.
Wir gehen jeden Schritt im Detail durch.
Voraussetzungen:
Folgende Voraussetzungen müssen Sie mitbringen:
- Knoten V12+/npm installiert
- Die AWS Command Line Interface (AWS CLI) ist installiert
- Node Version Manager (nvm) installiert
- Das Typoskript der Knotenmodule aws-sdk (unter Verwendung von nvm) installiert
- AWS-Anmeldeinformationen, die für das Konto und die Region konfiguriert sind, die Sie für diese Demo verwenden
- Berechtigungen zum Erstellen von Amazon Chime SIP-Medienanwendungen und Telefonnummern (stellen Sie sicher, dass Ihr Dienstkontingent in
us-east-1
orus-west-2
für Telefonnummern, Sprachconnectors, SIP-Medienanwendungen und SIP-Regeln wurde nicht erreicht) - Die Bereitstellung muss in erfolgen
us-east-1
orus-west-2
mit PSTN-Audioressourcen auszurichten
Ausführliche Installationsanweisungen, einschließlich eines Skripts, das die Installation automatisieren kann, und eines AWS Cloud Development Kit (AWS CDK)-Projekts zum einfachen Erstellen einer Amazon Elastic Compute Cloud (Amazon EC2)-Entwicklungsumgebung finden Sie unter Werkstattanweisungen.
Konfigurieren Sie den Amazon Lex-Chatbot
Mit Amazon Lex können Sie einen vollständigen Konversations-Voice-Bot erstellen. In diesem Beispiel verwenden Sie die Amazon Lex-Konsole, um einen Bot zu erstellen. Wir überspringen die Schritte, in denen Sie die Lambda-Funktion für Amazon Lex erstellen. Der Schwerpunkt liegt hier auf der Verbindung von Amazon Chime PSTN-Audio mit Amazon Lex. Anweisungen zum Erstellen benutzerdefinierter Amazon Lex-Bots finden Sie unter Amazon Lex: Wie es funktioniert. In diesem Beispiel verwenden wir das vorgefertigte Beispiel „Reise buchen“.
Erstellen Sie einen Bot
Führen Sie die folgenden Schritte aus, um Ihren Chatbot zu erstellen:
- Melden Sie sich bei der Amazon Lex-Konsole in derselben Region an, in der Sie die Amazon Chime SDK-Ressourcen bereitgestellt haben.
Das muss in einem von beiden sein us-east-1
or us-west-2
, je nachdem, wo Sie die Amazon Chime SDK-Ressourcen mit AWS CDK bereitgestellt haben.
- Wählen Sie im Navigationsbereich Bots.
- Auswählen Bot erstellen.
- Auswählen Beginnen Sie mit einem Beispiel.
- Aussichten für Bot Name, geben Sie einen Namen ein (z. B. BookTrip).
- Aussichten für BeschreibungGeben Sie eine optionale Beschreibung ein.
- Der IAM-BerechtigungenWählen Erstellen Sie eine Rolle mit grundlegenden Amazon Lex-Berechtigungen.
- Der Kinder Online-DatenschutzgesetzWählen Nein.
Dieses Beispiel benötigt diesen Schutz nicht, aber für Ihre eigene Bot-Erstellung sollten Sie diese Option entsprechend auswählen.
- Der Zeitlimit für Leerlaufsitzung¸ Sitzungs-Timeout auf 1 Minute setzen.
- Sie können das überspringen Erweiterte Einstellungen .
- Auswählen Weiter.
- Aussichten für Übersetzen, wählen Sie Ihre bevorzugte Sprache (für diesen Beitrag wählen wir Englisch (US)).
- Aussichten für Sprachinteraktion, wählen Sie die Stimme aus, die Sie verwenden möchten.
- Sie können ein Sprachbeispiel eingeben und auswählen Play um den Satz zu testen und zu bestätigen, dass die Stimme Ihren Wünschen entspricht.
- Belassen Sie andere Einstellungen auf ihren Standardeinstellungen.
- Auswählen Erledigt .
- Im Fulfillment Geben Sie im Abschnitt Bei erfolgreicher Erfüllung den folgenden Text ein:
- Der Antworten schließen, geben Sie den folgenden Text für Nachricht ein:
Goodbye!
- Auswählen Absicht speichern.
- Auswählen Bauen.
Der Erstellungsprozess dauert einige Augenblicke. Wenn es fertig ist, können Sie den Bot auf der Amazon Lex-Konsole testen.
Erstellen Sie eine Version
Sie haben jetzt den Bot erstellt. Als nächstes erstellen wir eine Version.
- Navigieren Sie zu der Versionen Seite Ihres Bots (unter dem Bot-Namen im Navigationsbereich).
- Auswählen Version erstellen.
- Akzeptieren Sie alle Standardwerte und wählen Sie Erstellen.
Ihre neue Version wird nun auf der aufgeführt Versionen
Erstellen Sie einen Alias
Als nächstes erstellen wir einen Alias.
- Wählen Sie im Navigationsbereich Aliases.
- Auswählen Alias erstellen.
- Aussichten für Alias Name, geben Sie einen Namen ein (z. B. Produktion).
- Der Partnerschaftsräte mit einer Version wählen Version 1 im Dropdown-Menü.
Wenn Sie mehr als eine Version des Bots hatten, können Sie hier die passende Version auswählen.
- Auswählen Erstellen.
Der Alias wird nun auf der aufgeführt Aliases
- Auf dem Aliases Wählen Sie auf der Seite den soeben erstellten Alias aus.
- Der Ressourcenbasierte Politik, wählen Bearbeiten.
- Fügen Sie die folgende Richtlinie hinzu, die es dem Amazon Chime SDK PSTN-Audio ermöglicht, Amazon Lex für Sie aufzurufen:
Geben Sie im vorhergehenden Code den Ressourcen-ARN (direkt über dem Textfeld) an, der der ARN für den Bot-Alias ist. Geben Sie auch Ihre Kontonummer an und geben Sie die Region an, in der Sie bereitstellen (us-east-1
or us-west-2
). Dadurch wird der ARN der PSTN-Audiosteuerungsebene in Ihrem Konto definiert.
- Auswählen Speichern um die Richtlinie zu speichern.
- Auswählen Kopieren neben dem Ressourcen-ARN, der in einem späteren Schritt verwendet werden soll.
Glückwünsche! Sie haben einen Amazon Lex-Bot konfiguriert!
In einer echten Chatbot-Anwendung würden Sie mit ziemlicher Sicherheit eine Lambda-Funktion implementieren, um die Absichten zu verarbeiten. Dieses Demoprogramm konzentriert sich darauf, zu erklären, wie man eine Verbindung zu Amazon Chime SDK PSTN-Audio herstellt, daher gehen wir nicht ins Detail. Für mehr Informationen, siehe Hinzufügen der Lambda-Funktion als Code-Hook.
Klonen Sie das GitHub-Repository
Sie können den Code für den gesamten Workshop erhalten, indem Sie das Repository klonen:
Stellen Sie die gemeinsamen Ressourcen für den Workshop bereit
Dieser Workshop verwendet das AWS CDK, um die Bereitstellung aller erforderlichen Ressourcen zu automatisieren (mit Ausnahme des Amazon Lex-Bots, den Sie bereits ausgeführt haben). Führen Sie zum Bereitstellen den folgenden Code von Ihrem Terminal aus:
Das AWS CDK stellt die Ressourcen bereit. Wir führen den Bootstrap-Schritt durch, um sicherzustellen, dass AWS CDK in der Region, in der Sie bereitstellen, ordnungsgemäß initialisiert wird. Beachten Sie, dass diese Beispiele AWS CDK Version 2 verwenden.
Das Repository enthält eine Reihe von Lektionen, die erklären sollen, wie PSTN-Audioanwendungen entwickelt werden. Wir empfehlen, diese Dokumente zu lesen, um die Grundlagen anhand der ersten paar Beispielprogramme zu verstehen. Sie können dann den Lambda-Beispielprogrammordner überprüfen. Befolgen Sie abschließend die Schritte zum Konfigurieren und Bereitstellen Ihres Codes. Geben Sie im Terminal folgenden Befehl ein:
Konfigurieren Sie Ihre Lambda-Funktion so, dass sie den Amazon Lex-Bot-ARN verwendet
Öffnen Sie den Microsoft Store auf Ihrem Windows-PC. src/index.ts
Quellcodedatei für die Lambda-Funktion und bearbeiten Sie die Variable botAlias
oben in der Datei (geben Sie den zuvor kopierten ARN an):
Sie können den Bot jetzt mit Garnbereitstellung bereitstellen und die neue Lambda-Funktion mit Garntausch in PSTN-Audio umwandeln. Den Begrüßungstext können Sie sich auch in der notieren startBotConversationAction
Objekt:
Amazon Lex startet den Bot und verwendet Amazon Polly, um diesen Text zu lesen. Dies gibt dem Anrufer eine Begrüßung und sagt ihm, was er als nächstes tun soll.
So funktioniert's
Das folgende Beispiel fügt dem, was wir in gelernt haben, weitere Aktionen hinzu Call- und Bridge-Call-Lektiondem „Vermischten Geschmack“. Seine NEW_INBOUND_CALL
Ereignis eintrifft und auf die gleiche Weise verarbeitet wird. Wir aktivieren Amazon Voice Focus (was die Fähigkeit von Amazon Lex verbessert, Wörter zu verstehen) und geben dann den eingehenden Anruf sofort mit a an den Bot weiter StartBotConversation
Aktion. Ein Beispiel für diese Aktion sieht wie das folgende Objekt aus:
Wenn der Bot eine zurückgibt ACTION_SUCCESSFUL
Event werden die vom Amazon Lex-Bot gesammelten Daten in das Event einbezogen. Die vom Bot gesammelten Daten sind enthalten, und Ihre Lambda-Funktion kann diese Daten bei Bedarf verwenden. Eine gängige Praxis zum Erstellen von Amazon Lex-Anwendungen besteht jedoch darin, die Daten mit der Funktion zu verarbeiten, die dem Amazon Lex-Bot zugeordnet ist. Beispiele für das Ereignis und die zurückgegebene Aktion finden Sie in der Workshop-Dokumentation für diese Session.
Sequenzdiagramm
Das folgende Diagramm zeigt die Abfolge von Anrufen zwischen PSTN-Audio und der Lambda-Funktion:
Eine ausführlichere Erläuterung der Bedienung finden Sie unter Werkstattdokumentation.
Aufräumen
Führen Sie die folgenden Schritte aus, um die in dieser Demo verwendeten Ressourcen zu bereinigen und weitere Gebühren zu vermeiden:
- Geben Sie im Terminal den folgenden Code ein:
- Zurück zum Workshop-Ordner (
cd ../../
) und geben Sie den folgenden Code ein:
Der vom AWS CDK erstellte AWS CloudFormation-Stack wird zerstört, wodurch alle zugewiesenen Ressourcen entfernt werden.
Zusammenfassung
In diesem Beitrag haben Sie gelernt, wie man eine dialogorientierte interaktive Sprachantwort (IVR)-System mit Amazon Lex und Amazon Chime SDK PSTN-Audio. Sie können diese Techniken verwenden, um Ihr eigenes System aufzubauen, um Ihre eigenen Kundenanrufauflösungszeiten zu verkürzen und Informationsantworten auf Ihre Kundenanrufe zu automatisieren.
Weitere Informationen finden Sie im Projekt GitHub-Repository und Verwenden des Amazon Chime SDK PSTN Audio-Dienstes.
Über den Autor
Gregor Herlein leitet seit über 25 Jahren Softwareteams in großen und kleinen Unternehmen, darunter mehrere Startups. Derzeit ist er Principal Evangelist für den Amazon Chime SDK-Service, wo er sich leidenschaftlich dafür einsetzt, Kunden beim Aufbau fortschrittlicher Kommunikationssoftware zu unterstützen.
- Coinsmart. Europas beste Bitcoin- und Krypto-Börse.
- Platoblockkette. Web3-Metaverse-Intelligenz. Wissen verstärkt. DEN FREIEN ZUGANG.
- CryptoHawk. Altcoin-Radar. Kostenlose Testphase.
- Quelle: https://aws.amazon.com/blogs/machine-learning/enable-conversational-chatbots-for-telephony-using-amazon-lex-and-the-amazon-chime-sdk/
- "
- 100
- 9
- Über uns
- Konto
- Action
- Aktionen
- Zusatz
- advanced
- Agenten
- AI
- Alle
- bereits
- Amazon
- Bekannt geben
- Bienen
- Anwendung
- Anwendungen
- Audio-
- Automatisiert
- AWS
- Hintergrund
- Grundlagen
- Grenze
- Wander- und Outdoorschuhen
- Bots
- Box
- BRIDGE
- bauen
- Building
- rufen Sie uns an!
- Kann bekommen
- Fähigkeiten
- Auto
- CD
- Gebühren
- Cloud
- Code
- gemeinsam
- Kommunikation
- Unternehmen
- Berechnen
- Zustand
- Konfiguration
- Konsul (Console)
- Inhalt
- Smartgeräte App
- könnte
- Schaffung
- Referenzen
- Original
- Kunden
- technische Daten
- einsetzen
- Bereitstellen
- Einsatz
- setzt ein
- Design
- zerstört
- Detail
- entwickeln
- Entwickler
- Entwicklung
- DID
- Unterlagen
- Tut nicht
- leicht
- bewirken
- Englisch
- Arbeitsumfeld
- Event
- Beispiel
- Außer
- Erfahrungen
- Eigenschaften
- Vorname
- Setzen Sie mit Achtsamkeit
- folgen
- Folgende
- Format
- gefunden
- Funktion
- GitHub
- Hilfe
- hier
- Ultraschall
- Hilfe
- HTTPS
- implementieren
- inklusive
- Einschließlich
- Information
- integrieren
- integriert
- Integration
- interaktive
- Schnittstelle
- IT
- Sprache
- grosse
- LERNEN
- gelernt
- lernen
- geführt
- Niveau
- Line
- Gelistet
- Maschine
- Maschinelles Lernen
- verwaltet
- Manager
- Medien
- Messaging
- ML
- Mobil
- Mobile Anwendungen
- mehr
- Natürliche
- Navigation
- In der Nähe von
- Netzwerk
- Neue Funktionen
- Lärm
- Anzahl
- Zahlen
- Online
- Online-Datenschutz
- Option
- Auftrag
- Andere
- Datenschutzrichtlinien
- größte treibende
- Praxis
- Principal
- Datenschutz
- Prozessdefinierung
- Produktion
- Programm
- Programme
- Projekt
- Sicherheit
- Protokoll
- die
- bietet
- Öffentlichkeit
- Echtzeit
- empfehlen
- Veteran
- Mieten
- ersetzt
- Quelle
- falls angefordert
- Ressourcen
- Downloads
- Antwort
- Rückgabe
- Überprüfen
- Ohne eine erfahrene Medienplanung zur Festlegung von Regeln und Strategien beschleunigt der programmatische Medieneinkauf einfach die Rate der verschwenderischen Ausgaben.
- Führen Sie
- Sdk
- Modellreihe
- Serverlos
- kompensieren
- Einfacher
- klein
- So
- Software
- Lösung
- anspruchsvoll
- Quellcode
- Stapel
- beginnt
- Startups
- Erklärung
- speichern
- erfolgreich
- System
- und Aufgaben
- Techniken
- Technologies
- erzählt
- Terminal
- Test
- Die Grundlagen
- Die Quelle
- Durch
- Top
- reisen
- verstehen
- us
- -
- Video
- Assistent
- Stimme
- Netz
- willkommen
- Was
- Worte
- arbeiten,
- Werk
- Jahr