会話型AIは、音声とテキストを介して強力で自動化されたインタラクティブなエクスペリエンスを提供できます。 Amazon Lex は、自動音声認識と自然言語理解技術を組み合わせたサービスであるため、これらの洗練された会話体験を構築できます。 会話型AIの一般的なアプリケーションは、コンタクトセンター、つまりセルフサービスの仮想エージェントにあります。 使用できるようになりました。 Amazon Chime SDK 公衆交換電話網(PSTN)オーディオにより、会話型セルフサービスアプリケーションを有効にして、通話の解決時間を短縮し、情報応答を自動化します。
Amazon Chime SDKは、開発者がWebおよびモバイルアプリケーションにオーディオ、メッセージング、ビデオ、および画面共有を追加するために使用できるリアルタイム通信コンポーネントのセットです。 Amazon Chime SDKPSTNオーディオとAmazonLexの統合により、ビルダーは公衆電話網との間の通話用の会話型インターフェイスを開発できます。 会話型などのAIを活用したセルフサービスアプリケーションを構築できるようになりました 対話型音声応答システム (IVR)、仮想エージェント、および音声通信にSession Initiation Protocol(SIP)を使用するその他のテレフォニーアプリケーション。
さらに、いくつかの新機能をリリースしました。 PSTN用のAmazonVoiceFocus ディープラーニングベースのノイズ抑制を提供して、通話時の不要なノイズを低減します。 また、ネイティブ統合により、アプリケーションで機械学習(ML)駆動のテキスト読み上げを使用できるようになりました。 Amazon Polly。 すべての機能がAmazonChimeSDKPSTNオーディオと直接統合されました。
この投稿では、その方法を説明します 会話型IVRシステムを構築する AmazonLexを使用して電話で予約を受け入れる架空の旅行サービスの場合。
ソリューションの概要
Amazon Chime SDK PSTNオーディオにより、開発者はサーバーレスの俊敏性と操作のシンプルさを使用して、カスタマイズされたテレフォニーアプリケーションを簡単に構築できます。 AWSラムダ 機能します。
このソリューションでは、次のコンポーネントを使用します。
- Amazon ChimeSDKPSTNオーディオ
- AWSラムダ
- Amazon Lex
- Amazon Polly
AmazonLexはAmazonPollyとネイティブに統合され、テキスト読み上げ機能を提供します。 この投稿では、Amazon Voice Focusを有効にして、通話のバックグラウンドノイズを低減します。 で 以前の投稿、APIインターフェースを使用してAmazonLexv1と統合する方法を示しました。 それはもう必要ありません。 AmazonLexとAmazonPollyでの作業の重労働は、いくつかの単純な関数呼び出しに置き換えられました。
次の図は、Amazon Chime SDKAmazonLexチャットボットシステムの高レベルの設計を示しています。
Amazon Chime SDK PSTNオーディオサービスを使用したビルドの学習を支援するために、 ソースコードとドキュメントのリポジトリ そのソースコードがどのように機能するかを説明します。 ソースコードはワークショップ形式であり、各サンプルプログラムは前のレッスンに基づいています。 最後のレッスンは、電話で完全なAmazonLex駆動のチャットボットを構築する方法です。 これが、この投稿で焦点を当てているレッスンです。
このソリューションの一部として、次のリソースを作成します。
- SIPメディアアプリケーション –呼び出すLambda関数を指定する管理対象オブジェクト。
- SIPルール –トリガーする電話番号と、Lambda関数を呼び出すために使用するSIPメディアアプリケーション管理対象オブジェクトを指定する管理対象オブジェクト。
- 電話 –電話を受けるためにプロビジョニングされたAmazon ChimeSDKPSTN電話番号。
- ラムダ関数 –PSTNオーディオサービスと統合されたTypescriptで記述された機能。 SIPメディアアプリケーションからの呼び出しを受信し、AmazonPollyおよびAmazonLexタスクを実行するようにSIPメディアアプリケーションに指示するアクションを送り返します。
デモコードはXNUMXつの部分に分けて展開されます。 Amazon Lexチャットボットの例は、Amazon ChimeSDKPSTNオーディオの使用方法を教える一連のワークショップの例のXNUMXつです。 この投稿では、チャットボットをデプロイするための次の高レベルの手順を完了します。
- AmazonLexチャットボットを構成します。
- GitHubリポジトリからコードのクローンを作成します。
- ワークショップの共通リソース(電話番号を含む)を展開します。
- AmazonLexを電話番号に接続するLambda関数をデプロイします。
各ステップを詳しく説明します。
前提条件
次の前提条件が必要です。
- ノードV12+/npmがインストールされています
- インストールされているAWSコマンドラインインターフェイス(AWS CLI)
- Node Version Manager(nvm)がインストールされています
- インストールされているノードモジュールtypescriptaws-sdk(nvmを使用)
- このデモに使用するアカウントとリージョンに設定されたAWSクレデンシャル
- Amazon Chime SIPメディアアプリケーションと電話番号を作成するためのアクセス許可(サービスクォータが
us-east-1
orus-west-2
電話番号、音声コネクタ、SIPメディアアプリケーション、およびSIPルールに達していない場合) - 展開はで行う必要があります
us-east-1
orus-west-2
PSTNオーディオリソースと連携する
インストールを自動化できるスクリプトや、Amazon Elastic Compute Cloud(Amazon EC2)開発環境を簡単に作成するためのAWS Cloud Development Kit(AWS CDK)プロジェクトなど、詳細なインストール手順については、 ワークショップの指示。
AmazonLexチャットボットを構成する
Amazon Lexを使用して、完全な会話型音声ボットを構築できます。 この例では、AmazonLexコンソールを使用してボットを構築します。 AmazonLexのLambda関数を作成する手順はスキップします。 ここでの焦点は、AmazonChimePSTNオーディオをAmazonLexに接続する方法です。 カスタムAmazonLexボットを構築する手順については、を参照してください。 アマゾンレックス:それがどのように機能するか。 この例では、事前に作成された「ブックトリップ」の例を使用します。
ボットを作成する
チャットボットを作成するには、次の手順を実行します。
- AmazonChimeSDKリソースをデプロイしたのと同じリージョンのAmazonLexコンソールにサインインします。
これはどちらかにある必要があります us-east-1
or us-west-2
、AWSCDKを使用してAmazonChimeSDKリソースをデプロイした場所によって異なります。
- ナビゲーションペインで、 ボット.
- 選択する ボットを作成する.
- 選択 例から始めます。
- ボット名、名前を入力します(たとえば、BookTrip)。
- 説明、オプションの説明を入力します。
- IAM権限選択 基本的なAmazonLex権限を持つロールを作成します.
- 子供のオンラインプライバシー保護法選択 いいえ.
この例ではその保護は必要ありませんが、独自のボットを作成するには、それに応じてこのオプションを選択する必要があります。
- アイドルセッションタイムアウト¸セッションタイムアウトを1分に設定します。
- スキップできます 詳細設定 のセクションから無料でダウンロードできます。
- 選択する Next.
- 言語の選択、ご希望の言語を選択してください(この投稿では、英語(US)を選択します)。
- 音声対話、使用する音声を選択します。
- 音声サンプルを入力して選択できます プレイ フレーズをテストし、声があなたの好みに合っていることを確認します。
- 他の設定はデフォルトのままにします。
- 選択する クリックします.
- フルフィルメント セクションで、「正常に実行された場合」に次のテキストを入力します。
- クロージングレスポンス、メッセージに次のテキストを入力します。
Goodbye!
- 選択する 意図を保存.
- 選択する 完成に向けてあなたの背中を押してくれる、執筆のための持続可能で本物のモーメンタムを作り出す。.
ビルドプロセスが完了するまでに少し時間がかかります。 終了したら、AmazonLexコンソールでボットをテストできます。
バージョンを作成する
これでボットが作成されました。 次に、バージョンを作成します。
- に移動します バージョン ボットのページ(ナビゲーションペインのボット名の下)。
- 選択する バージョンを作成する.
- すべてのデフォルト値を受け入れて、 創造する.
新しいバージョンが バージョン ページで見やすくするために変数を解析したりすることができます。
エイリアスを作成する
次に、エイリアスを作成します。
- ナビゲーションペインで、 エイリアス.
- 選択する エイリアスを作成する.
- エイリアス 名前、名前を入力します(たとえば、本番)。
- 仲間 バージョンで、選択します Version 1 ドロップダウンメニューで
ボットのバージョンが複数ある場合は、ここで適切なバージョンを選択できます。
- 選択する 創造する.
エイリアスは現在、 エイリアス ページで見やすくするために変数を解析したりすることができます。
- ソフトウェア設定ページで、下図のように エイリアス ページで、作成したエイリアスを選択します。
- リソースベースのポリシー、選択する 編集.
- 次のポリシーを追加します。これにより、Amazon ChimeSDKPSTNオーディオがAmazonLexを呼び出すことができます。
上記のコードでは、ボットエイリアスのARNであるリソースARN(テキストボックスのすぐ上にあります)を指定します。 また、アカウント番号を入力し、展開先の地域を指定します(us-east-1
or us-west-2
)。 これにより、アカウントのPSTNオーディオコントロールプレーンのARNが定義されます。
- 選択する Save ポリシーを保存します。
- 選択する コピー 後のステップで使用するリソースARNの横。
おめでとう! これで、AmazonLexボットが構成されました。
実際のチャットボットアプリケーションでは、ほぼ確実に、インテントを処理するためのLambda関数を実装します。 このデモプログラムは、Amazon Chime SDK PSTNオーディオに接続する方法を説明することに焦点を当てているため、そのレベルの詳細には立ち入りません。 詳細については、 ラムダ関数をコードフックとして追加するを参照してください.
GitHubリポジトリのクローンを作成します
リポジトリのクローンを作成することで、ワークショップ全体のコードを取得できます。
ワークショップの共通リソースを展開する
このワークショップでは、AWS CDKを使用して、必要なすべてのリソースのデプロイを自動化します(既に行ったAmazon Lexボットを除く)。 デプロイするには、ターミナルから次のコードを実行します。
AWSCDKはリソースをデプロイします。 ブートストラップステップを実行して、デプロイ先のリージョンでAWSCDKが適切に初期化されていることを確認します。 これらの例では、AWSCDKバージョン2を使用していることに注意してください。
リポジトリには、PSTNオーディオアプリケーションの開発方法を説明するために設計された一連のレッスンがあります。 これらのドキュメントを確認して、最初のいくつかのサンプルプログラムを使用して基本を理解することをお勧めします。 次に、Lambdaサンプルプログラムフォルダーを確認できます。 最後に、手順に従ってコードを構成してからデプロイします。 ターミナルで、次のコマンドを入力します。
AmazonLexボットARNを使用するようにLambda関数を設定します
Video Cloud Studioで src/index.ts
Lambda関数のソースコードファイルと変数を編集します botAlias
ファイルの先頭近く(前にコピーしたARNを提供します):
これで、yarn deployを使用してボットをデプロイし、yarnswapを使用して新しいLambda関数をPSTNオーディオにスワップできます。 また、ウェルカムテキストに注意することができます startBotConversationAction
オブジェクト:
Amazon Lexはボットを起動し、AmazonPollyを使用してそのテキストを読み取ります。 これにより、発信者に挨拶があり、次に何をすべきかが伝えられます。
機能
次の例では、 コールとブリッジコールのレッスンを選択します。 NEW_INBOUND_CALL
イベントが到着し、同じ方法で処理されます。 Amazon Voice Focus(Amazon Lexが単語を理解する能力を強化する)を有効にしてから、着信コールをボットにすぐに渡します。 StartBotConversation
アクション。 そのアクションの例は、次のオブジェクトのようになります。
ボットが ACTION_SUCCESSFUL
イベントでは、AmazonLexボットによって収集されたデータがイベントに含まれます。 ボットから収集されたデータが含まれ、Lambda関数は必要に応じてそのデータを使用できます。 ただし、Amazon Lexアプリケーションを構築するための一般的な方法は、AmazonLexボットに関連付けられた関数を使用してデータを処理することです。 イベントと返されるアクションの例は、 このセッションのワークショップドキュメント.
シーケンス図
次の図は、PSTNオーディオとLambda関数の間で行われる呼び出しのシーケンスを示しています。
操作の詳細については、以下を参照してください。 ワークショップのドキュメント.
クリーンアップ
このデモで使用されているリソースをクリーンアップし、追加料金が発生しないようにするには、次の手順を実行します。
- ターミナルで、次のコードを入力します。
- ワークショップフォルダに戻る(
cd ../../
)そして次のコードを入力します:
AWSCDKによって作成されたAWSCloudFormationスタックが破棄され、割り当てられたすべてのリソースが削除されます。
まとめ
この投稿では、を構築する方法を学びました 会話型対話型音声応答 (IVR)AmazonLexおよびAmazonChimeSDKPSTNオーディオを使用するシステム。 これらの手法を使用して独自のシステムを構築し、独自の顧客からの電話の解決時間を短縮し、顧客からの電話に対する情報応答を自動化できます。
詳細については、以下を参照してください プロジェクトGitHubリポジトリ & Amazon ChimeSDKPSTNオーディオサービスの使用.
著者について
グレッグ・ハーライン いくつかの新興企業を含む大小の企業で25年以上ソフトウェアチームを率いてきました。 彼は現在、Amazon Chime SDKサービスのプリンシパルエバンジェリストであり、顧客が高度な通信ソフトウェアを構築するのを支援する方法に情熱を注いでいます。
- "
- 100
- 9
- 私たちについて
- Action
- 行動
- 添加
- 高度な
- エージェント
- AI
- すべて
- 既に
- Amazon
- アナウンス
- API
- 申し込み
- オーディオ
- 自動化
- AWS
- 背景
- の基礎
- 国境
- ロボット
- ボット
- ボックス
- BRIDGE
- ビルド
- 建物
- コール
- 取得することができます
- 機能
- 自動車
- CD
- 課金
- クラウド
- コード
- コマンドと
- 通信部
- 企業
- 計算
- 条件
- 領事
- コンテンツ
- コントロール
- 可能性
- 創造
- Credentials
- カスタム
- Customers
- データ
- 展開します
- 展開する
- 展開
- 配備する
- 設計
- 破壊された
- 詳細
- 開発する
- 開発者
- 開発
- DID
- ドキュメント
- そうではありません
- 簡単に
- 効果
- 英語
- 環境
- イベント
- 例
- 除く
- エクスペリエンス
- 特徴
- 名
- フォーカス
- フォロー中
- 形式でアーカイブしたプロジェクトを保存します.
- 発見
- function
- GitHubの
- 助けます
- こちら
- 認定条件
- How To
- HTTPS
- 実装する
- 含まれました
- 含めて
- 情報
- 統合する
- 統合された
- 統合
- 相互作用的
- インタフェース
- IT
- 言語
- 大
- LEARN
- 学んだ
- 学習
- ツェッペリン
- レベル
- LINE
- リストされた
- 機械
- 機械学習
- マネージド
- マネージャー
- メディア
- メッセージング
- ML
- モバイル
- モバイルアプリ
- 他には?
- ナチュラル
- ナビゲーション
- 近く
- ネットワーク
- 新しい特徴
- ノイズ
- 数
- 番号
- オンライン
- オンラインプライバシー
- オプション
- 注文
- その他
- 方針
- 強力な
- 練習
- 校長
- プライバシー
- プロセス
- 生産
- 演奏曲目
- プログラム
- プロジェクト
- 保護
- 提供します
- は、大阪で
- 公共
- への
- 推奨する
- 減らします
- 家賃
- 置き換え
- 倉庫
- の提出が必要です
- リソースを追加する。
- リソース
- 応答
- 収益
- レビュー
- ルール
- ラン
- SDDK
- シリーズ
- サーバレス
- サービス
- セッションに
- 簡単な拡張で
- 小さい
- So
- ソフトウェア
- 溶液
- 洗練された
- ソースコード
- スタック
- 開始
- スタートアップ
- ステートメント
- 店舗
- 成功した
- タスク
- テクニック
- テクノロジー
- 伝える
- ターミナル
- test
- 基礎
- ソース
- 介して
- top
- 旅行
- わかる
- us
- つかいます
- ビデオ
- バーチャル
- ボイス
- ウェブ
- 歓迎
- この試験は
- 言葉
- ワーキング
- 作品
- 年