플라톤에 의해 재발행

팔로워 : 0

대화형 AI는 음성과 텍스트를 통해 강력하고 자동화된 대화형 경험을 제공할 수 있습니다. 아마존 렉스 자동 음성 인식과 자연어 이해 기술을 결합하여 이러한 정교한 대화 경험을 구축할 수 있는 서비스입니다. 대화형 AI의 일반적인 응용 프로그램은 컨택 센터인 셀프 서비스 가상 에이전트에서 찾을 수 있습니다. 이제 사용할 수 있음을 알려드립니다. 아마존 차임 SDK PSTN(Public Switched Telephone Network) 오디오를 통해 대화형 셀프 서비스 애플리케이션이 통화 해결 시간을 줄이고 정보 응답을 자동화할 수 있습니다.

Amazon Chime SDK는 개발자가 웹 및 모바일 애플리케이션에 오디오, 메시징, 비디오 및 화면 공유를 추가하는 데 사용할 수 있는 일련의 실시간 통신 구성 요소입니다. Amazon Chime SDK PSTN 오디오와 Amazon Lex의 통합을 통해 빌더는 공중 전화 네트워크와의 통화를 위한 대화형 인터페이스를 개발할 수 있습니다. 이제 대화형 앱과 같은 AI 기반 셀프 서비스 애플리케이션을 구축할 수 있습니다. 대화형 음성 응답 시스템 (IVR), 가상 에이전트 및 음성 통신에 SIP(Session Initiation Protocol)를 사용하는 기타 전화 통신 애플리케이션.

또한 몇 가지 새로운 기능을 출시했습니다. PSTN용 Amazon Voice Focus 통화 중 원치 않는 소음을 줄이기 위해 딥 러닝 기반 소음 억제 기능을 제공합니다. 또한 이제 기본 통합을 통해 애플리케이션에서 기계 학습(ML) 기반 텍스트 음성 변환을 사용할 수 있습니다. 아마존 폴리. 이제 모든 기능이 Amazon Chime SDK PSTN 오디오와 직접 통합됩니다.

이 게시물에서 우리는 당신에게 방법을 가르쳐 대화형 IVR 시스템 구축 Amazon Lex를 사용하여 전화로 예약을 수락하는 가상의 여행 서비스.

솔루션 개요

Amazon Chime SDK PSTN 오디오를 사용하면 개발자가 서버리스의 민첩성과 운영 단순성을 사용하여 맞춤형 전화 통신 애플리케이션을 쉽게 구축할 수 있습니다. AWS 람다 기능.

이 솔루션의 경우 다음 구성 요소를 사용합니다.

Amazon Chime SDK PSTN 오디오
AWS 람다
아마존 렉스
아마존 폴리

Amazon Lex는 기본적으로 Amazon Polly와 통합되어 텍스트 음성 변환 기능을 제공합니다. 이 게시물에서는 Amazon Voice Focus를 활성화하여 전화 통화 시 배경 소음도 줄일 수 있습니다. 안에 이전 게시물, 우리는 API 인터페이스를 사용하여 Amazon Lex v1과 통합하는 방법을 보여주었습니다. 더 이상 필요하지 않습니다. Amazon Lex 및 Amazon Polly로 작업하는 무거운 작업은 이제 몇 가지 간단한 함수 호출로 대체되었습니다.

다음 다이어그램은 Amazon Chime SDK Amazon Lex 챗봇 시스템의 개략적인 설계를 보여줍니다.

Amazon Lex 및 Amazon Chime SDK PlatoBlockchain Data Intelligence를 사용하여 전화 통신을 위한 대화형 챗봇을 활성화합니다. 수직 검색. 일체 포함.

Amazon Chime SDK PSTN 오디오 서비스를 사용하여 빌드하는 방법을 배우는 데 도움이 되도록 소스 코드 및 문서의 저장소 소스 코드가 어떻게 작동하는지 설명합니다. 소스 코드는 워크샵 형식으로 되어 있으며 각 예제 프로그램은 이전 수업을 기반으로 합니다. 마지막 강의는 전화를 통해 완전한 Amazon Lex 기반 챗봇을 구축하는 방법입니다. 이것이 우리가 이 포스트에서 집중하는 교훈입니다.

이 솔루션의 일부로 다음 리소스를 생성합니다.

SIP 미디어 애플리케이션 – 호출할 Lambda 함수를 지정하는 관리형 객체.
SIP 규칙 – 트리거할 전화번호와 Lambda 함수를 호출하는 데 사용할 SIP 미디어 애플리케이션 관리 객체를 지정하는 관리 객체.
전화번호 – 전화 수신을 위해 프로비저닝된 Amazon Chime SDK PSTN 전화 번호.
람다 함수 – PSTN 오디오 서비스와 통합된 Typescript로 작성된 기능입니다. SIP 미디어 애플리케이션에서 호출을 수신하고 SIP 미디어 애플리케이션이 Amazon Polly 및 Amazon Lex 작업을 수행하도록 지시하는 작업을 다시 보냅니다.

데모 코드는 두 부분으로 배포됩니다. Amazon Lex 챗봇 예제는 Amazon Chime SDK PSTN 오디오 사용 방법을 가르치는 워크샵 예제 시리즈 중 하나입니다. 이 게시물에서는 챗봇을 배포하기 위해 다음과 같은 높은 수준의 단계를 완료합니다.

Amazon Lex 챗봇을 구성합니다.
GitHub 리포지토리에서 코드를 복제합니다.
워크샵을 위한 공통 리소스(전화 번호 포함)를 배포합니다.
Amazon Lex를 전화번호에 연결하는 Lambda 함수를 배포합니다.

각 단계를 자세히 살펴봅니다.

사전 조건

다음 전제 조건이 있어야 합니다.

노드 V12+/npm 설치됨
설치된 AWS 명령줄 인터페이스(AWS CLI)
노드 버전 관리자(nvm) 설치
노드 모듈 typescript aws-sdk(nvm 사용)가 설치되었습니다.
이 데모에 사용하는 계정 및 리전에 대해 구성된 AWS 자격 증명
Amazon Chime SIP 미디어 애플리케이션 및 전화 번호를 생성할 수 있는 권한(서비스 할당량이 us-east-1 or us-west-2 전화 번호, 음성 커넥터, SIP 미디어 애플리케이션 및 SIP 규칙에 도달하지 않음)
배포는 다음에서 수행해야 합니다. us-east-1 or us-west-2 PSTN 오디오 리소스에 맞추기 위해

설치를 자동화할 수 있는 스크립트와 Amazon Elastic Compute Cloud(Amazon EC2) 개발 환경을 쉽게 생성할 수 있는 AWS CDK(AWS Cloud Development Kit) 프로젝트를 포함한 자세한 설치 지침은 다음을 참조하십시오. 워크샵 지침.

Amazon Lex 챗봇 구성

Amazon Lex를 사용하여 완전한 대화형 음성 봇을 구축할 수 있습니다. 이 예에서는 Amazon Lex 콘솔을 사용하여 봇을 구축합니다. Amazon Lex용 Lambda 함수를 빌드하는 단계는 건너뜁니다. 여기서 초점은 Amazon Chime PSTN 오디오를 Amazon Lex에 연결하는 방법입니다. 사용자 지정 Amazon Lex 봇 구축에 대한 지침은 다음을 참조하십시오. Amazon Lex: 작동 방식. 이 예에서는 사전 구축된 "책 여행" 예를 사용합니다.

봇 만들기

챗봇을 생성하려면 다음 단계를 완료하세요.

Amazon Chime SDK 리소스를 배포한 동일한 리전에서 Amazon Lex 콘솔에 로그인합니다.

이것은 다음 중 하나에 있어야 합니다. us-east-1 or us-west-2, AWS CDK를 사용하여 Amazon Chime SDK 리소스를 배포한 위치에 따라 다릅니다.

탐색 창에서 봇.
왼쪽 메뉴에서 봇 만들기.
선택 예를 들어 시작합니다.
럭셔리 봇 이름, 이름을 입력합니다(예: BookTrip).
럭셔리 상품 설명, 선택적 설명을 입력하십시오.
$XNUMX Million 미만 IAM 권한, 고르다 기본 Amazon Lex 권한이 있는 역할 생성.
$XNUMX Million 미만 어린이 온라인 개인 정보 보호법, 고르다 아니.

이 예에서는 해당 보호가 필요하지 않지만 자체 봇 생성을 위해 적절하게 이 옵션을 선택해야 합니다.

Amazon Lex 및 Amazon Chime SDK PlatoBlockchain Data Intelligence를 사용하여 전화 통신을 위한 대화형 챗봇을 활성화합니다. 수직 검색. 일체 포함.

$XNUMX Million 미만 유휴 세션 시간 초과¸ 세션 시간 초과를 1분으로 설정합니다.
당신은 "계정 정보"에서 안내
왼쪽 메뉴에서 다음 보기.

Amazon Lex 및 Amazon Chime SDK PlatoBlockchain Data Intelligence를 사용하여 전화 통신을 위한 대화형 챗봇을 활성화합니다. 수직 검색. 일체 포함.

럭셔리 언어 선택, 원하는 언어를 선택하십시오(이 게시물에서는 영어(미국)를 선택합니다).
럭셔리 음성 상호 작용, 사용하려는 음성을 선택합니다.
음성 샘플을 입력하고 선택할 수 있습니다. 연극 문구를 테스트하고 음성이 원하는지 확인합니다.
다른 설정은 기본값으로 둡니다.
왼쪽 메뉴에서 선택한다.

Amazon Lex 및 Amazon Chime SDK PlatoBlockchain Data Intelligence를 사용하여 전화 통신을 위한 대화형 챗봇을 활성화합니다. 수직 검색. 일체 포함.

. 이행 섹션에서 On 성공적인 이행에 대해 다음 텍스트를 입력합니다.

Thank you!  We'll see you on {CheckInDate}.

$XNUMX Million 미만 마무리 응답, 메시지에 다음 텍스트를 입력합니다.

Goodbye!

왼쪽 메뉴에서 의도 저장.
왼쪽 메뉴에서 짓다.

Amazon Lex 및 Amazon Chime SDK PlatoBlockchain Data Intelligence를 사용하여 전화 통신을 위한 대화형 챗봇을 활성화합니다. 수직 검색. 일체 포함.

빌드 프로세스를 완료하는 데 몇 분 정도 걸립니다. 완료되면 Amazon Lex 콘솔에서 봇을 테스트할 수 있습니다.

버전 만들기

이제 봇을 구축했습니다. 다음으로 버전을 생성합니다.

로 이동 버전 봇 페이지(탐색 창의 봇 이름 아래).
왼쪽 메뉴에서 버전 만들기.
모든 기본값을 수락하고 다음을 선택합니다. 만들기.

새 버전이 이제 버전 페이지.

Amazon Lex 및 Amazon Chime SDK PlatoBlockchain Data Intelligence를 사용하여 전화 통신을 위한 대화형 챗봇을 활성화합니다. 수직 검색. 일체 포함.

별칭 만들기

다음으로 별칭을 만듭니다.

탐색 창에서 별칭.
왼쪽 메뉴에서 별칭 만들기.
럭셔리 별명 이름, 이름(예: 생산)을 입력합니다.
$XNUMX Million 미만 준 버전으로 선택 버전 1 드롭 다운 메뉴에서

봇 버전이 두 개 이상인 경우 여기에서 적절한 버전을 선택할 수 있습니다.

왼쪽 메뉴에서 만들기.

이제 별칭이 별칭 페이지.

Amazon Lex 및 Amazon Chime SDK PlatoBlockchain Data Intelligence를 사용하여 전화 통신을 위한 대화형 챗봇을 활성화합니다. 수직 검색. 일체 포함.

에 별칭 페이지에서 방금 생성한 별칭을 선택합니다.
$XNUMX Million 미만 리소스 기반 정책선택한다. 편집.
Amazon Chime SDK PSTN 오디오가 Amazon Lex를 호출하도록 허용하는 다음 정책을 추가합니다.

{ "Version": "2012-10-17", "Statement": [ { "Sid": "SMALexAccess", "Effect": "Allow", "Principal": { "Service": "voiceconnector.chime.amazonaws.com" }, "Action": "lex:StartConversation", "Resource": "<Resource-ARN-for-the-Alias>", "Condition": { "StringEquals": { "AWS:SourceAccount": "<account-num>" }, "ArnEquals": { "AWS:SourceArn": "arn:aws:voiceconnector:<region>:<account-num>:*" } } } ]
}

앞의 코드에서 봇 별칭의 ARN인 리소스 ARN(텍스트 상자 바로 위에 있음)을 제공합니다. 또한 계정 번호를 제공하고 배포할 리전을 지정합니다(us-east-1 or us-west-2). 이는 계정에 있는 PSTN 오디오 컨트롤 플레인의 ARN을 정의합니다.

왼쪽 메뉴에서 찜하기 정책을 저장합니다.
왼쪽 메뉴에서 부 이후 단계에서 사용할 리소스 ARN 옆에 있습니다.

축하합니다! Amazon Lex 봇을 구성했습니다!

실제 챗봇 애플리케이션에서는 의도를 처리하기 위해 Lambda 함수를 구현하는 것이 거의 확실합니다. 이 데모 프로그램은 Amazon Chime SDK PSTN 오디오에 연결하는 방법을 설명하는 데 중점을 두므로 그 수준까지는 다루지 않습니다. 자세한 내용은, 코드 후크로 Lambda 함수 추가를 참조하십시오..

GitHub 리포지토리 복제

저장소를 복제하여 전체 워크샵에 대한 코드를 얻을 수 있습니다.

git clone https://github.com/aws-samples/amazon-chime-sdk-pstn-audio-workshop
cd amazon-chime-sdk-pstn-audio-workshop

워크샵을 위한 공통 리소스 배포

이 워크샵에서는 AWS CDK를 사용하여 필요한 모든 리소스의 배포를 자동화합니다(이미 수행한 Amazon Lex 봇 제외). 배포하려면 터미널에서 다음 코드를 실행하세요.

cdk bootstrap
yarn deploy

AWS CDK는 리소스를 배포합니다. AWS CDK가 배포할 리전에서 제대로 초기화되었는지 확인하기 위해 부트스트랩 단계를 수행합니다. 이 예제에서는 AWS CDK 버전 2를 사용합니다.

리포지토리에는 PSTN 오디오 응용 프로그램을 개발하는 방법을 설명하도록 설계된 일련의 수업이 있습니다. 처음 몇 개의 샘플 프로그램을 사용하여 기본 사항을 이해하려면 이러한 문서를 검토하는 것이 좋습니다. 그런 다음 Lambda 샘플 프로그램 폴더를 검토할 수 있습니다. 마지막으로 단계에 따라 코드를 구성한 다음 배포합니다. 터미널에서 다음 명령을 입력합니다.

cd lambdas/call-lex-bot

Amazon Lex 봇 ARN을 사용하도록 Lambda 함수 구성

열기 src/index.ts Lambda 함수에 대한 소스 코드 파일 및 변수 편집 botAlias 파일 상단 근처(이전에 복사한 ARN 제공):

const botAlias = "<Resource-ARN-for-the-Alias>";

이제 yarn deploy를 사용하여 봇을 배포하고 yarn swap을 사용하여 새로운 Lambda 함수를 PSTN 오디오로 바꿀 수 있습니다. 환영 텍스트를 메모할 수도 있습니다. startBotConversationAction 목적:

const startBotConversationAction = { Type: "StartBotConversation", Parameters: { BotAliasArn: "none", LocaleId: "en_US", Configuration: { SessionState: { DialogAction: { Type: "ElicitIntent" } }, WelcomeMessages: [ { ContentType: "PlainText", Content: "Welcome to AWS Chime SDK Voice Service. Please say what you would like to do. For example: I'd like to book a room, or, I'd like to rent a car." }, ] } }
}

Amazon Lex는 봇을 시작하고 Amazon Polly를 사용하여 해당 텍스트를 읽습니다. 이것은 발신자에게 인사말을 주고 다음에 무엇을 해야 하는지 알려줍니다.

전달 방법

다음 예제에서는 에서 배운 내용에 더 많은 작업을 추가합니다. 통화 및 브리지 통화 수업. 그만큼 NEW_INBOUND_CALL 이벤트가 도착하고 동일한 방식으로 처리됩니다. Amazon Voice Focus(Amazon Lex의 단어 이해 능력 향상)를 활성화한 다음 수신 전화를 즉시 봇에 전달합니다. StartBotConversation 동작. 해당 작업의 예는 다음 개체와 같습니다.

{ "SchemaVersion": "1.0", "Actions": [ { "Type": "Pause", "Parameters": { "DurationInMilliseconds": "1000" } }, { "Type": "VoiceFocus", "Parameters": { "Enable": true, "CallId": "2947dfba-0748-46fc-abc5-a2c21c7569eb" } }, { "Type": "StartBotConversation", "Parameters": { "BotAliasArn": "arn:aws:lex:us-east-1:<account-num>:bot-alias/RQXM74UXC7/ZYXLOINIJL", "LocaleId": "en_US", "Configuration": { "SessionState": { "DialogAction": { "Type": "ElicitIntent" } }, "WelcomeMessages": [ { "ContentType": "PlainText", "Content": "Welcome to AWS Chime SDK Voice Service. Please say what you would like to do. For example: I'd like to order flowers." } ] } } } ]
}

봇이 다음을 반환할 때 ACTION_SUCCESSFUL 이벤트의 경우 Amazon Lex 봇이 수집한 데이터가 이벤트에 포함됩니다. 봇에서 수집된 데이터가 포함되며 필요한 경우 Lambda 함수에서 해당 데이터를 사용할 수 있습니다. 그러나 Amazon Lex 애플리케이션을 구축하는 일반적인 방법은 Amazon Lex 봇과 연결된 기능으로 데이터를 처리하는 것입니다. 이벤트 및 반환된 작업의 예는 이 세션에 대한 워크샵 문서.

시퀀스 다이어그램

다음 다이어그램은 PSTN 오디오와 Lambda 함수 간의 호출 시퀀스를 보여줍니다.

Amazon Lex 및 Amazon Chime SDK PlatoBlockchain Data Intelligence를 사용하여 전화 통신을 위한 대화형 챗봇을 활성화합니다. 수직 검색. 일체 포함.

조작에 대한 자세한 설명은 다음을 참조하십시오. 워크샵 문서.

정리

이 데모에 사용된 리소스를 정리하고 추가 요금이 발생하지 않도록 하려면 다음 단계를 완료하십시오.

터미널에서 다음 코드를 입력하십시오.

yarn destroy

워크샵 폴더로 돌아가기(cd ../../) 다음 코드를 입력합니다.

yarn destroy

AWS CDK에서 생성된 AWS CloudFormation 스택이 폐기되어 할당된 모든 리소스가 제거됩니다.

결론

이 게시물에서는 빌드하는 방법을 배웠습니다. 대화형 대화형 음성 응답 (IVR) 시스템은 Amazon Lex 및 Amazon Chime SDK PSTN 오디오를 사용합니다. 이러한 기술을 사용하여 자체 시스템을 구축하여 고객 통화 해결 시간을 줄이고 고객 통화에 대한 정보 응답을 자동화할 수 있습니다.

자세한 내용은를 참조 프로젝트 GitHub 저장소 및 Amazon Chime SDK PSTN 오디오 서비스 사용.