A IA conversacional pode oferecer experiências poderosas, automatizadas e interativas por meio de voz e texto. Amazon-Lex é um serviço que combina tecnologias de reconhecimento automático de fala e compreensão de linguagem natural, para que você possa criar essas experiências de conversação sofisticadas. Uma aplicação comum de IA conversacional é encontrada em contact centers: agentes virtuais de autoatendimento. Temos o prazer de anunciar que agora você pode usar SDK do Amazon Chime Áudio de rede telefônica pública comutada (PSTN) para permitir que aplicativos de autoatendimento de conversação reduzam os tempos de resolução de chamadas e automatizem respostas informativas.
O Amazon Chime SDK é um conjunto de componentes de comunicação em tempo real que os desenvolvedores podem usar para adicionar áudio, mensagens, vídeo e compartilhamento de tela a seus aplicativos web e móveis. A integração de áudio PSTN do Amazon Chime SDK com o Amazon Lex permite que os construtores desenvolvam interfaces de conversação para chamadas de ou para a rede telefônica pública. Agora você pode criar aplicativos de autoatendimento com inteligência artificial, como conversas sistemas interativos de resposta de voz (IVRs), agentes virtuais e outros aplicativos de telefonia que usam o Session Initiation Protocol (SIP) para comunicações de voz.
Além disso, lançamos vários novos recursos. Amazon Voice Focus para PSTN fornece supressão de ruído baseada em aprendizado profundo para reduzir ruídos indesejados em chamadas. Agora você também pode usar a conversão de texto em fala orientada por aprendizado de máquina (ML) em seu aplicativo por meio de nossa integração nativa para Amazon Polly. Todos os recursos agora estão diretamente integrados ao áudio PSTN do Amazon Chime SDK.
Neste post, ensinamos como construir um sistema IVR conversacional para um serviço de viagens fictício que aceita reservas por telefone usando o Amazon Lex.
Visão geral da solução
O áudio PSTN do Amazon Chime SDK facilita para os desenvolvedores a criação de aplicativos de telefonia personalizados usando a agilidade e a simplicidade operacional do serverless AWS Lambda funções.
Para esta solução, usamos os seguintes componentes:
- Áudio PSTN do Amazon Chime SDK
- AWS Lambda
- Amazon-Lex
- Amazon Polly
O Amazon Lex se integra nativamente ao Amazon Polly para fornecer recursos de conversão de texto em fala. Nesta postagem, também habilitamos o Amazon Voice Focus para reduzir o ruído de fundo em chamadas telefônicas. Em um num post anterior, mostramos como integrar com o Amazon Lex v1 usando a interface da API. Isso não é mais necessário. O trabalho pesado de trabalhar com o Amazon Lex e o Amazon Polly agora foi substituído por algumas chamadas de função simples.
O diagrama a seguir ilustra o design de alto nível do sistema de chatbot do Amazon Chime SDK do Amazon Lex.
Para ajudá-lo a aprender a criar usando o serviço de áudio PSTN do Amazon Chime SDK, publicamos um repositório de código fonte e documentação explicando como esse código-fonte funciona. O código-fonte está em formato de workshop, com cada programa de exemplo baseado na lição anterior. A lição final é como criar um chatbot completo orientado pelo Amazon Lex por telefone. Essa é a lição em que nos concentramos neste post.
Como parte desta solução, você cria os seguintes recursos:
- aplicativo de mídia SIP – Um objeto gerenciado que especifica uma função do Lambda a ser invocada.
- Regra SIP – Um objeto gerenciado que especifica um número de telefone para acionar e qual objeto gerenciado de aplicativo de mídia SIP usar para invocar uma função do Lambda.
- Telefone – Um número de telefone PSTN do Amazon Chime SDK provisionado para receber chamadas telefônicas.
- Função lambda – Uma função escrita em Typescript integrada ao serviço de áudio PSTN. Ele recebe invocações do aplicativo de mídia SIP e envia de volta ações que instruem o aplicativo de mídia SIP a executar tarefas do Amazon Polly e do Amazon Lex.
O código de demonstração é implantado em duas partes. O exemplo de chatbot do Amazon Lex é um de uma série de exemplos de workshops que ensinam como usar o áudio PSTN do Amazon Chime SDK. Para esta postagem, você conclui as seguintes etapas de alto nível para implantar o chatbot:
- Configure o chatbot do Amazon Lex.
- Clone o código do repositório GitHub.
- Implante os recursos comuns para o workshop (incluindo um número de telefone).
- Implante a função do Lambda que conecta o Amazon Lex ao número de telefone.
Passamos por cada etapa em detalhes.
Pré-requisitos
Você deve ter os seguintes pré-requisitos:
- nó V12+/npm instalado
- A AWS Command Line Interface (AWS CLI) instalada
- Gerenciador de versão do nó (nvm) instalado
- Os módulos do nó typescript aws-sdk (usando nvm) instalados
- Credenciais da AWS configuradas para a conta e região que você usa para esta demonstração
- Permissões para criar aplicativos de mídia SIP do Amazon Chime e números de telefone (certifique-se de que sua cota de serviço em
us-east-1
orus-west-2
para números de telefone, conectores de voz, aplicativos de mídia SIP e regras SIP não foi alcançado) - A implantação deve ser feita em
us-east-1
orus-west-2
para alinhar com recursos de áudio PSTN
Para obter instruções detalhadas de instalação, incluindo um script que pode automatizar a instalação e um projeto AWS Cloud Development Kit (AWS CDK) para criar facilmente um ambiente de desenvolvimento Amazon Elastic Compute Cloud (Amazon EC2), consulte o instruções da oficina.
Configurar o chatbot do Amazon Lex
Você pode criar um bot de voz conversacional completo usando o Amazon Lex. Neste exemplo, você usa o console do Amazon Lex para criar um bot. Ignoramos as etapas em que você cria a função do Lambda para o Amazon Lex. O foco aqui é como conectar o áudio PSTN do Amazon Chime ao Amazon Lex. Para obter instruções sobre como criar bots personalizados do Amazon Lex, consulte Amazon Lex: como funciona. Neste exemplo, usamos o exemplo pré-construído de “reserva de viagem”.
Criar um bot
Para criar seu chatbot, conclua as seguintes etapas:
- Faça login no console do Amazon Lex na mesma região em que você implantou os recursos do SDK do Amazon Chime.
Isso deve ser em qualquer us-east-1
or us-west-2
, dependendo de onde você implantou os recursos do SDK do Amazon Chime usando o AWS CDK.
- No painel de navegação, escolha Bots.
- Escolha Criar bot.
- Selecionar Comece com um exemplo.
- Escolha Nome do bot, insira um nome (por exemplo, BookTrip).
- Escolha Descrição, insira uma descrição opcional.
- Debaixo Permissões do IAM, selecione Crie uma função com permissões básicas do Amazon Lex.
- Debaixo Lei de Proteção à Privacidade Online para Crianças, selecione Não.
Este exemplo não precisa dessa proteção, mas para sua própria criação de bot, você deve selecionar essa opção adequadamente.
- Debaixo Tempo limite da sessão ociosa¸ defina o tempo limite da sessão para 1 minuto.
- Você pode pular o Configurações avançadas seção.
- Escolha Próximo.
- Escolha Selecione o idioma, escolha seu idioma preferido (para este post, escolhemos inglês (EUA)).
- Escolha Interação de voz, escolha a voz que deseja usar.
- Você pode inserir uma amostra de voz e escolher Jogar para testar a frase e confirmar se a voz está do seu agrado.
- Deixe outras configurações em seu padrão.
- Escolha Pronto .
- No Cumprimento seção, insira o seguinte texto para No cumprimento bem-sucedido:
- Debaixo Respostas de fechamento, insira o seguinte texto para Mensagem:
Goodbye!
- Escolha Salvar intenção.
- Escolha Construa.
O processo de compilação leva alguns instantes para ser concluído. Quando terminar, você poderá testar o bot no console do Amazon Lex.
Criar uma versão
Agora você construiu o bot. Em seguida, criamos uma versão.
- Navegue até a versões página do seu bot (sob o nome do bot no painel de navegação).
- Escolha Criar versão.
- Aceite todos os valores padrão e escolha Crie.
Sua nova versão agora está listada no versões Disputas de Comerciais.
Crie um alias
Em seguida, criamos um alias.
- No painel de navegação, escolha Alias.
- Escolha Criar alias.
- Escolha aliás nome, insira um nome (por exemplo, produção).
- Debaixo Jurídico com uma versão, escolha versão 1 no menu suspenso.
Se você tiver mais de uma versão do bot, poderá escolher a versão apropriada aqui.
- Escolha Crie.
O alias agora está listado no Alias Disputas de Comerciais.
- No Alias página, escolha o alias que você acabou de criar.
- Debaixo Política baseada em recursos, escolha Editar.
- Adicione a seguinte política, que permite que o áudio PSTN do SDK do Amazon Chime invoque o Amazon Lex para você:
No código anterior, forneça o ARN do recurso (localizado diretamente acima da caixa de texto), que é o ARN do alias do bot. Forneça também o número da sua conta e especifique a região na qual você está implantando (us-east-1
or us-west-2
). Isso define o ARN do plano de controle de áudio PSTN em sua conta.
- Escolha Salvar para armazenar a política.
- Escolha Copiar ao lado do ARN do recurso para usar em uma etapa posterior.
Parabéns! Você configurou um bot do Amazon Lex!
Em um aplicativo de chatbot real, você quase certamente implementaria uma função Lambda para processar as intenções. Este programa de demonstração se concentra em explicar como se conectar ao áudio PSTN do Amazon Chime SDK, portanto, não entraremos nesse nível de detalhes. Para maiores informações, consulte Adicionar a função do Lambda como um gancho de código.
Clone o repositório do GitHub
Você pode obter o código de todo o workshop clonando o repositório:
Implantar os recursos comuns para o workshop
Este workshop usa o AWS CDK para automatizar a implantação de todos os recursos necessários (exceto o bot do Amazon Lex, que você já fez). Para implantar, execute o seguinte código no seu terminal:
O AWS CDK implanta os recursos. Realizamos a etapa de bootstrap para garantir que o AWS CDK seja inicializado corretamente na região em que você está implantando. Observe que esses exemplos usam o AWS CDK versão 2.
O repositório tem uma série de lições projetadas para explicar como desenvolver aplicativos de áudio PSTN. Recomendamos revisar esses documentos para entender o básico usando os primeiros programas de amostra. Você pode então revisar a pasta do programa de amostra do Lambda. Por fim, siga as etapas para configurar e implantar seu código. No terminal, digite o seguinte comando:
Configure sua função do Lambda para usar o ARN do bot do Amazon Lex
Abra o src/index.ts
arquivo de código-fonte para a função do Lambda e edite a variável botAlias
próximo ao topo do arquivo (forneça o ARN que você copiou anteriormente):
Agora você pode implantar o bot com yarn deploy e trocar a nova função Lambda em áudio PSTN com yarn swap. Você também pode observar o texto de boas-vindas no startBotConversationAction
objeto:
O Amazon Lex inicia o bot e usa o Amazon Polly para ler esse texto. Isso dá ao chamador uma saudação e informa o que ele deve fazer em seguida.
Como Funciona
O exemplo a seguir adiciona mais ações ao que aprendemos no Lição de chamada e ligação em ponte. O NEW_INBOUND_CALL
evento chega e é processado da mesma forma. Habilitamos o Amazon Voice Focus (que aprimora a capacidade do Amazon Lex de entender palavras) e, em seguida, transferimos imediatamente a chamada recebida para o bot com um StartBotConversation
açao. Um exemplo dessa ação se parece com o seguinte objeto:
Quando o bot retorna um ACTION_SUCCESSFUL
evento, os dados coletados pelo bot do Amazon Lex são incluídos no evento. Os dados coletados do bot estão incluídos, e sua função do Lambda pode usar esses dados, se necessário. No entanto, uma prática comum para criar aplicativos do Amazon Lex é processar os dados com a função associada ao bot do Amazon Lex. Exemplos do evento e da ação retornada são fornecidos no documentação do workshop para esta sessão.
Diagrama de sequência
O diagrama a seguir mostra a sequência de chamadas feitas entre o áudio PSTN e a função Lambda:
Para uma explicação mais detalhada da operação, consulte o documentação da oficina.
limpar
Para limpar os recursos usados nesta demonstração e evitar cobranças adicionais, conclua as etapas a seguir:
- No terminal, digite o seguinte código:
- Retorne à pasta da oficina (
cd ../../
) e digite o seguinte código:
A pilha do AWS CloudFormation criada pelo AWS CDK é destruída, removendo todos os recursos alocados.
Conclusão
Neste post, você aprendeu a construir um resposta de voz interativa conversacional (IVR) usando o áudio PSTN do Amazon Lex e do Amazon Chime SDK. Você pode usar essas técnicas para construir seu próprio sistema para reduzir seus próprios tempos de resolução de chamadas de clientes e automatizar respostas informativas nas chamadas de seus clientes.
Para mais informações, consulte o repositório GitHub do projeto e Usar o serviço de áudio PSTN do Amazon Chime SDK.
Sobre o autor
Greg Herlein liderou equipes de software por mais de 25 anos em grandes e pequenas empresas, incluindo várias startups. Atualmente, ele é o principal evangelista do serviço Amazon Chime SDK, onde é apaixonado por ajudar os clientes a criar softwares de comunicação avançados.
- Coinsmart. A melhor troca de Bitcoin e criptografia da Europa.
- Platoblockchain. Inteligência Metaverso Web3. Conhecimento Ampliado. ACESSO LIVRE.
- CryptoHawk. Radar Altcoin. Teste grátis.
- Fonte: https://aws.amazon.com/blogs/machine-learning/enable-conversational-chatbots-for-telephony-using-amazon-lex-and-the-amazon-chime-sdk/
- "
- 100
- 9
- Sobre
- Conta
- Açao Social
- ações
- Adição
- avançado
- agentes
- AI
- Todos os Produtos
- já
- Amazon
- Anunciar
- api
- Aplicação
- aplicações
- auditivo
- Automatizado
- AWS
- fundo
- fundamentos básicos
- fronteira
- Bot
- bots
- Caixa
- PONTE
- construir
- Prédio
- chamada
- Pode obter
- capacidades
- carro
- CD
- acusações
- Na nuvem
- código
- comum
- Comunicações
- Empresas
- Computar
- condição
- Configuração
- cônsul
- conteúdo
- ao controle
- poderia
- criação
- Credenciais
- personalizadas
- Clientes
- dados,
- implantar
- Implantação
- desenvolvimento
- implanta
- Design
- destruído
- detalhe
- desenvolver
- desenvolvedores
- Desenvolvimento
- DID
- INSTITUCIONAIS
- Não faz
- facilmente
- efeito
- Inglês
- Meio Ambiente
- Evento
- exemplo
- Exceto
- Experiências
- Funcionalidades
- Primeiro nome
- Foco
- seguir
- seguinte
- formato
- encontrado
- função
- GitHub
- ajudar
- SUA PARTICIPAÇÃO FAZ A DIFERENÇA
- Como funciona o dobrador de carta de canal
- Como Negociar
- HTTPS
- executar
- incluído
- Incluindo
- INFORMAÇÕES
- integrar
- integrado
- integração
- interativo
- Interface
- IT
- língua
- grande
- APRENDER
- aprendido
- aprendizagem
- levou
- Nível
- Line
- Listado
- máquina
- aprendizado de máquina
- gerenciados
- Gerente
- Mídia
- mensagens
- ML
- Móvel Esteira
- Aplicações móveis
- mais
- natural
- Navegação
- Perto
- rede
- Novos Recursos
- Ruído
- número
- números
- online
- privacidade online
- Opção
- ordem
- Outros
- Privacidade
- poderoso
- prática
- Diretor
- política de privacidade
- processo
- Produção
- Agenda
- Programas
- projeto
- proteção
- protocolo
- fornecer
- fornece
- público
- em tempo real
- recomendar
- reduzir
- Aluguel
- substituído
- repositório
- requeridos
- recurso
- Recursos
- resposta
- Retorna
- rever
- regras
- Execute
- Sdk
- Série
- Serverless
- serviço
- conjunto
- simples
- pequeno
- So
- Software
- solução
- sofisticado
- código fonte
- pilha
- começa
- Startups
- Declaração
- loja
- bem sucedido
- .
- tarefas
- técnicas
- Tecnologias
- conta
- terminal
- teste
- O Básico
- A fonte
- Através da
- topo
- viagens
- compreender
- us
- usar
- Vídeo
- Virtual
- voz
- web
- boas-vindas
- O Quê
- palavras
- trabalhar
- trabalho
- anos