Разговорный ИИ может предоставлять мощные автоматизированные интерактивные возможности с помощью голоса и текста. Amazon Lex — это сервис, который сочетает в себе технологии автоматического распознавания речи и понимания естественного языка, так что вы можете создавать эти сложные диалоги. Обычное применение диалогового ИИ можно найти в контакт-центрах: виртуальные агенты самообслуживания. Мы рады сообщить, что теперь вы можете использовать SDK Amazon Chime Звук в телефонной сети общего пользования (PSTN), позволяющий приложениям самообслуживания для разговоров сокращать время разрешения вызовов и автоматизировать информационные ответы.
Amazon Chime SDK — это набор компонентов для связи в реальном времени, которые разработчики могут использовать для добавления звука, обмена сообщениями, видео и демонстрации экрана в ваши веб-приложения и мобильные приложения. Интеграция аудио Amazon Chime SDK PSTN с Amazon Lex позволяет разработчикам разрабатывать диалоговые интерфейсы для звонков в телефонную сеть общего пользования или из нее. Теперь вы можете создавать приложения самообслуживания на базе ИИ, такие как диалоговые интерактивные системы голосового управления (IVR), виртуальные агенты и другие приложения телефонии, которые используют протокол инициации сеанса (SIP) для голосовой связи.
Кроме того, мы запустили несколько новых функций. Amazon Voice Focus для PSTN обеспечивает подавление шума на основе глубокого обучения, чтобы уменьшить нежелательный шум во время вызовов. Теперь вы также можете использовать преобразование текста в речь на основе машинного обучения (ML) в своем приложении благодаря нашей встроенной интеграции с Amazon Polly. Все функции теперь напрямую интегрированы со звуком Amazon Chime SDK PSTN.
В этом посте мы научим вас, как построить разговорную систему IVR для фиктивного туристического сервиса, который принимает бронирование по телефону с помощью Amazon Lex.
Обзор решения
Amazon Chime SDK PSTN Audio позволяет разработчикам создавать настраиваемые приложения телефонии, используя гибкость и простоту работы бессерверных приложений. AWS Lambda функции.
Для этого решения мы используем следующие компоненты:
- Звук Amazon Chime SDK PSTN
- AWS Lambda
- Amazon Lex
- Amazon Polly
Amazon Lex изначально интегрируется с Amazon Polly для обеспечения возможности преобразования текста в речь. В этом посте мы также включаем Amazon Voice Focus для уменьшения фонового шума при телефонных звонках. В предыдущей публикации, мы показали, как интегрироваться с Amazon Lex v1 с помощью API-интерфейса. Это больше не требуется. Тяжелая работа с Amazon Lex и Amazon Polly теперь заменена несколькими простыми вызовами функций.
На следующей диаграмме показан общий дизайн системы чат-ботов Amazon Lex из SDK Amazon Chime.
Чтобы помочь вам научиться строить с помощью аудиосервиса Amazon Chime SDK PSTN, мы опубликовали репозиторий исходного кода и документации объясняя, как работает этот исходный код. Исходный код представлен в формате семинара, где каждый пример программы основан на предыдущем уроке. Последний урок — как создать полноценный чат-бот на базе Amazon Lex по телефону. Это урок, на котором мы сосредоточимся в этом посте.
В рамках этого решения вы создаете следующие ресурсы:
- Медиа-приложение SIP – Управляемый объект, указывающий вызываемую функцию Lambda.
- SIP-правило – Управляемый объект, указывающий номер телефона для запуска и управляемый объект мультимедийного приложения SIP, который следует использовать для вызова функции Lambda.
- Номер телефона – Телефонный номер PSTN Amazon Chime SDK, предназначенный для приема телефонных звонков.
- Лямбда-функция – Функция, написанная на Typescript, которая интегрирована со службой аудио PSTN. Он получает вызовы от мультимедийного приложения SIP и отправляет обратно действия, которые предписывают мультимедийному приложению SIP выполнять задачи Amazon Polly и Amazon Lex.
Демонстрационный код развертывается в двух частях. Пример чат-бота Amazon Lex — один из серии примеров семинаров, в которых обучают использованию аудио Amazon Chime SDK PSTN. В этом посте вы выполните следующие высокоуровневые шаги для развертывания чат-бота:
- Настройте чат-бот Amazon Lex.
- Клонируйте код из репозитория GitHub.
- Разверните общие ресурсы для семинара (включая номер телефона).
- Разверните функцию Lambda, которая подключает Amazon Lex к номеру телефона.
Мы подробно проходим каждый шаг.
Предпосылки
У вас должны быть следующие предпосылки:
- узел V12+/npm установлен
- Интерфейс командной строки AWS (AWS CLI) установлен
- Установлен менеджер версий узла (nvm)
- Модули узла typescript aws-sdk (с использованием nvm) установлены
- Учетные данные AWS, настроенные для учетной записи и региона, которые вы используете для этой демонстрации.
- Разрешения на создание медиаприложений Amazon Chime SIP и телефонных номеров (убедитесь, что ваша квота обслуживания в
us-east-1
orus-west-2
для телефонных номеров, голосовых соединителей, мультимедийных приложений SIP и правил SIP не достигнуто) - Развертывание должно быть выполнено в
us-east-1
orus-west-2
для согласования с аудиоресурсами PSTN
Подробные инструкции по установке, включая скрипт, который может автоматизировать установку, и проект AWS Cloud Development Kit (AWS CDK) для простого создания среды разработки Amazon Elastic Compute Cloud (Amazon EC2), см. инструкции мастерской.
Настройка чат-бота Amazon Lex
Вы можете создать полноценного голосового бота с помощью Amazon Lex. В этом примере вы используете консоль Amazon Lex для создания бота. Мы пропускаем этапы создания функции Lambda для Amazon Lex. Основное внимание здесь уделяется тому, как подключить звук Amazon Chime PSTN к Amazon Lex. Инструкции по созданию пользовательских ботов Amazon Lex см. Амазон Лекс: как это работает. В этом примере мы используем готовый пример «забронировать поездку».
Создать бота
Чтобы создать чат-бота, выполните следующие действия:
- Войдите в консоль Amazon Lex в том же регионе, в котором вы развернули ресурсы Amazon Chime SDK.
Это должно быть либо в us-east-1
or us-west-2
, в зависимости от того, где вы развернули ресурсы Amazon Chime SDK с помощью AWS CDK.
- На панели навигации выберите Поисковые системы.
- Выберите Создать бота.
- Выберите Начните с примера.
- Что касается Имя бота, введите имя (например, BookTrip).
- Что касается Описание, введите необязательное описание.
- Под IAM-разрешения, наведите на Создайте роль с базовыми разрешениями Amazon Lex.
- Под Закон о защите конфиденциальности детей в Интернете, наведите на Нет.
Этот пример не нуждается в такой защите, но для создания собственного бота вы должны выбрать эту опцию соответствующим образом.
- Под Тайм-аут холостого сеанса¸ установите время ожидания сеанса равным 1 минуте.
- Вы можете пропустить Дополнительные параметры .
- Выберите Следующая.
- Что касается Выберите язык, выберите предпочитаемый язык (для этого поста мы выбираем английский (США)).
- Что касается Голосовое взаимодействие, выберите голос, который хотите использовать.
- Вы можете ввести образец голоса и выбрать Играть чтобы проверить фразу и убедиться, что голос вам нравится.
- Остальные настройки оставьте по умолчанию.
- Выберите Готово.
- В выполнение введите следующий текст для поля «При успешном выполнении»:
- Под Заключительные ответы, введите следующий текст для сообщения:
Goodbye!
- Выберите Сохранить намерение.
- Выберите строить.
Процесс сборки занимает несколько минут. По завершении вы можете протестировать бота на консоли Amazon Lex.
Создать версию
Вы создали бота. Далее создаем версию.
- Перейдите в Версии странице вашего бота (под именем бота в панели навигации).
- Выберите Создать версию.
- Примите все значения по умолчанию и выберите Создавай.
Ваша новая версия теперь указана на Версии стр.
Создать псевдоним
Далее мы создаем псевдоним.
- На панели навигации выберите Псевдонимов.
- Выберите Создать псевдоним.
- Что касается кличка название, введите название (например, производство).
- Под Юрист с версией, выберите Версия 1 в раскрывающемся меню.
Если у вас было несколько версий бота, вы можете выбрать подходящую версию здесь.
- Выберите Создавай.
Псевдоним теперь указан на Псевдонимов стр.
- На Псевдонимов страницу, выберите только что созданный псевдоним.
- Под Ресурсная политика, выберите Редактировать.
- Добавьте следующую политику, которая позволяет звуку PSTN Amazon Chime SDK вызывать Amazon Lex для вас:
В приведенном выше коде укажите ARN ресурса (расположенный непосредственно над текстовым полем), который является ARN для псевдонима бота. Также укажите номер своей учетной записи и укажите регион, в котором выполняется развертывание (us-east-1
or us-west-2
). Это определяет ARN плоскости управления звуком PSTN в вашей учетной записи.
- Выберите Сохранить для хранения политики.
- Выберите Копировать рядом с ARN ресурса для использования на более позднем этапе.
Поздравляем! Вы настроили бота Amazon Lex!
В реальном приложении чат-бота вы почти наверняка реализовали бы лямбда-функцию для обработки намерений. Эта демонстрационная программа посвящена объяснению того, как подключиться к звуку PSTN Amazon Chime SDK, поэтому мы не будем вдаваться в подробности. Чтобы получить больше информации, обратитесь к разделу Добавление лямбда-функции в качестве хука кода.
Клонировать репозиторий GitHub
Вы можете получить код всего воркшопа, клонировав репозиторий:
Развертывание общих ресурсов для семинара
В этом семинаре используется AWS CDK для автоматизации развертывания всех необходимых ресурсов (кроме бота Amazon Lex, который вы уже сделали). Для развертывания запустите следующий код из своего терминала:
AWS CDK развертывает ресурсы. Мы выполняем шаг начальной загрузки, чтобы убедиться, что AWS CDK правильно инициализирован в регионе, в котором выполняется развертывание. Обратите внимание, что в этих примерах используется AWS CDK версии 2.
В репозитории есть серия уроков, призванных объяснить, как разрабатывать аудиоприложения PSTN. Мы рекомендуем просмотреть эти документы, чтобы понять основы использования первых нескольких примеров программ. Затем вы можете просмотреть папку образца программы Lambda. Наконец, выполните шаги по настройке, а затем разверните свой код. В терминале введите следующую команду:
Настройте функцию Lambda для использования бота Amazon Lex ARN.
Откройте приложение src/index.ts
файл исходного кода для функции Lambda и отредактируйте переменную botAlias
в верхней части файла (укажите ARN, который вы скопировали ранее):
Теперь вы можете развернуть бота с помощью yarn deploy и заменить новую функцию Lambda на звук PSTN с помощью yarn swap. Вы также можете отметить текст приветствия в startBotConversationAction
объект:
Amazon Lex запускает бота и использует Amazon Polly для чтения этого текста. Это дает вызывающему абоненту приветствие и сообщает ему, что ему следует делать дальше.
Как это работает?
Следующий пример добавляет больше действий к тому, что мы узнали в Урок Call and Bridge Call, NEW_INBOUND_CALL
событие поступает и обрабатывается таким же образом. Мы включаем Amazon Voice Focus (что повышает способность Amazon Lex понимать слова), а затем сразу же передаем входящий вызов боту с StartBotConversation
действие. Пример такого действия выглядит следующим образом:
Когда бот возвращает ACTION_SUCCESSFUL
событие, данные, собранные ботом Amazon Lex, включаются в событие. Собранные данные от бота включены, и ваша функция Lambda может использовать эти данные, если это необходимо. Однако обычной практикой создания приложений Amazon Lex является обработка данных с помощью функции, связанной с ботом Amazon Lex. Примеры события и возвращаемого действия приведены в документация семинара для этой сессии.
Диаграмма последовательности
На следующей диаграмме показана последовательность вызовов между аудио PSTN и функцией Lambda:
Более подробное объяснение операции см. документация мастерской.
Убирать
Чтобы очистить ресурсы, используемые в этой демонстрации, и избежать дополнительных расходов, выполните следующие действия:
- В терминале введите следующий код:
- Вернитесь в папку мастерской (
cd ../../
) и введите следующий код:
Стек AWS CloudFormation, созданный AWS CDK, уничтожается, при этом удаляются все выделенные ресурсы.
Заключение
В этом посте вы узнали, как построить диалоговый интерактивный голосовой ответ (IVR) с использованием аудио Amazon Lex и Amazon Chime SDK PSTN. Вы можете использовать эти методы для создания собственной системы, чтобы сократить время решения ваших собственных звонков клиентов и автоматизировать информационные ответы на звонки ваших клиентов.
Для получения дополнительной информации см. GitHub-репозиторий проекта и Использование аудиосервиса Amazon Chime SDK PSTN Audio.
Об авторе
Грег Херлейн более 25 лет руководил командами разработчиков программного обеспечения в крупных и малых компаниях, включая несколько стартапов. В настоящее время он является главным евангелистом сервиса Amazon Chime SDK, где он увлечен тем, как помочь клиентам создавать передовое программное обеспечение для коммуникаций.
- Коинсмарт. Лучшая в Европе биржа биткойнов и криптовалют.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. БЕСПЛАТНЫЙ ДОСТУП.
- КриптоХок. Альткоин Радар. Бесплатная пробная версия.
- Источник: https://aws.amazon.com/blogs/machine-learning/enable-conversational-chatbots-for-telephony-using-amazon-lex-and-the-amazon-chime-sdk/
- "
- 100
- 9
- О нас
- Учетная запись
- Действие
- действия
- дополнение
- продвинутый
- агенты
- AI
- Все
- уже
- Amazon
- анонсировать
- API
- Применение
- Приложения
- аудио
- Автоматизированный
- AWS
- фон
- Основы
- граница
- Бот
- боты
- Коробка
- МОСТ
- строить
- Строительство
- призывают
- Может получить
- возможности
- автомобиль
- CD
- расходы
- облако
- код
- Общий
- Связь
- Компании
- Вычисление
- состояние
- Конфигурация
- Консоли
- содержание
- контроль
- может
- создание
- Полномочия
- изготовленный на заказ
- Клиенты
- данным
- развертывание
- развертывание
- развертывание
- развертывает
- Проект
- уничтожили
- подробность
- развивать
- застройщиков
- Разработка
- DID
- Документация
- не
- легко
- эффект
- Английский
- Окружающая среда
- События
- пример
- Кроме
- Впечатления
- Особенности
- First
- Фокус
- следовать
- после
- формат
- найденный
- функция
- GitHub
- помощь
- здесь
- Как
- How To
- HTTPS
- осуществлять
- включены
- В том числе
- информация
- интегрировать
- интегрированный
- интеграции.
- интерактивный
- Интерфейс
- IT
- язык
- большой
- УЧИТЬСЯ
- узнали
- изучение
- привело
- уровень
- линия
- Включенный в список
- машина
- обучение с помощью машины
- управляемого
- менеджер
- Медиа
- обмен сообщениями
- ML
- Мобильный телефон
- Приложения для мобильных устройств
- БОЛЕЕ
- натуральный
- Навигация
- Возле
- сеть
- Новые функции
- Шум
- номер
- номера
- онлайн
- конфиденциальности в Интернете
- Опция
- заказ
- Другие контрактные услуги
- политика
- мощный
- практика
- Основной
- политикой конфиденциальности.
- процесс
- Производство
- FitPartner™
- Программы
- Проект
- защиту
- протокол
- обеспечивать
- приводит
- что такое варган?
- реального времени
- рекомендовать
- уменьшить
- Аренда
- заменить
- хранилище
- обязательный
- ресурс
- Полезные ресурсы
- ответ
- Возвращает
- обзоре
- условиями,
- Run
- SDK
- Серии
- Serverless
- обслуживание
- набор
- просто
- небольшой
- So
- Software
- Решение
- сложный
- исходный код
- стек
- начинается
- Стартапы
- заявление
- магазин
- успешный
- система
- задачи
- снижения вреда
- технологии
- говорит
- Терминал
- тестXNUMX
- Основы
- Источник
- Через
- топ
- путешествовать
- понимать
- us
- использование
- Видео
- Виртуальный
- Режимы
- Web
- добро пожаловать
- Что
- слова
- работает
- работает
- лет