Розмовний AI може надавати потужний, автоматизований, інтерактивний досвід за допомогою голосу та тексту. Амазон Лекс — це послуга, яка поєднує в собі автоматичне розпізнавання мовлення та технології розуміння природної мови, тож ви можете створювати ці витончені розмови. Звичайне застосування розмовного ШІ можна знайти в контакт-центрах: віртуальних агентах самообслуговування. Ми раді повідомити, що тепер ви можете використовувати Amazon Chime SDK Аудіосистема комутованої телефонної мережі загального користування (PSTN), що дозволяє розмовним програмам самообслуговування скоротити час вирішення викликів і автоматизувати інформаційні відповіді.
Amazon Chime SDK — це набір комунікаційних компонентів у реальному часі, які розробники можуть використовувати для додавання аудіо, обміну повідомленнями, відео та спільного доступу до екрана у ваші веб- та мобільні програми. Аудіоінтеграція Amazon Chime SDK PSTN з Amazon Lex дає змогу розробникам розробляти інтерфейси для розмови для дзвінків до або з загальнодоступної телефонної мережі. Тепер ви можете створювати програми самообслуговування на основі штучного інтелекту, наприклад розмовні інтерактивні системи голосового реагування (IVR), віртуальні агенти та інші програми телефонії, які використовують протокол ініціації сеансу (SIP) для голосового зв’язку.
Крім того, ми запустили кілька нових функцій. Amazon Voice Focus для PSTN забезпечує придушення шуму на основі глибокого навчання, щоб зменшити небажаний шум під час дзвінків. Тепер ви також можете використовувати керовану машинним навчанням (ML) перетворення тексту в мовлення у своїй програмі за допомогою нашої вбудованої інтеграції до Амазонка Поллі. Усі функції тепер безпосередньо інтегровані з Amazon Chime SDK PSTN аудіо.
У цій публікації ми навчимо вас, як це зробити побудувати розмовну систему IVR за фіктивну туристичну послугу, яка приймає бронювання по телефону за допомогою Amazon Lex.
Огляд рішення
Аудіо Amazon Chime SDK PSTN дозволяє розробникам легко створювати індивідуальні додатки телефонії, використовуючи гнучкість та простоту експлуатації безсерверних AWS Lambda функції.
Для цього рішення ми використовуємо наступні компоненти:
- Amazon Chime SDK PSTN аудіо
- AWS Lambda
- Амазон Лекс
- Амазонка Поллі
Amazon Lex інтегрується з Amazon Polly, щоб забезпечити можливості перетворення тексту в мовлення. У цій публікації ми також увімкнули Amazon Voice Focus, щоб зменшити фоновий шум під час телефонних дзвінків. В попередній публікації, ми показали, як інтегруватися з Amazon Lex v1 за допомогою інтерфейсу API. Це більше не потрібно. Важка робота з Amazon Lex і Amazon Polly тепер замінена кількома простими викликами функцій.
Наступна діаграма ілюструє високорівневий дизайн системи чат-бота Amazon Chime SDK Amazon Lex.
Щоб допомогти вам навчитися створювати за допомогою аудіослужби Amazon Chime SDK PSTN, ми опублікували a сховище вихідного коду та документації пояснюючи, як працює цей вихідний код. Вихідний код у форматі семінару, кожен приклад програми будується на основі попереднього уроку. Останній урок — як створити повноцінний чат-бот на основі Amazon Lex по телефону. Це урок, на якому ми зосередимося в цій публікації.
У рамках цього рішення ви створюєте такі ресурси:
- Медіа-додаток SIP – Керований об’єкт, який визначає лямбда-функцію для виклику.
- Правило SIP – Керований об’єкт, який визначає номер телефону для активації та який керований об’єкт медіа-програми SIP використовувати для виклику лямбда-функції.
- Телефон – Телефонний номер PSTN Amazon Chime SDK, призначений для отримання телефонних дзвінків.
- Лямбда-функція – Функція, написана на Typescript, яка інтегрована з аудіослужбою PSTN. Він отримує виклики від медіа-програми SIP і надсилає дії назад, які інструктують медіа-програму SIP виконувати завдання Amazon Polly і Amazon Lex.
Демо-код розгортається на дві частини. Приклад чат-бота Amazon Lex є одним із серії прикладів семінарів, які навчають, як використовувати аудіо PSTN Amazon Chime SDK. Для цієї публікації ви виконуєте такі кроки високого рівня для розгортання чат-бота:
- Налаштуйте чат-бота Amazon Lex.
- Клонуйте код із репозиторію GitHub.
- Розгорніть загальні ресурси для семінару (включаючи номер телефону).
- Розгорніть функцію Lambda, яка з’єднує Amazon Lex з номером телефону.
Проходимо кожен крок детально.
Передумови
Ви повинні мати такі передумови:
- встановлено вузол V12+/npm
- Встановлено інтерфейс командного рядка AWS (AWS CLI).
- Установлено диспетчер версій вузлів (nvm).
- Встановлено модулі вузла typescript aws-sdk (з використанням nvm).
- Облікові дані AWS, налаштовані для облікового запису та регіону, які ви використовуєте для цієї демонстрації
- Дозволи на створення мультимедійних програм Amazon Chime SIP та номерів телефонів (переконайтеся, що ваша квота на обслуговування введена
us-east-1
orus-west-2
для номерів телефонів, голосових роз’ємів, медіапрограм SIP та правил SIP не було досягнуто) - Розгортання має бути здійснено в
us-east-1
orus-west-2
щоб узгодити аудіоресурси PSTN
Щоб отримати докладні інструкції з встановлення, включаючи сценарій, який може автоматизувати встановлення, і проект AWS Cloud Development Kit (AWS CDK), щоб легко створити середовище розробки Amazon Elastic Compute Cloud (Amazon EC2), див. інструкції майстерні.
Налаштуйте чат-бота Amazon Lex
Ви можете створити повноцінний розмовний голосовий бот за допомогою Amazon Lex. У цьому прикладі ви використовуєте консоль Amazon Lex для створення бота. Ми пропускаємо кроки, де ви створюєте функцію лямбда для Amazon Lex. У центрі уваги тут є те, як підключити аудіо Amazon Chime PSTN до Amazon Lex. Інструкції зі створення спеціальних ботів Amazon Lex див Amazon Lex: як це працює. У цьому прикладі ми використовуємо попередньо створений приклад «забронювати подорож».
Створіть бота
Щоб створити чат-бота, виконайте такі дії:
- Увійдіть на консоль Amazon Lex в тому самому регіоні, в якому ви розгорнули ресурси Amazon Chime SDK.
Це має бути в будь-якому us-east-1
or us-west-2
, залежно від того, де ви розгорнули ресурси Amazon Chime SDK за допомогою AWS CDK.
- На панелі навігації виберіть Пошукові системи.
- Вибирати Створити бота.
- Select Почніть з прикладу.
- для Ім'я бота, введіть назву (наприклад, BookTrip).
- для Опис, введіть необов’язковий опис.
- під Дозволи IAMвиберіть Створіть роль з основними дозволами Amazon Lex.
- під Закон про захист конфіденційності дітей в Інтернетівиберіть Немає.
Цей приклад не потребує такого захисту, але для створення власного бота вам слід вибрати цей параметр відповідно.
- під Тайм-аут сеансу простою¸ встановіть час очікування сеансу на 1 хвилину.
- Ви можете пропустити додаткові настройки .
- Вибирати МАЙБУТНІ.
- для Оберіть мову, виберіть потрібну мову (для цієї публікації ми вибираємо англійську (США)).
- для Голосова взаємодія, виберіть потрібний голос.
- Ви можете ввести зразок голосу та вибрати Play щоб перевірити фразу та переконатися, що голос вам подобається.
- Залиште інші налаштування за замовчуванням.
- Вибирати Зроблений.
- У Виконання розділі, введіть наступний текст для Успішного виконання:
- під Заключні відповіді, введіть такий текст для повідомлення:
Goodbye!
- Вибирати Зберегти намір.
- Вибирати Будувати.
Процес складання займає кілька хвилин. Коли це буде завершено, ви можете протестувати бота на консолі Amazon Lex.
Створіть версію
Тепер ви створили бота. Далі створюємо версію.
- перейдіть до версії сторінку вашого бота (під назвою бота на панелі навігації).
- Вибирати Створити версію.
- Прийміть усі значення за замовчуванням і виберіть Створювати.
Ваша нова версія тепер у списку версії стр.
Створіть псевдонім
Далі створюємо псевдонім.
- На панелі навігації виберіть псевдонімами.
- Вибирати Створіть псевдонім.
- для кличка назву, введіть назву (наприклад, виробництво).
- під Юрист з версією, виберіть версія 1 у спадному меню.
Якщо у вас було кілька версій бота, ви можете вибрати відповідну версію тут.
- Вибирати Створювати.
Псевдонім тепер вказано на псевдонімами стр.
- на псевдонімами на сторінці, виберіть псевдонім, який ви щойно створили.
- під Політика, орієнтована на ресурсивиберіть Редагувати.
- Додайте таку політику, яка дозволяє аудіосистемі Amazon Chime SDK PSTN викликати Amazon Lex для вас:
У попередньому коді надайте ресурс ARN (розташований безпосередньо над текстовим полем), який є ARN для псевдоніма бота. Також укажіть номер свого облікового запису та вкажіть регіон, у якому ви розгортаєте (us-east-1
or us-west-2
). Це визначає ARN плоскості керування звуком PSTN у вашому обліковому записі.
- Вибирати зберегти зберігати політику.
- Вибирати Скопіювати поруч із ресурсом ARN для використання на наступному кроці.
Вітаю! Ви налаштували бота Amazon Lex!
У справжньому додатку чат-бота ви майже напевно реалізуєте лямбда-функцію для обробки намірів. Ця демонстраційна програма зосереджена на поясненні того, як підключитися до аудіосистеми PSTN Amazon Chime SDK, тому ми не вдаємося в такий рівень деталей. Для отримання додаткової інформації, див. Додавання лямбда-функції як гачка коду.
Клонуйте репозиторій GitHub
Ви можете отримати код для всієї майстерні, клонуючи репозиторій:
Розгорніть загальні ресурси для семінару
Цей семінар використовує AWS CDK для автоматизації розгортання всіх необхідних ресурсів (крім бота Amazon Lex, який ви вже зробили). Щоб розгорнути, запустіть такий код зі свого терміналу:
AWS CDK розгортає ресурси. Ми робимо крок завантаження, щоб переконатися, що AWS CDK правильно ініціалізовано в регіоні, у якому ви розгортаєте. Зауважте, що в цих прикладах використовується AWS CDK версії 2.
Репозиторій містить серію уроків, які покликані пояснити, як розробляти аудіододатки PSTN. Ми рекомендуємо переглянути ці документи, щоб зрозуміти основи, використовуючи перші кілька прикладів програм. Потім ви можете переглянути папку прикладу програми Lambda. Нарешті, виконайте кроки, щоб налаштувати, а потім розгорнути свій код. У терміналі введіть таку команду:
Налаштуйте функцію Lambda для використання бота Amazon Lex ARN
Відкрийте src/index.ts
файл вихідного коду функції лямбда та відредагуйте змінну botAlias
у верхній частині файлу (надайте ARN, який ви скопіювали раніше):
Тепер ви можете розгорнути бота за допомогою yarn deploy і замінити нову функцію Lambda на аудіо PSTN за допомогою yarn swap. Ви також можете відзначити текст привітання в startBotConversationAction
об’єкт:
Amazon Lex запускає бота і використовує Amazon Polly для читання цього тексту. Це дає абоненту привітання та вказує йому, що їм слід робити далі.
Як це працює?
Наступний приклад додає більше дій до того, що ми дізналися в Урок Call and Bridge Call, NEW_INBOUND_CALL
подія надходить і обробляється таким же чином. Ми вмикаємо Amazon Voice Focus (що покращує здатність Amazon Lex розуміти слова), а потім негайно передаємо вхідний виклик боту за допомогою StartBotConversation
дії. Приклад цієї дії виглядає як такий об'єкт:
Коли бот повертає an ACTION_SUCCESSFUL
події, дані, зібрані ботом Amazon Lex, включені в подію. Дані, зібрані від бота, включені, і ваша лямбда-функція може використовувати ці дані, якщо потрібно. Однак поширеною практикою створення програм Amazon Lex є обробка даних за допомогою функції, пов’язаної з ботом Amazon Lex. Приклади події та поверненої дії наведено в документація семінару для цієї сесії.
Схема послідовності
На наступній схемі показано послідовність викликів між аудіо PSTN та функцією Lambda:
Для більш детального пояснення операції див цехову документацію.
Прибирати
Щоб очистити ресурси, використані в цій демонстрації, і уникнути додаткових витрат, виконайте такі дії:
- У терміналі введіть наступний код:
- Повернутися до папки майстерні (
cd ../../
) і введіть наступний код:
Стек AWS CloudFormation, створений AWS CDK, знищується, видаляючи всі виділені ресурси.
Висновок
У цій публікації ви дізналися, як побудувати a розмовна інтерактивна голосова відповідь (IVR) із використанням аудіо PSTN Amazon Lex і Amazon Chime SDK. Ви можете використовувати ці методи для створення власної системи, щоб скоротити час вирішення дзвінків ваших клієнтів і автоматизувати інформаційні відповіді на дзвінки ваших клієнтів.
Для отримання додаткової інформації див репозиторій проекту GitHub та Використання служби Amazon Chime SDK PSTN Audio.
Про автора
Грег Герлейн очолював команди програмного забезпечення понад 25 років у великих і малих компаніях, включаючи декілька стартапів. Зараз він є головним євангелістом служби Amazon Chime SDK, де він захоплений тим, як допомагати клієнтам створювати передові комунікаційні програми.
- Coinsmart. Найкраща в Європі біржа біткойн та криптовалют.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. БЕЗКОШТОВНИЙ ДОСТУП.
- CryptoHawk. Альткойн Радар. Безкоштовне випробування.
- Джерело: https://aws.amazon.com/blogs/machine-learning/enable-conversational-chatbots-for-telephony-using-amazon-lex-and-the-amazon-chime-sdk/
- "
- 100
- 9
- МЕНЮ
- рахунки
- дію
- дії
- доповнення
- просунутий
- агенти
- AI
- ВСІ
- вже
- Amazon
- Оголосити
- API
- додаток
- застосування
- аудіо
- Автоматизований
- AWS
- фон
- Основи
- border
- Бот
- боти
- Box
- BRIDGE
- будувати
- Створюємо
- call
- Може отримати
- можливості
- автомобіль
- CD
- вантажі
- хмара
- код
- загальний
- зв'язку
- Компанії
- обчислення
- стан
- конфігурація
- Консоль
- зміст
- контроль
- може
- створення
- Повноваження
- виготовлений на замовлення
- Клієнти
- дані
- розгортання
- розгортання
- розгортання
- розгортає
- дизайн
- зруйнований
- деталь
- розвивати
- розробників
- розробка
- DID
- документація
- Ні
- легко
- ефект
- англійська
- Навколишнє середовище
- Event
- приклад
- Крім
- Досліди
- риси
- Перший
- Сфокусувати
- стежити
- після
- формат
- знайдений
- функція
- GitHub
- допомога
- тут
- Як
- How To
- HTTPS
- здійснювати
- включені
- У тому числі
- інформація
- інтегрувати
- інтегрований
- інтеграція
- інтерактивний
- інтерфейс
- IT
- мова
- великий
- УЧИТЬСЯ
- вчений
- вивчення
- Led
- рівень
- Лінія
- Перераховані
- машина
- навчання за допомогою машини
- вдалося
- менеджер
- Медіа
- обмін повідомленнями
- ML
- Mobile
- Мобільні програми
- більше
- Природний
- навігація
- Близько
- мережу
- Нові можливості
- шум
- номер
- номера
- онлайн
- конфіденційності в Інтернеті
- варіант
- порядок
- Інше
- політика
- потужний
- практика
- Головний
- недоторканність приватного життя
- процес
- Production
- програма
- програми
- проект
- захист
- протокол
- забезпечувати
- забезпечує
- громадськість
- реального часу
- рекомендувати
- зменшити
- оренда
- замінити
- Сховище
- вимагається
- ресурс
- ресурси
- відповідь
- Умови повернення
- огляд
- Правила
- прогін
- Sdk
- Серія
- Без сервера
- обслуговування
- комплект
- простий
- невеликий
- So
- Софтвер
- рішення
- складний
- вихідні
- стек
- починається
- Стартапи
- Заява
- зберігати
- успішний
- система
- завдання
- методи
- Технології
- розповідає
- термінал
- тест
- Основи
- Джерело
- через
- топ
- подорожувати
- розуміти
- us
- використання
- Відео
- Віртуальний
- Голос
- Web
- ласкаво просимо
- Що
- слова
- робочий
- працює
- років