هوش مصنوعی مکالمه ای می تواند تجربیات قدرتمند، خودکار و تعاملی را از طریق صدا و متن ارائه دهد. آمازون لکس سرویسی است که فناوریهای تشخیص خودکار گفتار و درک زبان طبیعی را ترکیب میکند، بنابراین میتوانید این تجربیات مکالمه پیچیده را ایجاد کنید. یک کاربرد متداول از هوش مصنوعی مکالمه ای در مراکز تماس یافت می شود: عوامل مجازی سلف سرویس. ما با هیجان اعلام می کنیم که اکنون می توانید استفاده کنید Amazon Chime SDK صدای شبکه تلفن سوئیچ شده عمومی (PSTN) برای فعال کردن برنامههای سلف سرویس مکالمه برای کاهش زمان وضوح تماس و خودکارسازی پاسخهای اطلاعاتی.
Amazon Chime SDK مجموعهای از مؤلفههای ارتباطی بلادرنگ است که توسعهدهندگان میتوانند از آن برای اضافه کردن صدا، پیام، ویدیو و اشتراکگذاری صفحه به برنامههای وب و تلفن همراه خود استفاده کنند. ادغام صوتی Amazon Chime SDK PSTN با Amazon Lex سازندگان را قادر میسازد تا رابطهای مکالمهای را برای تماس با یا از شبکه تلفن عمومی ایجاد کنند. اکنون می توانید برنامه های سلف سرویس مبتنی بر هوش مصنوعی مانند مکالمه بسازید سیستم های پاسخ صوتی تعاملی (IVR)، عوامل مجازی و سایر برنامه های تلفنی که از پروتکل شروع جلسه (SIP) برای ارتباطات صوتی استفاده می کنند.
علاوه بر این، ما چندین ویژگی جدید را راه اندازی کرده ایم. فوکوس صوتی آمازون برای PSTN سرکوب نویز مبتنی بر یادگیری عمیق را برای کاهش نویز ناخواسته در تماس ها ارائه می دهد. همچنین اکنون می توانید از طریق یکپارچه سازی بومی ما از متن به گفتار مبتنی بر یادگیری ماشین (ML) در برنامه خود استفاده کنید. آمازون پولی. همه ویژگیها اکنون مستقیماً با صدای Amazon Chime SDK PSTN یکپارچه شدهاند.
در این پست به شما آموزش می دهیم که چگونه یک سیستم تلفن گویا مکالمه ای بسازید برای یک سرویس مسافرتی ساختگی که رزرو را از طریق تلفن با استفاده از آمازون لکس می پذیرد.
بررسی اجمالی راه حل
Amazon Chime SDK PSTN صدای PSTN ساخت برنامه های تلفنی سفارشی با استفاده از چابکی و سادگی عملیاتی بدون سرور را برای توسعه دهندگان آسان می کند. AWS لامبدا توابع.
برای این راه حل، ما از اجزای زیر استفاده می کنیم:
- صوتی Amazon Chime SDK PSTN
- AWS لامبدا
- آمازون لکس
- آمازون پولی
آمازون لکس به طور بومی با آمازون پولی ادغام می شود تا قابلیت تبدیل متن به گفتار را فراهم کند. در این پست، فوکوس صوتی آمازون را نیز فعال می کنیم تا نویز پس زمینه در تماس های تلفنی را کاهش دهد. در یک پست قبلی، ما نحوه ادغام با Amazon Lex v1 را با استفاده از رابط API نشان دادیم. که دیگر مورد نیاز نیست. کار با آمازون لکس و آمازون پولی اکنون با چند فراخوانی ساده جایگزین شده است.
نمودار زیر طراحی سطح بالای سیستم ربات گفتگوی Amazon Chime SDK Amazon Lex را نشان می دهد.
برای کمک به شما در یادگیری ساخت با استفاده از سرویس صوتی Amazon Chime SDK PSTN، یک مطلب را منتشر کرده ایم مخزن کد منبع و اسناد توضیح نحوه کار آن کد منبع کد منبع در قالب کارگاهی است که هر برنامه نمونه بر اساس درس قبلی ساخته شده است. آخرین درس این است که چگونه یک چت ربات کامل آمازون Lex را از طریق تلفن بسازیم. این درسی است که در این پست روی آن تمرکز می کنیم.
به عنوان بخشی از این راه حل، شما منابع زیر را ایجاد می کنید:
- برنامه رسانه SIP – یک شی مدیریت شده که تابع Lambda را برای فراخوانی مشخص می کند.
- قانون SIP – یک شی مدیریت شده که شماره تلفنی را برای راه اندازی مشخص می کند و از کدام شی مدیریت شده برنامه رسانه SIP برای فراخوانی یک تابع Lambda استفاده می کند.
- شماره تلفن – یک شماره تلفن Amazon Chime SDK PSTN که برای دریافت تماس های تلفنی ارائه شده است.
- تابع لامبدا – یک تابع نوشته شده در Typescript که با سرویس صوتی PSTN یکپارچه شده است. فراخوانهایی را از برنامه رسانه SIP دریافت میکند و اقداماتی را ارسال میکند که به برنامه رسانه SIP دستور میدهد تا وظایف Amazon Polly و Amazon Lex را انجام دهد.
کد دمو در دو بخش مستقر شده است. مثال آمازون لکس چت بات یکی از مجموعهای از نمونههای کارگاهی است که نحوه استفاده از صدای Amazon Chime SDK PSTN را آموزش میدهد. برای این پست، مراحل سطح بالا زیر را برای استقرار ربات چت انجام می دهید:
- ربات چت آمازون Lex را پیکربندی کنید.
- کد را از مخزن GitHub کلون کنید.
- منابع مشترک را برای کارگاه (از جمله شماره تلفن) مستقر کنید.
- تابع Lambda را که آمازون لکس را به شماره تلفن متصل می کند، اجرا کنید.
ما هر مرحله را با جزئیات مرور می کنیم.
پیش نیازها
شما باید پیش نیازهای زیر را داشته باشید:
- node V12+/npm نصب شده است
- رابط خط فرمان AWS (AWS CLI) نصب شده است
- Node Version Manager (nvm) نصب شده است
- ماژول های گره typescript aws-sdk (با استفاده از nvm) نصب شده است
- اعتبارنامه AWS برای حساب و منطقه ای که برای این نسخه نمایشی استفاده می کنید پیکربندی شده است
- مجوزهای ایجاد اپلیکیشن های رسانه ای Amazon Chime SIP و شماره تلفن (مطمئن شوید که سهمیه خدمات خود را وارد کنید
us-east-1
orus-west-2
برای شماره تلفن، اتصال دهنده های صوتی، برنامه های رسانه SIP و قوانین SIP به دست نیامده است) - استقرار باید در
us-east-1
orus-west-2
برای هماهنگی با منابع صوتی PSTN
برای دستورالعملهای نصب دقیق، از جمله یک اسکریپت که میتواند نصب را خودکار کند و یک پروژه AWS Cloud Development Kit (AWS CDK) برای ایجاد آسان یک محیط توسعه Amazon Elastic Compute Cloud (Amazon EC2) را ببینید. دستورالعمل کارگاه
ربات چت آمازون Lex را پیکربندی کنید
می توانید با استفاده از آمازون لکس یک ربات صوتی مکالمه کامل بسازید. در این مثال، شما از کنسول آمازون لکس برای ساخت یک ربات استفاده می کنید. ما از مراحلی که در آن تابع Lambda را برای آمازون Lex میسازید، صرف نظر میکنیم. تمرکز در اینجا نحوه اتصال صوتی Amazon Chime PSTN به آمازون Lex است. برای دستورالعملهای ساخت رباتهای آمازون لکس سفارشی، به مراجعه کنید آمازون لکس: چگونه کار می کند. در این مثال، از مثال از پیش ساخته شده “book trip” استفاده می کنیم.
یک ربات ایجاد کنید
برای ایجاد ربات چت خود، مراحل زیر را انجام دهید:
- در همان منطقه ای که منابع Amazon Chime SDK را در آن مستقر کرده اید، وارد کنسول آمازون Lex شوید.
این باید در هر دو باشد us-east-1
or us-west-2
بسته به جایی که منابع Amazon Chime SDK را با استفاده از AWS CDK مستقر کرده اید.
- در صفحه پیمایش، را انتخاب کنید رباتها.
- را انتخاب کنید ایجاد ربات.
- انتخاب کنید با یک مثال شروع کنید.
- برای نام ربات، یک نام (به عنوان مثال BookTrip) وارد کنید.
- برای توضیحات:، یک توضیح اختیاری وارد کنید.
- تحت مجوزهای IAM، انتخاب کنید با مجوزهای اساسی آمازون لکس یک نقش ایجاد کنید.
- تحت قانون حمایت از حریم خصوصی آنلاین کودکان، انتخاب کنید نه.
این مثال به آن محافظت نیاز ندارد، اما برای ایجاد ربات خودتان باید این گزینه را بر اساس آن انتخاب کنید.
- تحت پایان زمان جلسه بیکار¸ زمان پایان جلسه را روی 1 دقیقه تنظیم کنید.
- می توانید از آن بگذرید تنظیمات پیشرفته بخش.
- را انتخاب کنید بعدی.
- برای انتخاب زبان، زبان مورد نظر خود را انتخاب کنید (برای این پست، ما انگلیسی (US) را انتخاب می کنیم).
- برای تعامل صوتی، صدایی را که می خواهید استفاده کنید انتخاب کنید.
- می توانید یک نمونه صدا وارد کرده و انتخاب کنید بازی برای تست عبارت و تایید صدا مطابق میل شماست.
- تنظیمات دیگر را در حالت پیش فرض خود بگذارید.
- را انتخاب کنید انجام شده.
- در تکمیل بخش، متن زیر را برای انجام موفقیت آمیز وارد کنید:
- تحت پاسخ های پایانی، متن زیر را برای پیام وارد کنید:
Goodbye!
- را انتخاب کنید صرفه جویی در قصد.
- را انتخاب کنید ساختن.
مراحل ساخت چند لحظه طول می کشد تا کامل شود. وقتی کار تمام شد، میتوانید ربات را روی کنسول آمازون لکس آزمایش کنید.
یک نسخه ایجاد کنید
شما اکنون ربات را ساخته اید. بعد، یک نسخه ایجاد می کنیم.
- حرکت به نسخه صفحه ربات شما (زیر نام ربات در قسمت ناوبری).
- را انتخاب کنید نسخه ایجاد کنید.
- تمام مقادیر پیش فرض را بپذیرید و انتخاب کنید ساختن.
نسخه جدید شما اکنون در لیست فهرست شده است نسخه احتمال برد مراجعه کنید.
یک نام مستعار ایجاد کنید
سپس یک نام مستعار ایجاد می کنیم.
- در صفحه پیمایش، را انتخاب کنید نام مستعار.
- را انتخاب کنید نام مستعار ایجاد کنید.
- برای نام مستعار نام، نامی را وارد کنید (به عنوان مثال، تولید).
- تحت وابسته با یک نسخه، انتخاب کنید نسخه 1 در منوی کشویی
اگر بیش از یک نسخه از ربات داشتید، می توانید نسخه مناسب را در اینجا انتخاب کنید.
- را انتخاب کنید ساختن.
نام مستعار در حال حاضر در فهرست شده است نام مستعار احتمال برد مراجعه کنید.
- بر نام مستعار صفحه، نام مستعاری را که ایجاد کردید انتخاب کنید.
- تحت سیاست مبتنی بر منابع، انتخاب کنید ویرایش.
- خط مشی زیر را اضافه کنید، که به صدای Amazon Chime SDK PSTN اجازه می دهد Amazon Lex را برای شما فراخوانی کند:
در کد قبلی، منبع ARN (که مستقیماً بالای کادر متن قرار دارد) را ارائه کنید، که ARN برای نام مستعار ربات است. همچنین شماره حساب خود را وارد کنید و منطقه ای را که در آن مستقر هستید را مشخص کنید (us-east-1
or us-west-2
). این ARN صفحه کنترل صوتی PSTN را در حساب شما تعریف می کند.
- را انتخاب کنید ذخیره برای ذخیره سیاست
- را انتخاب کنید نسخه در کنار منبع ARN برای استفاده در مرحله بعد.
تبریک می گویم! شما یک ربات آمازون لکس را پیکربندی کرده اید!
در یک برنامه چت بات واقعی، تقریباً مطمئناً یک تابع Lambda را برای پردازش مقاصد پیاده سازی خواهید کرد. این برنامه آزمایشی بر توضیح نحوه اتصال به صوتی Amazon Chime SDK PSTN تمرکز دارد، بنابراین ما وارد این سطح از جزئیات نمی شویم. برای اطلاعات بیشتر، به افزودن تابع لامبدا به عنوان قلاب کد مراجعه کنید.
مخزن GitHub را کلون کنید
با شبیه سازی مخزن می توانید کد کل کارگاه را دریافت کنید:
منابع مشترک را برای کارگاه مستقر کنید
این کارگاه از CDK AWS برای به کارگیری تمام منابع مورد نیاز (به جز ربات آمازون Lex که قبلاً انجام دادید) استفاده می کند. برای استقرار، کد زیر را از ترمینال خود اجرا کنید:
CDK AWS منابع را مستقر می کند. ما مرحله بوت استرپ را انجام می دهیم تا مطمئن شویم AWS CDK به درستی در منطقه ای که در آن مستقر می شوید مقداردهی اولیه شده است. توجه داشته باشید که این نمونه ها از AWS CDK نسخه 2 استفاده می کنند.
این مخزن دارای یک سری درس است که برای توضیح نحوه توسعه برنامه های صوتی PSTN طراحی شده است. توصیه می کنیم این اسناد را برای درک اصول اولیه با استفاده از چند برنامه نمونه اول مرور کنید. سپس می توانید پوشه برنامه نمونه Lambda را بررسی کنید. در نهایت، مراحل را برای پیکربندی و سپس استقرار کد خود دنبال کنید. در ترمینال دستور زیر را وارد کنید:
تابع Lambda خود را برای استفاده از ربات Amazon Lex ARN پیکربندی کنید
باز کردن src/index.ts
فایل کد منبع برای تابع Lambda و ویرایش متغیر botAlias
نزدیک بالای فایل (ARN که قبلا کپی کرده اید را ارائه کنید):
اکنون می توانید ربات را با استفاده از yarn deploy و تابع جدید Lambda را با صدای PSTN با تعویض نخ تعویض کنید. همچنین می توانید متن خوشامدگویی را در قسمت یادداشت کنید startBotConversationAction
هدف - شی:
آمازون لکس ربات را راه اندازی می کند و از آمازون پولی برای خواندن آن متن استفاده می کند. این به تماس گیرنده سلام می دهد و به آنها می گوید که در مرحله بعد چه کاری باید انجام دهند.
چگونه کار می کند
مثال زیر اقدامات بیشتری را به آنچه در آن آموخته ایم اضافه می کند درس Call and Bridge Call. NEW_INBOUND_CALL
رویداد می رسد و به همین ترتیب پردازش می شود. فوکوس صوتی آمازون را فعال می کنیم (که توانایی آمازون لکس در درک کلمات را افزایش می دهد) و سپس بلافاصله تماس دریافتی را با یک ربات به ربات ارسال می کنیم. StartBotConversation
عمل. نمونه ای از آن عمل مانند شی زیر است:
وقتی ربات یک را برمی گرداند ACTION_SUCCESSFUL
رویداد، داده های جمع آوری شده توسط ربات آمازون Lex در رویداد گنجانده شده است. داده های جمع آوری شده از ربات گنجانده شده است، و تابع Lambda شما می تواند در صورت نیاز از آن داده ها استفاده کند. با این حال، یک روش معمول برای ساخت برنامه های آمازون لکس، پردازش داده ها با عملکرد مرتبط با ربات آمازون لکس است. نمونههایی از رویداد و عمل برگشت داده شده در مستندات کارگاه برای این جلسه.
نمودار توالی
نمودار زیر توالی تماس های برقرار شده بین صدای PSTN و تابع Lambda را نشان می دهد:
برای توضیح بیشتر در مورد عملیات به ادامه مطلب مراجعه کنید مستندات کارگاهی.
پاک کردن
برای پاکسازی منابع استفاده شده در این نسخه نمایشی و جلوگیری از تحمیل هزینه های بیشتر، مراحل زیر را انجام دهید:
- در ترمینال کد زیر را وارد کنید:
- بازگشت به پوشه کارگاه (
cd ../../
) و کد زیر را وارد کنید:
پشته AWS CloudFormation ایجاد شده توسط AWS CDK نابود می شود و تمام منابع اختصاص داده شده حذف می شود.
نتیجه
در این پست یاد گرفتید که چگونه a پاسخ صوتی تعاملی محاوره ای سیستم (IVR) با استفاده از Amazon Lex و Amazon Chime SDK PSTN صوتی. شما می توانید از این تکنیک ها برای ایجاد سیستم خود استفاده کنید تا زمان حل تماس مشتری خود را کاهش دهید و پاسخ های اطلاعاتی تماس های مشتریان خود را خودکار کنید.
برای کسب اطلاعات بیشتر، نگاه کنید به مخزن پروژه GitHub و با استفاده از سرویس صوتی Amazon Chime SDK PSTN.
درباره نویسنده
گرگ هرلین تیم های نرم افزاری را برای بیش از 25 سال در شرکت های بزرگ و کوچک، از جمله چندین استارتاپ، رهبری کرده است. او در حال حاضر مبشر اصلی سرویس Amazon Chime SDK است که در آن علاقه زیادی به نحوه کمک به مشتریان در ساختن نرم افزارهای ارتباطی پیشرفته دارد.
- Coinsmart. بهترین صرافی بیت کوین و کریپتو اروپا.
- پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی رایگان.
- CryptoHawk. رادار آلت کوین امتحان رایگان.
- منبع: https://aws.amazon.com/blogs/machine-learning/enable-conversational-chatbots-for-telephony-using-amazon-lex-and-the-amazon-chime-sdk/
- "
- 100
- 9
- درباره ما
- حساب
- عمل
- اقدامات
- اضافه
- پیشرفته
- عاملان
- AI
- معرفی
- قبلا
- آمازون
- اعلام
- API
- کاربرد
- برنامه های کاربردی
- سمعی
- خودکار
- AWS
- زمینه
- مبانی
- مرز
- ربات
- رباتها
- جعبه
- بریج
- ساختن
- بنا
- صدا
- می توانید دریافت کنید
- قابلیت های
- ماشین
- CD
- بار
- ابر
- رمز
- مشترک
- ارتباطات
- شرکت
- محاسبه
- شرط
- پیکر بندی
- کنسول
- محتوا
- کنترل
- میتوانست
- ایجاد
- مجوزها و اعتبارات
- سفارشی
- مشتریان
- داده ها
- گسترش
- استقرار
- گسترش
- مستقر می کند
- طرح
- نابود شده
- جزئیات
- توسعه
- توسعه دهندگان
- پروژه
- DID
- اسناد و مدارک
- نمی کند
- به آسانی
- اثر
- انگلیسی
- محیط
- واقعه
- مثال
- جز
- تجارب
- امکانات
- نام خانوادگی
- تمرکز
- به دنبال
- پیروی
- قالب
- یافت
- تابع
- GitHub
- کمک
- اینجا کلیک نمایید
- چگونه
- چگونه
- HTTPS
- انجام
- مشمول
- از جمله
- اطلاعات
- ادغام
- یکپارچه
- ادغام
- تعاملی
- رابط
- IT
- زبان
- بزرگ
- یاد گرفتن
- آموخته
- یادگیری
- رهبری
- سطح
- لاین
- ذکر شده
- دستگاه
- فراگیری ماشین
- اداره می شود
- مدیر
- رسانه ها
- پیام
- ML
- موبایل
- برنامه های موبایل
- بیش
- طبیعی
- جهت یابی
- نزدیک
- شبکه
- ویژگی های جدید
- سر و صدا
- عدد
- تعداد
- آنلاین
- حریم خصوصی آنلاین
- گزینه
- سفارش
- دیگر
- سیاست
- قوی
- تمرین
- اصلی
- خلوت
- روند
- تولید
- برنامه
- برنامه ها
- پروژه
- حفاظت
- پروتکل
- ارائه
- فراهم می کند
- عمومی
- زمان واقعی
- توصیه
- كاهش دادن
- اجاره
- جایگزین
- مخزن
- ضروری
- منابع
- منابع
- پاسخ
- بازده
- این فایل نقد می نویسید:
- قوانین
- دویدن
- sdk
- سلسله
- بدون سرور
- سرویس
- تنظیم
- ساده
- کوچک
- So
- نرم افزار
- راه حل
- مصنوعی
- کد منبع
- پشته
- شروع می شود
- نوپا
- بیانیه
- opbevare
- موفق
- سیستم
- وظایف
- تکنیک
- فن آوری
- می گوید
- پایانه
- آزمون
- مبانی
- منبع
- از طریق
- بالا
- سفر
- فهمیدن
- us
- استفاده کنید
- تصویری
- مجازی
- صدا
- وب
- خوش آمد
- چی
- کلمات
- کارگر
- با این نسخهها کار
- سال