Konwersacyjna sztuczna inteligencja może dostarczać potężne, zautomatyzowane, interaktywne doświadczenia za pomocą głosu i tekstu. Amazonka Lex to usługa, która łączy w sobie technologie automatycznego rozpoznawania mowy i rozumienia języka naturalnego, dzięki czemu możesz tworzyć zaawansowane konwersacje. Powszechne zastosowanie konwersacyjnej sztucznej inteligencji można znaleźć w contact center: samoobsługowi wirtualni agenci. Z przyjemnością informujemy, że możesz teraz korzystać Zestaw SDK Amazon Chime Dźwięk publicznej komutowanej sieci telefonicznej (PSTN) umożliwiający konwersacyjnym aplikacjom samoobsługowym skrócenie czasu rozwiązywania połączeń i automatyzację odpowiedzi informacyjnych.
Pakiet Amazon Chime SDK to zestaw komponentów komunikacyjnych w czasie rzeczywistym, których programiści mogą używać do dodawania dźwięku, wiadomości, wideo i udostępniania ekranu do aplikacji internetowych i mobilnych. Integracja audio Amazon Chime SDK PSTN z Amazon Lex umożliwia konstruktorom tworzenie interfejsów konwersacyjnych dla połączeń do lub z publicznej sieci telefonicznej. Możesz teraz tworzyć aplikacje samoobsługowe oparte na sztucznej inteligencji, takie jak konwersacyjne interaktywne systemy odpowiedzi głosowej (IVR), agenci wirtualni i inne aplikacje telefoniczne korzystające z protokołu SIP (Session Initiation Protocol) do komunikacji głosowej.
Ponadto wprowadziliśmy kilka nowych funkcji. Amazon Voice Focus dla PSTN zapewnia tłumienie hałasu oparte na głębokim uczeniu się, aby zredukować niechciany hałas podczas połączeń. Możesz teraz również korzystać z przetwarzania tekstu na mowę opartego na uczeniu maszynowym (ML) w swojej aplikacji dzięki naszej natywnej integracji z Amazon Polly. Wszystkie funkcje są teraz bezpośrednio zintegrowane z dźwiękiem PSTN Amazon Chime SDK.
W tym poście nauczymy Cię, jak zbudować konwersacyjny system IVR za fikcyjną usługę turystyczną, która przyjmuje rezerwacje przez telefon za pomocą Amazon Lex.
Omówienie rozwiązania
Amazon Chime SDK PSTN audio ułatwia programistom tworzenie niestandardowych aplikacji telefonicznych przy użyciu zwinności i prostoty operacyjnej bezserwerowej AWS Lambda funkcje.
Do tego rozwiązania wykorzystujemy następujące komponenty:
- Dźwięk PSTN z pakietu Amazon Chime SDK
- AWS Lambda
- Amazonka Lex
- Amazon Polly
Amazon Lex natywnie integruje się z Amazon Polly, aby zapewnić funkcje zamiany tekstu na mowę. W tym poście włączamy również funkcję Amazon Voice Focus, aby redukować szumy tła podczas połączeń telefonicznych. W poprzedni postpokazaliśmy, jak zintegrować się z Amazon Lex v1 za pomocą interfejsu API. To już nie jest wymagane. Trudną pracę z Amazon Lex i Amazon Polly zastępuje teraz kilka prostych wywołań funkcji.
Poniższy diagram ilustruje projekt wysokiego poziomu systemu chatbotów Amazon Chime SDK Amazon Lex.
Aby pomóc Ci nauczyć się budować za pomocą usługi audio Amazon Chime SDK PSTN, opublikowaliśmy repozytorium kodu źródłowego i dokumentacji wyjaśniając, jak działa ten kod źródłowy. Kod źródłowy jest w formacie warsztatowym, a każdy przykładowy program opiera się na poprzedniej lekcji. Ostatnią lekcją jest, jak zbudować przez telefon kompletny chatbot oparty na Amazon Lex. Na tej lekcji skupiamy się w tym poście.
W ramach tego rozwiązania tworzysz następujące zasoby:
- Aplikacja do obsługi mediów SIP – Obiekt zarządzany, który określa funkcję Lambda do wywołania.
- Reguła SIP – Obiekt zarządzany, który określa numer telefonu do wyzwolenia i który obiekt zarządzany przez aplikację SIP media ma być używany do wywołania funkcji Lambda.
- Numer telefonu – Numer telefonu Amazon Chime SDK PSTN przeznaczony do odbierania połączeń telefonicznych.
- Funkcja Lambdy – Funkcja napisana w Typescript, która jest zintegrowana z usługą audio PSTN. Odbiera wywołania z aplikacji multimedialnej SIP i wysyła z powrotem działania, które instruują aplikację multimedialną SIP do wykonywania zadań Amazon Polly i Amazon Lex.
Kod demo jest wdrażany w dwóch częściach. Przykład chatbota Amazon Lex jest jednym z serii przykładów warsztatowych, które uczą, jak korzystać z dźwięku Amazon Chime SDK PSTN. W tym poście wykonujesz następujące ogólne kroki, aby wdrożyć chatbota:
- Skonfiguruj chatbota Amazon Lex.
- Sklonuj kod z repozytorium GitHub.
- Wdróż wspólne zasoby warsztatu (w tym numer telefonu).
- Wdróż funkcję Lambda, która łączy Amazon Lex z numerem telefonu.
Szczegółowo przechodzimy przez każdy krok.
Wymagania wstępne
Musisz mieć następujące wymagania wstępne:
- zainstalowany węzeł V12+/npm
- Zainstalowany interfejs wiersza poleceń AWS (AWS CLI)
- Zainstalowany menedżer wersji węzła (nvm)
- Zainstalowano moduły nodescript aws-sdk (przy użyciu nvm)
- Poświadczenia AWS skonfigurowane dla konta i regionu, którego używasz w tym demo
- Uprawnienia do tworzenia aplikacji multimedialnych Amazon Chime SIP i numerów telefonów (upewnij się, że limit usług jest w
us-east-1
orus-west-2
dla numerów telefonów, połączeń głosowych, aplikacji multimedialnych SIP i reguł SIP nie zostały osiągnięte) - Wdrożenie należy wykonać w
us-east-1
orus-west-2
dostosować się do zasobów audio PSTN
Aby uzyskać szczegółowe instrukcje instalacji, w tym skrypt, który może zautomatyzować instalację i projekt AWS Cloud Development Kit (AWS CDK), aby łatwo utworzyć środowisko programistyczne Amazon Elastic Compute Cloud (Amazon EC2), zobacz instrukcje warsztatowe.
Skonfiguruj chatbota Amazon Lex
Możesz zbudować kompletnego konwersacyjnego bota głosowego za pomocą Amazon Lex. W tym przykładzie do zbudowania bota używasz konsoli Amazon Lex. Pomijamy kroki, w których budujesz funkcję Lambda dla Amazon Lex. Skupiamy się tutaj na tym, jak podłączyć dźwięk Amazon Chime PSTN do Amazon Lex. Aby uzyskać instrukcje dotyczące tworzenia niestandardowych botów Amazon Lex, zapoznaj się z Amazon Lex: Jak to działa. W tym przykładzie używamy gotowego przykładu „wycieczki książkowej”.
Utwórz bota
Aby stworzyć chatbota, wykonaj następujące kroki:
- Zaloguj się do konsoli Amazon Lex w tym samym regionie, w którym wdrożono zasoby Amazon Chime SDK.
To musi być albo us-east-1
or us-west-2
, w zależności od tego, gdzie wdrożono zasoby Amazon Chime SDK przy użyciu AWS CDK.
- W okienku nawigacji wybierz Boty.
- Dodaj Utwórz bota.
- Wybierz Zacznij od przykładu.
- W razie zamówieenia projektu Nazwa bota, wprowadź nazwę (na przykład BookTrip).
- W razie zamówieenia projektu Opiswprowadź opcjonalny opis.
- Pod Uprawnienia, Wybierz Utwórz rolę z podstawowymi uprawnieniami Amazon Lex.
- Pod Ustawa o ochronie prywatności dzieci w Internecie, Wybierz Nie.
Ten przykład nie wymaga takiej ochrony, ale do tworzenia własnego bota należy odpowiednio wybrać tę opcję.
- Pod Limit czasu bezczynności sesji¸ ustaw limit czasu sesji na 1 minutę.
- Możesz pominąć ustawienia zaawansowane
- Dodaj Następna.
- W razie zamówieenia projektu Wybierz język, wybierz preferowany język (w tym poście wybieramy angielski (USA)).
- W razie zamówieenia projektu Interakcja głosowa, wybierz głos, którego chcesz używać.
- Możesz wprowadzić próbkę głosu i wybrać Grać aby przetestować frazę i potwierdzić, że głos Ci odpowiada.
- Pozostałe ustawienia pozostaw domyślne.
- Dodaj Gotowe .
- W Realizacja w sekcji Po pomyślnej realizacji wprowadź następujący tekst:
- Pod Odpowiedzi końcowe, wprowadź następujący tekst w polu Wiadomość:
Goodbye!
- Dodaj Zapisz zamiar.
- Dodaj Budować.
Proces kompilacji zajmuje kilka chwil. Po zakończeniu możesz przetestować bota na konsoli Amazon Lex.
Utwórz wersję
Zbudowałeś teraz bota. Następnie tworzymy wersję.
- Nawiguj do wersje strona Twojego bota (pod nazwą bota w panelu nawigacyjnym).
- Dodaj Utwórz wersję.
- Zaakceptuj wszystkie wartości domyślne i wybierz Stwórz.
Twoja nowa wersja jest teraz wymieniona na wersje strona.
Utwórz alias
Następnie tworzymy alias.
- W okienku nawigacji wybierz Pseudonimy.
- Dodaj Utwórz alias.
- W razie zamówieenia projektu Alias nazwa, wprowadź nazwę (na przykład produkcja).
- Pod Współpracownik z wersją, wybierz Wersja 1 w menu rozwijanym.
Jeśli masz więcej niż jedną wersję bota, możesz wybrać odpowiednią wersję tutaj.
- Dodaj Stwórz.
Alias jest teraz wymieniony na Pseudonimy strona.
- Na Pseudonimy strony, wybierz właśnie utworzony alias.
- Pod Polityka oparta na zasobachwybierz Edytuj.
- Dodaj następującą zasadę, która pozwoli plikowi audio Amazon Chime SDK PSTN na wywoływanie dla Ciebie usługi Amazon Lex:
W poprzednim kodzie podaj ARN zasobu (znajdujący się bezpośrednio nad polem tekstowym), który jest numerem ARN aliasu bota. Podaj również numer swojego konta i określ region, w którym przeprowadzasz wdrożenie (us-east-1
or us-west-2
). To definiuje ARN płaszczyzny sterowania dźwiękiem PSTN na Twoim koncie.
- Dodaj Zapisz do przechowywania polisy.
- Dodaj Skopiuj obok zasobu ARN do użycia w późniejszym kroku.
Gratulacje! Skonfigurowałeś bota Amazon Lex!
W prawdziwej aplikacji chatbota prawie na pewno zaimplementowałbyś funkcję Lambda do przetwarzania intencji. Ten program demonstracyjny koncentruje się na wyjaśnieniu, jak połączyć się z dźwiękiem PSTN Amazon Chime SDK, więc nie wchodzimy w ten poziom szczegółowości. Po więcej informacji, zobacz Dodawanie funkcji lambda jako haka kodu.
Sklonuj repozytorium GitHub
Kod dla całego warsztatu możesz uzyskać, sklonując repozytorium:
Wdróż wspólne zasoby dla warsztatu
Ten warsztat wykorzystuje AWS CDK do automatyzacji wdrażania wszystkich potrzebnych zasobów (z wyjątkiem bota Amazon Lex, który już zrobiłeś). Aby wdrożyć, uruchom następujący kod ze swojego terminala:
AWS CDK wdraża zasoby. Wykonujemy krok ładowania początkowego, aby upewnić się, że AWS CDK jest prawidłowo zainicjowany w regionie, w którym wdrażasz. Zauważ, że te przykłady używają AWS CDK w wersji 2.
Repozytorium zawiera szereg lekcji, które mają na celu wyjaśnienie, jak tworzyć aplikacje audio PSTN. Zalecamy przejrzenie tych dokumentów w celu zrozumienia podstaw przy użyciu kilku pierwszych przykładowych programów. Następnie możesz przejrzeć folder przykładowego programu Lambda. Na koniec wykonaj kroki, aby skonfigurować, a następnie wdrożyć swój kod. W terminalu wpisz następujące polecenie:
Skonfiguruj swoją funkcję Lambda, aby korzystać z bota Amazon Lex ARN
Otwórz src/index.ts
plik z kodem źródłowym dla funkcji Lambda i edytuj zmienną botAlias
w górnej części pliku (podaj skopiowany wcześniej ARN):
Możesz teraz wdrożyć bota z włóczką i zamienić nową funkcję Lambda na dźwięk PSTN z włóczką. Możesz również zanotować tekst powitalny w startBotConversationAction
obiekt:
Amazon Lex uruchamia bota i używa Amazon Polly do odczytania tego tekstu. W ten sposób dzwoniący wita się i mówi mu, co powinien zrobić dalej.
Jak to działa?
Poniższy przykład dodaje więcej działań do tego, czego nauczyliśmy się w Lekcja Call and Bridge Call, NEW_INBOUND_CALL
zdarzenie nadchodzi i jest przetwarzane w ten sam sposób. Włączamy funkcję Amazon Voice Focus (która zwiększa zdolność Amazon Lex do rozumienia słów), a następnie natychmiast przekazujemy przychodzące połączenie botowi za pomocą StartBotConversation
akcja. Przykład takiej akcji wygląda jak następujący obiekt:
Kiedy bot wróci ACTION_SUCCESSFUL
zdarzenie, dane zebrane przez bota Amazon Lex są uwzględniane w zdarzeniu. Zebrane dane z bota są uwzględnione, a twoja funkcja Lambda może wykorzystać te dane w razie potrzeby. Jednak powszechną praktyką przy tworzeniu aplikacji Amazon Lex jest przetwarzanie danych za pomocą funkcji powiązanej z botem Amazon Lex. Przykłady zdarzenia i zwróconej akcji znajdują się w dokumentacja warsztatowa do tej sesji.
Diagram sekwencyjny
Poniższy diagram przedstawia sekwencję połączeń wykonywanych między dźwiękiem PSTN a funkcją Lambda:
Aby uzyskać bardziej szczegółowe wyjaśnienie operacji, zobacz dokumentacja warsztatowa.
Sprzątać
Aby wyczyścić zasoby używane w tym demo i uniknąć ponoszenia dalszych opłat, wykonaj następujące czynności:
- W terminalu wprowadź następujący kod:
- Wróć do folderu warsztatu (
cd ../../
) i wprowadź następujący kod:
Stos AWS CloudFormation utworzony przez AWS CDK jest niszczony, usuwając wszystkie przydzielone zasoby.
Wnioski
W tym poście nauczyłeś się budować a konwersacyjna interaktywna odpowiedź głosowa (IVR) wykorzystujący dźwięk Amazon Lex i Amazon Chime SDK PSTN. Możesz użyć tych technik do zbudowania własnego systemu, aby skrócić czas rozwiązywania własnych połączeń od klientów i zautomatyzować odpowiedzi informacyjne na połączenia od klientów.
Aby uzyskać więcej informacji, zobacz repozytorium projektu GitHub i Korzystanie z usługi Amazon Chime SDK PSTN Audio.
O autorze
Grega Herleina od ponad 25 lat kieruje zespołami programistycznymi w dużych i małych firmach, w tym w kilku startupach. Obecnie jest głównym ewangelistą usługi Amazon Chime SDK, gdzie z pasją pomaga klientom w tworzeniu zaawansowanego oprogramowania komunikacyjnego.
- Coinsmart. Najlepsza w Europie giełda bitcoinów i kryptowalut.
- Platoblockchain. Web3 Inteligencja Metaverse. Wzmocniona wiedza. DARMOWY DOSTĘP.
- CryptoJastrząb. Radar Altcoin. Bezpłatna wersja próbna.
- Źródło: https://aws.amazon.com/blogs/machine-learning/enable-conversational-chatbots-for-telephony-using-amazon-lex-and-the-amazon-chime-sdk/
- "
- 100
- 9
- O nas
- Konto
- Działania
- działania
- dodatek
- zaawansowany
- agentów
- AI
- Wszystkie kategorie
- już
- Amazonka
- Ogłosić
- api
- Zastosowanie
- aplikacje
- audio
- zautomatyzowane
- AWS
- tło
- Podstawy
- granica
- Bot
- boty
- Pudełko
- BRIDGE
- budować
- Budowanie
- wezwanie
- Może uzyskać
- możliwości
- wózek
- CD
- Opłaty
- Chmura
- kod
- wspólny
- Komunikacja
- Firmy
- obliczać
- warunek
- systemu
- Konsola
- zawartość
- kontrola
- mógłby
- tworzenie
- Listy uwierzytelniające
- zwyczaj
- Klientów
- dane
- rozwijać
- wdrażanie
- Wdrożenie
- wdraża się
- Wnętrze
- zniszczony
- detal
- rozwijać
- deweloperzy
- oprogramowania
- ZROBIŁ
- dokumenty
- Nie
- z łatwością
- efekt
- Angielski
- Środowisko
- wydarzenie
- przykład
- Z wyjątkiem
- Doświadczenia
- Korzyści
- i terminów, a
- Skupiać
- obserwuj
- następujący
- format
- znaleziono
- funkcjonować
- GitHub
- pomoc
- tutaj
- W jaki sposób
- How To
- HTTPS
- wdrożenia
- włączony
- Włącznie z
- Informacja
- integrować
- zintegrowany
- integracja
- interaktywne
- Interfejs
- IT
- język
- duży
- UCZYĆ SIĘ
- dowiedziałem
- nauka
- Doprowadziło
- poziom
- Linia
- Katalogowany
- maszyna
- uczenie maszynowe
- zarządzane
- kierownik
- Media
- wiadomości
- ML
- Aplikacje mobilne
- Aplikacje mobilne
- jeszcze
- Naturalny
- Nawigacja
- Blisko
- sieć
- Nowe funkcje
- Hałas
- numer
- z naszej
- Online
- Prywatność w Internecie
- Option
- zamówienie
- Inne
- polityka
- mocny
- praktyka
- Główny
- prywatność
- wygląda tak
- Produkcja
- Program
- Programy
- projekt
- ochrona
- protokół
- zapewniać
- zapewnia
- publiczny
- w czasie rzeczywistym
- polecić
- zmniejszyć
- Wynajem
- otrzymuje
- składnica
- wymagany
- Zasób
- Zasoby
- odpowiedź
- powraca
- przeglądu
- reguły
- run
- Sdk
- Serie
- Bezserwerowe
- usługa
- zestaw
- Prosty
- mały
- So
- Tworzenie
- rozwiązanie
- wyrafinowany
- Kod źródłowy
- stos
- rozpocznie
- Startups
- Zestawienie sprzedaży
- sklep
- udany
- system
- zadania
- Techniki
- Technologies
- mówi
- terminal
- test
- Podstawy
- Źródło
- Przez
- Top
- podróżować
- zrozumieć
- us
- posługiwać się
- Wideo
- Wirtualny
- Głos
- sieć
- powitanie
- Co
- słowa
- pracujący
- działa
- lat