Mempercepat Siklus Hidup Pengembangan Amazon Lex Chatbot Dengan Test Workbench

Diterbitkan Ulang Oleh Plato

Followers: 0

AmazonLex dengan bangga mengumumkan Test Workbench, solusi pengujian bot baru yang menyediakan alat untuk menyederhanakan dan mengotomatiskan proses pengujian bot. Selama pengembangan bot, pengujian adalah fase di mana pengembang memeriksa apakah bot memenuhi persyaratan, kebutuhan, dan harapan spesifik dengan mengidentifikasi kesalahan, cacat, atau bug dalam sistem sebelum melakukan penskalaan. Pengujian membantu memvalidasi kinerja bot di beberapa bidang seperti alur percakapan (memahami pertanyaan pengguna dan merespons secara akurat), penanganan maksud yang tumpang tindih, dan konsistensi di seluruh modalitas. Namun, pengujian sering kali dilakukan secara manual, rawan kesalahan, dan tidak terstandarisasi. Test Workbench menstandardisasi manajemen pengujian otomatis dengan memungkinkan tim pengembangan chatbot membuat, memelihara, dan mengeksekusi set pengujian dengan metodologi yang konsisten dan menghindari pembuatan skrip khusus dan integrasi ad-hoc. Dalam postingan ini, Anda akan mempelajari bagaimana Test Workbench menyederhanakan pengujian otomatis modalitas suara dan teks bot serta memberikan pengukuran akurasi dan performa untuk parameter seperti transkripsi audio, pengenalan maksud, dan resolusi slot untuk input ucapan tunggal dan percakapan multi-putaran. Hal ini memungkinkan Anda dengan cepat mengidentifikasi area peningkatan bot dan mempertahankan garis dasar yang konsisten untuk mengukur akurasi dari waktu ke waktu dan mengamati regresi akurasi apa pun karena pembaruan bot.

Amazon Lex adalah layanan terkelola sepenuhnya untuk membangun antarmuka suara dan teks percakapan. Amazon Lex membantu Anda membangun dan menerapkan chatbots dan asisten virtual di situs web, layanan pusat kontak, dan saluran perpesanan. Bot Amazon Lex membantu meningkatkan produktivitas respons suara interaktif (IVR), mengotomatiskan tugas-tugas sederhana, dan mendorong efisiensi operasional di seluruh organisasi. Test Workbench untuk Amazon Lex menstandardisasi dan menyederhanakan siklus hidup pengujian bot, yang sangat penting untuk meningkatkan desain bot.

Fitur Meja Kerja Uji

Test Workbench untuk Amazon Lex mencakup fitur berikut:

Hasilkan kumpulan data pengujian secara otomatis dari log percakapan bot
Unggah garis dasar set pengujian yang dibuat secara manual
Lakukan pengujian end-to-end pada percakapan input tunggal atau multi-putaran
Uji modalitas audio dan teks bot
Tinjau metrik gabungan dan lihat perincian untuk dimensi bot:
- Transkripsi ucapan
- Pengenalan niat
- Resolusi slot (termasuk slot multi-nilai atau slot komposit)
- Tag konteks
- Atribut sesi
- Atribut permintaan
- Petunjuk waktu proses
- Penundaan waktu dalam hitungan detik

Prasyarat

Untuk menguji fitur ini, Anda harus memiliki yang berikut ini:

Selain itu, Anda harus memiliki pengetahuan dan pemahaman tentang layanan dan fitur berikut:

Buat set pengujian

Untuk membuat set pengujian Anda, selesaikan langkah-langkah berikut:

pada Konsol Amazon Lex, dibawah Uji meja kerja di panel navigasi, pilih Set tes.

Anda dapat meninjau daftar set pengujian yang ada, termasuk informasi dasar seperti nama, deskripsi, jumlah input pengujian, modalitas, dan status. Pada langkah-langkah berikut, Anda dapat memilih antara membuat set pengujian dari log percakapan yang terkait dengan bot atau mengunggah set pengujian yang dibuat secara manual dalam format file CSV.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Pilih Buat set pengujian.

Menghasilkan set pengujian dari log percakapan memungkinkan Anda melakukan hal berikut:
- Sertakan percakapan multi-putaran nyata dari log bot di CloudWatch
- Sertakan log audio dan lakukan tes yang memperhitungkan nuansa ucapan, kebisingan latar belakang, dan aksen yang sebenarnya
- Mempercepat pembuatan set pengujian
Mengunggah set pengujian yang dibuat secara manual memungkinkan Anda melakukan hal berikut:
- Uji bot baru yang data produksinya tidak ada
- Lakukan uji regresi pada bot yang ada untuk setiap maksud, slot, dan alur percakapan yang baru atau yang dimodifikasi
- Uji skenario yang dibuat dengan cermat dan mendetail yang menentukan atribut sesi dan atribut permintaan

Untuk menghasilkan set pengujian, selesaikan langkah-langkah berikut. Untuk mengunggah set pengujian yang dibuat secara manual, lanjutkan ke langkah 7.

Pilih Hasilkan set pengujian dasar.
Pilih opsi Anda untuk Nama bot, Alias bot, dan Bahasa.
Untuk Rentang waktu, tetapkan rentang waktu untuk log.
Untuk Peran IAM yang ada, pilih peran.

Pastikan IAM role dapat memberi Anda akses untuk mengambil informasi dari log percakapan. Lihat Membuat peran IAM untuk membuat IAM role dengan kebijakan yang sesuai.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Jika Anda lebih suka menggunakan set pengujian yang dibuat secara manual, pilih Unggah file ke set pengujian ini.
Untuk Unggah file ke set pengujian ini, pilih dari opsi berikut:
- Pilih Unggah dari ember S3 untuk mengunggah file CSV dari Layanan Penyimpanan Sederhana Amazon (Amazon S3).
- Pilih Unggah file ke set pengujian ini untuk mengunggah file CSV dari komputer Anda.

Anda dapat menggunakan kumpulan uji sampel disediakan dalam posting ini. Untuk informasi lebih lanjut tentang templat, pilih Templat CSV tautan di halaman.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Untuk Pengandaian, pilih modalitas set pengujian Anda Teks or Audio.

Test Workbench menyediakan dukungan pengujian untuk format input audio dan teks.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Untuk Lokasi S3, masukkan lokasi bucket S3 tempat hasilnya akan disimpan.
Secara opsional, pilih sebuah Layanan Manajemen Kunci AWS (AWS KMS) kunci untuk mengenkripsi transkrip keluaran.
Pilih membuat.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Set pengujian yang baru Anda buat akan dicantumkan di Set tes halaman dengan salah satu status berikut:

Siap untuk anotasi – Untuk set pengujian yang dihasilkan dari log percakapan bot Amazon Lex, langkah anotasi berfungsi sebagai mekanisme gerbang manual untuk memastikan input pengujian berkualitas. Dengan menganotasi nilai untuk maksud yang diharapkan dan slot yang diharapkan untuk setiap item baris pengujian, Anda menunjukkan “kebenaran dasar” untuk baris tersebut. Hasil pengujian dari bot dikumpulkan dan dibandingkan dengan kebenaran dasar untuk menandai hasil pengujian sebagai lulus atau gagal. Perbandingan tingkat garis ini kemudian memungkinkan pembuatan pengukuran agregat.
Siap untuk pengujian – Hal ini menunjukkan bahwa set pengujian siap dijalankan terhadap bot Amazon Lex.
Kesalahan validasi – File pengujian yang diunggah diperiksa untuk menemukan kesalahan seperti melebihi panjang maksimum yang didukung, karakter yang tidak valid dalam nama maksud, atau tautan Amazon S3 yang berisi file audio tidak valid. Jika set tes ada di Kesalahan validasi negara bagian, unduh file yang menunjukkan detail validasi untuk melihat masalah atau kesalahan masukan pengujian setiap baris. Setelah masalah tersebut diatasi, Anda dapat mengunggah CSV set pengujian yang telah diperbaiki secara manual ke dalam set pengujian.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Menjalankan set pengujian

Satu set pengujian dipisahkan dari bot. Kumpulan pengujian yang sama dapat dijalankan terhadap bot atau alias bot yang berbeda di masa mendatang seiring berkembangnya kasus penggunaan bisnis Anda. Untuk melaporkan metrik kinerja bot terhadap data pengujian dasar, selesaikan langkah-langkah berikut:

impor bot sampel definisi dan buat bot (lihat Mengimpor bot untuk bimbingan).
Di konsol Amazon Lex, pilih Set tes di panel navigasi.
Pilih set pengujian Anda yang tervalidasi.

Di sini Anda dapat meninjau informasi dasar tentang set pengujian dan data pengujian yang diimpor.

Pilih Jalankan tes.
Pilih opsi yang sesuai untuk Nama bot, Alias bot, dan Bahasa.
Untuk Jenis pengujian, pilih Audio or Teks.
Untuk Pemilihan titik akhir, pilih salah satu streaming or Non-streaming.
Pilih Validasi perbedaan untuk memvalidasi kumpulan data pengujian Anda.

Sebelum menjalankan set pengujian, Anda dapat memvalidasi cakupan pengujian, termasuk mengidentifikasi maksud dan slot yang ada di set pengujian tetapi tidak di bot. Peringatan dini ini berfungsi untuk menetapkan ekspektasi penguji terhadap kegagalan pengujian yang tidak terduga. Jika perbedaan antara set data pengujian dan bot Anda terdeteksi, Jalankan tes halaman akan diperbarui dengan Lihat detail .

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Maksud dan slot yang ditemukan dalam kumpulan data pengujian tetapi tidak di alias bot dicantumkan seperti yang ditunjukkan pada tangkapan layar berikut.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Setelah Anda memvalidasi perbedaan, pilih Eksekusi untuk menjalankan tes.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Tinjau hasil

Ukuran kinerja yang dihasilkan setelah menjalankan set pengujian membantu Anda mengidentifikasi area desain bot yang memerlukan perbaikan dan berguna untuk mempercepat pengembangan dan pengiriman bot guna mendukung pelanggan Anda. Test Workbench memberikan wawasan tentang klasifikasi maksud dan resolusi slot dalam percakapan ujung ke ujung dan tingkat masukan satu baris. Uji coba yang telah selesai disimpan dengan stempel waktu di bucket S3 Anda, dan dapat digunakan untuk tinjauan komparatif di masa mendatang.

Di konsol Amazon Lex, pilih Hasil tes di panel navigasi.
Pilih ID hasil tes untuk hasil yang ingin Anda tinjau.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Di halaman berikutnya, hasil tes akan menyertakan rincian hasil yang disusun dalam empat tab utama: Hasil keseluruhan, Hasil percakapan, Hasil maksud dan slot, dan Hasil terperinci.

Hasil keseluruhan

Tab Hasil keseluruhan berisi tiga bagian utama:

Perincian masukan set pengujian — Bagan yang menunjukkan jumlah total percakapan ujung-ke-ujung dan ucapan masukan tunggal di set pengujian.
Perincian masukan tunggal — Bagan yang menunjukkan jumlah input tunggal yang lulus atau gagal.
Gangguan percakapan — Bagan yang menunjukkan jumlah input multi-putaran yang berhasil atau gagal.

Untuk set pengujian yang dijalankan dalam modalitas audio, bagan transkripsi ucapan disediakan untuk menunjukkan jumlah transkripsi ucapan yang lulus atau gagal pada input tunggal dan jenis percakapan. Dalam modalitas audio, satu input atau percakapan multi-putaran dapat lulus tes transkripsi ucapan, namun gagal dalam tes end-to-end secara keseluruhan. Hal ini dapat disebabkan, misalnya, oleh resolusi slot atau masalah pengenalan niat.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Hasil percakapan

Test Workbench membantu Anda menelusuri kegagalan percakapan yang dapat dikaitkan dengan maksud atau slot tertentu. Tab Hasil Percakapan disusun menjadi tiga area utama, yang mencakup semua maksud dan slot yang digunakan dalam set pengujian:

Tingkat kelulusan percakapan — Tabel yang digunakan untuk memvisualisasikan maksud dan slot mana yang bertanggung jawab atas kemungkinan kegagalan percakapan.
Metrik kegagalan niat percakapan — Grafik batang yang menunjukkan lima niat dengan kinerja terburuk dalam set pengujian, jika ada.
Metrik kegagalan slot percakapan — Grafik batang yang menunjukkan lima slot dengan kinerja terburuk dalam set pengujian, jika ada.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Maksud dan hasil slot

Tab Hasil niat dan slot menyediakan metrik penelusuran untuk dimensi bot seperti pengenalan niat dan resolusi slot.

Metrik pengenalan niat — Tabel yang menunjukkan tingkat keberhasilan pengenalan niat.
Metrik resolusi slot — Tabel yang menunjukkan tingkat keberhasilan resolusi slot, menurut setiap niat.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Hasil terperinci

Anda dapat mengakses laporan terperinci tentang pengujian yang dijalankan di tab Hasil terperinci. Tabel ditampilkan untuk memperlihatkan transkripsi aktual, maksud keluaran, dan nilai slot dalam set pengujian. Laporan dapat diunduh sebagai CSV untuk analisis lebih lanjut.

Percepat siklus hidup pengembangan chatbot Amazon Lex dengan Test Workbench | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Output tingkat baris memberikan wawasan untuk membantu meningkatkan desain bot dan meningkatkan akurasi. Misalnya, masukan ucapan yang salah dikenali atau terlewatkan seperti kata-kata bermerek dapat ditambahkan ke kosakata khusus dari suatu maksud atau sebagai ucapan di bawah suatu maksud.

Untuk lebih meningkatkan desain percakapan, Anda dapat merujuk ke posting ini, menguraikan praktik terbaik dalam menggunakan ML untuk membuat bot yang akan menyenangkan pelanggan Anda dengan memahami mereka secara akurat.

Kesimpulan

Dalam postingan ini, kami menyajikan Test Workbench untuk Amazon Lex, sebuah kemampuan asli yang menstandardisasi proses pengujian otomatis chatbot dan memungkinkan pengembang dan perancang percakapan untuk menyederhanakan dan melakukan iterasi dengan cepat melalui desain dan pengembangan bot.

Kami menantikan cara Anda menggunakan fungsi baru Amazon Lex ini dan menyambut masukan! Untuk pertanyaan, bug, atau permintaan fitur apa pun, silakan hubungi kami melalui AWS re:Posting untuk Amazon Lex atau kontak AWS Support Anda.

Untuk mempelajari lebih lanjut, lihat FAQ Amazon Lex dan Panduan Pengembang Amazon Lex V2.

Tentang penulis

Sandeep Srinivasan adalah Manajer Produk di tim Amazon Lex. Sebagai pengamat perilaku manusia yang tajam, dia sangat menyukai pengalaman pelanggan. Dia menghabiskan waktu terjaganya di persimpangan orang, teknologi, dan masa depan.

Grazia Russo Lassner adalah Konsultan Senior di tim AWS Professional Services Natural Language AI. Dia berspesialisasi dalam merancang dan mengembangkan solusi AI percakapan menggunakan teknologi AWS untuk pelanggan di berbagai industri. Di luar pekerjaan, dia menikmati akhir pekan di pantai, membaca buku fiksi terbaru, dan keluarga.

Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
Keuangan EVM. Antarmuka Terpadu untuk Keuangan Terdesentralisasi. Akses Di Sini.
Grup Media Kuantum. IR/PR Diperkuat. Akses Di Sini.
PlatoAiStream. Kecerdasan Data Web3. Pengetahuan Diperkuat. Akses Di Sini.
Sumber: https://aws.amazon.com/blogs/machine-learning/expedite-the-amazon-lex-chatbot-development-lifecycle-with-test-workbench/

Stempel Waktu: Juni 7, 2023

Memanfaatkan kekuatan data perusahaan dengan AI generatif: Wawasan dari Amazon Kendra, LangChain, dan model bahasa besar | Layanan Web Amazon

Kluster Sumber:

Pembelajaran Mesin AWS

Node Sumber: 1910724

Stempel Waktu: November 7, 2023

Percepat siklus pengembangan chatbot Amazon Lex dengan Test Workbench | Layanan Web Amazon

Diterbitkan Ulang Oleh Plato

Fitur Meja Kerja Uji

Prasyarat

Buat set pengujian

Menjalankan set pengujian

Tinjau hasil

Hasil keseluruhan

Hasil percakapan

Maksud dan hasil slot

Hasil terperinci

Kesimpulan

Tentang penulis

Lebih dari Pembelajaran Mesin AWS

Sorot teks saat diucapkan menggunakan Amazon Polly | Layanan Web Amazon

AWS Inferentia dan AWS Trainium memberikan biaya terendah untuk menerapkan model Llama 3 di Amazon SageMaker JumpStart | Layanan Web Amazon

Melindungi Konsumen dan Mempromosikan Inovasi – Regulasi AI dan Membangun Kepercayaan pada AI yang Bertanggung Jawab

Mengidentifikasi landmark dengan Label Kustom Amazon Rekognition

Percepat inferensi Amazon SageMaker dengan instans Amazon EC6 berbasis C2i Intel

Memanfaatkan kekuatan data perusahaan dengan AI generatif: Wawasan dari Amazon Kendra, LangChain, dan model bahasa besar | Layanan Web Amazon

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun