Secara Otomatis Mengidentifikasi Bahasa Dalam Audio Multibahasa Menggunakan Amazon Transcribe

Diterbitkan Ulang Oleh Plato

Followers: 0

Jika Anda beroperasi di negara dengan beberapa bahasa resmi atau di beberapa wilayah, file audio Anda dapat berisi bahasa yang berbeda. Peserta mungkin berbicara bahasa yang sama sekali berbeda atau mungkin beralih antar bahasa. Pertimbangkan panggilan layanan pelanggan untuk melaporkan masalah di area dengan populasi multibahasa yang substansial. Meskipun percakapan dapat dimulai dalam satu bahasa, pelanggan dapat beralih ke bahasa lain untuk menjelaskan masalahnya, tergantung pada tingkat kenyamanan atau preferensi penggunaan dengan bahasa lain. Dengan nada yang sama, perwakilan layanan pelanggan dapat beralih antar bahasa sambil menyampaikan instruksi pengoperasian atau pemecahan masalah.

Dengan minimal 3 detik audio, Amazon Transkripsikan dapat secara otomatis mengidentifikasi dan menghasilkan transkrip secara efisien dalam bahasa yang diucapkan dalam audio tanpa perlu manusia untuk menentukan bahasa. Ini berlaku untuk berbagai kasus penggunaan seperti menyalin panggilan pelanggan, mengonversi pesan suara menjadi teks, menangkap interaksi rapat, melacak komunikasi forum pengguna, atau memantau produksi konten media dan alur kerja pelokalan.

Posting ini membahas langkah-langkah untuk menyalin file audio multibahasa menggunakan Amazon Transcribe. Kami membahas cara membuat file audio tersedia untuk Amazon Transcribe dan mengaktifkan transkripsi file audio multibahasa saat memanggil API Amazon Transcribe.

Ikhtisar solusi

Amazon Transcribe adalah layanan AWS yang memudahkan Anda mengonversi ucapan menjadi teks. Menambahkan fungsionalitas ucapan ke teks ke aplikasi apa pun menjadi mudah dengan bantuan Amazon Transcribe, layanan pengenalan ucapan otomatis (ASR). Anda dapat menyerap input audio menggunakan Amazon Transcribe, membuat transkrip yang jelas yang mudah dibaca dan ditinjau, meningkatkan akurasi dengan penyesuaian, dan memfilter informasi untuk melindungi privasi klien.

Solusinya juga menggunakan Layanan Penyimpanan Sederhana Amazon (Amazon S3), layanan penyimpanan objek yang dibuat untuk menyimpan dan mengambil data dalam jumlah berapa pun dari mana saja. Ini adalah layanan penyimpanan sederhana yang menawarkan daya tahan, ketersediaan, kinerja, keamanan, dan skalabilitas tak terbatas yang terdepan di industri dengan biaya yang sangat rendah. Saat Anda menyimpan data di Amazon S3, Anda bekerja dengan sumber daya yang dikenal sebagai Ember dan objek. Ember adalah wadah untuk benda. Objek adalah file dan metadata apa pun yang menjelaskan file tersebut.

Dalam postingan ini, kami memandu Anda melalui langkah-langkah berikut untuk mengimplementasikan solusi transkripsi audio multibahasa:

Buat bucket S3.
Unggah file audio Anda ke ember.
Buat tugas transkripsi.
Tinjau hasil pekerjaan.

Prasyarat

Untuk penelusuran ini, Anda harus memiliki prasyarat berikut:

Amazon Transcribe menyediakan opsi untuk menyimpan output yang ditranskripsikan dalam bucket S3 yang dikelola layanan atau yang dikelola pelanggan. Untuk posting ini, kami meminta Amazon Transcribe menulis hasilnya ke bucket S3 yang dikelola layanan.

Perhatikan bahwa Amazon Transcribe adalah layanan Regional dan titik akhir Amazon Transcribe API yang dipanggil harus berada di Wilayah yang sama dengan bucket S3.

Buat bucket S3 untuk menyimpan file input audio Anda

Untuk membuat bucket S3 Anda, selesaikan langkah-langkah berikut:

Pada konsol Amazon S3, pilih Buat ember.
Untuk Nama ember, masukkan nama unik global untuk bucket.
Untuk Wilayah AWS, pilih Wilayah yang sama dengan titik akhir Amazon Transcribe API Anda.
Biarkan semua default apa adanya.
Pilih Buat ember.

Unggah file audio Anda ke bucket S3

Unggah file audio multibahasa Anda ke bucket S3 di akun AWS Anda. Untuk tujuan latihan ini, kami menggunakan contoh berikut file audio multibahasa. Itu menangkap panggilan dukungan pelanggan yang melibatkan bahasa Inggris dan Spanyol.

Pada konsol Amazon S3, pilih Ember di panel navigasi.
Pilih keranjang yang Anda buat sebelumnya untuk menyimpan file audio input.
Pilih Unggah.
Pilih Tambahkan file.
Pilih file audio yang ingin Anda salin dari komputer lokal Anda.
Pilih Unggah.

File audio Anda akan segera tersedia di bucket S3.

Buat tugas transkripsi

Dengan file audio yang diunggah, kami sekarang membuat tugas transkripsi.

Di konsol Amazon Transcribe, pilih Pekerjaan transkripsi di panel navigasi.
Pilih Ciptakan pekerjaan.
Untuk Nama, masukkan nama unik untuk pekerjaan tersebut.
Ini juga akan menjadi nama file transkrip keluaran.
Untuk Pengaturan bahasa, pilih Identifikasi beberapa bahasa otomatis.
Fitur ini memungkinkan Amazon Transcribe untuk secara otomatis mengidentifikasi dan mentranskripsikan semua bahasa yang digunakan dalam file audio.
Untuk Opsi bahasa untuk identifikasi bahasa otomatis, biarkan tidak dipilih.
Amazon Transcribe secara otomatis mengidentifikasi dan mentranskripsi semua bahasa yang digunakan dalam audio. Untuk meningkatkan akurasi transkripsi, Anda dapat memilih dua bahasa atau lebih yang Anda tahu digunakan dalam audio.
Untuk Tipe model, hanya Model umum opsi tersedia pada saat menulis posting ini.
Untuk Memasukan data, pilih Jelajahi S3.
Pilih file sumber audio yang telah kami unggah sebelumnya.
Untuk Data keluaran, Anda dapat memilih salah satunya Bucket S3 yang dikelola layanan or Bucket S3 yang ditentukan pelanggan. Untuk posting ini, pilih Bucket S3 yang dikelola layanan.
Pilih Selanjutnya.
Pilih Ciptakan pekerjaan.

Tinjau hasil pekerjaan

Saat tugas transkripsi selesai, buka tugas transkripsi.

Gulir ke bawah ke Pratinjau transkripsi bagian. Transkripsi audio ditampilkan di Teks tab. Transkripsi mencakup bagian percakapan dalam bahasa Inggris dan Spanyol.

Secara opsional, Anda dapat mendownload salinan transkrip sebagai file JSON, yang dapat Anda gunakan untuk selanjutnya analitik pasca-panggilan.

Membersihkan

Untuk menghindari timbulnya biaya di masa mendatang, kosongkan dan hapus bucket S3 yang Anda buat untuk menyimpan file sumber audio input. Pastikan Anda menyimpan file di tempat lain karena ini akan menghapus secara permanen semua objek yang ada di dalam bucket. Di konsol Amazon Transcribe, pilih dan hapus tugas yang dibuat sebelumnya untuk transkripsi.

Kesimpulan

Dalam postingan ini, kami membuat alur kerja end-to-end untuk mengotomatiskan identifikasi dan transkripsi file audio multibahasa, tanpa menulis kode apa pun. Kami menggunakan fungsionalitas baru di Amazon Transcribe untuk secara otomatis mengidentifikasi berbagai bahasa dalam file audio dan mentranskripsi setiap bahasa dengan benar.

Untuk informasi lebih lanjut, lihat Identifikasi bahasa dengan tugas transkripsi batch.

Tentang Penulis

Murtuza Bootwala adalah Arsitek Solusi Senior di AWS dengan minat pada teknologi AI/ML. Dia senang bekerja dengan pelanggan untuk membantu mereka mencapai hasil bisnis mereka. Di luar pekerjaan, ia menikmati kegiatan di luar ruangan dan menghabiskan waktu bersama keluarga.

Victor Red sangat tertarik dengan AI/ML dan pengembangan perangkat lunak. Dia membantu mengaktifkan dan menjalankan Amazon Alexa di AS dan Meksiko. Dia juga membawa Amazon Textract ke AWS Partners dan meluncurkan AWS Contact Center Intelligence (CCI). Dia saat ini adalah Pemimpin Teknologi Global untuk Mitra AI Percakapan.

Babu Srinivasan adalah AWS Sr. Specialist SA (Layanan AI Bahasa) yang berbasis di Chicago. Dia berfokus pada Amazon Transcribe (ucapan ke teks), membantu pelanggan kami menggunakan layanan AI untuk memecahkan masalah bisnis. Di luar pekerjaan, dia menikmati pertukangan kayu dan melakukan pertunjukan sulap.

Stempel Waktu: Desember 14, 2022Desember 14, 2022

Stempel Waktu: Juli 8, 2022

Transfer pembelajaran untuk model klasifikasi gambar TensorFlow di Amazon SageMaker

Kluster Sumber:

Pembelajaran Mesin AWS

Node Sumber: 1655641

Stempel Waktu: September 7, 2022

LightGBM bawaan Amazon SageMaker kini menawarkan pelatihan terdistribusi menggunakan Dask

Kluster Sumber:

Pembelajaran Mesin AWS

Node Sumber: 1797416

Stempel Waktu: Jan 30, 2023

Secara otomatis mengidentifikasi bahasa dalam audio multibahasa menggunakan Amazon Transcribe

Diterbitkan Ulang Oleh Plato

Ikhtisar solusi

Prasyarat

Buat bucket S3 untuk menyimpan file input audio Anda

Unggah file audio Anda ke bucket S3

Buat tugas transkripsi

Tinjau hasil pekerjaan

Membersihkan

Kesimpulan

Tentang Penulis

Lebih dari Pembelajaran Mesin AWS

Bangun solusi pemeliharaan prediktif dengan Amazon Kinesis, AWS Glue, dan Amazon SageMaker

Aktifkan tunanetra untuk mendengar dokumen menggunakan Amazon Textract dan Amazon Polly

Skala pelatihan dan inferensi ribuan model ML dengan Amazon SageMaker | Layanan Web Amazon

AWS menawarkan kecerdasan buatan baru, pembelajaran mesin, dan panduan AI generatif untuk merencanakan strategi AI Anda | Layanan Web Amazon

PaddleOCR terintegrasi dengan Proyek Amazon SageMaker untuk MLOps untuk melakukan pengenalan karakter optik pada dokumen identitas

Transfer pembelajaran untuk model klasifikasi gambar TensorFlow di Amazon SageMaker

LightGBM bawaan Amazon SageMaker kini menawarkan pelatihan terdistribusi menggunakan Dask

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun