Amazon Transkripsikan adalah layanan pengenalan ucapan otomatis (ASR) yang dikelola sepenuhnya yang memudahkan Anda menambahkan kemampuan ucapan-ke-teks ke aplikasi Anda. Hari ini, kami dengan gembira mengumumkan sistem berbasis model dasar ucapan multi-miliar parameter generasi berikutnya yang memperluas pengenalan ucapan otomatis hingga lebih dari Bahasa 100. Dalam postingan kali ini, kami membahas beberapa manfaat sistem ini, bagaimana perusahaan menggunakannya, dan cara memulainya. Kami juga memberikan contoh keluaran transkripsi di bawah ini.
Model dasar ucapan Transcribe dilatih menggunakan algoritme yang diawasi sendiri dan terbaik di kelasnya untuk mempelajari pola universal yang melekat pada ucapan manusia dalam berbagai bahasa dan aksen. Itu dilatih pada jutaan jam data audio tanpa label dari lebih dari 100 bahasa. Resep pelatihan dioptimalkan melalui pengambilan sampel data cerdas untuk menyeimbangkan data pelatihan antar bahasa, memastikan bahwa bahasa yang biasanya kurang terwakili juga mencapai tingkat akurasi yang tinggi.
Carbyne adalah perusahaan perangkat lunak yang mengembangkan solusi pusat kontak penting berbasis cloud untuk responden panggilan darurat. Misi Carbyne adalah membantu petugas tanggap darurat menyelamatkan nyawa, dan bahasa tidak dapat menghalangi tujuan mereka. Inilah cara mereka menggunakan Amazon Transcribe untuk menjalankan misi mereka:
โCarbyne Live Audio Translation yang didukung AI secara langsung ditujukan untuk membantu meningkatkan tanggap darurat bagi 68 juta orang Amerika yang berbicara dalam bahasa selain bahasa Inggris di negara mereka, selain 79 juta pengunjung asing yang mengunjungi negara tersebut setiap tahunnya. Dengan memanfaatkan model dasar multibahasa baru yang didukung ASR dari Amazon Transcribe, Carbyne akan lebih siap untuk mendemokratisasi layanan darurat yang menyelamatkan jiwa, karena Every. Orang. Penting.โ
โ Alex Dizengof, Salah Satu Pendiri dan CTO Carbyne.
Dengan memanfaatkan model dasar ucapan, Amazon Transcribe memberikan peningkatan akurasi yang signifikan antara 20% dan 50% di sebagian besar bahasa. Pada percakapan melalui telepon, yang merupakan domain yang menantang dan langka data, peningkatan akurasinya berkisar antara 30% dan 70%. Selain peningkatan akurasi yang signifikan, model ASR besar ini juga memberikan peningkatan dalam keterbacaan dengan tanda baca dan penggunaan huruf besar yang lebih akurat. Dengan munculnya AI generatif, ribuan perusahaan menggunakan Amazon Transcribe untuk membuka wawasan yang kaya dari konten audio mereka. Dengan akurasi yang ditingkatkan secara signifikan dan dukungan untuk lebih dari 100 bahasa, Amazon Transcribe akan memberikan dampak positif pada semua kasus penggunaan tersebut. Semua pelanggan lama dan baru yang menggunakan Amazon Transcribe dalam mode batch dapat mengakses pengenalan suara yang didukung model fondasi ucapan tanpa memerlukan perubahan apa pun pada titik akhir API atau parameter input.
Sistem ASR baru menghadirkan beberapa fitur utama dalam 100+ bahasa terkait kemudahan penggunaan, penyesuaian, keamanan pengguna, dan privasi. Ini mencakup fitur-fitur seperti tanda baca otomatis, kosakata khusus, identifikasi bahasa otomatis, diarisasi pembicara, skor kepercayaan tingkat kata, dan filter kosakata khusus. Dukungan sistem yang diperluas untuk berbagai aksen, lingkungan kebisingan, dan kondisi akustik memungkinkan Anda menghasilkan keluaran yang lebih akurat dan dengan demikian membantu Anda menanamkan teknologi suara secara efektif dalam aplikasi Anda.
Diaktifkan oleh akurasi tinggi Amazon Transcribe di berbagai aksen dan kondisi kebisingan, dukungannya untuk sejumlah besar bahasa, dan rangkaian fitur bernilai tambah yang luas, ribuan perusahaan akan diberdayakan untuk membuka wawasan yang kaya dari konten audio mereka, serta meningkatkan aksesibilitas dan kemudahan menemukan konten audio dan video mereka di berbagai domain. Misalnya, pusat kontak mentranskripsikan dan menganalisis panggilan pelanggan untuk mengidentifikasi wawasan dan kemudian meningkatkan pengalaman pelanggan dan produktivitas agen. Produser konten dan distributor media secara otomatis membuat subtitle menggunakan Amazon Transcribe untuk meningkatkan aksesibilitas konten.
Mulailah dengan Amazon Transcribe
Anda dapat menggunakan Antarmuka Baris Perintah AWS (AWS CLI), Konsol Manajemen AWS, dan beragam SDK AWS untuk transkripsi batch dan terus menggunakan yang sama StartTranscriptionJob
API untuk mendapatkan manfaat kinerja dari model ASR yang ditingkatkan tanpa perlu membuat perubahan kode atau parameter apa pun di pihak Anda. Untuk informasi selengkapnya tentang penggunaan AWS CLI dan konsol, lihat Mentranskripsikan dengan AWS CLI dan Mentranskripsikan dengan AWS Management Console, Masing-masing.
Langkah pertama adalah mengunggah file media Anda ke dalam Layanan Penyimpanan Sederhana Amazon (Amazon S3), layanan penyimpanan objek yang dibuat untuk menyimpan dan mengambil data dalam jumlah berapa pun dari mana saja. Amazon S3 menawarkan ketahanan, ketersediaan, kinerja, keamanan, dan skalabilitas hampir tak terbatas yang terdepan di industri dengan biaya sangat rendah. Anda dapat memilih untuk menyimpan transkrip Anda di bucket S3 Anda sendiri, atau meminta Amazon Transcribe menggunakan bucket default yang aman. Untuk mempelajari selengkapnya tentang penggunaan bucket S3, lihat Membuat, mengonfigurasi, dan bekerja dengan bucket Amazon S3.
Keluaran transkripsi
Amazon Transcribe menggunakan representasi JSON untuk outputnya. Ini memberikan hasil transkripsi dalam dua format berbeda: format teks dan format terperinci. Tidak ada perubahan sehubungan dengan titik akhir API atau parameter masukan.
Format teks menyediakan transkrip sebagai blok teks, sedangkan format terperinci menyediakan transkrip dalam bentuk item transkripsi yang diurutkan tepat waktu, bersama dengan metadata tambahan per item. Kedua format tersebut ada secara paralel di file keluaran.
Bergantung pada fitur yang Anda pilih saat membuat tugas transkripsi, Amazon Transcribe membuat tampilan hasil transkripsi tambahan dan diperkaya. Lihat contoh kode berikut:
Pandangannya adalah sebagai berikut:
- transkrip โ Diwakili oleh
transcripts
elemen, hanya berisi format teks transkrip. Dalam skenario multi-speaker dan multi-saluran, penggabungan semua transkrip disediakan sebagai satu blok. - Pembicara Utama โ Diwakili oleh
speaker_labels
elemen, berisi teks dan format transkrip terperinci yang dikelompokkan berdasarkan pembicara. Ini hanya tersedia bila fitur multi-speaker diaktifkan. - Saluran โ Diwakili oleh
channel_labels
elemen, berisi teks dan format transkrip yang diperinci, dikelompokkan berdasarkan saluran. Ini hanya tersedia bila fitur multisaluran diaktifkan. - item โ Diwakili oleh
items
elemen, ini hanya berisi format transkrip yang diperinci. Dalam skenario multi-speaker dan multi-saluran, item diperkaya dengan properti tambahan, yang menunjukkan speaker dan saluran. - Segmen โ Diwakili oleh
segments
elemen, berisi teks dan format transkrip yang diperinci, dikelompokkan berdasarkan transkripsi alternatif. Ini hanya tersedia bila fitur hasil alternatif diaktifkan.
Kesimpulan
Di AWS, kami terus berinovasi demi pelanggan kami. Dengan memperluas dukungan bahasa di Amazon Transcribe ke lebih dari 100 bahasa, kami memungkinkan pelanggan kami melayani pengguna dari latar belakang bahasa yang beragam. Hal ini tidak hanya meningkatkan aksesibilitas, namun juga membuka jalan baru bagi komunikasi dan pertukaran informasi dalam skala global. Untuk mempelajari lebih lanjut tentang fitur yang dibahas dalam postingan ini, lihat halaman fitur dan postingan apa yang baru.
Tentang penulis
Sumit Kumar adalah Manajer Produk Utama, Teknis di tim AWS AI Language Services. Dia memiliki 10 tahun pengalaman manajemen produk di berbagai domain dan sangat tertarik dengan AI/ML. Di luar pekerjaan, Sumit suka bepergian dan menikmati bermain kriket dan Tenis Rumput.
Vivek Singh adalah Manajer Senior, Manajemen Produk di tim AWS AI Language Services. Dia memimpin tim produk Amazon Transcribe. Sebelum bergabung dengan AWS, dia memegang peran manajemen produk di berbagai organisasi Amazon lainnya seperti pembayaran konsumen dan ritel. Vivek tinggal di Seattle, WA dan senang berlari dan mendaki.
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
- PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
- PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
- PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
- Sumber: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :memiliki
- :adalah
- :bukan
- $NAIK
- 10
- 100
- 14
- 24
- 7
- a
- Tentang Kami
- mengakses
- aksesibilitas
- ketepatan
- tepat
- di seluruh
- menambahkan
- tambahan
- Tambahan
- kedatangan
- Agen
- AI
- AI / ML
- ditujukan
- alex
- algoritma
- Semua
- sepanjang
- juga
- alternatif
- Amazon
- Amazon Transkripsikan
- Amazon Web Services
- Amerika
- jumlah
- an
- menganalisa
- dan
- Mengumumkan
- Mengumumkan
- Setiap tahun
- Apa pun
- di manapun
- api
- aplikasi
- ADALAH
- AS
- At
- audio
- secara otomatis
- secara otomatis
- tersedianya
- tersedia
- jalan
- AWS
- latar belakang
- Saldo
- BE
- karena
- nama
- di bawah
- Manfaat
- Lebih baik
- antara
- Memblokir
- kedua
- luasnya
- dibangun di
- tapi
- by
- panggilan
- Panggilan
- CAN
- kemampuan
- Kapitalisasi
- kasus
- pusat
- Pusat
- menantang
- perubahan
- Perubahan
- Saluran
- saluran
- memeriksa
- Pilih
- Co-founder
- kode
- Komunikasi
- Perusahaan
- perusahaan
- Lengkap
- Kondisi
- kepercayaan
- mengkonfigurasi
- konsul
- terus-menerus
- konsumen
- kontak
- contact center
- mengandung
- Konten
- terus
- Biaya
- negara
- menciptakan
- membuat
- jangkrik
- CTO
- adat
- pelanggan
- pengalaman pelanggan
- pelanggan
- kustomisasi
- data
- Default
- memberikan
- mendemokrasikan
- mengembangkan
- berbeda
- langsung
- membahas
- dibahas
- distributor
- beberapa
- domain
- domain
- daya tahan
- memudahkan
- kemudahan penggunaan
- efektif
- antara
- elemen
- menanamkan
- keadaan darurat
- diberdayakan
- aktif
- diaktifkan
- memungkinkan
- akhir
- Titik akhir
- Inggris
- ditingkatkan
- Meningkatkan
- diperkaya
- memastikan
- perusahaan
- lingkungan
- lengkap
- Bahkan
- Setiap
- contoh
- Pasar Valas
- ada
- ada
- diperluas
- mengembang
- pengalaman
- memperpanjang
- Fitur
- Fitur
- File
- File
- menyaring
- Pertama
- berikut
- berikut
- Untuk
- asing
- bentuk
- format
- Prinsip Dasar
- dari
- sepenuhnya
- menghasilkan
- generatif
- AI generatif
- mendapatkan
- Aksi
- skala global
- Anda
- senang
- Memiliki
- he
- Dimiliki
- membantu
- membantu
- membantu
- di sini
- hi
- High
- Beranda
- JAM
- Seterpercayaapakah Olymp Trade? Kesimpulan
- How To
- HTML
- http
- HTTPS
- manusia
- Identifikasi
- mengenali
- Dampak
- memperbaiki
- ditingkatkan
- perbaikan
- perbaikan
- in
- memasukkan
- Meningkatkan
- industri terkemuka
- informasi
- inheren
- berinovasi
- memasukkan
- wawasan
- contoh
- ke
- IT
- item
- NYA
- Pekerjaan
- bergabung
- jpg
- json
- kunci
- bahasa
- Bahasa
- besar
- Memimpin
- BELAJAR
- adalah ide yang bagus
- leveraging
- baris
- hidup
- hidup
- mencintai
- Rendah
- membuat
- MEMBUAT
- berhasil
- pengelolaan
- manajer
- Media
- Metadata
- juta
- jutaan
- Misi
- mode
- model
- lebih
- paling
- membutuhkan
- New
- generasi selanjutnya
- Kebisingan
- tidak ada
- jumlah
- obyek
- of
- Penawaran
- on
- hanya
- membuka
- dioptimalkan
- or
- organisasi
- Lainnya
- kami
- di luar
- keluaran
- output
- di luar
- lebih
- sendiri
- Paralel
- parameter
- parameter
- bergairah
- pola
- pembayaran
- untuk
- prestasi
- orang
- plato
- Kecerdasan Data Plato
- Data Plato
- bermain
- positif
- Pos
- didukung
- Utama
- Sebelumnya
- pribadi
- menghasilkan
- Produsen
- Produk
- manajemen Produk
- manajer produk
- produktifitas
- properties
- memberikan
- disediakan
- menyediakan
- mengejar
- mencapai
- pengakuan
- lihat
- terkait
- perwakilan
- diwakili
- menghormati
- masing-masing
- tanggapan
- mengakibatkan
- Hasil
- eceran
- Kaya
- peran
- berjalan
- Safety/keselamatan
- sama
- Save
- Skalabilitas
- Skala
- skenario
- Seattle
- aman
- keamanan
- melihat
- segmen
- memilih
- senior
- melayani
- layanan
- Layanan
- set
- beberapa
- penting
- signifikan
- Sederhana
- tunggal
- pintar
- Perangkat lunak
- Solusi
- beberapa
- berbicara
- Pembicara
- speaker
- pidato
- Speech Recognition
- speech-to-text
- mulai
- Status
- Langkah
- penyimpanan
- menyimpan
- mudah
- Kemudian
- besar
- sub judul
- seperti itu
- mendukung
- sistem
- tim
- Teknis
- Teknologi
- teks
- dari
- bahwa
- Grafik
- mereka
- dengan demikian
- Ini
- mereka
- ini
- ribuan
- Melalui
- tepat waktu
- untuk
- hari ini
- secara tradisional
- terlatih
- Pelatihan
- Salinan
- Terjemahan
- perjalanan
- dua
- Universal
- tak terbatas
- membuka kunci
- menggunakan
- Pengguna
- Pengguna
- kegunaan
- menggunakan
- variasi
- berbagai
- sangat
- Video
- 'view'
- sebenarnya
- pengunjung
- Suara
- Cara..
- we
- jaringan
- layanan web
- selamat datang
- BAIK
- ketika
- sedangkan
- yang
- SIAPA
- akan
- dengan
- tanpa
- Kerja
- kerja
- tahun
- Kamu
- Anda
- zephyrnet.dll