Amazon Yazısı uygulamalarınıza konuşmayı metne dönüştürme özelliklerini eklemenizi kolaylaştıran, tam olarak yönetilen bir otomatik konuşma tanıma (ASR) hizmetidir. Bugün, otomatik konuşma tanımayı genişleyen yeni nesil milyarlarca parametreli konuşma temeli modeli destekli sistemi duyurmaktan mutluluk duyuyoruz. 100 dil. Bu yazıda bu sistemin bazı faydalarını, şirketlerin onu nasıl kullandığını ve nasıl başlayacağını tartışacağız. Ayrıca aşağıda transkripsiyon çıktısının bir örneğini de sunuyoruz.
Transcribe'ın konuşma temeli modeli, diller ve aksanlar arasında insan konuşmasının doğasında var olan evrensel kalıpları öğrenmek için sınıfının en iyisi, kendi kendini denetleyen algoritmalar kullanılarak eğitilmiştir. 100'den fazla dilden milyonlarca saatlik etiketlenmemiş ses verileriyle eğitilmiştir. Eğitim tarifleri, diller arasındaki eğitim verilerini dengelemek için akıllı veri örnekleme yoluyla optimize edilir ve böylece geleneksel olarak az temsil edilen dillerin de yüksek doğruluk seviyelerine ulaşması sağlanır.
Carbyne, acil çağrı yanıtlayıcıları için bulut tabanlı, görev açısından kritik iletişim merkezi çözümleri geliştiren bir yazılım şirketidir. Carbyne'nin misyonu, acil müdahale ekiplerinin hayat kurtarmasına yardımcı olmaktır ve dil, onların hedeflerine engel olamaz. Görevlerini sürdürmek için Amazon Transcribe'ı şu şekilde kullanıyorlar:
"Yapay zeka destekli Carbyne Canlı Sesli Çeviri, ülkeye her yıl gelen 68 milyona kadar yabancı ziyaretçinin yanı sıra, evinde İngilizce dışında bir dil konuşan 79 milyon Amerikalı için acil durum müdahalesinin iyileştirilmesine doğrudan yardımcı olmayı amaçlıyor. Amazon Transcribe'ın ASR destekli yeni çok dilli temel modelinden yararlanan Carbyne, hayat kurtaran acil durum hizmetlerini demokratikleştirmek için daha da donanımlı olacak çünkü Every. Kişi. Önemlidir.”
– Alex Dizengof, Carbyne Kurucu Ortağı ve CTO'su.
Amazon Transcribe, konuşma temeli modelinden yararlanarak çoğu dilde %20 ila %50 arasında önemli bir doğruluk artışı sağlar. Zorlu ve veri kıtlığı olan bir alan olan telefon konuşmasında doğruluk artışı %30 ila %70 arasındadır. Bu büyük ASR modeli, doğrulukta önemli bir iyileşmenin yanı sıra, daha doğru noktalama işaretleri ve büyük harflerle okunabilirlikte de iyileşmeler sağlar. Üretken yapay zekanın ortaya çıkışıyla birlikte binlerce işletme, ses içeriklerinden zengin bilgiler elde etmek için Amazon Transcribe'ı kullanıyor. Önemli ölçüde iyileştirilmiş doğruluk ve 100'den fazla dil desteğiyle Amazon Transcribe, bu tür tüm kullanım örneklerini olumlu yönde etkileyecektir. Amazon Transcribe'ı toplu modda kullanan tüm mevcut ve yeni müşteriler, API uç noktasında veya giriş parametrelerinde herhangi bir değişikliğe gerek kalmadan konuşma temeli modeli destekli konuşma tanımaya erişebilir.
Yeni ASR sistemi, kullanım kolaylığı, özelleştirme, kullanıcı güvenliği ve gizlilikle ilgili 100'den fazla dilin tamamında çeşitli temel özellikler sunar. Bunlar, otomatik noktalama işaretleri, özel kelime dağarcığı, otomatik dil tanımlama, konuşmacı günlüğü tutma, kelime düzeyinde güven puanları ve özel kelime filtresi gibi özellikleri içerir. Sistemin farklı aksanlara, gürültü ortamlarına ve akustik koşullara yönelik genişletilmiş desteği, daha doğru çıktılar üretmenizi sağlar ve böylece ses teknolojilerini uygulamalarınıza etkili bir şekilde yerleştirmenize yardımcı olur.
Amazon Transcribe'ın farklı aksan ve gürültü koşullarındaki yüksek doğruluğu, çok sayıda dili desteklemesi ve geniş katma değerli özellik setleri sayesinde binlerce işletme aşağıdakileri yapma yetkisine sahip olacak: Ses içeriklerinden zengin içgörülerin kilidini açmanın yanı sıra çeşitli alanlarda ses ve video içeriklerinin erişilebilirliğini ve keşfedilebilirliğini artırın. Örneğin, iletişim merkezleri içgörüleri belirlemek ve ardından müşteri deneyimini ve temsilci üretkenliğini geliştirmek için müşteri çağrılarını yazıya döküp analiz eder. İçerik üreticileri ve medya dağıtıcıları, içerik erişilebilirliğini iyileştirmek için Amazon Transcribe'ı kullanarak otomatik olarak altyazı oluşturur.
Amazon Transcribe'ı kullanmaya başlayın
Sen kullanabilirsiniz AWS Komut Satırı Arayüzü (AWS CLI), AWS Yönetim Konsoluve çeşitli AWS SDK'ları toplu transkripsiyonlar için ve aynısını kullanmaya devam edin StartTranscriptionJob
Sizin tarafınızda herhangi bir kod veya parametre değişikliği yapmanıza gerek kalmadan geliştirilmiş ASR modelinden performans avantajları elde etmenizi sağlayan API. AWS CLI'yi ve konsolu kullanma hakkında daha fazla bilgi için bkz. AWS CLI ile yazıya dönüştürme ve AWS Management Console ile Metne Dönüştürme, Sırasıyla.
İlk adım, medya dosyalarınızı bir Amazon Basit Depolama Hizmeti (Amazon S3) kovası, herhangi bir miktardaki veriyi herhangi bir yerden depolamak ve almak için oluşturulmuş bir nesne depolama hizmetidir. Amazon S3, çok düşük maliyetle sektör lideri dayanıklılık, kullanılabilirlik, performans, güvenlik ve neredeyse sınırsız ölçeklenebilirlik sunar. Transkriptinizi kendi S3 klasörünüze kaydetmeyi veya Amazon Transcribe'ın güvenli bir varsayılan klasör kullanmasını seçebilirsiniz. S3 klasörlerini kullanma hakkında daha fazla bilgi edinmek için bkz. Amazon S3 klasörleri oluşturma, yapılandırma ve bunlarla çalışma.
Transkripsiyon çıktısı
Amazon Transcribe, çıktısı için JSON temsilini kullanır. Transkripsiyon sonucunu iki farklı formatta sağlar: metin formatı ve ayrıntılı format. API uç noktası veya giriş parametreleriyle ilgili olarak hiçbir şey değişmez.
Metin formatı, transkripti bir metin bloğu olarak sağlarken, maddeleştirilmiş format, transkripti, öğe başına ek meta verilerle birlikte zamanında sıralanmış transkripsiyonlu öğeler biçiminde sağlar. Çıkış dosyasında her iki format da paralel olarak bulunur.
Amazon Transcribe, transkripsiyon işini oluştururken seçtiğiniz özelliklere bağlı olarak transkripsiyon sonucunun ek ve zenginleştirilmiş görünümlerini oluşturur. Aşağıdaki örnek koda bakın:
Görüşler şu şekilde:
- Transkript – Tarafından temsil edilir
transcripts
öğesi, yalnızca transkriptin metin biçimini içerir. Çok konuşmacılı, çok kanallı senaryolarda tüm transkriptlerin birleştirilmesi tek blok halinde sağlanır. - Hoparlörler – Tarafından temsil edilir
speaker_labels
öğesi, konuşmacıya göre gruplandırılmış transkriptin metnini ve ayrıntılı formatlarını içerir. Yalnızca çoklu hoparlör özelliği etkinleştirildiğinde kullanılabilir. - Kanallar – Tarafından temsil edilir
channel_labels
öğesi, kanala göre gruplandırılmış metin ve dökümün ayrıntılı formatlarını içerir. Yalnızca çoklu kanal özelliği etkinleştirildiğinde kullanılabilir. - ürün – Tarafından temsil edilir
items
öğesi, yalnızca transkriptin ayrıntılı biçimini içerir. Çok hoparlörlü, çok kanallı senaryolarda öğeler, hoparlörü ve kanalı belirten ek özelliklerle zenginleştirilmiştir. - Segmentler – Tarafından temsil edilir
segments
öğesi, alternatif transkripsiyona göre gruplandırılmış metni ve transkriptin ayrıntılı formatlarını içerir. Yalnızca alternatif sonuçlar özelliği etkinleştirildiğinde kullanılabilir.
Sonuç
AWS'de müşterilerimiz adına sürekli olarak yenilikler yapıyoruz. Amazon Transcribe'daki dil desteğini 100'den fazla dile genişleterek müşterilerimizin farklı dil geçmişine sahip kullanıcılara hizmet vermesini sağlıyoruz. Bu sadece erişilebilirliği arttırmakla kalmıyor, aynı zamanda küresel ölçekte iletişim ve bilgi alışverişi için yeni yollar açıyor. Bu yayında tartışılan özellikler hakkında daha fazla bilgi edinmek için şuraya göz atın: özellikler sayfası ve yeni gönderi ne.
yazarlar hakkında
Sumit Kumar AWS AI Dil Hizmetleri ekibinde Teknik Baş Ürün Yöneticisidir. Çeşitli alanlarda 10 yıllık ürün yönetimi deneyimine sahiptir ve AI/ML konusunda tutkuludur. Sumit, iş dışında seyahat etmeyi seviyor ve kriket ve Çim Tenisi oynamaktan hoşlanıyor.
Vivek Singh AWS AI Dil Hizmetleri ekibinde Ürün Yönetimi Kıdemli Yöneticisidir. Amazon Transcribe ürün ekibine liderlik ediyor. AWS'ye katılmadan önce tüketici ödemeleri ve perakende gibi diğer çeşitli Amazon kuruluşlarında ürün yönetimi görevlerinde bulundu. Vivek Seattle, WA'da yaşıyor ve koşmayı ve yürüyüş yapmayı seviyor.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :vardır
- :dır-dir
- :olumsuzluk
- $UP
- 10
- 100
- 14
- 24
- 7
- a
- Hakkımızda
- erişim
- ulaşabilme
- doğruluk
- doğru
- karşısında
- eklemek
- ilave
- Ek
- Advent
- Danışman
- AI
- AI / ML
- Hedeflenen
- alex
- algoritmalar
- Türkiye
- boyunca
- Ayrıca
- alternatif
- Amazon
- Amazon Yazısı
- Amazon Web Servisleri
- Amerikalılar
- miktar
- an
- çözümlemek
- ve
- duyurmak
- duyurdu
- Yıllık
- herhangi
- hiçbir yerde
- api
- uygulamaları
- ARE
- AS
- At
- ses
- Otomatik
- otomatik olarak
- kullanılabilirliği
- mevcut
- caddeler
- AWS
- arka
- Bakiye
- BE
- Çünkü
- adına
- altında
- faydaları
- Daha iyi
- arasında
- Engellemek
- her ikisi de
- genişlik
- yapılı
- fakat
- by
- çağrı
- aramalar
- CAN
- yetenekleri
- sermayelendirme
- durumlarda
- Merkez
- Merkezleri
- zor
- değişiklik
- değişiklikler
- Telegram Kanal
- kanallar
- Kontrol
- Klinik
- Kurucu
- kod
- Yakın İletişim
- Şirketler
- şirket
- Tamamlandı
- koşullar
- güven
- yapılandırarak
- konsolos
- sürekli
- tüketici
- UAF ile
- iletişim merkezi
- içeren
- içerik
- devam etmek
- Ücret
- ülke
- oluşturur
- Oluşturma
- kriket
- CTO
- görenek
- müşteri
- müşteri deneyimi
- Müşteriler
- özelleştirme
- veri
- Varsayılan
- sağlıyor
- demokratikleştirmek
- geliştirir
- farklı
- direkt olarak
- tartışmak
- tartışılan
- distribütörler
- çeşitli
- domain
- etki
- dayanıklılık
- kolaylaştırmak
- kullanım kolaylığı
- etkili bir şekilde
- ya
- eleman
- gömmek
- acil durum
- yetkisi
- etkinleştirmek
- etkin
- sağlar
- son
- Son nokta
- İngilizce
- gelişmiş
- Geliştirir
- zenginleştirilmiş
- sağlanması
- işletmelerin
- ortamları
- donanımlı
- Hatta
- Her
- örnek
- takas
- mevcut
- mevcut
- genişletilmiş
- genişletir
- deneyim
- uzatma
- Özellikler(Hazırlık aşamasında)
- Özellikler
- fileto
- dosyalar
- filtre
- Ad
- takip etme
- şu
- İçin
- yabancı
- Airdrop Formu
- biçim
- vakıf
- itibaren
- tamamen
- oluşturmak
- üretken
- üretken yapay zeka
- almak
- Küresel
- küresel ölçek
- Goller
- mutlu
- Var
- he
- Held
- yardım et
- yardım
- yardımcı olur
- okuyun
- hi
- Yüksek
- Ana Sayfa
- SAAT
- Ne kadar
- Nasıl Yapılır
- HTML
- http
- HTTPS
- insan
- Kimlik
- belirlemek
- darbe
- iyileştirmek
- gelişmiş
- iyileşme
- iyileştirmeler
- in
- dahil
- Artırmak
- endüstri lideri
- bilgi
- doğal
- yenilik
- giriş
- anlayışlar
- örnek
- içine
- IT
- ürün
- ONUN
- İş
- birleştirme
- jpg
- json
- anahtar
- dil
- Diller
- büyük
- İlanlar
- ÖĞRENİN
- seviyeleri
- kaldıraç
- çizgi
- yaşamak
- Yaşıyor
- seviyor
- Düşük
- yapmak
- YAPAR
- yönetilen
- yönetim
- müdür
- medya
- Metadata
- milyon
- milyonlarca
- Misyonumuz
- Moda
- model
- Daha
- çoğu
- gerek
- yeni
- gelecek nesil
- Gürültü
- hiçbir şey değil
- numara
- nesne
- of
- Teklifler
- on
- bir tek
- açılır
- optimize
- or
- organizasyonlar
- Diğer
- bizim
- dışarı
- çıktı
- çıkışlar
- dışında
- tekrar
- kendi
- Paralel
- parametre
- parametreler
- tutkulu
- desen
- ödemeler
- başına
- performans
- kişi
- Platon
- Plato Veri Zekası
- PlatoVeri
- oynama
- pozitif olarak
- Çivi
- powered
- Anapara
- Önceki
- gizlilik
- üretmek
- Üreticileri
- PLATFORM
- ürün Yönetimi
- ürün müdürü
- verimlilik
- özellikleri
- sağlamak
- sağlanan
- sağlar
- takip etmek
- ulaşmak
- tanıma
- başvurmak
- ilgili
- temsil
- temsil
- saygı
- sırasıyla
- yanıt
- sonuç
- Sonuçlar
- perakende
- Zengin
- rolleri
- koşu
- Güvenlik
- aynı
- İndirim
- ölçeklenebilirlik
- ölçek
- senaryolar
- Seattle
- güvenli
- güvenlik
- görmek
- segmentler
- seçmek
- kıdemli
- hizmet vermek
- hizmet
- Hizmetler
- Setleri
- birkaç
- önemli
- önemli ölçüde
- Basit
- tek
- akıllı
- Yazılım
- Çözümler
- biraz
- konuşmak
- konuşmacı
- hoparlörler
- konuşma
- Konuşma Tanıma
- konuşmadan yazıya
- başladı
- Durum
- adım
- hafızası
- mağaza
- basit
- Daha sonra
- önemli
- Altyazılar
- böyle
- destek
- sistem
- takım
- Teknik
- Teknolojileri
- metin
- göre
- o
- The
- ve bazı Asya
- böylece
- Bunlar
- onlar
- Re-Tweet
- Binlerce
- İçinden
- vakitli
- için
- bugün
- geleneksel
- eğitilmiş
- Eğitim
- Transkript
- Çeviri
- seyahat
- iki
- Evrensel
- sınırsız
- kilidini açmak
- kullanım
- kullanıcı
- kullanıcılar
- kullanım
- kullanma
- çeşitlilik
- çeşitli
- çok
- Video
- Gösterim
- fiilen
- ziyaretçi
- ses
- Yol..
- we
- ağ
- web hizmetleri
- karşılama
- İYİ
- ne zaman
- oysa
- hangi
- DSÖ
- irade
- ile
- olmadan
- İş
- çalışma
- yıl
- Sen
- zefirnet