Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai.

Amazon Transcribe'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının çeviri yazı doğruluğunu iyileştirin

Birçok AWS müşteriler başarıyla kullanıyor Amazon Yazısı Müşterilerinin sesli konuşmalarını doğru, verimli ve otomatik olarak metne dönüştürmek ve onlardan eyleme dönüştürülebilir içgörüler çıkarmak için. Bu içgörüler, müşterileriniz için kaliteyi ve deneyimi doğrudan iyileştiren süreçleri ve ürünleri sürekli olarak geliştirmenize yardımcı olabilir.

Hindistan gibi birçok ülkede, İngilizce ana iletişim dili değildir. Hintli müşteri konuşmaları, aramalar boyunca rastgele konuşulan İngilizce kelimeler ve ifadeler ile Hintçe gibi bölgesel dilleri içerir. Kaynak medya dosyalarında, varsayılan Amazon Transcribe modelinin bilmediği özel isimler, alana özgü kısaltmalar, kelimeler veya ifadeler olabilir. Bu tür medya dosyalarının transkripsiyonları, bu kelimeler için yanlış yazımlara sahip olabilir.

Bu gönderide, Amazon Transcribe'a nasıl daha fazla bilgi sağlayabileceğinizi gösteriyoruz. özel sözlükler Amazon Transcribe'ın ses dosyalarınızın transkripsiyonunu işleme biçimini işletmeye özel terminolojiyle güncellemek için. Hintçe aramalar (Hintçe İngilizce kelimeler ve ifadeler içeren Hintçe Hintçe aramalar) için çeviri yazıların doğruluğunu iyileştirme adımlarını gösteriyoruz. Aynı işlemi, sesli aramaları herhangi bir desteklenen dil Amazon Transcribe tarafından. Özel sözlükler oluşturduktan sonra, sesli aramaları doğru ve geniş ölçekte yazıya dökebilirsiniz. arama sonrası analizleri Bu yazıda daha sonra tartışacağımız çözüm.

Çözüme genel bakış

Aşağıdaki Hintçe Hintçe sesli aramayı kullanıyoruz (SampleAudio.wav) süreci göstermek için rastgele İngilizce kelimelerle.

Ardından, aşağıdaki üst düzey adımlarda size yol gösteriyoruz:

  1. Varsayılan Amazon Transcribe Hintçe modelini kullanarak ses dosyasını kopyalayın.
  2. Model doğruluğunu ölçün.
  3. Modeli özel kelime dağarcığıyla eğitin.
  4. Eğitilen modelin doğruluğunu ölçün.

Önkoşullar

Başlamadan önce, giriş ses dosyasının aşağıdakileri karşıladığını doğrulamamız gerekiyor. veri girişi gereksinimlerinin yazıya dökülmesi.

A tek sesli olarak da adlandırılan kayıt mono, temsilcinin ve müşterinin tüm ses öğelerinin tek bir kanalda birleştirildiği bir ses sinyali içerir. A stereofonik olarak da adlandırılan kayıt müzik seti, temsilcinin ve müşterinin ses öğelerini iki ayrı kanalda yakalamak için iki ses sinyali içerir. Her temsilci-müşteri kayıt dosyası, biri temsilci için diğeri müşteri için olmak üzere iki ses kanalı içerir.

Telefon kayıtları gibi düşük kaliteli ses kayıtları tipik olarak 8,000 Hz örnek hızları kullanır. Amazon Transcribe, 16,000–48,000 Hz arasında örnekleme hızlarına sahip mono kayıtlı ve yüksek kaliteli ses dosyalarının işlenmesini destekler.

İyileştirilmiş transkripsiyon sonuçları için ve temsilci ile müşteri tarafından konuşulan kelimeleri net bir şekilde ayırt etmek için, 8,000 Hz örnekleme hızında kaydedilmiş ve stereo kanallı ayrılmış ses dosyalarını kullanmanızı öneririz.

Gibi bir araç kullanabilirsiniz ffmpeg giriş ses dosyalarınızı komut satırından doğrulamak için:

ffmpeg -i SampleAudio.wav

Döndürülen yanıtta Input bölümünde Stream ile başlayan satırı kontrol edin ve ses dosyalarının 8,000 Hz olduğunu ve stereo kanalın ayrıldığını onaylayın:

Input #0, wav, from 'SampleAudio.wav':
Duration: 00:01:06.36, bitrate: 256 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, stereo, s16, 256 kb/s

Çok sayıda ses dosyasını işlemek için bir işlem hattı oluşturduğunuzda, gereksinimleri karşılamayan dosyaları filtrelemek için bu adımı otomatikleştirebilirsiniz.

Ek bir ön koşul adımı olarak, kopyalanacak ses dosyalarını barındırmak için bir Amazon Simple Storage Service (Amazon S3) paketi oluşturun. Talimatlar için bkz. İlk S3 paketinizi oluşturun.O zamanlar ses dosyasını yükle S3 kovasına.

Ses dosyasını varsayılan modelle kopyalayın

Şimdi yapabiliriz bir Amazon Transkripsiyonunu başlat yüklediğimiz ses dosyasını kullanarak analitik işi çağırın. Bu örnekte, AWS Yönetim Konsolu ses dosyasını kopyalamak için. AWS Komut Satırı Arayüzü (AWS CLI) veya AWS SDK.

  1. Amazon Transcribe konsolunda, Arama analizi Gezinti bölmesinde.
  2. Klinik Arama analizi işleri.
  3. Klinik İş oluştur.
  4. İçin Name, isim girin.
  5. İçin Dil ayarlarıseçin belirli dil.
  6. İçin Dil, seçmek Hintçe, IN (merhaba).
  7. İçin Model türüseçin Genel model.
  8. İçin S3'te dosya konumunu girin, yüklenen ses dosyasını içeren S3 klasörüne gidin.Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai.
  9. içinde Çıktı verileri bölümünde, varsayılanları bırakın.
  10. içinde Erişim izinleri bölümünde, seçin Bir IAM rolü oluşturma.
  11. Yeni bir tane oluştur AWS Kimlik ve Erişim Yönetimi Amazon Transcribe hizmet izinlerini S3 klasöründen ses dosyalarını okumak ve AWS Anahtar Yönetim Hizmeti (AWS KMS) şifresini çözmek için anahtar.Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai.
  12. içinde İşi yapılandır bölümünde, dahil olmak üzere varsayılanları bırakın Özel kelime hazinesi seçimi kaldırıldı.
  13. Klinik İş oluştur ses dosyasını kopyalamak için.

Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai.

İşin durumu Tamamlandığında, işi seçerek (SampleAudio) dökümü inceleyebilirsiniz.

Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai.

Müşteri ve acente cümleleri açıkça ayrılmıştır, bu da müşterinin veya acentenin herhangi bir özel kelime veya kelime öbeği söyleyip söylemediğini belirlememize yardımcı olur.

Model doğruluğunu ölçün

Kelime hata oranı (WER), Otomatik Konuşma Tanıma (ASR) sistemlerinin doğruluğunu değerlendirmek için önerilen ve en yaygın kullanılan ölçümdür. Amaç, ASR sisteminin doğruluğunu artırmak için WER'yi mümkün olduğunca azaltmaktır.

WER'i hesaplamak için aşağıdaki adımları tamamlayın. Bu gönderi açık kaynak kullanıyor asr değerlendirme WER'yi hesaplamak için değerlendirme aracı, ancak diğer araçlar SCTK or JiWER da mevcuttur.

  1. kurmak the asr-evaluation wer betiğini komut satırınızda kullanılabilir hale getiren araç.
    Gönderinin ilerleyen bölümlerinde gösterilen wer komutlarını çalıştırmak için macOS veya Linux platformlarında bir komut satırı kullanın.
  2. Dökümü Amazon Transcribe iş ayrıntıları sayfasından adlı bir metin dosyasına kopyalayın. hypothesis.txt.
    Konsoldan deşifreyi kopyaladığınızda, kelimeler arasında yeni bir satır karakteri göreceksiniz. Agent :, Customer :, ve Hintçe komut dosyası.
    Bu gönderide yer kazanmak için yeni satır karakterleri kaldırıldı. Metni konsoldan olduğu gibi kullanmayı seçerseniz, oluşturduğunuz referans metin dosyasının yeni satır karakterlerine sahip olduğundan emin olun, çünkü wer aracı satır satır karşılaştırır.
  3. Transkriptin tamamını gözden geçirin ve düzeltilmesi gereken tüm kelimeleri veya cümleleri belirleyin:
    Hesap : iyi,
    Danışman : म मोर्निग इंडिया ट्रेवल एजेंसी işte bu। लावन्या बात क sos ही सह किस तरह से मैं आपकी सह सहा कर सकती हूँ।।
    Hesap : Evet bu हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आपारे क्या ुझारे में बता सकती हैं?
    Danışman :हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें स Bu çok önemli. मंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    Hesap : हाँ बढिया थैंक ैले सैटरडे और संडे को ट्राई करूँगा।
    Danışman : जीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    Hesap : सिरियसली एनी टिप्स Tavuk evet
    Danışman : Bu çok iyi. ड्रैब Bu çok önemli.
    Hesap : ग्रेट आइडिया थैंक्यू सो मच।Vurgulanan sözcükler, varsayılan Amazon Transcribe modelinin doğru şekilde oluşturmadığı sözcüklerdir.
  4. adlı başka bir metin dosyası oluşturun reference.txt, vurgulanan kelimeleri transkripsiyonda görmeyi beklediğiniz kelimelerle değiştirerek:
    Hesap : iyi,
    Danışman : म मोर्निग सौथ इंडिया ट्रेवल एजेंसी ै मैं । लावन्या बात क sos ही सह किस तरह से मैं आपकी सह सहा कर सकती हूँ।।
    Hesap : Evet दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आपारे क्या ुझारे में बता सकती हैं?
    Danışman : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें स Bu çok önemli. मंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    Hesap : हाँ बढिया थैंक ैले सैटरडे और संडे को ट्राई करूँगा।
    Danışman : जीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    Hesap : सिरियसली एनी टिप्स işte bu evet
    Danışman : Bu çok iyi. ड्रैव Bu çok önemli.
    Hesap : Bu çok önemli.
  5. Oluşturduğunuz referans ve hipotez metin dosyalarını karşılaştırmak için aşağıdaki komutu kullanın:
    wer -i reference.txt hypothesis.txt

    Aşağıdaki çıktıyı alırsınız:

    REF: customer : हेलो,
    
    HYP: customer : हेलो,
    
    SENTENCE 1
    
    Correct = 100.0% 3 ( 3)
    
    Errors = 0.0% 0 ( 3)
    
    REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    SENTENCE 2
    
    Correct = 84.0% 21 ( 25)
    
    Errors = 16.0% 4 ( 25)
    
    REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    SENTENCE 3
    
    Correct = 96.0% 24 ( 25)
    
    Errors = 8.0% 2 ( 25)
    
    REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    SENTENCE 4
    
    Correct = 83.3% 20 ( 24)
    
    Errors = 16.7% 4 ( 24)
    
    REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    SENTENCE 5
    
    Correct = 100.0% 14 ( 14)
    
    Errors = 0.0% 0 ( 14)
    
    REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    SENTENCE 6
    
    Correct = 100.0% 12 ( 12)
    
    Errors = 0.0% 0 ( 12)
    
    REF: customer : सिरियसली एनी टिप्स यू केन शेर
    
    HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर
    
    SENTENCE 7
    
    Correct = 75.0% 6 ( 8)
    
    Errors = 25.0% 2 ( 8)
    
    REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    
    HYP: agent : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    
    SENTENCE 8
    
    Correct = 92.9% 13 ( 14)
    
    Errors = 7.1% 1 ( 14)
    
    REF: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    SENTENCE 9
    
    Correct = 100.0% 7 ( 7)
    
    Errors = 0.0% 0 ( 7)
    
    Sentence count: 9
    
    WER: 9.848% ( 13 / 132)
    
    WRR: 90.909% ( 120 / 132)
    
    SER: 55.556% ( 5 / 9)

wer komutu, dosyalardan gelen metni karşılaştırır reference.txt ve hypothesis.txt. Her cümle için hataları ve ayrıca toplam hata sayısını bildirir (WER: %9.848 ( 13 / 132)) tüm transkript.

Önceki çıktıdan, dökümdeki 13 kelimeden 132'ü hata rapor edildi. Bu hatalar üç tipte olabilir:

  • ikame hataları – Bunlar, Amazon Transcribe bir kelimeyi diğerinin yerine yazdığında meydana gelir. Örneğin, bizim transkriptimizde “kelimeevet (Mahina)” yerine “bu (Minar)” cümlesinde 4.
  • Silme hataları – Bunlar, Amazon Transcribe, transkriptteki bir kelimeyi tamamen kaçırdığında meydana gelir. Transkriptimizde, " kelimesiौथ (Güney)” cümle 2'de atlanmıştır.
  • Ekleme hataları – Bunlar, Amazon Transcribe söylenmeyen bir kelime eklediğinde meydana gelir. Transkriptimizde herhangi bir ekleme hatası görmüyoruz.

Varsayılan model tarafından oluşturulan transkriptten gözlemler

Transkripte dayanarak aşağıdaki gözlemleri yapabiliriz:

  • Toplam WER %9.848'dir, yani kelimelerin %90.152'si doğru olarak yazılmıştır.
  • Varsayılan Hintçe modeli, İngilizce kelimelerin çoğunu doğru bir şekilde yazdı. Bunun nedeni, varsayılan modelin kutudan çıkan en yaygın İngilizce kelimeleri tanımak üzere eğitilmiş olmasıdır. Model ayrıca Hintçe konuşmalarda İngilizce kelimelerin rastgele göründüğü Hinglish dilini tanımak üzere eğitilmiştir. Örneğin:
    • गुड मोर्निग – Günaydın (cümle 2).
    • ट्रेवल एजेंसी – Seyahat acentesi (cümle 2).
    • ग्रेट आइडिया थैंक्यू सो मच – Harika fikir, çok teşekkür ederim (cümle 9).
  • Hint şehri Haydarabad'daki yerlerin adları olan 4. cümlede en fazla hata var:
    • Bu çok önemli. Bu çok önemli. işte bu Bu çok önemli. मंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

Bir sonraki adımda, Amazon Transcribe'da özel sözlük kullanarak önceki cümlede vurgulanan sözcüklerin nasıl düzeltileceğini gösteriyoruz:

  • evet evet (karakter mahina) olmalı bu (karakter baltalamak)
  • Yuvarlakकुंişte (Golcunda Four) गोल olmalıdırकोंişteevet (Golconda Fort)
  • bu (Salar Jung) olmalıdır bu (hizmetJung)

Özel bir kelime dağarcığıyla varsayılan modeli eğitin

için özel bir kelime hazinesi oluşturun, varsayılan Amazon Transcribe modelini eğitmek için kelimeler ve ifadelerle tablo biçiminde bir metin dosyası oluşturmanız gerekir. Tablonuz dört sütunun tümünü içermelidir (Phrase, SoundsLike, IPA, ve DisplayAs), fakat Phrase sütun, her satırda bir girdi içermesi gereken tek sütundur. Diğer sütunları boş bırakabilirsiniz. Bazı sütunlar boş bırakılsa bile her sütun bir sekme karakteriyle ayrılmalıdır. Örneğin, bırakırsanız IPA ve SoundsLike bir satır için boş sütunlar, Phrase ve DisplaysAs o satırdaki sütunlar üç sekme karakteriyle ayrılmalıdır (arasında Phrase ve IPA, IPA ve SoundsLike, ve SoundsLike ve DisplaysAs).

Modeli özel bir sözcük dağarcığıyla eğitmek için aşağıdaki adımları tamamlayın:

  1. Adlı bir dosya oluşturun HindiCustomVocabulary.txt aşağıdaki içerikle.
    İfade IPA SoundsLike DisplayAs गोलकुंडा-फोर गोलकोंडा फोर्ट सालार-जंग सा-लार-जंग सालार जंग चार-महीना चार मिनार

    Yalnızca diliniz için desteklenen karakterleri kullanabilirsiniz. kendi dilinize bakın karakter seti Ayrıntılar için.

    Sütunlar aşağıdaki bilgileri içerir:

    1. Phrase – Doğru bir şekilde yazıya dökmek istediğiniz kelimeleri veya cümleleri içerir. Varsayılan Amazon Transcribe modeli tarafından oluşturulan dökümde vurgulanan kelimeler veya ifadeler bu sütunda görünür. Bu kelimeler genellikle kısaltmalar, özel isimler veya varsayılan modelin bilmediği alana özgü kelimeler ve kelime öbekleridir. Bu, özel sözlük tablosundaki her satır için zorunlu bir alandır. Transkriptimizde 4. cümledeki “गोलकुंडा फोर (Golcunda Four)” ifadesini düzeltmek için bu sütunda “गोलकुंडा-फोर (Golcunda-Four)” kullanın. Girişiniz birden fazla kelime içeriyorsa, her kelimeyi kısa çizgi (-) ile ayırın; boşluk kullanmayın.
    2. IPA – Yazılı biçimde konuşma seslerini temsil eden kelimeleri veya cümleleri içerir. Sütun isteğe bağlıdır; satırlarını boş bırakabilirsiniz. Bu sütun, yalnızca Uluslararası Fonetik Alfabesindeki (IPA) karakterleri kullanan fonetik yazımlar için tasarlanmıştır. Hintçe dili için izin verilen IPA karakterleri için Hintçe karakter kümesine bakın. Örneğimizde IPA kullanmıyoruz. Bu sütunda bir girdiniz varsa, SoundsLike sütun boş olmalıdır.
    3. SoundsLike – Her parça için o parçanın kulağa nasıl geldiğine bağlı olarak bir telaffuz sağlamak için daha küçük parçalara (genellikle hecelere veya yaygın kelimelere göre) ayrılmış sözcükleri veya cümleleri içerir. Bu sütun isteğe bağlıdır; satırları boş bırakabilirsiniz. Bu sütuna yalnızca, girdiniz marka adı gibi standart olmayan bir sözcük içeriyorsa veya yanlış biçimde yazıya dökülen bir sözcüğü düzeltmek için içerik ekleyin. Transkriptimizde, 4. cümleden “सलार जंग (Salar Jung)” ifadesini düzeltmek için bu sütunda “सा-लार-जंग (Saa-lar-jung)” kullanın. Bu sütunda boşluk kullanmayın. Bu sütunda bir girdiniz varsa, IPA sütun boş olmalıdır.
    4. DisplaysAs – Yazımdaki kelimeler veya kelime öbekleri için transkripsiyon çıktısında görmek istediğiniz yazımları içeren kelimeleri veya kelime öbeklerini içerir. Phrase alan. Bu sütun isteğe bağlıdır; satırları boş bırakabilirsiniz. Bu alanı belirtmezseniz Amazon Transcribe, aşağıdakilerin içeriğini kullanır: Phrase çıktı dosyasındaki alan. Örneğin, transkriptimizde 4. cümledeki “गोलकुंडा फोर (Golcunda Four)” ifadesini düzeltmek için bu sütunda “गोलकोंडा फोर्ट (Golconda Kalesi)” ifadesini kullanın.
  2. Foto Yükle metin dosyası (HindiCustomVocabulary.txt) bir S3 kovasına dönüştürün. Şimdi Amazon Transcribe'da özel bir sözlük oluşturuyoruz.
  3. Amazon Transcribe konsolunda, Özel kelime hazinesi Gezinti bölmesinde.
  4. İçin Name, isim girin.
  5. İçin Dil, seçmek Hintçe, IN (merhaba).
  6. İçin Kelime giriş kaynağıseçin S3 konumu.
  7. İçin S3'te kelime bilgisi dosyası konumu, S3 yolunu girin HindiCustomVocabulary.txt dosyası.
  8. Klinik Kelime oluştur. Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai.
  9. transkript SampleAudio.wav aşağıdaki parametrelerle özel kelime dağarcığına sahip dosya:
    1. İçin İş adı , girmek SampleAudioCustomVocabulary.
    2. İçin Dil, seçmek Hintçe, IN (merhaba).
    3. İçin S3'te dosya konumunu girin, konumuna göz atın SampleAudio.wav.
    4. İçin IAM rolüseçin Mevcut bir IAM rolünü kullanma ve daha önce oluşturduğunuz rolü seçin.
    5. içinde İşi yapılandır bölümünde, seçin Özel kelime hazinesi ve özel kelime dağarcığı seçin HindiCustomVocabulary.
  10. Klinik İş oluştur.

Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai.

Özel kelime dağarcığı kullandıktan sonra model doğruluğunu ölçün

Dökümü Amazon Transcribe iş ayrıntıları sayfasından adlı bir metin dosyasına kopyalayın. hypothesis-custom-vocabulary.txt:

Hesap : iyi,

Danışman : म मोर्निग इंडिया ट्रेवल एजेंसी सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

Hesap : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल कारे में सोच रहा था। क्या आपारे क्या ुझारे में बता सकती हैं?

Danışman : Evet. Bu çok önemli. işte bu bu çok önemli. मंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

Hesap : हाँ बढिया थैंक ैले सैटरडे और संडे को ट्राई करूँगा।

Danışman : जीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

Hesap : सिरियसली एनी टिप्स चिकन शेर

Danışman : आप टेक्सी यूस कर लो ड्रैब औ duymak पर्किंग का प्राब्लम नहीं होग।

Hesap : Bu çok önemli.

Vurgulanan kelimelerin istendiği gibi kopyalandığını unutmayın.

Çalıştır wer yeni transkript ile tekrar komut verin:

wer -i reference.txt hypothesis-custom-vocabulary.txt

Aşağıdaki çıktıyı alırsınız:

REF: customer : हेलो,

HYP: customer : हेलो,

SENTENCE 1

Correct = 100.0% 3 ( 3)

Errors = 0.0% 0 ( 3)

REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

SENTENCE 2

Correct = 84.0% 21 ( 25)

Errors = 16.0% 4 ( 25)

REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

SENTENCE 3

Correct = 96.0% 24 ( 25)

Errors = 8.0% 2 ( 25)

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

SENTENCE 5

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

SENTENCE 6

Correct = 100.0% 12 ( 12)

Errors = 0.0% 0 ( 12)

REF: customer : सिरियसली एनी टिप्स यू केन शेर

HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर

SENTENCE 7

Correct = 75.0% 6 ( 8)

Errors = 25.0% 2 ( 8)

REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

HYP: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

SENTENCE 8

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: customer : ग्रेट आइडिया थैंक्यू सो मच।

HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।

SENTENCE 9

Correct = 100.0% 7 ( 7)

Errors = 0.0% 0 ( 7)

Sentence count: 9

WER: 6.061% ( 8 / 132)

WRR: 94.697% ( 125 / 132)

SER: 33.333% ( 3 / 9)

Özel kelime dağarcığı ile oluşturulan transkriptten gözlemler

Toplam WER %6.061'dir, yani kelimelerin %93.939'si doğru olarak yazılmıştır.

Özel kelime dağarcığı olan ve olmayan 4. cümle için wer çıktısını karşılaştıralım. Aşağıdakiler özel kelime bilgisi olmadan:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 83.3% 20 ( 24)

Errors = 16.7% 4 ( 24)

Aşağıdakiler özel kelime hazinesiyle birlikte:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

4. Cümlede hata yok. Yerlerin adları, özel kelime dağarcığı yardımıyla doğru bir şekilde yazıya geçirilir, böylece bu ses dosyası için genel WER'yi %9.848'den %6.061'e düşürür. Bu, transkripsiyon doğruluğunun yaklaşık %4 oranında arttığı anlamına gelir.

Özel kelime dağarcığı doğruluğu nasıl geliştirdi?

Aşağıdaki özel sözlüğü kullandık:

Phrase IPA SoundsLike DisplayAs

गोलकुंडा-फोर गोलकोंडा फोर्ट

सालार-जंग सा-लार-जंग सालार जंग

चार-महीना चार मिनार

Amazon Transcribe, ses dosyasında aşağıda belirtilen kelimelere benzeyen kelimeler olup olmadığını kontrol eder. Phrase kolon. Daha sonra model, girişleri kullanır. IPA, SoundsLike, ve DisplaysAs Bu belirli kelimelerin istenen yazımlarla yazılması için sütunlar.

Bu özel kelime hazinesiyle, Amazon Transcribe "गोलकुंडा-फोर (Golcunda-Four)" gibi bir kelime belirlediğinde, bu kelimeyi "गोलकोंडा फोर्ट (Golconda Kalesi)" olarak yazar.

Öneriler

Transkripsiyonun doğruluğu aynı zamanda konuşmacıların telaffuzu, üst üste binen konuşmacılar, konuşma hızı ve arka plan gürültüsü gibi parametrelere de bağlıdır. Bu nedenle, kapsamlı bir özel kelime dağarcığı oluşturabilmeniz için, en sık kullanılan alana özgü kelimeleri kapsayan çeşitli aramalarla (farklı müşteriler, temsilciler, kesintiler vb. ile) süreci takip etmenizi öneririz.

Bu gönderide, özel kelime dağarcığı kullanarak bir sesli aramayı metne dönüştürmenin doğruluğunu artırma sürecini öğrendik. Her gün binlerce çağrı merkezi çağrı kaydınızı işlemek için şunları kullanabilirsiniz: arama sonrası analizleri, ağır kaldırmanın çoğunu halleden tam otomatik, ölçeklenebilir ve uygun maliyetli uçtan uca bir çözüm. Yalnızca ses dosyalarınızı bir S3 klasörüne yüklersiniz ve birkaç dakika içinde çözüm, bir web kullanıcı arayüzündeki duyarlılık gibi çağrı analitiği sağlar. Çağrı sonrası analitiği, ortaya çıkan eğilimleri tespit etmek, temsilci koçluğu fırsatlarını belirlemek ve çağrıların genel duyarlılığını değerlendirmek için eyleme geçirilebilir içgörüler sağlar. Çağrı sonrası analitiği, açık kaynaklı çözüm kullanarak dağıtabileceğiniz AWS CloudFormation.

Özel sözlüklerin sözcüklerin söylendiği bağlamı kullanmadığını, yalnızca sağladığınız sözcüklere odaklandıklarını unutmayın. Doğruluğu daha da artırmak için kullanabilirsiniz özel dil modelleri. Telaffuzu yazımla ilişkilendiren özel sözlüklerin aksine, özel dil modelleri belirli bir kelimeyle ilişkili bağlamı öğrenir. Bu, bir kelimenin nasıl ve ne zaman kullanıldığını ve bir kelimenin diğer kelimelerle olan ilişkisini içerir. Özel bir dil modeli oluşturmak için, çeşitli çağrılar için öğrendiğimiz süreçten türetilen transkripsiyonları kullanabilir ve bunları web sitelerinizden veya alana özel kelime ve kelime öbekleri içeren kullanım kılavuzlarınızdan içerikle birleştirebilirsiniz.

Toplu çeviri yazılarıyla en yüksek çeviri yazı doğruluğunu elde etmek için özel dil modellerinizle birlikte özel sözlükler kullanabilirsiniz.

Sonuç

Bu gönderide, Amazon Transcribe'daki arama analizi ve özel sözlükleri kullanarak İngilizce kelimeler içeren Hintçe ses dosyalarını doğru şekilde işlemek için ayrıntılı adımlar sağladık. Sesli aramaları herhangi biriyle işlemek için aynı adımları kullanabilirsiniz. desteklenen dil Amazon Transcribe tarafından.

Deşifreleri istediğiniz doğrulukta elde ettikten sonra, acentelerinizi eğiterek acente-müşteri görüşmelerinizi geliştirebilirsiniz. Müşteri duygularınızı ve trendlerinizi de anlayabilirsiniz. Çağrı analitiğindeki konuşmacı günlükleştirme, ses yüksekliği algılama ve kelime filtreleme özelliklerinin yardımıyla, sesini yükseltenin veya belirli kelimeleri söyleyenin temsilci mi yoksa müşteri mi olduğunu belirleyebilirsiniz. Çağrıları alana özgü kelimelere göre kategorilere ayırabilir, eyleme dönüştürülebilir içgörüler yakalayabilir ve ürünlerinizi geliştirmek için analizler çalıştırabilirsiniz. Son olarak, transkriptlerinizi kullanarak İngilizce'ye veya seçtiğiniz diğer desteklenen dillere çevirebilirsiniz. Amazon Tercüme.


Yazarlar Hakkında

Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai. Sarat Gutikonda AWS World Wide Public Sector'da Kıdemli Çözüm Mimarıdır. Sarat, müşterilerin iş çevikliğinden ödün vermeden bulut kaynaklarını otomatikleştirmelerine, yönetmelerine ve yönetmelerine yardımcı olmaktan keyif alır. Boş zamanlarında oğluyla lego yapmayı ve masa tenisi oynamayı seviyor.

Amazon Transcribe PlatoBlockchain Data Intelligence'daki özel kelime dağarcığıyla müşteri-aracı çağrılarının transkripsiyon doğruluğunu iyileştirin. Dikey Arama. Ai.lavanya özü AWS World Wide Public Sector'da Yeni Delhi, Hindistan merkezli bir Çözüm Mimarıdır. Lavanya, yeni teknolojileri öğrenmekten ve müşterilere bulut benimseme yolculuklarında yardımcı olmaktan keyif alıyor. Boş zamanlarında seyahat etmeyi ve farklı yiyecekler denemeyi sever.

Zaman Damgası:

Den fazla AWS Makine Öğrenimi