Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai.

Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe kohandatud sõnavara abil

Paljud AWS-id kliendid on edukalt kasutanud Amazoni transkribeerimine täpselt, tõhusalt ja automaatselt teisendada oma klientide helivestlused tekstiks ning hankida neist praktilisi teadmisi. Need ülevaated võivad aidata teil pidevalt täiustada protsesse ja tooteid, mis parandavad otseselt teie klientide kvaliteeti ja kogemusi.

Paljudes riikides, näiteks Indias, ei ole inglise keel peamine suhtluskeel. India kliendivestlused sisaldavad piirkondlikke keeli, nagu hindi, ning kõne ajal räägitakse juhuslikult ingliskeelseid sõnu ja fraase. Lähtemeediumifailides võivad olla pärisnimed, domeenispetsiifilised akronüümid, sõnad või fraasid, millest Amazon Transcribe'i vaikemudel ei ole teadlik. Selliste meediumifailide transkriptsioonides võib olla nende sõnade ebatäpne kirjapilt.

Selles postituses näitame, kuidas saate Amazon Transcribe'ile rohkem teavet anda kohandatud sõnavarad värskendada viisi, kuidas Amazon Transcribe teie helifailide transkriptsiooni käsitleb ettevõttepõhise terminoloogiaga. Näitame juhiseid hinglishi kõnede (india hindi kõned, mis sisaldavad india ingliskeelseid sõnu ja fraase) transkriptsioonide täpsuse parandamiseks. Saate kasutada sama protsessi mis tahes helikõnede transkribeerimiseks toetatud keel autor Amazon Transcribe. Pärast kohandatud sõnavarade loomist saate helikõnesid täpselt ja ulatuslikult transkribeerida, kasutades meie kõnede postitamise analüüs lahendus, millest me hiljem selles postituses lähemalt arutame.

Lahenduse ülevaade

Kasutame järgmist India hindi helikõnet (SampleAudio.wav) juhuslike ingliskeelsete sõnadega protsessi demonstreerimiseks.

Seejärel juhendame teid läbi järgmiste kõrgetasemeliste sammude:

  1. Transkribeerige helifail Amazon Transcribe Hindi vaikemudeli abil.
  2. Mõõtke mudeli täpsust.
  3. Treenige mudelit kohandatud sõnavaraga.
  4. Mõõtke koolitatud mudeli täpsust.

Eeldused

Enne alustamist peame kinnitama, et sisendhelifail vastab transkribeerimise andmete sisestamise nõuded.

A monofooniline salvestus, mida nimetatakse ka mono, sisaldab ühte helisignaali, milles kõik agendi ja kliendi helielemendid on ühendatud üheks kanaliks. A stereofooniline salvestus, mida nimetatakse ka stereosüsteem, sisaldab kahte helisignaali agendi ja kliendi helielementide jäädvustamiseks kahes eraldi kanalis. Iga agent-kliendi salvestusfail sisaldab kahte helikanalit, ühte agendile ja teist kliendile.

Madala täpsusega helisalvestised, näiteks telefonisalvestused, kasutavad tavaliselt 8,000 Hz diskreetimissagedust. Amazon Transcribe toetab nii monosalvestusega kui ka ülitäpse helifailide töötlemist diskreetimissagedusega 16,000 48,000–XNUMX XNUMX Hz.

Paremate transkriptsioonitulemuste saavutamiseks ning agendi ja kliendi öeldud sõnade selgeks eristamiseks soovitame kasutada helifaile, mis on salvestatud 8,000 Hz diskreetimissagedusega ja on stereokanalid eraldatud.

Võite kasutada sellist tööriista ffmpeg sisendhelifailide kinnitamiseks käsurealt:

ffmpeg -i SampleAudio.wav

Kontrollige tagastatud vastuses sisendi jaotises rida, mis algab tekstiga Stream, ja veenduge, et helifailid on 8,000 Hz ja stereokanalid on eraldatud:

Input #0, wav, from 'SampleAudio.wav':
Duration: 00:01:06.36, bitrate: 256 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, stereo, s16, 256 kb/s

Kui loote torujuhtme suure hulga helifailide töötlemiseks, saate selle sammu automatiseerida, et filtreerida faile, mis ei vasta nõuetele.

Täiendava eeltingimusena looge transkribeeritavate helifailide majutamiseks Amazon Simple Storage Service (Amazon S3) ämber. Juhiste saamiseks vaadake Looge oma esimene S3 ämber.Siis laadige helifail üles S3 ämbrisse.

Transkribeerige helifail vaikemudeliga

Nüüd saame käivitage Amazon Transscribe helistage analüüsitööle, kasutades meie üleslaaditud helifaili.Selles näites kasutame AWS-i juhtimiskonsool helifaili transkribeerimiseks.Saate kasutada ka AWS-i käsurea liides (AWS CLI) või AWS SDK.

  1. Amazon Transcribe'i konsoolil valige Kõnede analüüsimine navigeerimispaanil.
  2. Vali Helistage analüütikutele.
  3. Vali Loo töökoht.
  4. eest Nimi, sisestage nimi.
  5. eest Keele seadedvalige Konkreetne keel.
  6. eest Keel, vali hindi, IN (hi-IN).
  7. eest Mudelitüüpvalige Üldmudel.
  8. eest Sisestage faili asukoht S3-s, sirvige üleslaaditud helifaili sisaldavat S3 ämbrit.Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai.
  9. aasta Väljundandmed jätke vaikeseaded.
  10. aasta Juurdepääsuõigused jaotises valige Looge IAM-i roll.
  11. Loo uus AWS-i identiteedi- ja juurdepääsuhaldus (IAM) roll nimega HindiTranscription, mis annab teenusele Amazon Transcribe õigused lugeda helifaile S3 ämbrist ja kasutada AWS-i võtmehaldusteenus (AWS KMS) võti dekrüpteerimiseks.Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai.
  12. aasta Konfigureerige töö jaotises jätke vaikeseaded, sealhulgas Kohandatud sõnavara valitud.
  13. Vali Loo töökoht helifaili transkribeerimiseks.

Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai.

Kui töö olek on Lõpetatud, saate transkriptsiooni üle vaadata, valides töö (SampleAudio).

Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai.

Kliendi ja agendi laused on selgelt eraldatud, mis aitab meil tuvastada, kas klient või agent rääkis konkreetseid sõnu või fraase.

Mõõtke mudeli täpsust

Sõna veamäär (WER) on soovitatav ja kõige sagedamini kasutatav mõõdik automaatse kõnetuvastuse (ASR) süsteemide täpsuse hindamiseks. Eesmärk on vähendada WER-i nii palju kui võimalik, et parandada ASR-süsteemi täpsust.

WER-i arvutamiseks toimige järgmiselt. See postitus kasutab avatud lähtekoodiga asr-hinnang hindamistööriist WER-i arvutamiseks, kuid muud tööriistad, nagu SCTK or JiWER on saadaval ka.

  1. paigaldama the,en asr-evaluation tööriist, mis teeb wer-skripti teie käsureal kättesaadavaks.
    Kasutage macOS-i või Linuxi platvormidel käsurida, et käivitada postituses hiljem näidatud wer-käsud.
  2. Kopeerige ärakiri Amazon Transcribe'i töö üksikasjade lehelt tekstifaili nimega hypothesis.txt.
    Kui kopeerite transkriptsiooni konsoolist, märkate sõnade vahel uut reamärki Agent :, Customer :, ja hindi kiri.
    Uued reamärgid on sellest postitusest ruumi säästmiseks eemaldatud. Kui otsustate kasutada konsooli teksti sellisena, nagu see on, veenduge, et loodud viitetekstifailis oleks ka uued reamärgid, sest tööriist wer võrdleb ridade kaupa.
  3. Vaadake kogu ärakiri üle ja tuvastage kõik parandamist vajavad sõnad või fraasid:
    Klient : हेलो,
    Agent : गुड मोर्निग इंडिया ट्रेवल एजेंसी सेम है। ल ब क क हूँ हूँ त से मैं आपकी सह क क हूँ।।
    Klient : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहाा क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंे बार.
    Agent :हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम
    Klient : ह बढिय थैंक मैं अगले अगले सैट सैट औ संडे को ट ट क।।
    Agent : एक सजेशन वीकेंड में ट्रैफिक ज्यातइेेरत
    Klient : सिरियसली एनी टिप्स Kana शेर
    Agent : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    Klient : ग्रेट आइडिया थैंक्यू सो मच।Esiletõstetud sõnad on need, mida Amazon Transscribe'i vaikemudel ei renderdanud õigesti.
  4. Looge teine ​​tekstifail nimega reference.txt, asendades esiletõstetud sõnad soovitud sõnadega, mida ootate transkriptsioonis näha:
    Klient : हेलो,
    Agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजें से मैं । ल ब क क हूँ हूँ त से मैं आपकी सह क क हूँ।।
    Klient : मैं बहुत दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहाा क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंे बार.
    Agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम
    Klient : ह बढिय थैंक मैं अगले अगले सैट सैट औ संडे को ट ट क।।
    Agent : एक सजेशन वीकेंड में ट्रैफिक ज्यातइेेरत
    Klient : सिरियसली एनी टिप्स यू केन शेर
    Agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    Klient : ग्रेट आइडिया थैंक्यू सो मच।
  5. Loodud viite- ja hüpoteesi tekstifailide võrdlemiseks kasutage järgmist käsku:
    wer -i reference.txt hypothesis.txt

    Saate järgmise väljundi:

    REF: customer : हेलो,
    
    HYP: customer : हेलो,
    
    SENTENCE 1
    
    Correct = 100.0% 3 ( 3)
    
    Errors = 0.0% 0 ( 3)
    
    REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    SENTENCE 2
    
    Correct = 84.0% 21 ( 25)
    
    Errors = 16.0% 4 ( 25)
    
    REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    SENTENCE 3
    
    Correct = 96.0% 24 ( 25)
    
    Errors = 8.0% 2 ( 25)
    
    REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    SENTENCE 4
    
    Correct = 83.3% 20 ( 24)
    
    Errors = 16.7% 4 ( 24)
    
    REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    SENTENCE 5
    
    Correct = 100.0% 14 ( 14)
    
    Errors = 0.0% 0 ( 14)
    
    REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    SENTENCE 6
    
    Correct = 100.0% 12 ( 12)
    
    Errors = 0.0% 0 ( 12)
    
    REF: customer : सिरियसली एनी टिप्स यू केन शेर
    
    HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर
    
    SENTENCE 7
    
    Correct = 75.0% 6 ( 8)
    
    Errors = 25.0% 2 ( 8)
    
    REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    
    HYP: agent : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    
    SENTENCE 8
    
    Correct = 92.9% 13 ( 14)
    
    Errors = 7.1% 1 ( 14)
    
    REF: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    SENTENCE 9
    
    Correct = 100.0% 7 ( 7)
    
    Errors = 0.0% 0 ( 7)
    
    Sentence count: 9
    
    WER: 9.848% ( 13 / 132)
    
    WRR: 90.909% ( 120 / 132)
    
    SER: 55.556% ( 5 / 9)

Käsk wer võrdleb failide teksti reference.txt ja hypothesis.txt. See teatab iga lause vead ja ka vigade koguarvu (WER: 9.848% ( 13 / 132)) kogu ärakirjas.

Eelmisest väljundist teatas wer ärakirjas 13st sõnast 132 viga. Neid vigu võib olla kolme tüüpi:

  • Asendusvead – Need tekivad siis, kui Amazon Transcribe kirjutab ühe sõna teise asemel. Näiteks meie ärakirjas on sõna "महीना (Mahina)" kirjutati "" asemelमिनार (Minar)” 4. lauses.
  • Kustutamise vead – Need tekivad siis, kui Amazon Transcribe jätab ärakirjas sõna täielikult vahele. Meie ärakirjas on sõna "सौथ (Lõuna)” jäi lauses 2 vahele.
  • Sisestusvead – Need tekivad siis, kui Amazon Transcribe lisab sõna, mida ei öeldud. Me ei näe oma ärakirjas sisestusvigu.

Tähelepanekud vaikemudeli loodud ärakirjast

Transkriptsiooni põhjal saame teha järgmised tähelepanekud:

  • WER koguarv on 9.848%, mis tähendab, et 90.152% sõnadest on täpselt transkribeeritud.
  • Hindi vaikemudel transkribeeris enamiku ingliskeelsetest sõnadest täpselt. Seda seetõttu, et vaikemudel on koolitatud ära tundma kõige tavalisemaid ingliskeelseid sõnu. Mudelit õpetatakse ära tundma ka hingli keelt, kus ingliskeelsed sõnad esinevad juhuslikult hindi vestlustes. Näiteks:
    • गुड मोर्निग – Tere hommikust (lause 2).
    • ट्रेवल एजेंसी – reisibüroo (lause 2).
    • ग्रेट आइडिया थैंक्यू सो मच – Suurepärane idee, tänan teid väga (9. lause).
  • Lauses 4 on kõige rohkem vigu, mis on India linna Hyderabadi kohtade nimed:
    • हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम

Järgmises etapis näitame, kuidas parandada eelmises lauses esiletõstetud sõnu, kasutades Amazon Transcribe'i kohandatud sõnavara:

  • चार महीना (Char Kuu) peaks olema चार मिनार (Char Õõnestada)
  • Ümarकुंडा फोJne (Kolcunda Four) peaks olema गोलकोंडा फोर्ट (Kolconda Fort)
  • लार जंग (Salar Jung) peaks olema सालार जंग (Saalar Jung)

Treenige kohandatud sõnavaraga vaikemudelit

Et luua kohandatud sõnavara, peate Amazon Transcribe'i vaikemudeli treenimiseks looma tabelivormingus tekstifaili sõnade ja fraasidega. Tabel peab sisaldama kõiki nelja veergu (Phrase, SoundsLike, IPAja DisplayAs), kuid Phrase veerg on ainus, mis peab sisaldama kirjet igal real. Teised veerud võite tühjaks jätta. Iga veerg tuleb eraldada tabeldusmärgiga, isegi kui mõni veerg on tühjaks jäetud. Näiteks kui jätate IPA ja SoundsLike veerud tühjad rea jaoks, Phrase ja DisplaysAs selle rea veerud tuleb eraldada kolme tabeldusmärgiga (vahel Phrase ja IPA, IPA ja SoundsLikeja SoundsLike ja DisplaysAs).

Mudeli kohandatud sõnavaraga koolitamiseks toimige järgmiselt.

  1. Looge fail nimega HindiCustomVocabulary.txt järgmise sisuga.
    Fraas IPA kõlab sarnaselt kuvar गोलकुंड -फो फो ट ल -जंग स -ल -जंग स स जंग च महीन च च मिन मिन

    Saate kasutada ainult teie keele jaoks toetatud märke. Vaadake oma keelt märgikomplekt üksikasjad.

    Veerud sisaldavad järgmist teavet:

    1. Phrase – Sisaldab sõnu või fraase, mida soovite täpselt transkribeerida. Selles veerus kuvatakse Amazon Transcribei vaikemudeliga loodud transkriptsiooni esiletõstetud sõnad või fraasid. Need sõnad on üldiselt akronüümid, pärisnimed või domeenispetsiifilised sõnad ja fraasid, mida vaikemudel ei tunne. See väli on kohandatud sõnavara tabeli iga rea ​​jaoks kohustuslik. Meie ärakirjas 4. lause „गोलकुंडा फोर (Golcunda neli)” parandamiseks kasutage selles veerus "गोलकुंडा-फोर" (Golcunda) c. Kui teie kirje sisaldab mitut sõna, eraldage iga sõna sidekriipsuga (-); ärge kasutage tühikuid.
    2. IPA – Sisaldab sõnu või fraase, mis esindavad kõnehelisid kirjalikul kujul. Veerg on valikuline; võite selle read tühjaks jätta. See veerg on mõeldud foneetilise õigekirja jaoks, kasutades ainult rahvusvahelise foneetilise tähestiku (IPA) märke. Hindi keele lubatud IPA-märkide kohta vaadake Hindi märgikomplekti. Meie näites ei kasuta me IPA-d. Kui teil on selles veerus kanne, siis teie SoundsLike veerg peab olema tühi.
    3. SoundsLike – Sisaldab sõnu või fraase, mis on jaotatud väiksemateks tükkideks (tavaliselt silpide või tavasõnade alusel), et anda iga teose hääldus vastavalt sellele, kuidas see pala kõlab. See veerg on valikuline; võid read tühjaks jätta. Lisage sellesse veergu sisu ainult siis, kui teie kirje sisaldab ebastandardset sõna, näiteks kaubamärgi nime, või kui soovite parandada sõna, mida transkribeeritakse valesti. Meie ärakirjas 4. lause "सलार जंग (Salar Jung)" parandamiseks kasutage selles veerus "सा-लार-जंग (Saa-lar-jung)". Ärge kasutage selles veerus tühikuid. Kui teil on selles veerus kanne, siis teie IPA veerg peab olema tühi.
    4. DisplaysAs – Sisaldab sõnu või fraase, mille õigekirja soovite näha tekstis olevate sõnade või fraaside transkriptsiooniväljundis. Phrase valdkonnas. See veerg on valikuline; võid read tühjaks jätta. Kui te seda välja ei määra, kasutab Amazon Transcribe selle sisu Phrase välja väljundfailis. Näiteks meie ärakirjas 4. lause „गोलकुंडा फोर (Golcunda Four)” parandamiseks kasutage sõna „गोलकोंडा फोर For this ()्conट.
  2. Täiendava tekstifail (HindiCustomVocabulary.txt) S3 ämbrisse. Nüüd loome rakenduses Amazon Transcribe kohandatud sõnavara.
  3. Amazon Transcribe'i konsoolil valige Kohandatud sõnavara navigeerimispaanil.
  4. eest Nimi, sisestage nimi.
  5. eest Keel, vali hindi, IN (hi-IN).
  6. eest Sõnavara sisendallikasvalige S3 asukoht.
  7. eest Sõnavarafaili asukoht S3-s, sisestage S3 tee HindiCustomVocabulary.txt faili.
  8. Vali Loo sõnavara. Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai.
  9. Transkribeeri SampleAudio.wav kohandatud sõnavaraga fail järgmiste parameetritega:
    1. eest Töö nimi , sisenema SampleAudioCustomVocabulary.
    2. eest Keel, vali hindi, IN (hi-IN).
    3. eest Sisestage faili asukoht S3-s, sirvige asukohta SampleAudio.wav.
    4. eest IAM rollvalige Kasutage olemasolevat IAM-i rolli ja valige varem loodud roll.
    5. aasta Konfigureerige töö jaotises valige Kohandatud sõnavara ja valige kohandatud sõnavara HindiCustomVocabulary.
  10. Vali Loo töökoht.

Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai.

Mõõtke mudeli täpsust pärast kohandatud sõnavara kasutamist

Kopeerige ärakiri Amazon Transcribe'i töö üksikasjade lehelt tekstifaili nimega hypothesis-custom-vocabulary.txt:

Klient : हेलो,

Agent : गुड मोर्निग इंडिया ट्रेवल एजेंसी से। से। ल ब क क हूँ हूँ त से मैं आपकी सह क क हूँ।।

Klient : मैं बहुत दिनों उनसे हैद द ट के के में में ह ह।। क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंे बार.

Agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम

Klient : ह बढिय थैंक मैं अगले अगले सैट सैट औ संडे को ट ट क।।

Agent : एक सजेशन वीकेंड में ट्रैफिक ज्यातइेेरत

Klient : सिरियसली एनी टिप्स चिकन शेर

Agent : आप टेक यूस क लो ड औ प प प ब नहीं।।

Klient : ग्रेट आइडिया थैंक्यू सो मच।

Pange tähele, et esiletõstetud sõnad transkribeeritakse vastavalt soovile.

Käivita wer käsk uuesti uue ärakirjaga:

wer -i reference.txt hypothesis-custom-vocabulary.txt

Saate järgmise väljundi:

REF: customer : हेलो,

HYP: customer : हेलो,

SENTENCE 1

Correct = 100.0% 3 ( 3)

Errors = 0.0% 0 ( 3)

REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

SENTENCE 2

Correct = 84.0% 21 ( 25)

Errors = 16.0% 4 ( 25)

REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

SENTENCE 3

Correct = 96.0% 24 ( 25)

Errors = 8.0% 2 ( 25)

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

SENTENCE 5

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

SENTENCE 6

Correct = 100.0% 12 ( 12)

Errors = 0.0% 0 ( 12)

REF: customer : सिरियसली एनी टिप्स यू केन शेर

HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर

SENTENCE 7

Correct = 75.0% 6 ( 8)

Errors = 25.0% 2 ( 8)

REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

HYP: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

SENTENCE 8

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: customer : ग्रेट आइडिया थैंक्यू सो मच।

HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।

SENTENCE 9

Correct = 100.0% 7 ( 7)

Errors = 0.0% 0 ( 7)

Sentence count: 9

WER: 6.061% ( 8 / 132)

WRR: 94.697% ( 125 / 132)

SER: 33.333% ( 3 / 9)

Tähelepanekud kohandatud sõnavaraga loodud ärakirjast

WER koguarv on 6.061%, mis tähendab, et 93.939% sõnadest on täpselt transkribeeritud.

Võrdleme 4. lause wer-väljundit kohandatud sõnavaraga ja ilma. Järgmine on ilma kohandatud sõnavarata:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 83.3% 20 ( 24)

Errors = 16.7% 4 ( 24)

Järgmine on kohandatud sõnavaraga:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

Lauses 4 pole vigu. Kohade nimed transkribeeritakse täpselt kohandatud sõnavara abil, vähendades seeläbi selle helifaili üldist WER-i 9.848%-lt 6.061%-le. See tähendab, et transkriptsiooni täpsus paranes ligi 4%.

Kuidas kohandatud sõnavara täpsust parandas

Kasutasime järgmist kohandatud sõnavara:

Phrase IPA SoundsLike DisplayAs

गोलकुंडा-फोर गोलकोंडा फोर्ट

सालार-जंग सा-लार-जंग सालार जंग

चार-महीना चार मिनार

Amazon Transcribe kontrollib, kas helifailis on sõnu, mis kõlavad nagu failis mainitud sõnad Phrase veerg. Seejärel kasutab mudel kirjeid IPA, SoundsLikeja DisplaysAs veerud nende konkreetsete sõnade jaoks soovitud kirjapildiga transkribeerimiseks.

Kui Amazon Transcribe tuvastab selle kohandatud sõnavaraga sõna, mis kõlab nagu "गोलकुंडा-फोर (Golcunda-Four)," transkribeerib see selle sõna kui "गोलफों"ोलफों.

Soovitused

Transkriptsiooni täpsus sõltub ka sellistest parameetritest nagu kõlarite hääldus, kattuvad kõlarid, kõne kiirus ja taustmüra. Seetõttu soovitame teil kõikehõlmava kohandatud sõnavara koostamiseks jälgida protsessi mitmesuguste kõnedega (erinevate klientide, agentide, katkestuste ja nii edasi), mis hõlmavad kõige sagedamini kasutatavaid domeenispetsiifilisi sõnu.

Selles postituses õppisime, kuidas kohandatud sõnavara kasutades parandada ühe helikõne transkribeerimise täpsust. Tuhandete oma kontaktkeskuse kõnesalvestiste töötlemiseks iga päev saate kasutada kõnede postitamise analüüs, täielikult automatiseeritud, skaleeritav ja kuluefektiivne terviklahendus, mis hoolitseb suurema osa raskuste tõstmisest. Laadite lihtsalt oma helifailid üles S3 ämbrisse ja mõne minutiga pakub lahendus kõneanalüütikat, nagu sentiment, veebiliideses. Kõnejärgse analüüs annab praktilisi teadmisi esilekerkivate suundumuste tuvastamiseks, agentide juhendamise võimaluste tuvastamiseks ja kõnede üldise suhtumise hindamiseks. Kõnejärgse analüüs on avatud lähtekoodiga lahendus mida saate kasutada kasutades AWS CloudFormation.

Pange tähele, et kohandatud sõnavarad ei kasuta konteksti, milles sõnad öeldi, vaid keskenduvad ainult teie esitatud üksikutele sõnadele. Täpsuse edasiseks parandamiseks võite kasutada kohandatud keelemudelid. Erinevalt kohandatud sõnavaradest, mis seostavad hääldust õigekirjaga, õpivad kohandatud keelemudelid antud sõnaga seotud konteksti. See hõlmab seda, kuidas ja millal sõna kasutatakse ning sõna seost teiste sõnadega. Kohandatud keelemudeli loomiseks saate kasutada erinevate kõnede jaoks õpitud protsessist tuletatud transkriptsioone ja kombineerida neid oma veebisaitide või kasutusjuhendite sisuga, mis sisaldab domeenispetsiifilisi sõnu ja fraase.

Paketttranskriptsioonidega transkriptsiooni kõrgeima täpsuse saavutamiseks võite kasutada kohandatud sõnavarasid koos kohandatud keelemudelitega.

Järeldus

Selles postituses esitasime üksikasjalikud juhised ingliskeelseid sõnu sisaldavate hindi helifailide täpseks töötlemiseks, kasutades Amazon Transcribe'i kõneanalüütikat ja kohandatud sõnavarasid. Neid samu toiminguid saate kasutada mis tahes helikõnede töötlemiseks toetatud keel autor Amazon Transcribe.

Kui olete transkriptsioonid soovitud täpsusega tuletanud, saate agentide koolitamise kaudu parandada oma agendi ja kliendi vestlusi. Samuti saate aru oma klientide meeleoludest ja suundumustest. Kõneanalüüsi kõneleja diariseerimise, helitugevuse tuvastamise ja sõnavara filtreerimise funktsioonide abil saate tuvastada, kas agent või klient tõstis tooni või rääkis konkreetseid sõnu. Saate kategoriseerida kõnesid domeenispetsiifiliste sõnade alusel, koguda praktilisi teadmisi ja käitada analüüsi, et oma tooteid täiustada. Lõpuks saate tõlkida oma ärakirjad inglise keelde või muudesse teie valitud toetatud keeltesse, kasutades selleks Amazoni tõlge.


Autoritest

Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai. Sarat Guttikonda on lahenduste vanem arhitekt AWS-i ülemaailmses avalikus sektoris. Saratile meeldib aidata klientidel oma pilveressursse automatiseerida, hallata ja hallata ilma äritegevuse paindlikkust ohverdamata. Vabal ajal meeldib talle pojaga legosid ehitada ja lauatennist mängida.

Parandage kliendi-agendi kõnede transkriptsiooni täpsust rakenduse Amazon Transcribe PlatoBlockchain Data Intelligence kohandatud sõnavara abil. Vertikaalne otsing. Ai.Lavanya Sood on lahenduste arhitekt AWS-i ülemaailmses avalikus sektoris, mis asub Indias New Delhis. Lavanya naudib uute tehnoloogiate õppimist ja klientide abistamist nende pilvepõhise kasutuselevõtu teekonnal. Vabal ajal armastab ta reisida ja erinevaid toite proovida.

Ajatempel:

Veel alates AWS-i masinõpe