Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai.

Paranna asiakasagenttipuheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribessa

Monet AWS asiakkaat ovat käyttäneet onnistuneesti Amazonin transkriptio muuntaa asiakkaiden äänikeskustelut tarkasti, tehokkaasti ja automaattisesti tekstiksi ja poimia niistä käyttökelpoisia oivalluksia. Nämä oivallukset voivat auttaa sinua parantamaan jatkuvasti prosesseja ja tuotteita, jotka parantavat suoraan asiakkaidesi laatua ja kokemusta.

Monissa maissa, kuten Intiassa, englanti ei ole ensisijainen viestintäkieli. Intialaiset asiakaskeskustelut sisältävät alueellisia kieliä, kuten hindi, ja englanninkielisiä sanoja ja lauseita puhutaan satunnaisesti koko puhelun ajan. Lähdemediatiedostoissa voi olla erisnimiä, verkkotunnuskohtaisia ​​lyhenteitä, sanoja tai lauseita, joista Amazon Transcriben oletusmalli ei ole tietoinen. Tällaisten mediatiedostojen transkriptioissa voi olla näiden sanojen kirjoitusvirheitä.

Tässä viestissä näytämme, kuinka voit antaa lisätietoja Amazon Transcribeille mukautetut sanastot päivittääksesi tapaa, jolla Amazon Transcribe käsittelee äänitiedostojesi transkriptiota, yrityskohtaisella terminologialla. Näytämme vaiheet, joilla parannetaan hinglish-puheluiden (intialaisen hindin puhelut, jotka sisältävät intialaisen englannin sanoja ja lauseita) transkriptioiden tarkkuutta. Voit käyttää samaa prosessia äänipuhelujen litteroimiseen millä tahansa kieli tuettu kirjoittanut Amazon Transcribe. Kun olet luonut mukautettuja sanastoja, voit litteroida äänipuhelut tarkasti ja suuressa mittakaavassa käyttämällä post call analytics ratkaisu, josta keskustelemme lisää myöhemmin tässä viestissä.

Ratkaisun yleiskatsaus

Käytämme seuraavaa intialaista hindi-äänipuhelua (SampleAudio.wav) satunnaisilla englanninkielisillä sanoilla prosessin havainnollistamiseksi.

Ohjaamme sinut sitten seuraavien korkean tason vaiheiden läpi:

  1. Literoi äänitiedosto käyttämällä oletusarvoista Amazon Transcribe Hindi -mallia.
  2. Mittaa mallin tarkkuus.
  3. Harjoittele mallia mukautetulla sanastolla.
  4. Mittaa koulutetun mallin tarkkuus.

Edellytykset

Ennen kuin aloitamme, meidän on varmistettava, että tuloäänitiedosto täyttää litteroida tietojen syöttövaatimukset.

A yksiääniset tallennus, jota kutsutaan myös nimellä mono, sisältää yhden äänisignaalin, jossa kaikki edustajan ja asiakkaan äänielementit yhdistetään yhdeksi kanavaksi. A stereofoninen tallennus, jota kutsutaan myös nimellä stereo, sisältää kaksi äänisignaalia välittäjän ja asiakkaan äänielementtien kaappaamiseksi kahdella erillisellä kanavalla. Jokainen agentti-asiakas-tallennustiedosto sisältää kaksi äänikanavaa, yhden edustajalle ja toisen asiakkaalle.

Matalalaatuiset äänitallenteet, kuten puhelintallenteet, käyttävät tyypillisesti 8,000 16,000 Hz:n näytteenottotaajuutta. Amazon Transcribe tukee mononauhoitettujen ja myös korkealaatuisten äänitiedostojen käsittelyä näytteenottotaajuuksilla 48,000 XNUMX–XNUMX XNUMX Hz.

Transkriptiotulosten parantamiseksi ja edustajan ja asiakkaan puhumien sanojen erottamiseksi selvästi, suosittelemme käyttämään äänitiedostoja, jotka on tallennettu 8,000 XNUMX Hz:n näytteenottotaajuudella ja jotka on erotettu stereokanavasta.

Voit käyttää työkalua kuten ffmpeg vahvistaaksesi syöttämäsi äänitiedostot komentoriviltä:

ffmpeg -i SampleAudio.wav

Tarkista palautetussa vastauksessa Input-osiossa rivi, joka alkaa tekstillä Stream ja varmista, että äänitiedostot ovat 8,000 XNUMX Hz ja stereokanavat erotettu toisistaan:

Input #0, wav, from 'SampleAudio.wav':
Duration: 00:01:06.36, bitrate: 256 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, stereo, s16, 256 kb/s

Kun rakennat putken käsittelemään suurta määrää äänitiedostoja, voit automatisoida tämän vaiheen suodattaaksesi tiedostot, jotka eivät täytä vaatimuksia.

Lisäedellytyksenä on, että luo Amazon Simple Storage Service (Amazon S3) -ämpäri, joka isännöi transkriboitavia äänitiedostoja. Katso ohjeet kohdasta Luo ensimmäinen S3-ämpärisi.Sitten lataa äänitiedosto S3-kauhaan.

Literoi äänitiedosto oletusmallilla

Nyt voimme aloita Amazon Transcribe soita analytiikkatyöhön lataamamme äänitiedoston avulla. Tässä esimerkissä käytämme AWS-hallintakonsoli Literoidaksesi äänitiedoston.Voit myös käyttää AWS-komentoriviliitäntä (AWS CLI) tai AWS SDK.

  1. Valitse Amazon Transcribe -konsolissa Soita analytiikkaan navigointipaneelissa.
  2. Valita Soita analytiikan töihin.
  3. Valita Luo työpaikka.
  4. varten Nimi, kirjoita nimi.
  5. varten Kieliasetuksetvalitse Tietty kieli.
  6. varten Kieli, valitse hindi, IN (hi-IN).
  7. varten Mallityyppivalitse Yleinen malli.
  8. varten Syötä tiedoston sijainti S3:ssa, selaa S3-säilöä, joka sisältää ladatun äänitiedoston.Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai.
  9. In Lähtötiedot -osiossa, jätä oletusasetukset.
  10. In Käyttöoikeudet , valitse Luo IAM-rooli.
  11. Luoda uusi AWS-henkilöllisyyden ja käyttöoikeuksien hallinta (IAM) -rooli nimeltä HindiTranscription, joka tarjoaa Amazon Transcribe -palvelun oikeudet lukea äänitiedostoja S3-säilöstä ja käyttää AWS-avainhallintapalvelu (AWS KMS) -avain salauksen purkamiseen.Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai.
  12. In Määritä työ -osiossa, jätä oletusasetukset, mukaan lukien Mukautettu sanasto poistettu.
  13. Valita Luo työpaikka litteroidaksesi äänitiedoston.

Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai.

Kun työn tila on Valmis, voit tarkastella transkriptiota valitsemalla työn (SampleAudio).

Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai.

Asiakas- ja agenttilauseet erotetaan selvästi toisistaan, mikä auttaa tunnistamaan, puhuiko asiakas tai agentti jotain tiettyä sanaa tai lausetta.

Mittaa mallin tarkkuus

Sanan virheprosentti (WER) on suositeltu ja yleisimmin käytetty mittari automaattisten puheentunnistusjärjestelmien (ASR) tarkkuuden arvioinnissa. Tavoitteena on vähentää WER:ää niin paljon kuin mahdollista ASR-järjestelmän tarkkuuden parantamiseksi.

Laske WER suorittamalla seuraavat vaiheet. Tämä viesti käyttää avointa lähdekoodia asr-arviointi arviointityökalu WER: n laskemiseksi, mutta muut työkalut, kuten SCTK or JiWER ovat myös saatavilla.

  1. install Ishayoiden opettaman asr-evaluation työkalu, jonka avulla wer-skripti on käytettävissä komentorivilläsi.
    Käytä komentoriviä macOS- tai Linux-alustoilla suorittaaksesi myöhemmin viestissä näkyvät wer-komennot.
  2. Kopioi transkriptio Amazon Transcribe -työn tiedot -sivulta tekstitiedostoon nimeltä hypothesis.txt.
    Kun kopioit transkription konsolista, huomaat uuden rivimerkin sanojen välissä Agent :, Customer :, ja hindin kirjoitus.
    Uudet rivimerkit on poistettu tilan säästämiseksi tästä viestistä. Jos päätät käyttää tekstiä sellaisena kuin se on konsolista, varmista, että luomassasi viitetekstitiedostossa on myös uudet rivimerkit, koska wer-työkalu vertailee rivi riviltä.
  3. Tarkista koko transkriptio ja tunnista sanat tai ilmaukset, jotka on korjattava:
    Asiakas : हेलो,
    Agentti : गुड मोर्निग इंडिया ट्रेवल एजेंसी सेम है। ल ब ब मैं आपकी सह सह क सकती हूँ।।।।।।।।।।।
    Asiakas : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा। क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंे बात
    Agentti :हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम
    Asiakas : ह बढिय थैंक यू मैं अगले सैट औ संडे को ट क।।
    Agentti : एक सजेशन वीकेंड में ट्रैफिक ज्यााइेेरत
    Asiakas : सिरियसली एनी टिप्स Kana शेर
    Agentti : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    Asiakas : ग्रेट आइडिया थैंक्यू सो मच। Korostetut sanat ovat niitä, joita Amazon Transcriben oletusmalli ei hahmontunut oikein.
  4. Luo toinen tekstitiedosto nimeltä reference.txt, korvaa korostetut sanat halutuilla sanoilla, joiden odotat näkevän transkriptiossa:
    Asiakas : हेलो,
    Agentti : गुड मोर्निग सौथ इंडिया ट्रेवल एजें से मैं । ल ब ब मैं आपकी सह सह क सकती हूँ।।।।।।।।।।।
    Asiakas : मैं बहुत दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा। क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंे बात
    Agentti : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम
    Asiakas : ह बढिय थैंक यू मैं अगले सैट औ संडे को ट क।।
    Agentti : एक सजेशन वीकेंड में ट्रैफिक ज्यााइेेरत
    Asiakas : सिरियसली एनी टिप्स यू केन शेर
    Agentti : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    Asiakas : ग्रेट आइडिया थैंक्यू सो मच।
  5. Käytä seuraavaa komentoa vertaillaksesi luomiasi viite- ja hypoteesitekstitiedostoja:
    wer -i reference.txt hypothesis.txt

    Saat seuraavan tuloksen:

    REF: customer : हेलो,
    
    HYP: customer : हेलो,
    
    SENTENCE 1
    
    Correct = 100.0% 3 ( 3)
    
    Errors = 0.0% 0 ( 3)
    
    REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    SENTENCE 2
    
    Correct = 84.0% 21 ( 25)
    
    Errors = 16.0% 4 ( 25)
    
    REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    SENTENCE 3
    
    Correct = 96.0% 24 ( 25)
    
    Errors = 8.0% 2 ( 25)
    
    REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    SENTENCE 4
    
    Correct = 83.3% 20 ( 24)
    
    Errors = 16.7% 4 ( 24)
    
    REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    SENTENCE 5
    
    Correct = 100.0% 14 ( 14)
    
    Errors = 0.0% 0 ( 14)
    
    REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    SENTENCE 6
    
    Correct = 100.0% 12 ( 12)
    
    Errors = 0.0% 0 ( 12)
    
    REF: customer : सिरियसली एनी टिप्स यू केन शेर
    
    HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर
    
    SENTENCE 7
    
    Correct = 75.0% 6 ( 8)
    
    Errors = 25.0% 2 ( 8)
    
    REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    
    HYP: agent : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    
    SENTENCE 8
    
    Correct = 92.9% 13 ( 14)
    
    Errors = 7.1% 1 ( 14)
    
    REF: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    SENTENCE 9
    
    Correct = 100.0% 7 ( 7)
    
    Errors = 0.0% 0 ( 7)
    
    Sentence count: 9
    
    WER: 9.848% ( 13 / 132)
    
    WRR: 90.909% ( 120 / 132)
    
    SER: 55.556% ( 5 / 9)

wer-komento vertaa tekstiä tiedostoista reference.txt ja hypothesis.txt. Se raportoi jokaisen lauseen virheet ja myös virheiden kokonaismäärän (WER: 9.848 % ( 13 / 132)) koko tekstityksessä.

Edellisessä tulosteessa wer ilmoitti 13 virhettä transkription 132 sanasta. Nämä virheet voivat olla kolmenlaisia:

  • Korvausvirheet – Näitä tapahtuu, kun Amazon Transcribe kirjoittaa yhden sanan toisen tilalle. Esimerkiksi tekstissämme sana "महीना (Mahina)" kirjoitettiin ""मिनार (Minar)" lauseessa 4.
  • Poistovirheet – Näitä esiintyy, kun Amazon Transcribe jättää sanan kokonaan huomiotta transkriptiossa. Literaattisessamme sana "सौथ (Etelä)” jätettiin pois lauseesta 2.
  • Lisäysvirheet – Näitä esiintyy, kun Amazon Transcribe lisää sanan, jota ei puhuttu. Emme näe lisäysvirheitä transkriptiossamme.

Havainnot oletusmallin luomasta transkriptiosta

Voimme tehdä seuraavat havainnot transkription perusteella:

  • Kokonais-WER on 9.848%, mikä tarkoittaa, että 90.152% sanoista on litteroitu tarkasti.
  • Hindi-oletusmalli litteroi suurimman osan englanninkielisistä sanoista tarkasti. Tämä johtuu siitä, että oletusmalli on koulutettu tunnistamaan yleisimmät englanninkieliset sanat. Malli on myös koulutettu tunnistamaan hinglish-kieltä, jossa englanninkieliset sanat esiintyvät satunnaisesti hindinkielisissä keskusteluissa. Esimerkiksi:
    • गुड मोर्निग – Hyvää huomenta (lause 2).
    • ट्रेवल एजेंसी – Matkatoimisto (lause 2).
    • ग्रेट आइडिया थैंक्यू सो मच – Hieno idea, kiitos paljon (lause 9).
  • Lauseessa 4 on eniten virheitä, jotka ovat intialaisen kaupungin Hyderabadin paikkojen nimet:
    • हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम

Seuraavassa vaiheessa näytämme kuinka korjata edellisen lauseen korostetut sanat käyttämällä mukautettua sanastoa Amazon Transcribessa:

  • चार महीना (Hiiltyä Kuukausi) tulee olla चार मिनार (Hiiltyä heikentää)
  • Pyöristääकुंडा फो (Kolcunda Four) tulee olla गोलकोंडा फोर्ट (Kolconda Fort)
  • लार जंग (Salar Jung) pitäisi olla सालार जंग (Saalar Jung)

Harjoittele oletusmallia mukautetun sanaston avulla

jotta luo mukautettu sanasto, sinun on rakennettava tekstitiedosto taulukkomuodossa sanoilla ja lauseilla, jotta voit harjoitella Amazon Transcriben oletusmallia. Taulukon tulee sisältää kaikki neljä saraketta (Phrase, SoundsLike, IPAja DisplayAs), mutta Phrase sarake on ainoa, jonka jokaisella rivillä on oltava merkintä. Voit jättää muut sarakkeet tyhjiksi. Jokainen sarake on erotettava sarkainmerkillä, vaikka jotkin sarakkeet jätettäisiin tyhjiksi. Esimerkiksi jos jätät IPA ja SoundsLike sarakkeet tyhjät riville Phrase ja DisplaysAs rivin sarakkeet on erotettava kolmella sarkainmerkillä (välillä Phrase ja IPA, IPA ja SoundsLikeja SoundsLike ja DisplaysAs).

Jos haluat kouluttaa mallia mukautetulla sanastolla, suorita seuraavat vaiheet:

  1. Luo tiedosto nimeltä HindiCustomVocabulary.txt seuraavalla sisällöllä.
    Lause IPA kuulostaa kaltaisilta näytöiltä गोलकुंड-फो गोलकोंड फो स-जंग स-र-जंग स जंग च-महीन च मिन मिन मिन मिन मिन मिन मिन

    Voit käyttää vain kielelläsi tuettuja merkkejä. Katso omaa kieltäsi Merkistö lisätietoja.

    Sarakkeet sisältävät seuraavat tiedot:

    1. Phrase – Sisältää sanat tai lauseet, jotka haluat litteroida tarkasti. Tässä sarakkeessa näkyvät Amazon Transcriben oletusmallin luoman transkription korostetut sanat tai lauseet. Nämä sanat ovat yleensä lyhenteitä, erisnimisiä tai verkkotunnuskohtaisia ​​sanoja ja ilmauksia, joita oletusmalli ei tunne. Tämä on pakollinen kenttä mukautetun sanastotaulukon jokaiselle riville. Korjataksesi tekstin tekstin "गोलकुंडा फोर (Golcunda Four)" lauseesta 4, käytä "गोलकुंडा-फोर" (Gol.) c. Jos kirjoituksesi sisältää useita sanoja, erota jokainen sana yhdysmerkillä (-); älä käytä välilyöntejä.
    2. IPA – Sisältää sanat tai lauseet, jotka edustavat puheääniä kirjoitetussa muodossa. Sarake on valinnainen; voit jättää sen rivit tyhjiksi. Tämä sarake on tarkoitettu foneettisille oikeinkirjoituksille, joissa käytetään vain kansainvälisen foneettisen aakkoston (IPA) merkkejä. Katso hindin kielen sallitut IPA-merkit kohdasta Hindi. Esimerkissämme emme käytä IPA:ta. Jos sinulla on merkintä tässä sarakkeessa, sinun SoundsLike sarakkeen on oltava tyhjä.
    3. SoundsLike – Sisältää sanoja tai lauseita, jotka on jaettu pienempiin osiin (perustuu tavallisesti tavuihin tai yleisiin sanoihin), jotta jokaiselle kappaleelle voidaan antaa ääntäminen sen mukaan, miltä kappale kuulostaa. Tämä sarake on valinnainen; voit jättää rivit tyhjiksi. Lisää sisältöä tähän sarakkeeseen vain, jos merkintäsi sisältää standardista poikkeavan sanan, kuten tuotemerkin, tai jos haluat korjata sanan, joka on litteroitu väärin. Korjataksesi tekstin sanan "सलार जंग (Salar Jung)" lauseesta 4, käytä tässä sarakkeessa "सा-लार-जंग (Saa-lar-jung)". Älä käytä välilyöntejä tässä sarakkeessa. Jos sinulla on merkintä tässä sarakkeessa, sinun IPA sarakkeen on oltava tyhjä.
    4. DisplaysAs – Sisältää sanoja tai lauseita, joiden oikeinkirjoitus on haluamasi Phrase ala. Tämä sarake on valinnainen; voit jättää rivit tyhjiksi. Jos et määritä tätä kenttää, Amazon Transcribe käyttää sen sisältöä Phrase -kenttään tulostiedostossa. Esimerkiksi, jos haluat korjata transkriptiossamme lauseen "गोलकुंडा फोर (Golcunda Four)" lauseesta 4, käytä "गोलकोंडा फ्ट for this ()्con
  2. Lataa tekstitiedosto (HindiCustomVocabulary.txt) S3-ämpäriin. Nyt luomme mukautetun sanaston Amazon Transcribessa.
  3. Valitse Amazon Transcribe -konsolissa Mukautettu sanasto navigointipaneelissa.
  4. varten Nimi, kirjoita nimi.
  5. varten Kieli, valitse hindi, IN (hi-IN).
  6. varten Sanaston syöttölähdevalitse S3 sijainti.
  7. varten Sanastotiedoston sijainti S3:ssa, syötä S3-polku HindiCustomVocabulary.txt tiedosto.
  8. Valita Luo sanasto. Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai.
  9. Literoi SampleAudio.wav tiedosto mukautetun sanaston kanssa seuraavilla parametreilla:
    1. varten Työn nimi , tulla sisään SampleAudioCustomVocabulary.
    2. varten Kieli, valitse hindi, IN (hi-IN).
    3. varten Syötä tiedoston sijainti S3:ssa, selaa sijaintiin SampleAudio.wav.
    4. varten IAM-roolivalitse Käytä olemassa olevaa IAM-roolia ja valitse aiemmin luomasi rooli.
    5. In Määritä työ , valitse Mukautettu sanasto ja valitse mukautettu sanasto HindiCustomVocabulary.
  10. Valita Luo työpaikka.

Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai.

Mittaa mallin tarkkuus mukautetun sanaston käytön jälkeen

Kopioi transkriptio Amazon Transcribe -työn tiedot -sivulta tekstitiedostoon nimeltä hypothesis-custom-vocabulary.txt:

Asiakas : हेलो,

Agentti : गुड मोर्निग इंडिया ट्रेवल एजेंस। से। ल ब ब मैं आपकी सह सह क सकती हूँ।।।।।।।।।।।

Asiakas : मैं बहुत दिनों उनसे हैद ह ट ट।। थ थ।।।। क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंे बात

Agentti : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम

Asiakas : ह बढिय थैंक यू मैं अगले सैट औ संडे को ट क।।

Agentti : एक सजेशन वीकेंड में ट्रैफिक ज्यााइेेरत

Asiakas : सिरियसली एनी टिप्स चिकन शेर

Agentti : आप टेक यूस क लो ड औ प क प नहीं नहीं होग।

Asiakas : ग्रेट आइडिया थैंक्यू सो मच।

Huomaa, että korostetut sanat kirjoitetaan halutulla tavalla.

Suorita wer komento uudelleen uudella transkriptiolla:

wer -i reference.txt hypothesis-custom-vocabulary.txt

Saat seuraavan tuloksen:

REF: customer : हेलो,

HYP: customer : हेलो,

SENTENCE 1

Correct = 100.0% 3 ( 3)

Errors = 0.0% 0 ( 3)

REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

SENTENCE 2

Correct = 84.0% 21 ( 25)

Errors = 16.0% 4 ( 25)

REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

SENTENCE 3

Correct = 96.0% 24 ( 25)

Errors = 8.0% 2 ( 25)

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

SENTENCE 5

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

SENTENCE 6

Correct = 100.0% 12 ( 12)

Errors = 0.0% 0 ( 12)

REF: customer : सिरियसली एनी टिप्स यू केन शेर

HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर

SENTENCE 7

Correct = 75.0% 6 ( 8)

Errors = 25.0% 2 ( 8)

REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

HYP: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

SENTENCE 8

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: customer : ग्रेट आइडिया थैंक्यू सो मच।

HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।

SENTENCE 9

Correct = 100.0% 7 ( 7)

Errors = 0.0% 0 ( 7)

Sentence count: 9

WER: 6.061% ( 8 / 132)

WRR: 94.697% ( 125 / 132)

SER: 33.333% ( 3 / 9)

Havainnot tekstikirjoituksesta, joka on luotu mukautetulla sanastolla

Kokonais-WER on 6.061%, mikä tarkoittaa, että 93.939% sanoista on litteroitu tarkasti.

Verrataan lauseen 4 wer-tulostusta mukautetun sanaston kanssa ja ilman. Seuraava on ilman mukautettua sanastoa:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 83.3% 20 ( 24)

Errors = 16.7% 4 ( 24)

Seuraavassa on mukautettu sanasto:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

Virkkeessä 4 ei ole virheitä. Paikkojen nimet on litteroitu tarkasti mukautetun sanaston avulla, mikä pienentää tämän äänitiedoston yleistä WER-arvoa 9.848 prosentista 6.061 prosenttiin. Tämä tarkoittaa, että transkription tarkkuus parani lähes 4 %.

Kuinka mukautettu sanasto paransi tarkkuutta

Käytimme seuraavaa mukautettua sanastoa:

Phrase IPA SoundsLike DisplayAs

गोलकुंडा-फोर गोलकोंडा फोर्ट

सालार-जंग सा-लार-जंग सालार जंग

चार-महीना चार मिनार

Amazon Transcribe tarkistaa, onko äänitiedostossa sanoja, jotka kuulostavat tiedostossa mainituilta sanoilta Phrase sarakkeessa. Sitten malli käyttää merkintöjä IPA, SoundsLikeja DisplaysAs sarakkeet kyseisille sanoille litteroitaviksi halutuilla kirjoitusasuilla.

Kun tällä mukautetulla sanastolla Amazon Transcribe tunnistaa sanan, joka kuulostaa "गोलकुंडा-फोर (Golcunda-Four)," se litteroi sanan muodossa "गोलका"ोलकऋं

Suositukset

Transkription tarkkuus riippuu myös parametreista, kuten kaiuttimien ääntämisestä, päällekkäisistä kaiuttimista, puhenopeudesta ja taustamelusta. Siksi suosittelemme, että seuraat prosessia useilla puheluilla (eri asiakkaiden, agenttien, keskeytysten ja niin edelleen), jotka kattavat yleisimmin käytetyt verkkotunnuskohtaiset sanat, jotta voit rakentaa kattavan mukautetun sanaston.

Tässä viestissä opimme prosessin, jolla parannetaan yhden äänipuhelun litterointitarkkuutta muokatun sanaston avulla. Voit käsitellä tuhansia yhteyskeskuksesi puhelutallenteita päivittäin käyttämällä post call analytics, täysin automatisoitu, skaalautuva ja kustannustehokas päästä päähän -ratkaisu, joka hoitaa suurimman osan raskaiden nostoista. Lataat vain äänitiedostot S3-ämpäriin, ja muutamassa minuutissa ratkaisu tarjoaa puheluanalytiikkaa, kuten tunteita verkkokäyttöliittymässä. Puhelun jälkeinen analytiikka tarjoaa käyttökelpoisia oivalluksia uusien trendien havaitsemiseen, agenttien valmennusmahdollisuuksien tunnistamiseen ja puheluiden yleisen tunteen arvioimiseen. Puhelujen jälkeinen analytiikka on avoimen lähdekoodin ratkaisu joita voit ottaa käyttöön käyttämällä AWS-pilven muodostuminen.

Huomaa, että mukautetut sanastot eivät käytä kontekstia, jossa sanat puhuttiin, vaan ne keskittyvät vain antamiisi yksittäisiin sanoihin. Voit parantaa tarkkuutta edelleen käyttämällä mukautetut kielimallit. Toisin kuin mukautetut sanastot, jotka yhdistävät ääntämisen oikeinkirjoitukseen, mukautetut kielimallit oppivat tiettyyn sanaan liittyvän kontekstin. Tämä sisältää sen, miten ja milloin sanaa käytetään, ja sanan suhdetta muihin sanoihin. Voit luoda mukautetun kielimallin käyttämällä eri puheluissa oppimamme prosessista johdettuja transkriptioita ja yhdistää ne verkkosivustojesi tai käyttöoppaidesi sisältöön, joka sisältää verkkotunnuskohtaisia ​​sanoja ja ilmauksia.

Saavuttaaksesi parhaan transkription tarkkuuden erätranskriptioilla, voit käyttää mukautettuja sanastoja yhdessä mukautettujen kielimalliesi kanssa.

Yhteenveto

Tässä viestissä esitimme yksityiskohtaiset vaiheet englanninkielisiä sanoja sisältävien hindi-äänitiedostojen käsittelemiseksi tarkasti käyttämällä Amazon Transcriben puheluanalytiikkaa ja mukautettuja sanastoja. Voit käyttää näitä samoja vaiheita käsitelläksesi äänipuheluita millä tahansa kieli tuettu kirjoittanut Amazon Transcribe.

Kun olet johtanut transkriptiot haluamallasi tarkkuudella, voit parantaa agenttien ja asiakkaiden välisiä keskustelujasi kouluttamalla agenttejasi. Voit myös ymmärtää asiakkaidesi tunteita ja trendejä. Puheluanalytiikan kaiutindiarisoinnin, äänenvoimakkuuden tunnistuksen ja sanaston suodatusominaisuuksien avulla voit tunnistaa, korottiko agentti vai asiakas äänensävyään tai puhuiko tiettyjä sanoja. Voit luokitella puhelut verkkotunnuskohtaisten sanojen perusteella, kerätä käyttökelpoisia oivalluksia ja parantaa tuotteitasi suorittamalla analytiikkaa. Lopuksi voit kääntää tekstisi englanniksi tai muille tuetuille kielille valitsemallasi tavalla Amazon Käännä.


Tietoja Tekijät

Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai. Sarat Guttikonda on vanhempi ratkaisuarkkitehti AWS:n maailmanlaajuisella julkisella sektorilla. Sarat auttaa asiakkaita automatisoimaan, hallitsemaan ja hallitsemaan pilviresurssejaan tinkimättä liiketoiminnan ketteryydestä. Vapaa-ajallaan hän rakastaa legojen rakentamista poikansa kanssa ja pöytätennistä.

Paranna asiakasagentin puheluiden transkription tarkkuutta mukautetulla sanastolla Amazon Transcribe PlatoBlockchain Data Intelligencessa. Pystysuuntainen haku. Ai.Lavanya Sood on ratkaisuarkkitehti AWS:n maailmanlaajuisella julkisella sektorilla New Delhistä, Intiasta. Lavanya nauttii uusien teknologioiden oppimisesta ja asiakkaiden auttamisesta pilvipalveluiden käyttöönottoon. Vapaa-ajallaan hän rakastaa matkustamista ja erilaisten ruokien kokeilemista.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen