Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai.

Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe egyéni szókincsével

Sok AWS ügyfelek sikeresen használták Amazon átirat hogy pontosan, hatékonyan és automatikusan konvertálják az ügyfelek hangos beszélgetéseit szöveggé, és hasznosítható betekintést nyerjenek belőlük. Ezek a betekintések segíthetnek Önnek azon folyamatok és termékek folyamatos fejlesztésében, amelyek közvetlenül javítják ügyfelei minőségét és élményét.

Sok országban, például Indiában, nem az angol az elsődleges kommunikációs nyelv. Az indiai ügyfélbeszélgetések regionális nyelveket, például hindit tartalmaznak, és az angol szavakat és kifejezéseket véletlenszerűen mondják el a hívások során. A forrás médiafájlokban lehetnek olyan tulajdonnevek, tartományspecifikus mozaikszavak, szavak vagy kifejezések, amelyeket az alapértelmezett Amazon Transcribe modell nem ismer. Az ilyen médiafájlok átírásaiban ezek a szavak pontatlanok lehetnek.

Ebben a bejegyzésben bemutatjuk, hogyan nyújthat több információt az Amazon Transcribe számára egyéni szókincsek hogy frissítse az Amazon Transcribe kezelési módját a hangfájlok átírásával az üzletspecifikus terminológiával. Megmutatjuk a Hinglish hívások (indiai angol szavakat és kifejezéseket tartalmazó indiai hindi hívások) átírási pontosságának javítását. Ugyanezt a folyamatot használhatja bármely hanghívás átírására támogatott nyelv az Amazon Transcribe által. Az egyéni szókincsek létrehozása után a hanghívásokat pontosan és nagy mértékben átírhatja hívás utáni elemzés megoldást, amelyről ebben a bejegyzésben később bővebben is szó lesz.

Megoldás áttekintése

A következő indiai hindi hanghívást használjuk (SampleAudio.wav) véletlenszerű angol szavakkal a folyamat bemutatására.

Ezután végigvezetjük a következő magas szintű lépéseken:

  1. Írja át a hangfájlt az alapértelmezett Amazon Transcribe hindi modell használatával.
  2. Mérje meg a modell pontosságát.
  3. Tanítsd meg a modellt egyéni szókinccsel.
  4. Mérje meg a betanított modell pontosságát.

Előfeltételek

Mielőtt elkezdené, meg kell győződnünk arról, hogy a bemeneti hangfájl megfelel-e a átírási adatbeviteli követelmények.

A egyszólamú felvétel, más néven monó, egy hangjelet tartalmaz, amelyben az ügynök és az ügyfél összes hangeleme egy csatornába van egyesítve. A térhatású felvétel, más néven sztereó, két hangjelet tartalmaz az ügynök és az ügyfél audioelemeinek két külön csatornán történő rögzítésére. Minden ügynök-ügyfél rögzítési fájl két hangcsatornát tartalmaz, egyet az ügynök és egyet az ügyfél számára.

Az alacsony hangminőségű hangfelvételek, például a telefonfelvételek általában 8,000 Hz-es mintavételi frekvenciát használnak. Az Amazon Transcribe támogatja a mono rögzített és a 16,000 48,000 és XNUMX XNUMX Hz közötti mintavételi frekvenciájú, nagy hűségű hangfájlok feldolgozását.

A jobb átírási eredmények, valamint az ügyintéző és az ügyfél által kimondott szavak egyértelmű megkülönböztetése érdekében javasoljuk, hogy használjon 8,000 Hz-es mintavételi frekvencián rögzített hangfájlokat, amelyek sztereó csatornákkal vannak elválasztva.

Használhat egy ilyen eszközt ffmpeg a bemeneti audiofájlok ellenőrzéséhez a parancssorból:

ffmpeg -i SampleAudio.wav

A visszaküldött válaszban ellenőrizze a Stream szóval kezdődő sort a Bemenet szakaszban, és ellenőrizze, hogy az audiofájlok 8,000 Hz-esek és a sztereó csatornák el vannak választva:

Input #0, wav, from 'SampleAudio.wav':
Duration: 00:01:06.36, bitrate: 256 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, stereo, s16, 256 kb/s

Ha nagyszámú hangfájl feldolgozására szolgáló folyamatot épít fel, ezt a lépést automatizálhatja a követelményeknek nem megfelelő fájlok kiszűréséhez.

További előfeltételként hozzon létre egy Amazon Simple Storage Service (Amazon S3) tárolót az átírandó hangfájlok tárolására. Az utasításokat lásd Készítse el az első S3 vödröt.Akkor töltse fel a hangfájlt az S3 vödörhöz.

Írja át a hangfájlt az alapértelmezett modellel

Most megtehetjük indítson el egy Amazon Transcribe-t az általunk feltöltött hangfájl segítségével hívja fel az analitikai munkát.Ebben a példában a AWS felügyeleti konzol hogy átírja a hangfájlt.Használhatja a AWS parancssori interfész (AWS CLI) vagy AWS SDK.

  1. Az Amazon Transcribe konzolon válassza a lehetőséget Hívja az elemzőket a navigációs ablaktáblában.
  2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Hívjon elemzői munkákat.
  3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Állás létrehozása.
  4. A Név, írjon be egy nevet.
  5. A Nyelvi beállításokválassza Konkrét nyelv.
  6. A Nyelv, választ hindi, IN (hi-IN).
  7. A Modelltípusválassza Általános modell.
  8. A Adja meg a fájl helyét az S3-on, tallózással keresse meg a feltöltött hangfájlt tartalmazó S3 tárolót.Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai.
  9. A Kimeneti adatok szakaszban hagyja meg az alapértelmezett értékeket.
  10. A Hozzáférési engedélyek válasszon Hozzon létre egy IAM-szerepet.
  11. Újat csinálni AWS Identity and Access Management (IAM) szerepkör, a HindiTranscription, amely az Amazon Transcribe szolgáltatás engedélyét biztosítja az S3 tárolóból származó hangfájlok olvasásához és a AWS kulcskezelési szolgáltatás (AWS KMS) kulcs a visszafejtéshez.Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai.
  12. A Munka konfigurálása szakaszban hagyja meg az alapértelmezett értékeket, beleértve Egyedi szókincs törölve.
  13. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Állás létrehozása a hangfájl átírásához.

Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai.

Ha a feladat állapota Befejezett, a feladat kiválasztásával (SampleAudio) megtekintheti az átírást.

Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai.

Az ügyfél és az ügynök mondatok egyértelműen elkülönülnek egymástól, ami segít azonosítani, hogy az ügyfél vagy az ügynök mondott-e valamilyen konkrét szót vagy kifejezést.

Mérje meg a modell pontosságát

A szóhibaarány (WER) az ajánlott és leggyakrabban használt mérőszám az automatikus beszédfelismerő (ASR) rendszerek pontosságának értékelésére. A cél a WER lehető legnagyobb mértékű csökkentése az ASR rendszer pontosságának javítása érdekében.

A WER kiszámításához hajtsa végre a következő lépéseket. Ez a bejegyzés nyílt forráskódot használ asr-értékelés kiértékelő eszköz a WER kiszámításához, de más eszközök, mint pl SCTK or JiWER rendelkezésre állnak.

  1. felszerel a asr-evaluation eszköz, amely elérhetővé teszi a wer szkriptet a parancssorban.
    Használjon parancssort macOS vagy Linux platformokon a bejegyzés későbbi részében bemutatott wer parancsok futtatásához.
  2. Másolja át az átiratot az Amazon Transcribe feladat részleteit tartalmazó oldalról egy nevű szövegfájlba hypothesis.txt.
    Amikor kimásolja az átírást a konzolról, új sorkarakter jelenik meg a szavak között Agent :, Customer :, és a hindi írás.
    Az új sorkaraktereket eltávolítottuk, hogy helyet takarítsanak meg ebben a bejegyzésben. Ha úgy dönt, hogy a konzolból származó szöveget használja, győződjön meg arról, hogy a létrehozott hivatkozási szövegfájlban is szerepelnek az új sorkarakterek, mert a wer eszköz soronként összehasonlítja.
  3. Tekintse át a teljes átiratot, és azonosítsa a javítandó szavakat vagy kifejezéseket:
    Vevő : हेलो,
    Ügynök : गुड मोर्निग इंडिया ट्रेवल एजेंसी सेम है। ल ब क हूँ किस त से मैं आपकी यत क सकती हूँ।।।।।।।।।।।।।।
    Vevő : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहाा क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंेतरे बार
    Ügynök :हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम
    Vevő : ह बढिय थैंक यू अगले अगले सैट औ संडे को ई ई।।
    Ügynök : एक सजेशन वीकेंड में ट्रैफिक ज्यिक ज्याा
    Vevő : सिरियसली एनी टिप्स Csirke शेर
    Ügynök : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    Vevő : ग्रेट आइडिया थैंक्यू सो मच।A kiemelt szavak azok, amelyeket az alapértelmezett Amazon Transcribe modell nem jelenített meg megfelelően.
  4. Hozzon létre egy másik szöveges fájlt reference.txt, cserélje ki a kiemelt szavakat azokra a kívánt szavakra, amelyeket az átírásban látni fog:
    Vevő : हेलो,
    Ügynök : गुड मोर्निग सौथ इंडिया ट्रेवल एजें से मैं । ल ब क हूँ किस त से मैं आपकी यत क सकती हूँ।।।।।।।।।।।।।।
    Vevő : मैं बहुत दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहाा क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंेतरे बार
    Ügynök : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम
    Vevő : ह बढिय थैंक यू अगले अगले सैट औ संडे को ई ई।।
    Ügynök : एक सजेशन वीकेंड में ट्रैफिक ज्यिक ज्याा
    Vevő : सिरियसली एनी टिप्स यू केन शेर
    Ügynök : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    Vevő : ग्रेट आइडिया थैंक्यू सो मच।
  5. A következő paranccsal hasonlítsa össze az Ön által létrehozott referencia- és hipotézisszövegfájlokat:
    wer -i reference.txt hypothesis.txt

    A következő kimenetet kapod:

    REF: customer : हेलो,
    
    HYP: customer : हेलो,
    
    SENTENCE 1
    
    Correct = 100.0% 3 ( 3)
    
    Errors = 0.0% 0 ( 3)
    
    REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    SENTENCE 2
    
    Correct = 84.0% 21 ( 25)
    
    Errors = 16.0% 4 ( 25)
    
    REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    SENTENCE 3
    
    Correct = 96.0% 24 ( 25)
    
    Errors = 8.0% 2 ( 25)
    
    REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    SENTENCE 4
    
    Correct = 83.3% 20 ( 24)
    
    Errors = 16.7% 4 ( 24)
    
    REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    SENTENCE 5
    
    Correct = 100.0% 14 ( 14)
    
    Errors = 0.0% 0 ( 14)
    
    REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    SENTENCE 6
    
    Correct = 100.0% 12 ( 12)
    
    Errors = 0.0% 0 ( 12)
    
    REF: customer : सिरियसली एनी टिप्स यू केन शेर
    
    HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर
    
    SENTENCE 7
    
    Correct = 75.0% 6 ( 8)
    
    Errors = 25.0% 2 ( 8)
    
    REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    
    HYP: agent : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    
    SENTENCE 8
    
    Correct = 92.9% 13 ( 14)
    
    Errors = 7.1% 1 ( 14)
    
    REF: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    SENTENCE 9
    
    Correct = 100.0% 7 ( 7)
    
    Errors = 0.0% 0 ( 7)
    
    Sentence count: 9
    
    WER: 9.848% ( 13 / 132)
    
    WRR: 90.909% ( 120 / 132)
    
    SER: 55.556% ( 5 / 9)

A wer parancs összehasonlítja a fájlok szövegét reference.txt és a hypothesis.txt. Minden mondatnál jelzi a hibákat, valamint a hibák teljes számát (WER: 9.848% ( 13/132)) a teljes átiratban.

Az előző kimenetből wer 13 hibát jelentett az átiratban szereplő 132 szóból. Ezek a hibák háromféleek lehetnek:

  • Helyettesítési hibák – Ezek akkor fordulnak elő, amikor az Amazon Transcribe egy szót ír a másik helyére. Például az átiratunkban a „महीना (Mahina)” volt írva a „“ helyettमिनार (Minar)” a 4. mondatban.
  • Törlési hibák – Ezek akkor fordulnak elő, amikor az Amazon Transcribe egy szót teljesen kihagy az átiratból. A mi átiratunkban a „सौथ (Dél)” a 2. mondatból kimaradt.
  • Beillesztési hibák – Ezek akkor fordulnak elő, amikor az Amazon Transcribe beszúr egy szót, amelyet nem mondtak ki. Nem látunk beillesztési hibát az átiratunkban.

Észrevételek az alapértelmezett modell által létrehozott átiratból

Az átirat alapján a következő megfigyeléseket tehetjük:

  • A teljes WER 9.848%, ami azt jelenti, hogy a szavak 90.152%-a van pontosan átírva.
  • Az alapértelmezett hindi modell az angol szavak nagy részét pontosan írta át. Ennek az az oka, hogy az alapértelmezett modellt a leggyakoribb angol szavak felismerésére tanítják. A modellt a hinglish nyelv felismerésére is képezték, ahol az angol szavak véletlenszerűen jelennek meg a hindi beszélgetésekben. Például:
    • गुड मोर्निग – Jó reggelt (2. mondat).
    • ट्रेवल एजेंसी – Utazási iroda (2. mondat).
    • ग्रेट आइडिया थैंक्यू सो मच – Nagyszerű ötlet, köszönöm szépen (9. mondat).
  • A 4. mondatban van a legtöbb hiba, ezek az indiai Hyderabad város helyeinek nevei:
    • हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम

A következő lépésben bemutatjuk, hogyan lehet javítani az előző mondatban kiemelt szavakat az Amazon Transcribe egyéni szókincsével:

  • चार महीना (Char Hónap) legyen चार मिनार (Char aláássák)
  • गोलकुंडा फो (Golcunda Four) legyen गोलकोंडा फोर्ट (Golconda Fort)
  • लार जंग (Salar Jung) legyen सालार जंग (Ígylar Jung)

Tanítsd meg az alapértelmezett modellt egyéni szókinccsel

Nak nek egyéni szókincs létrehozása, létre kell hoznia egy szöveges fájlt táblázatos formátumban a szavakkal és kifejezésekkel az alapértelmezett Amazon Transcribe modell betanításához. A táblázatnak tartalmaznia kell mind a négy oszlopot (Phrase, SoundsLike, IPAés DisplayAs), de a Phrase oszlop az egyetlen, amelynek minden sorban tartalmaznia kell egy bejegyzést. A többi oszlopot üresen hagyhatja. Minden oszlopot tabulátor karakterrel kell elválasztani, még akkor is, ha egyes oszlopok üresek. Például, ha elhagyja a IPA és a SoundsLike soronként üres oszlopok, a Phrase és a DisplaysAs az adott sorban lévő oszlopokat három tabulátor karakterrel kell elválasztani (között Phrase és a IPA, IPA és a SoundsLikeés SoundsLike és a DisplaysAs).

A modell egyéni szókinccsel való betanításához hajtsa végre a következő lépéseket:

  1. Hozzon létre egy nevű fájlt HindiCustomVocabulary.txt a következő tartalommal.
    Az IPA kifejezés az IPA hangos kijelzőjei गोलकुंड-फो फो स र स-ल स ल जंग च च च च मिन मिन मिन र र र र र ल ल ल ल ल ल ल ल ल ल

    Csak olyan karaktereket használhat, amelyeket az Ön nyelve támogat. Nézze meg a saját nyelvét karakterkészlet a részletekért.

    Az oszlopok a következő információkat tartalmazzák:

    1. Phrase – Tartalmazza a pontosan átírni kívánt szavakat vagy kifejezéseket. Ebben az oszlopban jelennek meg az alapértelmezett Amazon Transcribe modell által létrehozott átirat kiemelt szavai vagy kifejezései. Ezek a szavak általában mozaikszavak, tulajdonnevek vagy tartományspecifikus szavak és kifejezések, amelyeket az alapértelmezett modell nem ismer. Ez egy kötelező mező az egyéni szókincs táblázat minden sorában. Átiratunkban a „गोलकुंडा फोर (Golcunda Four)” 4. mondatának javításához használja a „गोलकुंडा-फोर” (Golcunda) c. Ha a bejegyzés több szót tartalmaz, válassza el az egyes szavakat kötőjellel (-); ne használjon szóközt.
    2. IPA – Tartalmazza a beszédhangokat képviselő szavakat vagy kifejezéseket írott formában. Az oszlop nem kötelező; sorait üresen hagyhatja. Ez az oszlop csak a Nemzetközi Fonetikus ABC (IPA) karaktereit használó fonetikus írásmódokhoz készült. Tekintse meg a Hindi karakterkészletet a hindi nyelvben engedélyezett IPA-karakterekkel kapcsolatban. Példánkban nem használunk IPA-t. Ha van bejegyzése ebben az oszlopban, az Ön SoundsLike oszlopnak üresnek kell lennie.
    3. SoundsLike – Kisebb darabokra bontott szavakat vagy kifejezéseket tartalmaz (általában szótagok vagy gyakori szavak alapján), hogy minden egyes darabhoz kiejtést biztosítson a darab hangzása alapján. Ez az oszlop nem kötelező; üresen hagyhatja a sorokat. Csak akkor adjon hozzá tartalmat ehhez az oszlophoz, ha a bejegyzés nem szabványos szót, például márkanevet tartalmaz, vagy ha egy hibásan átírt szót szeretne javítani. Átiratunkban a 4. mondat „सलार जंग (Salar Jung)” kijavításához használja a „सा-लार-जंग (Saa-lar-jung)” kifejezést ebben az oszlopban. Ne használjon szóközt ebben az oszlopban. Ha van bejegyzése ebben az oszlopban, az Ön IPA oszlopnak üresnek kell lennie.
    4. DisplaysAs – Olyan szavakat vagy kifejezéseket tartalmaz, amelyek helyesírása a szövegben szereplő szavak vagy kifejezések átírási kimenetében látható. Phrase terület. Ez az oszlop nem kötelező; üresen hagyhatja a sorokat. Ha nem adja meg ezt a mezőt, az Amazon Transcribe a fájl tartalmát használja Phrase mezőt a kimeneti fájlban. Például az átiratunkban a „गोलकुंडा फोर (Golcunda Four)” 4. mondatból való kijavításához használja a „गोलकोंडा फो
  2. Feltöltés a szöveges fájl (HindiCustomVocabulary.txt) egy S3 vödörbe.Most létrehozunk egy egyéni szókincset az Amazon Transcribe-ban.
  3. Az Amazon Transcribe konzolon válassza a lehetőséget Egyedi szókincs a navigációs ablaktáblában.
  4. A Név, írjon be egy nevet.
  5. A Nyelv, választ hindi, IN (hi-IN).
  6. A Szókincs beviteli forrásaválassza S3 hely.
  7. A A szókincsfájl helye az S3-on, adja meg az S3 útvonalat a HindiCustomVocabulary.txt fájlt.
  8. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Szókincs létrehozása. Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai.
  9. Átírni a SampleAudio.wav fájl az egyéni szókinccsel, a következő paraméterekkel:
    1. A Munka megnevezés , belép SampleAudioCustomVocabulary.
    2. A Nyelv, választ hindi, IN (hi-IN).
    3. A Adja meg a fájl helyét az S3-on, tallózzon a helyére SampleAudio.wav.
    4. A IAM szerepkörválassza Használjon meglévő IAM-szerepet és válassza ki a korábban létrehozott szerepet.
    5. A Munka konfigurálása válasszon Egyedi szókincs és válassza ki az egyéni szókincset HindiCustomVocabulary.
  10. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Állás létrehozása.

Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai.

Mérje meg a modell pontosságát egyéni szókincs használata után

Másolja át az átiratot az Amazon Transcribe feladat részleteit tartalmazó oldalról egy nevű szövegfájlba hypothesis-custom-vocabulary.txt:

Vevő : हेलो,

Ügynök : गुड मोर्निग इंडिया ट्रेवल एजेंसॹ।से। ल ब क हूँ किस त से मैं आपकी यत क सकती हूँ।।।।।।।।।।।।।

Vevő : मैं दिनों उनसे हैद ट ट के ब में सोच ह थ।। क्या आप मुझे कुछ अच्छे लोकेशन केशन के ईंेतरे बार

Ügynök : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियंोरियम

Vevő : ह बढिय थैंक यू अगले अगले सैट औ संडे को ई ई।।

Ügynök : एक सजेशन वीकेंड में ट्रैफिक ज्यिक ज्याा

Vevő : सिरियसली एनी टिप्स चिकन शेर

Ügynök : आप यूस क लो ड औ प क प लम नहीं नहीं होग।।

Vevő : ग्रेट आइडिया थैंक्यू सो मच।

Vegye figyelembe, hogy a kiemelt szavakat a program tetszés szerint átírja.

Futtassa a wer parancsot újra az új átirattal:

wer -i reference.txt hypothesis-custom-vocabulary.txt

A következő kimenetet kapod:

REF: customer : हेलो,

HYP: customer : हेलो,

SENTENCE 1

Correct = 100.0% 3 ( 3)

Errors = 0.0% 0 ( 3)

REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

SENTENCE 2

Correct = 84.0% 21 ( 25)

Errors = 16.0% 4 ( 25)

REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

SENTENCE 3

Correct = 96.0% 24 ( 25)

Errors = 8.0% 2 ( 25)

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

SENTENCE 5

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

SENTENCE 6

Correct = 100.0% 12 ( 12)

Errors = 0.0% 0 ( 12)

REF: customer : सिरियसली एनी टिप्स यू केन शेर

HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर

SENTENCE 7

Correct = 75.0% 6 ( 8)

Errors = 25.0% 2 ( 8)

REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

HYP: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

SENTENCE 8

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: customer : ग्रेट आइडिया थैंक्यू सो मच।

HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।

SENTENCE 9

Correct = 100.0% 7 ( 7)

Errors = 0.0% 0 ( 7)

Sentence count: 9

WER: 6.061% ( 8 / 132)

WRR: 94.697% ( 125 / 132)

SER: 33.333% ( 3 / 9)

Észrevételek az egyéni szókinccsel készített átiratból

A teljes WER 6.061%, ami azt jelenti, hogy a szavak 93.939%-a van pontosan átírva.

Hasonlítsuk össze a 4. mondat wer kimenetét egyéni szókinccsel és anélkül. Az alábbiak nem egyedi szókincsek:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 83.3% 20 ( 24)

Errors = 16.7% 4 ( 24)

A következő egyéni szókincs:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

A 4. mondatban nincsenek hibák. A helyek neveit a rendszer pontosan írja át az egyéni szókincs segítségével, ezáltal a teljes WER 9.848%-ról 6.061%-ra csökken ennél a hangfájlnál. Ez azt jelenti, hogy a transzkripció pontossága közel 4%-kal javult.

Hogyan javította az egyéni szókincs a pontosságot

A következő egyéni szókincset használtuk:

Phrase IPA SoundsLike DisplayAs

गोलकुंडा-फोर गोलकोंडा फोर्ट

सालार-जंग सा-लार-जंग सालार जंग

चार-महीना चार मिनार

Az Amazon Transcribe ellenőrzi, hogy vannak-e olyan szavak az audiofájlban, amelyek a következőben említett szavakhoz hasonlóak Phrase oszlop. Ezután a modell használja a bejegyzéseket IPA, SoundsLikeés DisplaysAs oszlopokat az adott szavakhoz, amelyeket a kívánt írásmóddal kell átírni.

Ezzel az egyéni szókinccsel, amikor az Amazon Transcribe olyan szót azonosít, amely így hangzik: „गोलकुंडा-फोर (Golcunda-Négy),”, akkor ezt a szót a következőképpen írja át: „गोलकऋं”ोलकऋं

ajánlások

Az átírás pontossága olyan paraméterektől is függ, mint a hangszórók kiejtése, az átfedő hangszórók, a beszédsebesség és a háttérzaj. Ezért azt javasoljuk, hogy kövesse a folyamatot különféle hívásokkal (különböző ügyfelekkel, ügynökökkel, megszakításokkal stb.), amelyek lefedik a leggyakrabban használt tartományspecifikus szavakat, hogy átfogó egyéni szókincset hozzon létre.

Ebben a bejegyzésben megtanultuk azt a folyamatot, amellyel javítható egy hanghívás egyéni szókincs használatával történő átírásának pontossága. Naponta több ezer kapcsolattartó központ hívásfelvételének feldolgozásához használhatja hívás utáni elemzés, egy teljesen automatizált, méretezhető és költséghatékony, végpontok közötti megoldás, amely a nehéz emelés nagy részét megoldja. Egyszerűen feltöltheti hangfájljait egy S3 tárolóba, és a megoldás perceken belül olyan híváselemzést biztosít, mint a hangulat egy webes felhasználói felületen. A hívás utáni elemzés gyakorlati betekintést nyújt a feltörekvő trendek észleléséhez, az ügynöki coaching lehetőségek azonosításához és a hívások általános hangulatának felméréséhez. A hívás utáni elemzés egy nyílt forráskódú megoldás segítségével telepítheti AWS felhőképződés.

Vegye figyelembe, hogy az egyéni szótárak nem használják a szövegkörnyezetet, amelyben a szavak elhangzottak, csak az Ön által megadott egyes szavakra összpontosítanak. A pontosság további javítása érdekében használhatja egyedi nyelvi modellek. Az egyéni szótáraktól eltérően, amelyek a kiejtést a helyesírással társítják, az egyéni nyelvi modellek megtanulják az adott szóhoz társított szövegkörnyezetet. Ez magában foglalja a szó használatának módját és idejét, valamint azt, hogy egy szó milyen kapcsolatban áll más szavakkal. Egyéni nyelvi modell létrehozásához használhatja az általunk tanult folyamatból származó átírásokat különféle hívásokhoz, és kombinálhatja azokat webhelyeinek vagy felhasználói kézikönyveinek tartalmaival, amelyek domain-specifikus szavakat és kifejezéseket tartalmaznak.

A legnagyobb átírási pontosság elérése érdekében a kötegelt átírással egyéni szókincseket használhat egyéni nyelvi modelljeivel együtt.

Következtetés

Ebben a bejegyzésben részletes lépéseket mutattunk be az angol szavakat tartalmazó hindi hangfájlok pontos feldolgozásához az Amazon Transcribe híváselemzése és egyéni szókincsei segítségével. Ugyanezeket a lépéseket használhatja bármely hanghívás feldolgozásához támogatott nyelv az Amazon Transcribe által.

Miután a kívánt pontossággal levezette az átiratokat, az ügynökök képzésével javíthatja az ügynök-ügyfél beszélgetéseket. Megértheti vásárlói érzéseit és trendjeit is. A híváselemzésben a beszélőnaplózás, a hangerő-észlelés és a szókincsszűrés funkciói segítségével megállapíthatja, hogy az ügynök vagy az ügyfél emelte-e fel a hangot, vagy mondott-e konkrét szavakat. A hívásokat domain-specifikus szavak alapján kategorizálhatja, hasznos betekintést nyerhet, és elemzéseket futtathat termékei fejlesztése érdekében. Végül lefordíthatja átiratait angolra vagy más támogatott nyelvekre Amazon Translate.


A szerzőkről

Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai. Sarat Guttikonda az AWS World Wide Public Sector Sr. Solutions Architect-je. Sarat szívesen segít ügyfeleinek felhő-erőforrásaik automatizálásában, kezelésében és szabályozásában anélkül, hogy az üzleti agilitást feláldozná. Szabadidejében szeret legókat építeni fiával és asztaliteniszezni.

Javítsa az ügyfél-ügynök hívások átírási pontosságát az Amazon Transcribe PlatoBlockchain Data Intelligence egyéni szókincsével. Függőleges keresés. Ai.Lavanya Sood az AWS World Wide Public Sector Solutions Architect-je Újdelhiben, Indiában. Lavanya élvezi az új technológiák elsajátítását, és segít az ügyfeleknek a felhőbe való bevezetésük során. Szabadidejében szeret utazni és különféle ételeket kipróbálni.

Időbélyeg:

Még több AWS gépi tanulás