Amazon Polly on tekst kõneks teenus, mis kasutab loomuliku kõlaga inimkõne sünteesimiseks täiustatud süvaõppetehnoloogiaid. Seda kasutatakse mitmesugustel kasutusjuhtudel, näiteks kontaktikeskuste süsteemides, pakkudes vestluskogemusi inimlike häältega automaatseks reaalajas olekukontrolliks, automaatsete konto- ja arvelduspäringute jaoks ning uudisteagentuurides, nagu The Washington Post. võimaldada lugejatel uudisteartikleid kuulata.
Tänase seisuga pakub Amazon Polly üle 60 hääle 30+ keelevariandis. Amazon Polly kasutab ka konteksti teatud sõnade erinevaks hääldamiseks verbi ajavormi ja muu kontekstuaalse teabe põhjal. Näiteks "loe" sõnades "Ma loen raamatut" (olevikus) ja "Ma loen raamatut" (tulevikus) hääldatakse erinevalt.
Mõnes olukorras võite soovida kohandada viisi, kuidas Amazon Polly sõna hääldab. Näiteks peate võib-olla sobitama häälduse kohaliku murde või rahvakeelega. Asjade nimed (nt Tomatit võib hääldada kui tom-ah-to or tom-ay-to), inimesi, tänavaid või kohti hääldatakse sageli mitmel erineval viisil.
Selles postituses näitame, kuidas saate kohandatud hääldussõnade loomiseks kasutada leksikone. Leksikone saate kasutada selliste kasutusjuhtumite jaoks nagu avaldamine, haridus või kõnekeskused.
Kohandage hääldust SSML-märgendi abil
Oletame, et voogesitate populaarset taskuhäälingusaadet Austraaliast ja kasutate Amazon Polly Australian English (Olivia) häält, et teisendada oma skript inimlikuks kõneks. Ühes oma skriptis soovite kasutada sõnu, mida Amazon Polly voice ei tea. Näiteks soovite saata oma Uus-Meremaa kuulajatele Mātariki (maoori uusaasta) tervitused. Selliste stsenaariumide puhul toetab Amazon Polly foneetilist hääldust, mille abil saate saavutada võõrkeele õigele hääldusele lähedase häälduse.
Saate kasutada Kõnesünteesi märgistuskeel (SSML) märgend, et soovitada ph-atribuudis foneetiline hääldus. Las ma näitan teile, kuidas saate seda kasutada SSML-märgend.
Esiteks logige sisse oma AWS konsool ja otsige ülaosas asuvalt otsinguribalt Amazon Polly. Valige Amazon Polly ja seejärel nupp Proovi Pollyt.
Valige Amazon Polly konsooli keele rippmenüüst Austraalia inglise keel ja sisestage järgmine tekst sisestusteksti väljale ning seejärel klõpsake häälduse testimiseks nuppu Kuula.
Soovin teile kõigile palju õnne Matariki.
Kõne näidis ilma foneetilise häälduseta:
Kui kuulete ülaltoodud näidiskõnet, võite märgata, et hääldus Matariki – sõna, mis ei kuulu Austraalia inglise keelde – ei ole päris täpne. Nüüd vaatame, kuidas sellistel juhtudel saame kasutada foneetilist hääldust kasutades SSML-märgend Amazon Polly toodetud kõne kohandamiseks.
SSML-märgendite kasutamiseks lülitage Amazon Polly konsoolis SSML-valik SISSE. Seejärel kopeerige ja kleepige järgmine SSML-skript, mis sisaldab foneetilist hääldust Matariki määratud atribuudi ph sees silt.
Koos silt, Amazon Polly kasutab ph atribuudiga määratud hääldust standardse häälduse asemel, mis on vaikimisi seotud valitud hääle kasutatava keelega.
Kõne näidis pärast foneetilise häälduse rakendamist:
Kui kuulete näidisheli, märkate, et valisime mõne täishääliku (nt ā) jaoks teistsuguse häälduse, et panna Amazon Polly sünteesima õigele hääldusele lähemal olevaid helisid. Nüüd võib teil tekkida küsimus, kuidas luua foneetiline transkriptsioon "mA:.tA:.ri.ki” sõna pärast Matariki?
Saate luua foneetilisi transkriptsioone, viidates Foneemi ja Viseme tabelid toetatud keelte jaoks. Ülaltoodud näites oleme kasutanud foneemid Austraalia inglise keeles.
Amazon Polly pakub tuge kahes foneetilises tähestikus: IPA ja X-Sampa. X-Sampa eeliseks on see, et tegemist on standardsete ASCII-märkidega, mistõttu on foneetilise transkriptsiooni tippimine tavalise klaviatuuriga lihtsam. Saate oma transkriptsioonide genereerimiseks kasutada kas IPA-d või X-Sampa, kuid veenduge, et jääksite oma valikule järjekindlaks, eriti kui kasutate leksikonifaili, mida käsitleme järgmises jaotises.
Iga foneem foneemide tabelis tähistab kõne heli. Paksus kirjas tähed "Näide" Eespool lingitud Austraalia ingliskeelse lehe foneem/viseme tabeli veerg tähistab sõna osa, millele vastab „Phoneme”. Näiteks foneem /j/ tähistab heli, mida Austraalia inglise keele kõneleja teeb, kui hääldab "y"-tähte "jah".
Kohandage hääldust leksikonide abil
Foneemisildid sobivad üksikjuhtumite kohandamiseks ühekordseteks olukordadeks, kuid need ei ole skaleeritavad. Kui töötlete tohutul hulgal teksti, mida haldavad erinevad toimetajad ja arvustajad, soovitame kasutada leksikone. Leksikonide abil saate kohandatud häälduste lisamisel saavutada järjepidevuse ja samal ajal vähendada skripti foneemimärgendite käsitsi lisamist.
Hea tava on see, et pärast kohandatud häälduse testimist Amazon Polly konsoolil, kasutades sildi abil saate luua kohandatud häälduste teegi leksikonid. Kui leksikonifail on üles laaditud, rakendab Amazon Polly automaatselt leksikonifailis määratud foneetilisi hääldusi ja kõrvaldab vajaduse käsitsi esitada silt.
Looge leksikoni fail
Leksikonifail sisaldab sõnade ja nende foneetilise häälduse vastendamist. Hääldusleksikoni spetsifikatsioon (PLS) on W3C soovitus koostalitlusvõimelise hääldusteabe täpsustamiseks. Järgmine on PLS-dokumendi näide:
Veenduge, et kasutate õiget väärtust xml:lang
valdkonnas. Kasuta en-AU
kui laadite leksikonifaili üles, et seda kasutada Amazon Polly Australian English häälega. Toetatud keelte täieliku loendi leiate aadressilt Keeled, mida toetab Amazon Polly.
Kohandatud häälduse määramiseks peate lisama a element, mis on ühe või mitme leksikaalse kirje konteiner <grapheme>
element ja üks või mitu selle sees olevat hääldusteavet <phoneme>
element.
. <grapheme>
element sisaldab teksti, mis kirjeldab õigekiri Euroopa element. Võite kasutada a <grapheme>
element, et määrata sõna, mille hääldust soovite kohandada. Saate lisada mitu <grapheme>
elemendid, et määrata kõik sõnavariatsioonid, näiteks makronitega või ilma. The <grapheme>
element on tõstutundlik ja kõnesünteesi ajal vastab Amazon Polly string sõnadele teie skriptis, mida te kõneks teisendate. Kui vaste leitakse, kasutab see element, mis kirjeldab, kuidas hääldatakse foneetilise transkriptsiooni genereerimiseks.
Vous pouvez aussi kasutamine <alias>
tavaliselt kasutatavate lühendite jaoks. Eelmises leksikonifaili näites NZ kasutatakse varjunimena Uus-Meremaa. See tähendab, et kui Amazon Polly kohtab teksti põhiosas sõna „NZ” (koos vastavate suurtähtedega), loeb ta need kaks tähte „Uus-Meremaa”.
Leksikoni failivormingu kohta lisateabe saamiseks vt Hääldusleksikoni spetsifikatsiooni (PLS) versioon 1.0 W3C veebisaidil.
Enne Amazon Pollysse üleslaadimist saate leksikonifaili salvestada .pls- või .xml-failina.
Laadige üles ja rakendage leksikoni fail
Laadige oma leksikonifail Amazon Pollysse, järgides järgmisi juhiseid.
- Amazon Polly konsoolil valige Leksikonid navigeerimispaanil.
- Vali Laadi üles leksikon.
- Sisestage leksikonile nimi ja seejärel valige leksikoni fail.
- Valige üleslaaditav fail.
- Vali Laadi üles leksikon.
Kui samanimeline leksikon (kas .pls- või .xml-fail) on juba olemas, kirjutab leksikoni üleslaadimine olemasoleva leksikoni üle.
Nüüd saate häälduse kohandamiseks kasutada leksikoni.
- Vali Tekst kõneks navigeerimispaanil.
- Laiendama Lisasätted.
- sisse lülitama Kohandage hääldust.
- Valige rippmenüüst leksikon.
Võite ka valida Laadi üles leksikon uue leksikonifaili (või uue versiooni) üleslaadimiseks.
Hea tava on leksikonifaili versioonijuhtimine lähtekoodihoidlas. Kohandatud häälduste hoidmine leksikonifailis tagab, et saate kogu organisatsioonis järjekindlalt viidata teatud sõnade foneetilisele hääldusele. Pidage meeles ka mainitud hääldusleksikoni piiranguid Kvoodid Amazon Pollys lehel.
Pärast leksikoni rakendamist kontrollige hääldust
Teeme kiirtesti, kasutades sisendtekstina "Wishing all my listeners in NZ, a very Happy Matariki".
Saame võrrelda helifaile enne ja pärast leksikoni rakendamist.
Enne leksikoni rakendamist:
Pärast leksikoni rakendamist:
Järeldus
Selles postituses arutasime, kuidas saate kohandada sageli kasutatavate akronüümide või sõnade hääldust, mida Amazon Polly valitud keeles ei leidu. Sa võid kasutada SSML-märgend, mis sobib suurepäraselt ühekordsete kohanduste sisestamiseks või testimise eesmärgil. Soovitame kasutada Lexiconit, et luua ühtne häälduskomplekt teie organisatsioonis sageli kasutatavate sõnade jaoks. See võimaldab teie sisu kirjutajatel kulutada aega kirjutamisele, selle asemel, et tüütu ülesanne lisada skripti foneetilisi hääldusi korduvalt. Saate seda proovida oma AWS-i kontol Amazon Polly konsoolil.
Ressursside kokkuvõte
Autoritest
Ratan Kumar on lahenduste arhitekt, mis asub Uus-Meremaal Aucklandis. Ta teeb koostööd suurettevõtete klientidega, aidates neil AWS-i pilve abil kavandada ja luua turvalisi, kuluefektiivseid ja usaldusväärseid Interneti-rakendusi. Ta on kirglik tehnoloogia vastu ja talle meeldib jagada teadmisi ajaveebipostituste ja twitch-seansside kaudu.
Maciek Tegi on Polly Brand Voicesi peamine helidisainer ja tootejuht. Ta on töötanud professionaalselt tehnikatööstuse, filmide, reklaamide ja mängude lokaliseerimise alal. 2013. aastal oli ta esimene heliinsener, kes palgati Alexa teksti kõneks muutmise meeskonda. Maciek osales erinevates riikides 12 Alexa TTS-hääle, enam kui 20 Polly hääle ja 4 Alexa kuulsuste hääle avaldamises. Maciek on triatleet ja innukas akustilise kitarri mängija.
- "
- 100
- 116
- MEIST
- konto
- Saavutada
- üle
- edasijõudnud
- Alexa
- Materjal: BPA ja flataatide vaba plastik
- juba
- Amazon
- rakendused
- Rakendades
- heli-
- Austraalia
- auto
- Automatiseeritud
- AWS
- enne
- kasu
- arvete
- Blogi
- Blogi postitused
- keha
- piir
- Kast
- bränd
- ehitama
- helistama
- Võimsus
- juhtudel
- Kuulsus
- kindel
- Vali
- lähemale
- Cloud
- kood
- Veerg
- konsool
- kontakt
- Konteiner
- sisaldab
- sisu
- kontrollida
- kuluefektiivne
- riikides
- cover
- looma
- loomine
- tava
- Kliendid
- edastamine
- näitama
- Disain
- arendaja
- erinev
- ajal
- Käsitöö
- jõupingutusi
- elemendid
- kõrvaldama
- insener
- Inglise
- sisene
- ettevõte
- eriti
- näide
- olemasolevate
- Kogemused
- esimene
- Järel
- välis-
- formaat
- avastatud
- tulevik
- mäng
- tekitama
- hea
- suur
- õnnelik
- aidates
- Kuidas
- HTTPS
- tohutu
- inim-
- tööstus
- info
- sisend
- Internet
- koostalitlusvõimeline
- seotud
- IT
- pidamine
- teadmised
- keel
- Keeled
- suur
- õppimine
- Finantsvõimendus
- Raamatukogu
- nimekiri
- kohalik
- TEEB
- juhitud
- juht
- käsiraamat
- käsitsi
- kaardistus
- Vastama
- sobitamine
- vahendid
- mainitud
- võib
- meeles
- rohkem
- Filmid
- mitmekordne
- nimed
- NAVIGATSIOON
- uusaasta
- Uus-Meremaa
- uudised
- normaalne
- Pakkumised
- valik
- organisatsioon
- Muu
- osa
- kirglik
- Inimesed
- mängija
- podcast
- populaarne
- Postitusi
- tava
- esitada
- Peamine
- protsess
- Toodetud
- Toode
- professionaalne
- anda
- annab
- Kirjastamine
- eesmärkidel
- küsimus
- Kiire
- lugejad
- reaalajas
- soovitama
- vähendama
- usaldusväärne
- Hoidla
- esindama
- esindab
- skaalautuvia
- Skaala
- Otsing
- kindlustama
- väljavalitud
- teenus
- istungid
- komplekt
- jagamine
- So
- tahke
- Lahendused
- mõned
- lähtekoodi
- Kõneleja
- täpsustus
- kulutama
- standard
- olek
- jääma
- oja
- toetama
- Toetatud
- Toetab
- süsteemid
- meeskond
- tech
- tehnikatööstus
- Tehnoloogiad
- Tehnoloogia
- test
- Testimine
- The Washington Post
- Läbi
- aeg
- täna
- ülemine
- Tõmblema
- kasutama
- väärtus
- sort
- versioon
- Hääl
- HÄÄLED
- maht
- W3
- Washington
- veebisait
- kas
- Wikipedia
- ilma
- sõnad
- töötas
- töötab
- kirjutamine
- XML
- aasta