Amazon Polly je besedilo v govor storitev, ki uporablja napredne tehnologije globokega učenja za sintezo naravno zvenečega človeškega govora. Uporablja se v različnih primerih uporabe, kot so sistemi kontaktnih centrov, zagotavljanje pogovornih uporabniških izkušenj s človeškimi glasovi za avtomatizirano preverjanje statusa v realnem času, avtomatizirane poizvedbe o računih in obračunih ter tiskovne agencije, kot je The Washington Post omogočiti bralcem poslušanje novic.
Od danes ponuja Amazon Polly več kot 60 glasov v več kot 30 jezikovnih različicah. Amazon Polly uporablja tudi kontekst za različno izgovorjavo določenih besed glede na glagolski čas in druge kontekstualne informacije. Na primer, "brati" v "prebral sem knjigo" (sedanjik) in "prebral bom knjigo" (prihodnji čas) se izgovori drugače.
Vendar boste v nekaterih situacijah morda želeli prilagoditi način, kako Amazon Polly izgovori besedo. Na primer, morda boste morali uskladiti izgovorjavo z lokalnim narečjem ali ljudskim jezikom. Imena stvari (npr. Paradižnik se lahko izgovori kot tom-ah-to or Tom-ay-to), ljudje, ulice ali kraji se pogosto izgovarjajo na različne načine.
V tej objavi prikazujemo, kako lahko uporabite leksikone za ustvarjanje izgovorjave po meri. Leksikone lahko uporabite za primere uporabe, kot so založništvo, izobraževanje ali klicni centri.
Prilagodite izgovorjavo z uporabo oznake SSML
Recimo, da pretakate priljubljen podcast iz Avstralije in uporabite glas Amazon Polly Australian English (Olivia), da svoj scenarij pretvorite v človeški govor. V enem od svojih skriptov želite uporabiti besede, ki jih glas Amazon Polly ne pozna. Na primer, želite svojim poslušalcem na Novi Zelandiji čestitati Mātariki (maorsko novo leto). Za takšne scenarije Amazon Polly podpira fonetično izgovorjavo, s katero lahko dosežete izgovorjavo, ki je blizu pravilni izgovorjavi v tujem jeziku.
Lahko uporabite Označevalni jezik za sintezo govora (SSML), ki predlaga fonetično izgovorjavo v atributu ph. Naj vam pokažem, kako lahko uporabite Oznaka SSML.
Najprej se prijavite v svoj AWS konzola in poiščite Amazon Polly v iskalni vrstici na vrhu. Izberite Amazon Polly in nato gumb Poskusi Polly.
V konzoli Amazon Polly izberite avstralsko angleščino s spustnega menija za jezik in vnesite naslednje besedilo v besedilno polje Input in nato kliknite Poslušaj, da preizkusite izgovorjavo.
Vsem vam želim zelo srečen Mātariki.
Primer govora brez uporabe fonetičnega izgovora:
Če slišite zgornji vzorec govora, lahko opazite, da je izgovorjava Mātariki – beseda, ki ni del avstralske angleščine – ni čisto na mestu. Zdaj pa poglejmo, kako lahko v takšnih scenarijih uporabimo fonetično izgovorjavo z uporabo Oznaka SSML za prilagoditev govora, ki ga ustvari Amazon Polly.
Če želite uporabljati oznake SSML, VKLOPITE možnost SSML v konzoli Amazon Polly. Nato kopirajte in prilepite naslednji skript SSML, ki vsebuje fonetično izgovorjavo za Mātariki naveden znotraj atributa ph oznaka.
Z oznaka, Amazon Polly uporablja izgovorjavo, določeno z atributom ph, namesto standardne izgovorjave, ki je privzeto povezana z jezikom, ki ga uporablja izbrani glas.
Vzorec govora po uporabi fonetične izgovorjave:
Če slišite vzorčni zvok, boste opazili, da smo se odločili za drugačno izgovorjavo nekaterih samoglasnikov (npr. ā), da bi Amazon Polly sintetiziral zvoke, ki so bližje pravilni izgovorjavi. Morda imate vprašanje, kako ustvarim fonetični prepis "mA:.tA:.ri.ki” za besedo Mātariki?
Fonetične transkripcije lahko ustvarite s sklicevanjem na Tabele fonem in Viseme za podprte jezike. V zgornjem primeru smo uporabili fonemi za avstralsko angleščino.
Amazon Polly ponuja podporo v dveh fonetičnih abecedah: IPA in X-Sampa. Prednost X-Sampa je, da so standardni znaki ASCII, zato je fonetični prepis lažje vnesti z običajno tipkovnico. Za ustvarjanje svojih transkripcij lahko uporabite IPA ali X-Sampa, vendar pazite, da ostanete dosledni pri svoji izbiri, zlasti ko uporabljate datoteko z leksikonom, ki jo bomo obravnavali v naslednjem razdelku.
Vsak fonem v tabeli fonemov predstavlja govorni zvok. Odebeljene črke v "Primer" stolpec tabele Phoneme/Viseme na zgornji povezavi v avstralski angleščini predstavlja del besede, ki mu ustreza »Phoneme«. Na primer, fonem /j/ predstavlja zvok, ki ga avstralski govorec angleščine izda, ko izgovori črko »y« v »yes«.
Prilagodite izgovorjavo z uporabo leksikonov
Oznake fonemov so primerne za enkratne situacije za prilagoditev posameznih primerov, vendar jih ni mogoče razširiti. Če obdelujete ogromno besedila, ki ga upravljajo različni uredniki in recenzenti, priporočamo uporabo leksikonov. Z uporabo leksikonov lahko dosežete doslednost pri dodajanju izgovorjave po meri in hkrati zmanjšate ročni napor pri vstavljanju oznak fonemov v skript.
Dobra praksa je, da potem, ko preizkusite izgovorjavo po meri na konzoli Amazon Polly z uporabo ustvarite knjižnico prilagojenih izgovorov z uporabo leksikoni. Ko je datoteka z leksikoni naložena, bo Amazon Polly samodejno uporabil fonetično izgovorjavo, navedeno v datoteki z leksikoni, in odstranil potrebo po ročnem zagotavljanju oznaka.
Ustvari datoteko z leksikonom
Leksikonska datoteka vsebuje preslikavo med besedami in njihovo fonetično izgovorjavo. Specifikacija leksikona izgovorjave (PLS) je priporočilo W3C za določanje interoperabilnih informacij o izgovorjavi. Sledi primer dokumenta PLS:
Prepričajte se, da uporabljate pravilno vrednost za xml:lang
polje. Uporaba en-AU
če nalagate datoteko leksikona za uporabo z glasom Amazon Polly Australian English. Za popoln seznam podprtih jezikov glejte Jeziki, ki jih podpira Amazon Polly.
Če želite določiti izgovorjavo po meri, morate dodati a element, ki je vsebnik za leksikalni vnos z enim ali več <grapheme>
element in ena ali več informacij o izgovorjavi, ki so navedene znotraj <phoneme>
element.
O <grapheme>
element vsebuje besedilo, ki opisuje pravopis od element. Uporabite lahko a <grapheme>
element, da določite besedo, katere izgovorjavo želite prilagoditi. Dodate jih lahko več <grapheme>
elemente za določitev vseh različic besed, na primer z makroni ali brez njih. The <grapheme>
element razlikuje med velikimi in malimi črkami in niz Amazon Polly med sintezo govora se ujema z besedami v vašem skriptu, ki ga pretvarjate v govor. Če najde ujemanje, uporabi element, ki opisuje, kako se izgovori za ustvarjanje fonetične transkripcije.
Vous uporaba pouvez aussi <alias>
za pogosto uporabljene okrajšave. V prejšnjem primeru leksikonske datoteke NZ se uporablja kot vzdevek za Nova Zelandija. To pomeni, da kadar koli Amazon Polly v besedilu naleti na »NZ« (z ujemajočimi se velikimi in malimi črkami), bo ti dve črki prebral kot »Nova Zelandija«.
Za več informacij o formatu datoteke leksikona glejte Specifikacija leksikona izgovorjave (PLS) različica 1.0 na spletni strani W3C.
Datoteko z leksikonom lahko shranite kot datoteko .pls ali .xml, preden jo naložite v Amazon Polly.
Naložite in uporabite datoteko leksikona
Prenesite datoteko z leksikonom v Amazon Polly po naslednjih navodilih:
- Na konzoli Amazon Polly izberite Leksikoni v podoknu za krmarjenje.
- Izberite Naloži leksikon.
- Vnesite ime za leksikon in nato izberite datoteka z leksikonom.
- Izberite datoteko za nalaganje.
- Izberite Naloži leksikon.
Če leksikon z istim imenom (ne glede na to, ali je datoteka .pls ali .xml) že obstaja, nalaganje leksikona prepiše obstoječi leksikon.
Zdaj lahko uporabite leksikon za prilagoditev izgovorjave.
- Izberite Besedilo v govor v podoknu za krmarjenje.
- Razširi Dodatne nastavitve.
- Vklopite Prilagodite izgovorjavo.
- V spustnem meniju izberite leksikon.
Lahko tudi izbirate Naloži leksikon da naložite novo datoteko leksikona (ali novo različico).
Dobra praksa je, da nadzirate različico datoteke leksikona v repozitoriju izvorne kode. Ohranjanje izgovorjave po meri v datoteki leksikona zagotavlja, da se lahko dosledno sklicujete na fonetično izgovorjavo za določene besede v celotni organizaciji. Upoštevajte tudi omejitve leksikona izgovorjave, ki so omenjene Kvote v Amazon Polly stran.
Preizkusite izgovorjavo po uporabi leksikona
Izvedimo hiter preizkus z uporabo »Vsem mojim poslušalcem na Novi Zelandiji želim zelo srečen Mātariki« kot vhodno besedilo.
Zvočne datoteke lahko primerjamo pred in po uporabi leksikona.
Pred uporabo leksikona:
Po uporabi leksikona:
zaključek
V tej objavi smo razpravljali o tem, kako lahko prilagodite izgovorjavo pogosto uporabljenih akronimov ali besed, ki jih v izbranem jeziku v Amazon Polly ni mogoče najti. Lahko uporabiš Oznaka SSML, ki je odlična za vstavljanje enkratnih prilagoditev ali namene testiranja. Priporočamo uporabo leksikona za ustvarjanje doslednega nabora izgovorov za pogosto uporabljene besede v vaši organizaciji. To vašim piscem vsebine omogoča, da porabijo čas za pisanje namesto za dolgočasno nalogo ponavljajočega se dodajanja fonetičnih izgovorov v skript. To lahko preizkusite v svojem računu AWS na konzoli Amazon Polly.
Povzetek virov
O avtorjih
Ratan Kumar je arhitekt rešitev s sedežem v Aucklandu na Novi Zelandiji. Sodeluje z velikimi podjetniškimi strankami in jim pomaga oblikovati in zgraditi varne, stroškovno učinkovite in zanesljive internetne aplikacije z uporabo oblaka AWS. Navdušen je nad tehnologijo in rad deli znanje prek objav v blogih in sej twitcha.
Maciek Tegi je glavni avdio oblikovalec in produktni vodja za Polly Brand Voices. Poklicno je delal v tehnološki industriji, filmih, reklamah in lokalizaciji iger. Leta 2013 je bil prvi avdio inženir, ki je bil zaposlen v ekipi Alexa Text-To-Speech. Maciek je sodeloval pri izdaji 12 glasov Alexa TTS v različnih državah, več kot 20 glasov Polly in 4 glasove zvezdnikov Alexa. Maciek je triatlonec in navdušen igralec akustične kitare.
- "
- 100
- 116
- O meni
- Račun
- Doseči
- čez
- napredno
- Alexa
- vsi
- že
- Amazon
- aplikacije
- Uporaba
- audio
- Avstralija
- avto
- Avtomatizirano
- AWS
- pred
- koristi
- zaračunavanje
- Blog
- Blog Prispevkov
- telo
- meja
- Pasovi
- blagovne znamke
- izgradnjo
- klic
- kapaciteta
- primeri
- Celebrity
- nekatere
- Izberite
- bližje
- Cloud
- Koda
- Stolpec
- Konzole
- kontakt
- Posoda
- Vsebuje
- vsebina
- nadzor
- stroškovno učinkovito
- države
- pokrov
- ustvarjajo
- Ustvarjanje
- po meri
- Stranke, ki so
- dostavo
- izkazati
- Oblikovanje
- Razvojni
- drugačen
- med
- Izobraževanje
- prizadevanje
- elementi
- odpravo
- inženir
- Angleščina
- Vnesite
- Podjetje
- zlasti
- Primer
- obstoječih
- Doživetja
- prva
- po
- tuji
- format
- je pokazala,
- Prihodnost
- igra
- ustvarjajo
- dobro
- veliko
- srečna
- pomoč
- Kako
- HTTPS
- velika
- človeškega
- Industrija
- Podatki
- vhod
- Internet
- interoperabilno
- vključeni
- IT
- vzdrževanje
- znanje
- jezik
- jeziki
- velika
- učenje
- Vzvod
- Knjižnica
- Seznam
- lokalna
- IZDELA
- upravlja
- upravitelj
- Navodilo
- ročno
- kartiranje
- Stave
- ujemanje
- pomeni
- omenjeno
- morda
- moti
- več
- filmi
- več
- Imena
- ostalo
- novo leto
- Nova Zelandija
- novice
- normalno
- Ponudbe
- Možnost
- Organizacija
- Ostalo
- del
- strastno
- ljudje
- predvajalnik
- Podcast
- Popular
- Prispevkov
- praksa
- predstaviti
- , ravnateljica
- Postopek
- Proizvedeno
- Izdelek
- strokovni
- zagotavljajo
- zagotavlja
- Založništvo
- namene
- vprašanje
- Hitro
- bralci
- v realnem času
- Priporočamo
- zmanjša
- zanesljiv
- Skladišče
- predstavljajo
- predstavlja
- razširljive
- Lestvica
- Iskalnik
- zavarovanje
- izbran
- Storitev
- sej
- nastavite
- delitev
- So
- trdna
- rešitve
- nekaj
- Izvorna koda
- Zvočniki
- specifikacija
- preživeti
- standardna
- Status
- bivanje
- tok
- podpora
- Podprti
- Podpira
- sistemi
- skupina
- tech
- tehnološka industrija
- Tehnologije
- Tehnologija
- Test
- Testiranje
- Washington Post
- skozi
- čas
- danes
- vrh
- Trzanje
- uporaba
- vrednost
- raznolikost
- različica
- Voice
- GLASOVI
- Obseg
- W3
- washington
- Spletna stran
- ali
- Wikipedia
- brez
- besede
- delal
- deluje
- pisanje
- XML
- leto