AI-d kasutatakse kõige loomiseks pildid et tekst et kunstlikud valgud, ja nüüd on nimekirja lisatud veel üks asi: kõne. Eelmisel nädalal uurijad alates Microsoft avaldas paberi uuel AI-l nimega VALL-E, mis suudab täpselt simuleerida igaühe häält vaid kolme sekundi pikkuse näidise põhjal. VALL-E ei ole esimene kõnesimulaator, mis loodi, kuid see on ehitatud teisiti kui tema eelkäijad – ja sellega võib kaasneda suurem oht võimalikuks väärkasutuseks.
Enamik olemasolevaid kõneks muutmise mudeleid kasutavad võltshäälte loomiseks lainekujusid (helilainete graafilisi esitusi, kui need liiguvad aja jooksul läbi meediumi), kohandades omadusi, nagu toon või helikõrgus, et ligikaudselt hinnata antud häält. VALL-E aga võtab kellegi hääleproovi ja jagab selle komponentideks, mida nimetatakse märkideks, ning seejärel kasutab neid märke uute helide loomiseks reeglite alusel, mida ta selle hääle kohta juba õppinud on. Kui hääl on eriti sügav või kui kõneleja hääldab oma A-d nasaalselt või kui nad on keskmisest monotoonsemad, siis need on kõik tunnused, mida tehisintellekt märkab ja suudab korrata.
Mudel põhineb tehnoloogial nn EnCodec by Meta, mis ilmus just selle osa oktoobris. Tööriist kasutab kolmeosalist süsteemi, et tihendada heli 10 korda väiksemaks kui MP3-d, ilma et kvaliteet väheneks; selle loojad olid selle üheks kasutusotstarbeks mõeldud väikese ribalaiusega ühenduste kaudu tehtud kõnede hääle ja muusika kvaliteedi parandamiseks.
VALL-E koolitamiseks kasutasid selle loojad audioraamatukogu nimega LibriLight, mille 60,000 7,000 tundi ingliskeelset kõnet koosneb peamiselt audioraamatu jutustusest. Mudel annab parima tulemuse, kui sünteesitav hääl on sarnane ühele koolitusteeki häälele (mida on üle XNUMX, nii et see ei tohiks olla liiga kõrge).
Lisaks kellegi hääle taasloomisele simuleerib VALL-E ka helikeskkonda kolmesekundilisest proovist. Telefoni teel salvestatud klipp kõlaks teisiti kui isiklikult tehtud klipp ja kui kõnnite või sõidate rääkimise ajal, võetakse arvesse nende stsenaariumide ainulaadset akustikat.
Mõned proovid kõlavad üsna realistlikult, samas kui teised on ikka väga ilmselgelt arvuti loodud. Kuid häälte vahel on märgatavaid erinevusi; võite öelda, et need põhinevad inimestel, kellel on erinevad kõnestiilid, helikõrgused ja intonatsioonimustrid.
VALL-E loonud meeskond teab, et halvad näitlejad võivad seda väga lihtsalt ära kasutada; Alates poliitikute või kuulsuste teesklemisest kuni tuttavate häälte kasutamiseni raha või teabe küsimiseks telefoni teel – on tehnoloogia ärakasutamiseks lugematul hulgal võimalusi. Nad on targalt hoidunud VALL-E koodi avalikult kättesaadavaks tegemisest ja lisasid oma paberi lõppu eetikaavalduse (mis ei aita palju ära hoida kedagi, kes soovib AI-d pahatahtlikel eesmärkidel kasutada).
Tõenäoliselt on vaid aja küsimus, millal sarnased tööriistad kerkivad ja valedesse kätesse satuvad. Teadlased viitavad sellele, et selliste mudelite nagu VALL-E riske saab leevendada tuvastusmudelite loomisega, et hinnata, kas heliklipid on tõelised või sünteesitud. Kui vajame AI-d, et meid AI eest kaitsta, siis kuidas teada saada, kas neil tehnoloogiatel on positiivne mõju? Aeg näitab.
Image Credit: Shutterstock.com/Tancha
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. Juurdepääs siia.
- Allikas: https://singularityhub.com/2023/01/12/microsofts-new-ai-can-clone-your-voice-in-just-3-seconds/
- 000
- 10
- 7
- a
- Võimalik
- MEIST
- konto
- täpselt
- lisatud
- ADEelis
- AI
- Materjal: BPA ja flataatide vaba plastik
- juba
- ja
- Teine
- keegi
- heli-
- saadaval
- keskmine
- Halb
- põhineb
- enne
- on
- BEST
- vahel
- puruneb
- Ehitus
- ehitatud
- kutsutud
- Kutsub
- viima
- kuulsused
- omadused
- klambrid
- kood
- komponendid
- arvutiga loodud
- Side
- võiks
- looma
- loodud
- loojad
- krediit
- sügav
- Detection
- erinevused
- erinev
- alla
- sõidu
- kergesti
- Inglise
- keskkond
- eetika
- kõik
- olemasolevate
- õiglaselt
- võlts
- Langema
- tuttav
- esimene
- Alates
- tekitama
- GitHub
- antud
- suurem
- Käed
- võttes
- Lahtiolekuajad
- Kuidas
- HTTPS
- mõju
- Paranemist
- in
- lisatud
- info
- IT
- Teadma
- viimane
- õppinud
- Raamatukogu
- Tõenäoliselt
- nimekiri
- Pikk
- kaotus
- tehtud
- Tegemine
- küsimus
- keskmine
- mudel
- mudelid
- raha
- rohkem
- liikuma
- muusika
- Vajadus
- neto
- Uus
- oktoober
- ONE
- et
- teised
- Paber
- osa
- eriti
- mustrid
- Inimesed
- inimene
- telefon
- valima
- Pigi
- pigi
- Platon
- Platoni andmete intelligentsus
- PlatoData
- Poliitikud
- positiivne
- potentsiaal
- esitada
- eelkõige
- kaitsma
- avalikult
- eesmärkidel
- kvaliteet
- reaalne
- realistlik
- dokumenteeritud
- vabastatud
- taotleda
- Teadlased
- Tulemused
- Oht
- riskide
- stsenaariumid
- sekundit
- Shutterstock
- sarnane
- simulaator
- väiksem
- So
- heli
- Kõneleja
- rääkimine
- kõne
- kevad
- väljavõte
- Veel
- süsteem
- Võtma
- võtab
- rääkimine
- meeskond
- Tehnoloogiad
- Tehnoloogia
- Tekst kõneks
- .
- oma
- asi
- kolm
- Läbi
- aeg
- korda
- et
- märgid
- TONE
- liiga
- tööriist
- töövahendid
- Rong
- koolitus
- tutistamine
- ainulaadne
- us
- kasutama
- Hääl
- HÄÄLED
- jalutamine
- lained
- kuidas
- nädal
- kas
- mis
- kuigi
- WHO
- will
- oleks
- Vale
- valed käed
- saagikus
- sa
- Sinu
- sephyrnet