Tekoälyä käytetään kaiken tuottamiseen kuvien että teksti että keinotekoisia proteiineja, ja nyt listaan on lisätty toinen asia: puhe. Viime viikolla tutkijat alkaen Microsoft julkaisi paperin uudella tekoälyllä nimeltä VALL-E, joka voi simuloida tarkasti kenen tahansa ääntä vain kolmen sekunnin mittaisen näytteen perusteella. VALL-E ei ole ensimmäinen luotu puhesimulaattori, mutta se on rakennettu eri tavalla kuin edeltäjänsä – ja siihen voi liittyä suurempi riski mahdolliselle väärinkäytölle.
Useimmat olemassa olevat tekstistä puheeksi -mallit käyttävät aaltomuotoja (ääniaaltojen graafisia esityksiä niiden liikkuessa välineessä ajan mittaan) väärennettyjen äänien luomiseen, säätämällä ominaisuuksia, kuten sävyä tai sävelkorkeutta lähemmäksi tiettyä ääntä. VALL-E kuitenkin ottaa näytteen jonkun äänestä ja jakaa sen osiksi, joita kutsutaan nimikkeiksi, ja käyttää sitten näitä tokeneita luodakseen uusia ääniä "sääntöjen" perusteella, jotka se on jo oppinut tästä äänestä. Jos ääni on erityisen syvä tai puhuja lausuu A:t nenämäisesti tai ne ovat keskimääräistä yksitoikkoisempia, nämä ovat kaikki piirteitä, jotka tekoäly havaitsee ja pystyy toistamaan.
Malli perustuu teknologiaan ns Meta EnCodec, joka julkaistiin juuri tämän osan lokakuussa. Työkalu käyttää kolmiosaista järjestelmää pakkaamaan äänen 10 kertaa pienemmäksi kuin MP3-tiedostot laadun heikkenemättä; sen tekijät tarkoittivat yhdeksi sen käyttötarkoituksista äänen ja musiikin laadun parantamista puheluissa, jotka soitetaan matalan kaistanleveyden kautta.
VALL-E:n kouluttamiseen sen luojat käyttivät äänikirjastoa nimeltä LibriLight, jonka 60,000 7,000 tuntia englanninkielistä puhetta koostuu pääasiassa äänikirjan kerronnasta. Malli tuottaa parhaat tulokset, kun syntetisoitava ääni on samanlainen kuin jokin koulutuskirjaston ääni (joita on yli XNUMX, joten ei pitäisi olla liian korkea tilaus).
Sen lisäksi, että VALL-E toistaa jonkun äänen, se myös simuloi ääniympäristöä kolmen sekunnin näytteestä. Puhelimella tallennettu leike kuulostaisi erilaiselta kuin henkilökohtaisesti tehty, ja jos kävelet tai ajat ajaessasi puhuessasi, näiden skenaarioiden ainutlaatuinen akustiikka otetaan huomioon.
Jotkut näytteet kuulostavat melko realistisilta, kun taas toiset ovat edelleen selvästi tietokoneella luotuja. Mutta äänien välillä on huomattavia eroja; voit kertoa, että ne perustuvat ihmisiin, joilla on erilaiset puhetyylit, äänenkorkeudet ja intonaatiomallit.
VALL-E:n luonut tiimi tietää, että huonot näyttelijät voivat helposti käyttää sitä; Teknologiaa voi hyödyntää lukemattomilla tavoilla aina poliitikkojen tai julkkisten teeskentelystä tuttujen äänten käyttämiseen rahan tai tiedon pyytämiseen puhelimitse. He ovat viisaasti pidättäytyneet tekemästä VALL-E:n koodia julkisesti saataville ja lisänneet eettisen lausunnon paperinsa loppuun (joka ei juurikaan estä ketään, joka haluaa käyttää tekoälyä ilkeisiin tarkoituksiin).
On todennäköisesti vain ajan kysymys, ennen kuin vastaavat työkalut nousevat esiin ja joutuvat vääriin käsiin. Tutkijat ehdottavat, että VALL-E:n kaltaisten mallien aiheuttamia riskejä voitaisiin lieventää rakentamalla tunnistusmalleja, joilla mitataan, ovatko äänileikkeet todellisia vai syntetisoituja. Jos tarvitsemme tekoälyä suojaamaan meitä tekoälyltä, mistä tiedämme, onko näillä teknologioilla nettopositiivinen vaikutus? Aika kertoo.
Kuva pistetilanne: Shutterstock.com/Tancha
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- Platoblockchain. Web3 Metaverse Intelligence. Tietoa laajennettu. Pääsy tästä.
- Lähde: https://singularityhub.com/2023/01/12/microsofts-new-ai-can-clone-your-voice-in-just-3-seconds/
- 000
- 10
- 7
- a
- pystyy
- Meistä
- Tili
- tarkasti
- lisä-
- Etu
- AI
- Kaikki
- jo
- ja
- Toinen
- joku
- audio-
- saatavissa
- keskimäärin
- Huono
- perustua
- ennen
- ovat
- PARAS
- välillä
- taukoja
- Rakentaminen
- rakennettu
- nimeltään
- Puhelut
- kuljettaa
- julkkikset
- ominaisuudet
- leikkeet
- koodi
- osat
- tietokoneella luotu
- Liitännät
- voisi
- luoda
- luotu
- luojat
- pisteitä
- syvä
- Detection
- erot
- eri
- alas
- ajo
- helposti
- Englanti
- ympäristö
- etiikka
- kaikki
- olemassa
- melko
- väärennös
- Pudota
- tuttu
- Etunimi
- alkaen
- tuottaa
- GitHub
- tietty
- suurempi
- käsissä
- ottaa
- TUNTIA
- Miten
- HTTPS
- Vaikutus
- parantaminen
- in
- mukana
- tiedot
- IT
- Tietää
- Sukunimi
- oppinut
- Kirjasto
- Todennäköisesti
- Lista
- Pitkät
- pois
- tehty
- Tekeminen
- asia
- keskikokoinen
- malli
- mallit
- raha
- lisää
- liikkua
- Musiikki
- Tarve
- netto
- Uusi
- lokakuu
- ONE
- tilata
- Muuta
- Paperi
- osa
- erityisesti
- kuviot
- Ihmiset
- henkilö
- puhelin
- poimia
- Piki
- kentillä
- Platon
- Platonin tietotieto
- PlatonData
- poliitikot
- positiivinen
- mahdollinen
- esittää
- pääasiallisesti
- suojella
- julkisesti
- tarkoituksiin
- laatu
- todellinen
- realistinen
- kirjataan
- julkaistu
- pyyntö
- Tutkijat
- tulokset
- Riski
- riskit
- skenaariot
- sekuntia
- Shutterstock
- samankaltainen
- simulaattori
- pienempiä
- So
- kuulostaa
- Kaiutin
- puhuminen
- puhe
- kevät
- Lausunto
- Yhä
- järjestelmä
- ottaa
- vie
- puhuminen
- joukkue-
- Technologies
- Elektroniikka
- Teksti puheeksi
- -
- heidän
- asia
- kolmella
- Kautta
- aika
- kertaa
- että
- tokens
- TONE
- liian
- työkalu
- työkalut
- Juna
- koulutus
- säätämistä
- unique
- us
- käyttää
- Ääni
- ÄÄNTÄ
- kävely
- aallot
- tavalla
- viikko
- onko
- joka
- vaikka
- KUKA
- tulee
- olisi
- Väärä
- väärissä käsissä
- saannot
- Voit
- Sinun
- zephyrnet