AI este folosit pentru a genera totul din imagini la a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match. la proteine artificiale, iar acum un alt lucru a fost adăugat pe listă: vorbirea. Săptămâna trecută cercetători de la Microsoft a lansat o lucrare pe un nou AI numit VALL-E care poate simula cu acuratețe vocea oricui pe baza unui eșantion de doar trei secunde. VALL-E nu este primul simulator de vorbire creat, dar este construit într-un mod diferit față de predecesorii săi – și ar putea prezenta un risc mai mare pentru o potențială utilizare greșită.
Cele mai multe modele existente de text în vorbire folosesc forme de undă (reprezentări grafice ale undelor sonore pe măsură ce se deplasează printr-un mediu în timp) pentru a crea voci false, modificând caracteristici precum tonul sau înălțimea pentru a aproxima o anumită voce. VALL-E, totuși, ia o mostră din vocea cuiva și o descompune în componente numite jetoane, apoi folosește acele jetoane pentru a crea sunete noi pe baza „regulilor” pe care le-a învățat deja despre această voce. Dacă o voce este deosebit de profundă, sau un vorbitor își pronunță A într-un mod nazal, sau este mai monoton decât media, toate acestea sunt trăsături pe care AI le-ar înțelege și le-ar putea replica.
Modelul se bazează pe o tehnologie numită EnCodec de la Meta, care tocmai a fost lansat în această parte în octombrie. Instrumentul folosește un sistem din trei părți pentru a comprima audio la de 10 ori mai mic decât MP3-urile, fără pierderi de calitate; creatorii săi au vrut ca una dintre utilizările sale să fie îmbunătățirea calității vocii și a muzicii la apelurile efectuate prin conexiuni cu lățime de bandă redusă.
Pentru a antrena VALL-E, creatorii săi au folosit o bibliotecă audio numită LibriLight, ale cărui 60,000 de ore de vorbire în limba engleză sunt alcătuite în principal din narațiune de cărți audio. Modelul dă cele mai bune rezultate atunci când vocea sintetizată este similară cu una dintre vocile din biblioteca de antrenament (dintre care sunt peste 7,000, așa că nu ar trebui să fie prea înalt).
Pe lângă recrearea vocii cuiva, VALL-E simulează și mediul audio din eșantionul de trei secunde. Un clip înregistrat la telefon ar suna diferit de cel realizat personal, iar dacă mergi sau conduci în timp ce vorbești, se ia în considerare acustica unică a acestor scenarii.
Unele dintre probe sună destul de realist, în timp ce altele sunt încă foarte evident generate de computer. Dar există diferențe notabile între voci; vă puteți da seama că se bazează pe oameni care au stiluri de vorbire, tonuri și modele de intonație diferite.
Echipa care a creat VALL-E știe că ar putea fi foarte ușor folosit de actori răi; de la falsificarea sunetelor politicienilor sau celebrităților până la utilizarea vocilor familiare pentru a solicita bani sau informații prin telefon, există nenumărate modalități de a profita de tehnologie. Ei s-au abținut cu înțelepciune să facă disponibil public codul lui VALL-E și au inclus o declarație de etică la sfârșitul lucrării lor (care nu va descuraja prea mult pe oricine dorește să folosească IA în scopuri nefaste).
Este probabil doar o chestiune de timp înainte ca instrumente similare să apară și să cadă în mâinile greșite. Cercetătorii sugerează că riscurile pe care modelele precum VALL-E le vor prezenta ar putea fi atenuate prin construirea de modele de detectare pentru a evalua dacă clipurile audio sunt reale sau sintetizate. Dacă avem nevoie de AI pentru a ne proteja de AI, de unde știm dacă aceste tehnologii au un impact net pozitiv? Timpul va spune.
Credit imagine: Shutterstock.com/Tancha
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- Platoblockchain. Web3 Metaverse Intelligence. Cunoștințe amplificate. Accesați Aici.
- Sursa: https://singularityhub.com/2023/01/12/microsofts-new-ai-can-clone-your-voice-in-just-3-seconds/
- 000
- 10
- 7
- a
- Capabil
- Despre Noi
- Cont
- precis
- adăugat
- Avantaj
- AI
- TOATE
- deja
- și
- O alta
- oricine
- audio
- disponibil
- in medie
- Rău
- bazat
- înainte
- fiind
- CEL MAI BUN
- între
- pauze
- Clădire
- construit
- denumit
- apeluri
- transporta
- celebritati
- Caracteristici
- clipuri
- cod
- componente
- generat de computer
- Conexiuni
- ar putea
- crea
- a creat
- Creatorii
- credit
- adânc
- Detectare
- diferenţele
- diferit
- jos
- conducere
- cu ușurință
- Engleză
- Mediu inconjurator
- etică
- tot
- existent
- destul de
- fals
- Cădea
- familiar
- First
- din
- genera
- GitHub
- dat
- mai mare
- mâini
- având în
- ORE
- Cum
- HTTPS
- Impactul
- îmbunătățirea
- in
- inclus
- informații
- IT
- Cunoaște
- Nume
- învățat
- Bibliotecă
- Probabil
- Listă
- Lung
- de pe
- făcut
- Efectuarea
- materie
- mediu
- model
- Modele
- bani
- mai mult
- muta
- Muzică
- Nevoie
- net
- Nou
- octombrie
- ONE
- comandă
- Altele
- Hârtie
- parte
- în special
- modele
- oameni
- persoană
- telefon
- alege
- Smoală
- smoale
- Plato
- Informații despre date Platon
- PlatoData
- politicienii
- pozitiv
- potenţial
- prezenta
- în primul rând
- proteja
- public
- scopuri
- calitate
- real
- realist
- inregistrata
- eliberat
- solicita
- cercetători
- REZULTATE
- Risc
- Riscurile
- scenarii
- secunde
- Shutterstock
- asemănător
- Simulator
- mai mici
- So
- Suna
- Vorbitor
- vorbire
- discurs
- primăvară
- Declarație
- Încă
- sistem
- Lua
- ia
- vorbesc
- echipă
- Tehnologii
- Tehnologia
- Text-to-Speech
- lor
- lucru
- trei
- Prin
- timp
- ori
- la
- indicativele
- TONE
- de asemenea
- instrument
- Unelte
- Tren
- Pregătire
- optimizări
- unic
- us
- utilizare
- Voce
- VOCI
- mers
- valuri
- modalități de
- săptămână
- dacă
- care
- în timp ce
- OMS
- voi
- ar
- Greșit
- mâini greșite
- randamentele
- Tu
- Ta
- zephyrnet