Noua IA Microsoft vă poate clona vocea în doar 3 secunde

Republicat de Platon

Urmaritori: 0

Microsoft’s New AI Can Clone Your Voice in Just 3 Seconds PlatoBlockchain Data Intelligence. Vertical Search. Ai.

AI este folosit pentru a genera totul din imagini la a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match. la proteine artificiale, iar acum un alt lucru a fost adăugat pe listă: vorbirea. Săptămâna trecută cercetători de la Microsoft a lansat o lucrare pe un nou AI numit VALL-E care poate simula cu acuratețe vocea oricui pe baza unui eșantion de doar trei secunde. VALL-E nu este primul simulator de vorbire creat, dar este construit într-un mod diferit față de predecesorii săi – și ar putea prezenta un risc mai mare pentru o potențială utilizare greșită.

Cele mai multe modele existente de text în vorbire folosesc forme de undă (reprezentări grafice ale undelor sonore pe măsură ce se deplasează printr-un mediu în timp) pentru a crea voci false, modificând caracteristici precum tonul sau înălțimea pentru a aproxima o anumită voce. VALL-E, totuși, ia o mostră din vocea cuiva și o descompune în componente numite jetoane, apoi folosește acele jetoane pentru a crea sunete noi pe baza „regulilor” pe care le-a învățat deja despre această voce. Dacă o voce este deosebit de profundă, sau un vorbitor își pronunță A într-un mod nazal, sau este mai monoton decât media, toate acestea sunt trăsături pe care AI le-ar înțelege și le-ar putea replica.

Modelul se bazează pe o tehnologie numită EnCodec de la Meta, care tocmai a fost lansat în această parte în octombrie. Instrumentul folosește un sistem din trei părți pentru a comprima audio la de 10 ori mai mic decât MP3-urile, fără pierderi de calitate; creatorii săi au vrut ca una dintre utilizările sale să fie îmbunătățirea calității vocii și a muzicii la apelurile efectuate prin conexiuni cu lățime de bandă redusă.

Pentru a antrena VALL-E, creatorii săi au folosit o bibliotecă audio numită LibriLight, ale cărui 60,000 de ore de vorbire în limba engleză sunt alcătuite în principal din narațiune de cărți audio. Modelul dă cele mai bune rezultate atunci când vocea sintetizată este similară cu una dintre vocile din biblioteca de antrenament (dintre care sunt peste 7,000, așa că nu ar trebui să fie prea înalt).

Pe lângă recrearea vocii cuiva, VALL-E simulează și mediul audio din eșantionul de trei secunde. Un clip înregistrat la telefon ar suna diferit de cel realizat personal, iar dacă mergi sau conduci în timp ce vorbești, se ia în considerare acustica unică a acestor scenarii.

Unele dintre probe sună destul de realist, în timp ce altele sunt încă foarte evident generate de computer. Dar există diferențe notabile între voci; vă puteți da seama că se bazează pe oameni care au stiluri de vorbire, tonuri și modele de intonație diferite.

Echipa care a creat VALL-E știe că ar putea fi foarte ușor folosit de actori răi; de la falsificarea sunetelor politicienilor sau celebrităților până la utilizarea vocilor familiare pentru a solicita bani sau informații prin telefon, există nenumărate modalități de a profita de tehnologie. Ei s-au abținut cu înțelepciune să facă disponibil public codul lui VALL-E și au inclus o declarație de etică la sfârșitul lucrării lor (care nu va descuraja prea mult pe oricine dorește să folosească IA în scopuri nefaste).

Este probabil doar o chestiune de timp înainte ca instrumente similare să apară și să cadă în mâinile greșite. Cercetătorii sugerează că riscurile pe care modelele precum VALL-E le vor prezenta ar putea fi atenuate prin construirea de modele de detectare pentru a evalua dacă clipurile audio sunt reale sau sintetizate. Dacă avem nevoie de AI pentru a ne proteja de AI, de unde știm dacă aceste tehnologii au un impact net pozitiv? Timpul va spune.

Credit imagine: Shutterstock.com/Tancha

Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
Platoblockchain. Web3 Metaverse Intelligence. Cunoștințe amplificate. Accesați Aici.
Sursa: https://singularityhub.com/2023/01/12/microsofts-new-ai-can-clone-your-voice-in-just-3-seconds/

Timestamp-ul: Ianuarie 12, 2023

Timestamp-ul: Februarie 17, 2024

Noua IA Microsoft vă poate clona vocea în doar 3 secunde

Republicat de Platon

Mai mult de la Singularity Hub

Măsurarea heliului în galaxii îndepărtate poate oferi fizicienilor o perspectivă asupra de ce există universul

Elementele de construcție ale vieții s-ar putea să se fi format în spray-ul de mare primordial

Conflictul din Ucraina are întreaga lume pe o funcționare a energiei regenerabile, spune raportul AIE

Editarea genelor CRISPR a avut un an revoluționar – și este abia la început

Cum ar putea studia sentimentele animalelor să rezolve puzzle-ul etic al inteligenței artificiale sensibile

Împuşcarea prafului de Lună în spaţiu ca „protecţie solară” pentru Pământ ar putea ajuta la oprirea schimbărilor climatice

Mașinile fără șofer ale lui Waymo lovesc autostrada fără șoferi de siguranță din Arizona

Această inteligență artificială poate proiecta proteine complexe perfect adaptate nevoilor noastre

Acest startup susținut de Gates construiește case modulare din panouri eficiente din punct de vedere energetic

Minuscul nou AI de la NVIDIA transformă fotografiile în scene 3D complete în doar câteva secunde

Despre noi

Căutare verticală și Ai

Platformă

Rămâneți conectat

Cont