AI Baru Microsoft Dapat Mengkloning Suara Anda Hanya Dalam 3 Detik

Diterbitkan Ulang Oleh Plato

Followers: 0

AI Baru Microsoft Dapat Mengkloning Suara Anda Hanya dalam 3 Detik PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

AI digunakan untuk menghasilkan segala sesuatu dari gambar untuk teks untuk protein buatan, dan sekarang hal lain telah ditambahkan ke daftar: ucapan. Pekan lalu peneliti dari Microsoft merilis sebuah makalah pada AI baru yang disebut VALL-E yang dapat secara akurat mensimulasikan suara siapa pun berdasarkan sampel yang hanya berdurasi tiga detik. VALL-E bukanlah simulator ucapan pertama yang dibuat, tetapi dibuat dengan cara yang berbeda dari pendahulunya—dan dapat membawa risiko lebih besar untuk potensi penyalahgunaan.

Sebagian besar model text-to-speech yang ada menggunakan bentuk gelombang (representasi grafis dari gelombang suara saat bergerak melalui media dari waktu ke waktu) untuk membuat suara palsu, mengutak-atik karakteristik seperti nada atau nada untuk mendekati suara yang diberikan. Namun, VALL-E mengambil sampel suara seseorang dan memecahnya menjadi komponen yang disebut token, lalu menggunakan token tersebut untuk membuat suara baru berdasarkan "aturan" yang telah dipelajarinya tentang suara ini. Jika suaranya sangat dalam, atau pembicara melafalkan A mereka dengan cara yang sengau, atau lebih monoton daripada rata-rata, ini semua adalah ciri-ciri yang akan diambil AI dan dapat ditiru.

Model ini didasarkan pada teknologi yang disebut Encodec oleh Meta, yang baru saja dirilis bagian Oktober ini. Alat ini menggunakan sistem tiga bagian untuk memampatkan audio hingga 10 kali lebih kecil dari MP3 tanpa kehilangan kualitas; penciptanya dimaksudkan untuk salah satu kegunaannya untuk meningkatkan kualitas suara dan musik pada panggilan yang dilakukan melalui koneksi bandwidth rendah.

Untuk melatih VALL-E, pembuatnya menggunakan pustaka audio bernama LibraLight, yang 60,000 jam pidato bahasa Inggrisnya sebagian besar terdiri dari narasi buku audio. Model menghasilkan hasil terbaiknya ketika suara yang disintesis mirip dengan salah satu suara dari pustaka pelatihan (yang jumlahnya lebih dari 7,000, jadi urutannya tidak boleh terlalu tinggi).

Selain membuat ulang suara seseorang, VALL-E juga menyimulasikan lingkungan audio dari sampel tiga detik. Klip yang direkam melalui telepon akan terdengar berbeda dari yang dibuat secara langsung, dan jika Anda berjalan atau mengemudi sambil berbicara, akustik unik dari skenario tersebut diperhitungkan.

Beberapa sampel terdengar cukup realistis, sementara yang lain masih sangat jelas dihasilkan oleh komputer. Tapi ada perbedaan mencolok antara suara-suara itu; Anda dapat mengetahui bahwa itu didasarkan pada orang-orang yang memiliki gaya bicara, nada, dan pola intonasi yang berbeda.

Tim yang menciptakan VALL-E tahu bahwa VALL-E dapat dengan mudah digunakan oleh aktor jahat; dari memalsukan suara politisi atau selebritas hingga menggunakan suara yang sudah dikenal untuk meminta uang atau informasi melalui telepon, ada banyak cara untuk memanfaatkan teknologi ini. Mereka dengan bijak menahan diri untuk tidak membuat kode VALL-E tersedia untuk umum, dan menyertakan pernyataan etika di akhir makalah mereka (yang tidak akan berbuat banyak untuk mencegah siapa pun yang ingin menggunakan AI untuk tujuan jahat).

Mungkin hanya masalah waktu sebelum alat serupa muncul dan jatuh ke tangan yang salah. Para peneliti menyarankan risiko yang akan dihadirkan oleh model seperti VALL-E dapat dikurangi dengan membangun model deteksi untuk mengukur apakah klip audio itu nyata atau disintesis. Jika kita membutuhkan AI untuk melindungi kita dari AI, bagaimana cara mengetahui apakah teknologi ini memiliki dampak positif? Waktu akan berbicara.

Gambar Kredit: Shutterstock.com/tancha

Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
Platoblockchain. Intelijen Metaverse Web3. Pengetahuan Diperkuat. Akses Di Sini.
Sumber: https://singularityhub.com/2023/01/12/microsofts-new-ai-can-clone-your-voice-in-just-3-seconds/

Stempel Waktu: Januari 12, 2023

Stempel Waktu: Februari 17, 2024

AI Baru Microsoft Dapat Mengkloning Suara Anda Hanya Dalam 3 Detik

Diterbitkan Ulang Oleh Plato

Lebih dari Hub Singularity

Mengukur Helium di Galaksi Jauh Dapat Memberi Fisikawan Wawasan Tentang Mengapa Alam Semesta Ada

Blok Bangunan Kehidupan Mungkin Telah Terbentuk dalam Semburan Laut Primordial

Konflik Ukraina Membuat Dunia Menjalankan Energi Terbarukan, Laporan IEA Mengatakan

Pengeditan Gen CRISPR Mengalami Tahun Terobosan—dan Ini Baru Permulaan

Bagaimana Mempelajari Perasaan Hewan Dapat Membantu Memecahkan Teka-Teki Etis AI Hidup

Menembakkan Debu Bulan ke Luar Angkasa sebagai 'Tabir Surya' untuk Bumi Dapat Membantu Menghentikan Perubahan Iklim

Mobil Tanpa Pengemudi Waymo Menghantam Jalan Raya Tanpa Keselamatan Pengemudi di Arizona

AI Ini Dapat Merancang Protein Kompleks yang Disesuaikan dengan Sempurna untuk Kebutuhan Kita

Startup yang Didukung Gerbang Ini Membangun Rumah Modular dari Panel Hemat Energi

AI Baru NVIDIA yang Kecil Mengubah Foto Menjadi Pemandangan 3D Penuh Hanya dalam Beberapa Detik

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun