Les problèmes de droits d’auteur font obstacle à l’IA et à la musique

Les problèmes de droits d’auteur font obstacle à l’IA et à la musique

Les problèmes de droits d'auteur font obstacle à l'IA et à la musique PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Commentaires Les modèles d’IA générative sont surtout connus pour supprimer le texte et les images, bien qu’ils s’améliorent également dans le domaine de l’audio. La musique est sans doute particulièrement délicate : en tant qu’humains, nous pouvons être relativement indulgents avec les images imaginées par la machine et certaines formes d’écriture, mais peut-être pas tellement avec l’audio. Les gens peuvent être très pointilleux sur les sons qu’ils aiment écouter.

Ce n’est pas la seule difficulté à laquelle est confrontée la musique créée par l’IA : il y a aussi la loi sur le droit d’auteur, que l’intelligence artificielle en général commence à rencontrer de plus en plus dans toutes les formes de médias.

D’énormes quantités de données sont nécessaires pour entraîner ces systèmes à reproduire des modèles et des comportements courants. Les startups et les grandes technologies ont parcouru de vastes pans d’Internet, attaquant les éditeurs de presse, les forums Web, les livres, les sites de partage d’images et bien plus encore pour obtenir du contenu. Pourtant, ils sont plus prudents lorsqu’il s’agit d’utiliser la musique. Il n’est pas difficile de comprendre pourquoi.

Les maisons de disques sont farouchement contestataires. L'année dernière, un groupe d'éditeurs de musique dirigé par Universal Music Group (UMG) poursuivi AI a lancé Anthropic en octobre, l'accusant d'avoir volé des paroles. Et ce ne sont que des mots : nous savons tous ce qui se passe lorsque des échantillons, ou ce qui ressemble à des échantillons, sont utilisés dans des pistes sans autorisation. Des poursuites sont intentées et des redevances sont exigées. Si vous créez de la musique et que vous la basez sur le travail d’autres personnes, vous devez obtenir l’autorisation de ce droit d’auteur. Et nous imaginons que les créateurs d’IA qui intègrent la musique d’aujourd’hui dans leurs modèles pendant la formation devront également passer par là, d’une manière ou d’une autre.

Imaginez les problèmes que les développeurs de ML se poseront s'ils récupèrent de la musique protégée par le droit d'auteur et créent des succès en tête des charts contenant des éléments familiers, tout comme la plupart des contenus créés par l'IA peuvent être retracés jusqu'à une partie des données de formation, sans autorisation. L'IA peut désormais créer primé art, donc nous supposons que la musique est la prochaine étape.

Le morceau Heart On My Sleeve, généré à l'aide de l'IA et copié les voix et les styles musicaux du rappeur Drake et du musicien canadien The Weeknd, a été réalisé par un mystérieux producteur connu sous le nom de Ghostwriter et est devenu viral. UMG est immédiatement intervenu à nouveau, exigeant qu'il soit retiré des plateformes de streaming. Il est clair que les réseaux de neurones peuvent créer une musique pop convaincante, mais comme pour l’art et l’écriture, si le résultat est trop proche des données de formation originales, les réclamations pour droits d’auteur voleront et les utilisateurs pourraient hésiter à utiliser la technologie par crainte de litiges.

Certains développeurs d'IA, se méfiant des batailles juridiques avec les maisons de disques, pourraient même décider de former leurs modèles sur de la musique qu'ils ont eux-mêmes créée ou commandée, ou qu'ils ont la permission de le faire, et il sera intéressant de voir comment la production de ces réseaux neuronaux se compare à celle-ci. de réseaux formés sur un ensemble plus large d’audio qui peuvent ou non avoir été récoltés légalement.

D’une manière générale, cependant, les créateurs d’IA estiment que former leurs modèles sur du matériel protégé par le droit d’auteur est une utilisation équitable. Ils soutiennent également que les résultats des grands modèles de langage sont transformateurs, ce qui signifie qu’ils ajoutent quelque chose de nouveau et ne constituent pas une copie directe ou un substitut des œuvres originales. On peut dire sans se tromper que tout le monde n’est pas convaincu par ces points.

Les modèles puissants capables de créer un contenu cohérent sont de plus en plus accusés de plagier la propriété intellectuelle. Un procès intenté par le New York Times revendiqué ChatGPT d'OpenAI peut, entre autres choses, rappeler textuellement des passages d'articles de presse, offrant ainsi aux gens un moyen simple de contourner le paywall du titre.

De même, des illustrateurs et des artistes ont partagé des images générées par Midjourney qui reproduisent des images fixes de films, comme indiqué ci-dessous :

Il est probable que les maisons de disques n’auront pas à prouver la violation du droit d’auteur de manière aussi explicite que d’autres éditeurs l’ont fait pour le texte et les images. Après tout, les musiciens se sont poursuivis en justice pour des arnaques moins flagrantes ; une progression d'accords ou un riff de guitare similaire, ou un bref échantillon, suffit pour lancer une action en justice. Alors, où en est la génération musicale IA ?

La menace de poursuites judiciaires signifie que ceux qui travaillent à la construction de modèles capables de générer de la musique doivent avoir les moyens financiers suffisants pour repousser les éditeurs de musique ou indemniser les artistes pour l’autorisation explicite d’utiliser leur travail. Google, par exemple, a négocié des accords de licence avec un groupe sélectionné de chanteurs et de rappeurs pour former ses utilisateurs. Lyrie Modèle d'IA.

Cela introduit d’autres problèmes. Est-il juste que les lois sur le droit d’auteur empêchent les petites startups de rivaliser avec les grandes technologies ? Comment les musiciens et les développeurs, petits et grands, peuvent-ils travailler ensemble pour faire progresser l’IA de manière éthique ? Et si la musique synthétique décolle un jour, sera-t-elle commercialement viable compte tenu droit d'auteur Le contenu de l’IA constitue une zone grise juridique qui n’a pas encore été résolue. ®

Horodatage:

Plus de Le registre