La créativité basée sur l'IA donne enfin aux PC surpuissants quelque chose d'intéressant à faire, PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

La créativité pilotée par l'IA donne enfin aux PC surpuissants quelque chose d'intéressant à faire

Colonne Jusqu'à récemment, le matériel informatique personnel semblait avoir dépassé toutes les exigences que les logiciels pouvaient éventuellement lui imposer. Même les jeux haut de gamme – traditionnellement à la pointe des exigences des utilisateurs en matière de performances – ont à peine taxé le silicium haut de gamme massivement surpuissant disponible. Puis l'art de l'IA est arrivé.

Le microprocesseur M1 Ultra d'Apple arbore un nombre de transistors au nord de 100 milliards. Nvidia vient de sortir son GPU phare RTX 4090, avec 76 milliards de transistors - une multiplication par trois par rapport à la génération précédente, le produit du dernier nœud de processus et une attitude indifférente à l'égard de la consommation d'énergie. Près de 500W TDP ? Allumez-le et chauffez votre maison cet hiver.

Mais dans quel but ? Une bataille royale Fortnite 300fps? En avril J'ai écrit: "Ces monstres doivent être apprivoisés, entraînés et mis au travail." La technologie a horreur du vide - quatre décennies dans le domaine me l'ont appris. Là où il y a de la capacité, quelque chose viendra pour l'employer.

Cette autre chaussure est tombée début septembre, lorsque CâlinsFace AI – une entreprise privée créant des outils logiciels exploitant des techniques d’intelligence artificielle de pointe – publiée Diffusion stable.

Semblable à des systèmes tels que DALL•E et À mi-parcours, Stable Diffusion passe l'aspirateur puis réduit des milliards d'images à des jetons symboliquement pondérés qui peuvent être ramenés à la visibilité avec une invite de texte conçue de manière appropriée. Le tout se situe juste de ce côté de la sorcellerie – pourtant cela fonctionne remarquablement bien.

Contrairement à DALL•E ou Midjourney, Stable Diffusion est à la fois entièrement autonome (capable de fonctionner sur n'importe quelle machine suffisamment puissante) et pur FOSS. Cela signifiait que bien que la version initiale nécessitait certains des GPU les plus haut de gamme de Nvidia, en une semaine, les contributeurs du projet avaient dépouillé de son code et réduit ses exigences matérielles. La version actuelle peut fonctionner assez confortablement sur le PC costaud que j'ai acheté il y a six ans pour explorer le monde nouvellement renaissant de la réalité virtuelle - ainsi que sur à peu près n'importe quel Mac basé sur M1. De nombreux PC et ordinateurs portables de jeu peuvent exécuter Stable Diffusion suffisamment bien pour l'utiliser pour des besoins créatifs basés sur des projets - ou simplement pour le plaisir.

Puis un groupe de chercheurs publié un document sur quelque chose qu'ils ont appelé Dreamfusion - capable de créer une série infinie de modèles 3D entièrement réalisés à partir d'invites de texte. Tapez pineapple, et l'ordinateur réfléchira, puis générera sa meilleure approximation de ce à quoi ce modèle devrait ressembler. Bien que ce groupe n'ait pas encore publié son code, le document a fourni suffisamment de plan pour qu'un codeur ambitieux adapte la base de code Stable Diffusion afin de créer Fusion de rêves stable – qui, encore une fois, nécessite un matériel assez puissant.

Une image réalisée par Stable Diffusion à partir de l'invite de texte 'Un robot peignant une image en courant sur un tapis roulant' … Cliquez pour agrandir

Pour ne pas être en reste, un autre groupe de l'Université de Tel-Aviv a stupéfié le monde avec le Modèle de diffusion du mouvement humain. Cet article a montré comment les chercheurs avaient utilisé des techniques d'IA basées sur la diffusion pour convertir une invite telle que "the person walks forward two steps and does a cartwheel» en une animation humaniforme. Une semaine plus tard, les chercheurs eux-mêmes a publié son code comme FOSS.

Nous sommes encore un peu tôt dans cette croissance exponentielle des capacités de l'IA pour savoir où cela nous mènera. Canva et Microsoft ont déjà intégré des générateurs d'images basés sur des invites dans leurs outils de création. Méta, Google, et d'autres ont fait la démonstration de générateurs propriétaires d'invite de vidéo. Selon la tendance actuelle, nous n'aurons pas à attendre longtemps avant d'avoir des équivalents FOSS avec lesquels jouer.

Les arts visuels disposent de nouveaux outils puissants qui ne sont pas le domaine exclusif de géants comme Google ou OpenAI - ce dernier une entreprise qui a promis de démocratiser l'IA à sa fondation, mais semble perversement s'être concentrée sur la création de son propre empire propriétaire avec Microsoft comme son propriétaire non officiel.

Dans une de mes premières colonnes pour Le registre j'ai pointé l'extrémité du cycle de mise à niveau sans fin pour les PC. Fini les tapis roulants : ça suffit, ils ne seraient remplacés que lorsqu'ils seraient usés. À l'exception d'une vague de mises à niveau pour s'adapter vidéoconférence axée sur la pandémie cette prédiction s'est avérée exacte.

Mais l'ordinateur personnel s'est débarrassé de sa peau, révélant sa nouvelle forme élégante en tant que superordinateur créatif : propulsé par la diffusion et capable de créativité d'une manière que le PC d'autrefois ne pouvait pas commencer à approcher. Plutôt que d'offrir un autre nouveau stylet ou pinceau, ces outils qualitativement différents forgent un nouveau type de partenariat créatif.

En juin, j'ai acheté un ordinateur portable haut de gamme et je me suis immédiatement senti coupable, pensant que je ne le mettrais jamais vraiment au travail. Aujourd'hui, j'utilise pleinement une machine capable de faire à la fois le quotidien et l'incroyable. Rétrospectivement, cet achat ressemble à une bonne affaire - annonciateur d'une véritable renaissance - alors que le PC, renaissant, se met au travail. ®

Horodatage:

Plus de Le registre