KI-gesteuerte Kreativität gibt überlasteten PCs etwas, das sich lohnt, endlich PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

KI-gesteuerte Kreativität gibt überlasteten PCs endlich etwas, das sich lohnt

Kolonne Bis vor kurzem schien die PC-Hardware alle Anforderungen, die Software möglicherweise an sie stellen könnte, übersprungen zu haben. Selbst High-End-Spiele – traditionell die Spitze der Benutzeranforderungen an die Leistung – haben das massiv überlastete, verfügbare High-End-Silizium kaum belastet. Dann kam KI-Kunst daher.

Der Mikroprozessor M1 Ultra von Apple hat eine Transistorzahl von über 100 Milliarden. Nvidia hat gerade seine veröffentlicht Flaggschiff RTX 4090 GPU, mit 76 Milliarden Transistoren – eine Verdreifachung gegenüber der vorherigen Generation, das Produkt des neuesten Prozessknotens und eine unbekümmerte Einstellung zum Stromverbrauch. Fast 500 W TDP? Drehen Sie es auf und heizen Sie Ihr Zuhause diesen Winter.

Aber zu welchem ​​Zweck? Ein Fortnite Battle Royale mit 300 fps? Im April Ich schrieb: „Diese Monster müssen gezähmt, trainiert und eingesetzt werden.“ Technik verabscheut ein Vakuum – das haben mich vier Jahrzehnte in der Branche gelehrt. Wo Kapazität vorhanden ist, wird etwas kommen, um sie einzusetzen.

Dieser andere Schuh fiel Anfang September, als HuggingFace-KI – ein privates Unternehmen, das Softwaretools entwickelt, die modernste Techniken der künstlichen Intelligenz nutzen – veröffentlicht Stable Diffusion .

Ähnlich wie bei Systemen wie DALL•E und Zwischendurch, Stable Diffusion saugt auf und reduziert dann Milliarden von Bildern auf symbolisch gewichtete Token, die mit einer entsprechend gestalteten Textaufforderung wieder sichtbar gemacht werden können. Das Ganze ist nur diesseits der Hexerei angesiedelt – und doch funktioniert es bemerkenswert gut.

Im Gegensatz zu DALL•E oder Midjourney ist Stable Diffusion sowohl vollständig eigenständig – kann auf jedem ausreichend leistungsfähigen Rechner ausgeführt werden – als auch reines FOSS. Dies bedeutete, dass, obwohl die erste Version einige der High-End-GPUs von Nvidia erforderte, die Projektmitarbeiter innerhalb einer Woche hatten seinen Code zurückgezogen und reduzierte seine Hardwareanforderungen. Die aktuelle Version läuft recht komfortabel auf dem bulligen PC, den ich mir vor sechs Jahren gekauft habe, um die neugeborene Welt der virtuellen Realität zu erkunden – sowie auf so ziemlich jedem M1-basierten Mac. Viele Gaming-PCs und Laptops können Stable Diffusion gut genug ausführen, um es für projektbasierte kreative Zwecke zu verwenden – oder einfach nur zum Spaß.

Dann eine Gruppe von Forschern veröffentlichte ein Papier auf etwas, das sie Dreamfusion nannten – das in der Lage ist, eine unendliche Reihe von vollständig realisierten 3D-Modellen aus Texteingabeaufforderungen zu zaubern. Eintippen pineapple, und der Computer denkt nach und generiert dann seine beste Annäherung, wie dieses Modell aussehen sollte. Obwohl diese Gruppe ihren Code noch nicht veröffentlicht hat, lieferte das Papier eine ausreichende Blaupause für einen ambitionierten Programmierer, um die Codebasis von Stable Diffusion anzupassen und zu erstellen Stabile Traumfusion – was wiederum ziemlich leistungsfähige Hardware erfordert.

Ein von Stable Diffusion erstelltes Bild aus der Textaufforderung „Ein Roboter malt ein Bild, während er auf einem Laufband läuft“ … Zum Vergrößern anklicken

Um nicht übertroffen zu werden, erstaunte eine andere Gruppe an der Universität Tel Aviv die Welt mit dem Menschliches Bewegungsdiffusionsmodell. Dieses Papier zeigte, wie Forscher auf Diffusion basierende KI-Techniken verwendet hatten, um eine Eingabeaufforderung wie „the person walks forward two steps and does a cartwheel“ in eine humaniforme Animation. Eine Woche später die Forscher selbst veröffentlichten ihren Code als FOSS.

Wir sind noch etwas früh in diesem exponentiellen Wachstum der KI-Fähigkeiten, um zu wissen, wohin es führen wird. Sowohl Canva als auch Microsoft haben bereits prompt-basierte Bildgeneratoren in ihre Kreativtools integriert. Meta, Google, und andere haben proprietäre Prompt-to-Video-Generatoren demonstriert. Im aktuellen Trend müssen wir nicht lange warten, bis wir FOSS-Äquivalente zum Spielen haben.

Die bildende Kunst verfügt über leistungsstarke neue Tools, die nicht die exklusive Domäne von Giganten wie Google oder OpenAI sind – letzteres eine Firma, die bei ihrer Gründung versprach, die KI zu demokratisieren, sich aber perverserweise darauf konzentriert zu haben scheint, mit Microsoft als ihr eigenes proprietäres Imperium zu schaffen inoffizieller Besitzer.

In einer meiner ersten Kolumnen für Das Register Ich zeigte auf das Ende des endlosen Upgrade-Zyklus für PCs. Kein Laufband mehr: Gut genug, sie würden nur ersetzt, wenn sie abgenutzt sind. Mit Ausnahme einer Flut von Upgrades, die untergebracht werden müssen pandemiebedingte Videokonferenzen diese Vorhersage hat sich als richtig erwiesen.

Aber der Personal Computer hat seine Haut abgestreift und seine elegante neue Form als kreativer Supercomputer enthüllt: Diffusionsbetrieben und kreativ in einer Weise, die der PC von früher nicht erreichen konnte. Anstatt einen weiteren neuen Stift oder Pinsel anzubieten, bilden diese qualitativ unterschiedlichen Werkzeuge eine neue Art von kreativer Partnerschaft.

Im Juni kaufte ich mir einen High-Spec-PC-Laptop – und fühlte mich sofort schuldig, weil ich dachte, ich hätte ihn nie wirklich zum Laufen gebracht. Heute nutze ich eine Maschine, die sowohl das Alltägliche als auch das Unglaubliche kann. Rückblickend sieht dieser Kauf wie ein cleveres Schnäppchen aus – ein Vorbote einer wahren Renaissance – wenn der wiedergeborene PC an die Arbeit geht. ®

Zeitstempel:

Mehr von Das Register