Kunst ist nicht tot, sie ist nur maschinengenerierte PlatoBlockchain-Datenintelligenz. Vertikale Suche. Ai.

Kunst ist nicht tot, sie ist nur maschinengeneriert

Warum KI-Modelle Künstler ersetzen werden, lange bevor sie Programmierer ersetzen

Die vielleicht verblüffendste Implikation, die wir von der generativen KI sehen, ist, dass entgegen der allgemeinen Ansicht, dass Kreativität angesichts der Automatisierung die letzte Bastion des menschlichen Einfallsreichtums sein wird, dies tatsächlich so scheint viel einfacher eher schwierige kreative Aufgaben zu automatisieren, als relativ einfache Programmieraufgaben zu automatisieren. Um ein Gefühl dafür zu bekommen, vergleichen wir zwei der beliebtesten Anwendungsfälle für generative KI: Codegenerierung und Bildgenerierung. Aber wir glauben, dass die Behauptung allgemeiner gilt, selbst wenn generative Modelle in komplexere Anwendungen expandieren.

Die Kurzfassung des Arguments (auf das wir weiter unten näher eingehen) lautet, dass zwar ein Produkt wie GitHub-Copilot, in seiner jetzigen Form, das Programmieren etwas effizienter machen kann, macht es nicht überflüssig, fähige Softwareentwickler mit Programmierkenntnissen zu benötigen. Ein wichtiger Grund ist, dass beim Erstellen eines Programms Korrektheit wirklich wichtig ist. Wenn die KI ein Programm generiert, muss es immer noch von einem Menschen auf Korrektheit überprüft werden – ein Aufwand, der fast dem gleichen Aufwand entspricht wie der Erstellung.

Andererseits kann jeder, der tippen kann, ein Modell wie verwenden Stable Diffusion hochwertige, einzigartige Bilder innerhalb von Minuten zu um ein Vielfaches geringeren Kosten zu erstellen. Kreative Arbeitsergebnisse haben oft keine strengen Korrektheitsbeschränkungen, und die Ergebnisse der Modelle sind erstaunlich vollständig. Es ist schwer, in Branchen, die auf kreative Visuals angewiesen sind, keinen vollständigen Phasenwechsel zu sehen, da die Visuals, die KI jetzt produzieren kann, für viele Anwendungen bereits ausreichen, und wir uns noch in den sehr frühen Innings der Technologie befinden.

Wir erkennen voll und ganz an, dass es schwierig ist, sich bei der Geschwindigkeit, mit der sich das Feld bewegt, auf Vorhersagen zu verlassen. Im Moment scheint es jedoch viel wahrscheinlicher, dass wir Anwendungen voller kreativer Bilder sehen, die ausschließlich von Programmierern erstellt wurden, als Anwendungen mit von Menschen entworfener Kunst, die ausschließlich von Schöpfern erstellt wurden. 

Warum der Hype und warum jetzt?

Bevor wir auf die Besonderheiten der Codegenerierung im Vergleich zur Bildgenerierung eingehen, ist es hilfreich, sich ein Bild davon zu machen, wie beliebt KI im Allgemeinen und generative KI im Besonderen derzeit sind.

Generative KI wird von Entwicklern am schnellsten angenommen, die wir je gesehen haben. Während wir dies schreiben, führt Stable Diffusion die Trendcharts der GitHub-Repositories mit großem Abstand an. Sein Wachstum ist jeder neueren Infrastruktur- oder Kryptotechnologie weit voraus (siehe Abbildung oben). Es gibt fast täglich Start- und Finanzierungsankündigungen von Startups, die diese Technologie verwenden, und soziale Online-Netzwerke werden mit Inhalten überschwemmt, die von generativen Modellen erstellt wurden.

Auch das Gesamtniveau der Investitionen in KI in den letzten zehn Jahren ist kaum zu überschätzen. Wir haben allein seit Mitte der 2010er Jahre einen exponentiellen Anstieg der Veröffentlichungen erlebt (siehe Abbildung unten). Heute beschäftigen sich etwa 20 % aller auf arXiv veröffentlichten Artikel mit KI, ML und NLP. Wichtig ist, dass die theoretischen Ergebnisse eine kritische Schwelle überschritten haben, wo sie leicht konsumierbar geworden sind und eine kambrische Explosion neuer Techniken, Software und Startups ausgelöst haben. 

Kunst ist nicht tot, sie ist nur maschinengenerierte PlatoBlockchain-Datenintelligenz. Vertikale Suche. Ai.

Der jüngste Anstieg in der obigen Abbildung ist größtenteils auf die generative KI zurückzuführen. In einem einzigen Jahrzehnt haben wir uns von KI-Modellen nur für Experten, die Bilder klassifizieren und Worteinbettungen erstellen konnten, zu öffentlich nutzbaren Modellen entwickelt, die effektiven Code schreiben und bemerkenswert genaue Bilder mit Eingabeaufforderungen in natürlicher Sprache erstellen können. Es ist keine Überraschung, dass das Innovationstempo nur angezogen hat, und es sollte keine Überraschung sein, wenn generative Modelle beginnen, in andere Bereiche vorzudringen, die einst von Menschen dominiert wurden.

Generative KI und Programmierung

Eine der frühesten Anwendungen der generativen KI war die Unterstützung des Programmierers. Es funktioniert so, dass ein Modell mit einem großen Codekorpus (z. B. allen öffentlichen Repos in GitHub) trainiert wird und dann einem Programmierer beim Codieren einen Vorschlag macht. Die Ergebnisse sind hervorragend. So sehr, dass es vernünftig ist, dass dieser Ansatz in Zukunft zum Synonym für Programmierung wird.

Kunst ist nicht tot, sie ist nur maschinengenerierte PlatoBlockchain-Datenintelligenz. Vertikale Suche. Ai.
Generierter Code: sicher gegen Angriffe, die keine Semikolons verwenden.

Allerdings waren die Produktivitätsgewinne im Vergleich zur Bildgenerierung, die wir weiter unten behandeln, bescheiden. Ein Teil des Grundes dafür ist, wie oben erwähnt, dass Korrektheit beim Programmieren von entscheidender Bedeutung ist (und in der Tat bei technischen Problemen im weiteren Sinne, aber wir konzentrieren uns in diesem Beitrag auf das Programmieren). Zum Beispiel, eine aktuelle Studie gefunden das für Szenarien mit hohem Risiko CWEs (allgemeine Schwachstellenaufzählungen), enthielten 40 % des KI-generierten Codes Schwachstellen.

Daher muss der Benutzer ein Gleichgewicht zwischen der Generierung von genügend Code finden, um eine sinnvolle Produktivitätssteigerung zu erzielen, und ihn dennoch einschränken, damit er auf Korrektheit überprüft werden kann. Als Ergebnis hat Copilot dazu beigetragen, Verbesserung der Entwicklerproduktivität – aktuelle Studien (hier und hier) Setzen Sie Gewinne in der Größenordnung von 2x oder weniger – aber auf einem Niveau, das mit dem vergleichbar ist, was wir bei früheren Fortschritten bei Entwicklersprachen und -werkzeugen gesehen haben. Der Sprung von der Montage zu C verbesserte beispielsweise die Produktivität nach Schätzungen um das 2- bis 5-fache.

Für erfahrenere Programmierer können sich die Bedenken über die Korrektheit des Codes hinaus auf die allgemeine Codequalität erstrecken. Wie schnell.aiist Jeremy Howard hat erklärt in Bezug auf neuere Versionen des OpenAI-Codex-Modells: „[I]t schreibt ausführlichen Code, weil er generiert durchschnittlich Code. Für mich ist es viel langsamer, durchschnittlichen Code zu nehmen und ihn in Code zu verwandeln, den ich mag und von dem ich weiß, dass er richtig ist, als ihn einfach von Grund auf neu zu schreiben – zumindest in Sprachen, die ich gut kenne.“

Obwohl es klar ist, dass generative Programmierung eine Schrittfunktion in der Entwicklerproduktivität ist, ist es nicht klar, dass sich die Verbesserung dramatisch von denen unterscheidet, die wir zuvor gesehen haben. Generative KI macht bessere Programmierer, aber sie müssen trotzdem programmieren.

Generative KI und Visuals

Andererseits ist der Einfluss generativer Modelle auf die kreative Arbeitsleistung, wie etwa die Bildgenerierung, extrem. Es hat zu Effizienz- und Kostenverbesserungen um viele Größenordnungen geführt, und es ist schwer zu sehen, dass es nicht zu einem branchenweiten Phasenwechsel führt.

Die Art und Weise, wie generative KI in diesem Bereich funktioniert, besteht darin, einfache Texteingaben vom Benutzer, sogenannte Eingabeaufforderungen, entgegenzunehmen, und dann generiert das Modell eine visuelle Ausgabe. Derzeit gibt es Modelle zum Erstellen vieler Ausgabeformate, darunter Bilder, Videos, 3D-Modelle und Texturen.

Besonders interessant ist, wie diese Modelle erweitert werden können, um fast ohne kreative Eingriffe neue oder domänenspezifische Bilder zu generieren. Zum Beispiel nahm Guido (einer der Autoren) ein vortrainiertes Bildmodell und trainierte es auf ein paar Dutzend Fotos von sich neu. Von dort aus konnte er Bilder generieren in der Eingabeaufforderung. Unten sind Fotos, die aus den folgenden Eingabeaufforderungen generiert wurden: ” als Captain America", " in Paris", " in einem Gemälde".

Kunst ist nicht tot, sie ist nur maschinengenerierte PlatoBlockchain-Datenintelligenz. Vertikale Suche. Ai.
Wo die Bildgenerierung im geschäftlichen Kontext eine massive Abkehr von der Codegenerierung darstellt, ist das Ausmaß, in dem die generative KI das ökonomische Kalkül verändert. Um die obigen Bilder zu erstellen, trainierte Guido das Modell mit einer Handvoll Fotos, die etwa 50 $ an Infrastrukturressourcen kosten. Nach dem Training kostet das Generieren von Bildern etwa 0.001 $ in Rechenressourcen und kann in der Cloud oder durchgeführt werden auf einem Laptop der neusten Generation. Außerdem dauert das Erzeugen des Bildes nur wenige Sekunden. 

Ohne generative KI besteht die einzige Möglichkeit, ein benutzerdefiniertes Bild zu erhalten, darin, entweder einen Künstler einzustellen oder es selbst zu tun. Selbst wenn wir davon ausgehen, dass eine Person innerhalb einer Stunde für 10 US-Dollar ein vollständig individuelles, fotorealistisches Bild erstellen könnte, Der generative KI-Ansatz ist leicht vier Größenordnungen billiger und eine Größenordnung schneller. Realistischer betrachtet wird jedes benutzerdefinierte Kunstwerk oder Grafikdesignprojekt wahrscheinlich Tage oder Wochen dauern und Hunderte, wenn nicht Tausende von Dollar kosten. 

Ähnlich wie bei den oben genannten Programmierhilfen wird generative KI sein als Werkzeug übernommen von Künstlern und beide erfordern ein gewisses Maß an Überwachung durch den Benutzer. Aber es ist schwer, den wirtschaftlichen Unterschied zu übertreiben, der durch die Fähigkeit eines Bildmodells entsteht, die gesamte künstlerische Leistung nachzuahmen. Unter Verwendung eines Codegenerierungsmodells erfordert das Schreiben selbst eines sehr einfachen funktionalen Programms, das eine standardmäßige Computeraufgabe ausführt, das Überprüfen, Bearbeiten und Hinzufügen von Tests für viele Codeschnipsel. Aber für ein einfaches Bild kann die Eingabe einer Eingabeaufforderung und die Auswahl eines Bildes aus einem Dutzend Vorschlägen in weniger als einer Minute erledigt werden.

Nehmen Sie zum Beispiel unsere eigene Karikaturistin (und Investitionspartnerin) Yoko Li (@stuffyokodraws). Wir haben ein Model mit 70 ihrer vorherigen Bilder trainiert, und das Model war in der Lage, Bilder mit einem unheimlichen Grad an Mimikry zu erzeugen. Jeder Künstler muss herausfinden, was er als Nächstes kreieren soll, und sie stellte sogar fest, dass die ausgebildeten Modelle mehr Optionen aufzeigen können, als sie sich vorgestellt hatte – zumindest, wenn sie unter Druck gesetzt wurden, etwas in einem bestimmten Zeitraum zu produzieren. Es gibt Hunderte von Möglichkeiten, dasselbe Objekt zu zeichnen, aber generative Modelle machten sofort deutlich, welche Wege es wert sind, erkundet zu werden. 

Wenn es also um solche Aufgaben geht, argumentieren wir nicht, dass Computer unbedingt sind better als Menschen auf einer 1:1-Basis. Aber wie bei so vielen anderen Aufgaben, wenn Computer eine vollständige Arbeitsleistung erbringen können, töten sie uns einfach Treppe

Versuchen Sie zu erraten, welche der folgenden Zeichnungen direkt von Yoko gezeichnet und welche generiert wurden. 

Kunst ist nicht tot, sie ist nur maschinengenerierte PlatoBlockchain-Datenintelligenz. Vertikale Suche. Ai.
Antwort: Das KI-Modell hat die Bilder mit einem nicht weißen Hintergrund generiert.

Die massive Verbesserung der Wirtschaftlichkeit, die Flexibilität bei der Entwicklung neuer Stile und Konzepte und die Fähigkeit, vollständige oder nahezu vollständige Arbeitsergebnisse zu generieren, lassen uns darauf schließen, dass wir in allen Branchen, in denen kreative Ressourcen zum Einsatz kommen, einen deutlichen Wandel erleben werden Großteil des Geschäfts. Und das nicht nur bei Bildern, sondern im gesamten Designbereich. Zum Beispiel:

  • Generative KI kann 2D-Grafiken, Texturen und 3D-Modelle erstellen und beim Leveldesign für Spiele helfen. 
  • Im Marketing scheint es bereit zu sein, Stock Art, Produktfotografie und Illustrationen zu ersetzen. 
  • Wir sehen bereits Anwendungen im Webdesign, Innendesign und Landschaftsdesign.

Und wir stehen wirklich erst ganz am Anfang. Wenn ein Anwendungsfall eine kreative Generierung von Inhalten erfordert, ist es schwer zu verstehen, warum die generative KI dies nicht stört oder zumindest Teil des Prozesses wird.

-

OK, also was ist der Sinn dieses Beitrags? Während es sich etwas eng auf die Code- und Bildgenerierung konzentriert, vermuten wir, dass die Ergebnisse breiter gefasst sind. Insbesondere, dass kreative Bemühungen auf breiter Front – ob visuell, textlich oder musikalisch – wahrscheinlich lange vor dem Systemaufbau durch KI gestört werden. 

Zusätzlich zu dem oben verwendeten Korrektheitsargument kann es auch der Fall sein, dass das Kombinieren und Neukombinieren des gesamten Standes der Technik für die praktische Bandbreite kreativer Ergebnisse ausreichen kann. Die Musik- und Filmindustrie zum Beispiel hat in der Vergangenheit unzählige Nachahmungen beliebter Alben und Filme produziert. Es ist durchaus denkbar, dass generative Modelle helfen könnten, diese Funktionen im Laufe der Zeit zu automatisieren. Das Bemerkenswerte an so vielen Bildern, die von Stable Diffusion und DALL-E 2 produziert werden, ist jedoch Folgendes sie sind wirklich gut und wirklich interessant. Es ist nicht schwer, sich ein KI-Modell vorzustellen, das wirklich interessante Verschmelzungen von Musikstilen produziert oder sogar Filme in Spielfilmlänge „schreibt“, die faszinierend darin sind, wie sie Konzepte und Stile miteinander verbinden. 

Im Gegenteil, es ist schwer vorstellbar, dass frühere Systeme alle Tools enthalten, die wir für die Entwicklung aller zukünftigen Systeme benötigen. Oder sogar, dass komplexe Systeme so einfach kombiniert werden könnten wie verschiedene Kunst- oder Musikstile. So oft liegt der Wert eines Systems und warum es so schwierig zu bauen ist, im langen Schwanz der Details – all die Kompromisse, Problemumgehungen, Optimierungen für einen bestimmten Designraum und institutionelles/latentes Wissen, das sie enthalten. Also müssen wir weiter bauen.

Wir werden dem Drang widerstehen, Vorhersagen zu treffen genau wie generative KI die Kreativbranche beeinflussen wird. Jedoch, Die Geschichte legt nahe, dass neue Tools dazu neigen erweitern anstatt die Definition von Kunst zu verkürzen, und es neuen Arten von Künstlern zugänglich zu machen. In diesem Fall sind die neuen Künstler Systembauer. So, Für Tech-Gründer glauben wir, dass generative KI ein absolut positives Werkzeug ist um die Reichweite von Software zu erweitern – Spiele werden schöner, Marketing überzeugender, geschriebene Inhalte ansprechender, Filme inspirierender.

Wer weiß: Eines Tages könnte ein Archiv des Internets von Ende 2022 als eines der letzten größtenteils von Menschen erstellten Inhaltsrepositorys geschätzt werden. Zumindest dieser Text für diesen Artikel wurde vollständig von Menschen erstellt. 

Kunst ist nicht tot, sie ist nur maschinengenerierte PlatoBlockchain-Datenintelligenz. Vertikale Suche. Ai.
Dieses Stück wurde vom a16z infra-Team geschrieben, mit den Hauptautoren Guido Appenzeller, Matt Bornstein, Martin Casado und Yoko Li und einem starken Beitrag des restlichen Teams.

***

Die hier geäußerten Ansichten sind die der einzelnen zitierten Mitarbeiter von AH Capital Management, LLC („a16z“) und nicht die Ansichten von a16z oder seinen verbundenen Unternehmen. Bestimmte hierin enthaltene Informationen stammen aus Drittquellen, einschließlich von Portfoliounternehmen von Fonds, die von a16z verwaltet werden. Obwohl sie aus als zuverlässig erachteten Quellen stammen, hat a16z solche Informationen nicht unabhängig überprüft und macht keine Zusicherungen über die aktuelle oder dauerhafte Genauigkeit der Informationen oder ihre Angemessenheit für eine bestimmte Situation. Darüber hinaus kann dieser Inhalt Werbung von Drittanbietern enthalten; a16z hat solche Anzeigen nicht überprüft und unterstützt keine darin enthaltenen Werbeinhalte.

Dieser Inhalt wird nur zu Informationszwecken bereitgestellt und sollte nicht als Rechts-, Geschäfts-, Anlage- oder Steuerberatung angesehen werden. Sie sollten diesbezüglich Ihre eigenen Berater konsultieren. Verweise auf Wertpapiere oder digitale Vermögenswerte dienen nur der Veranschaulichung und stellen keine Anlageempfehlung oder ein Angebot zur Erbringung von Anlageberatungsdiensten dar. Darüber hinaus richtet sich dieser Inhalt nicht an Anleger oder potenzielle Anleger und ist nicht für die Verwendung durch diese bestimmt, und es darf unter keinen Umständen darauf vertraut werden, wenn eine Entscheidung getroffen wird, in einen von a16z verwalteten Fonds zu investieren. (Ein Angebot zur Investition in einen a16z-Fonds wird nur durch das Privatplatzierungsmemorandum, den Zeichnungsvertrag und andere relevante Unterlagen eines solchen Fonds abgegeben und sollte vollständig gelesen werden.) Alle erwähnten, erwähnten oder erwähnten Investitionen oder Portfoliounternehmen oder Portfoliounternehmen Die beschriebenen Investitionen sind nicht repräsentativ für alle Investitionen in von a16z verwaltete Vehikel, und es kann nicht garantiert werden, dass die Investitionen rentabel sind oder dass andere Investitionen in der Zukunft ähnliche Merkmale oder Ergebnisse aufweisen werden. Eine Liste der Investitionen von Fonds, die von Andreessen Horowitz verwaltet werden (mit Ausnahme von Investitionen, für die der Emittent a16z keine Genehmigung zur öffentlichen Offenlegung erteilt hat, sowie unangekündigte Investitionen in öffentlich gehandelte digitale Vermögenswerte) ist unter https://a16z.com/investments verfügbar /.

Die darin bereitgestellten Diagramme und Grafiken dienen ausschließlich zu Informationszwecken und sollten bei Anlageentscheidungen nicht als verlässlich angesehen werden. Die Wertentwicklung in der Vergangenheit ist kein Hinweis auf zukünftige Ergebnisse. Der Inhalt spricht nur zum angegebenen Datum. Alle Prognosen, Schätzungen, Prognosen, Ziele, Aussichten und/oder Meinungen, die in diesen Materialien geäußert werden, können ohne Vorankündigung geändert werden und können von den Meinungen anderer abweichen oder ihnen widersprechen. Weitere wichtige Informationen finden Sie unter https://a16z.com/disclosures.

Zeitstempel:

Mehr von Andreessen Horowitz