Wie Generative IA im laufenden Jahrzehnt alles auf den Kopf stellen wird

Viele werden überrascht sein

Bild vom Autor mit stabiler Diffusion

In In den letzten Monaten haben KI-Systeme wie Midjourney, DALL-E, Stable Diffusion, LaMDA und PaLM große Fortschritte in scheinbar so unterschiedlichen Bereichen wie der Bild- und Textgenerierung gemacht. Die Fähigkeiten dieser Systeme sind beeindruckend: Sie erzeugen äußerst eindrucksvolle Bilder, erstellen wirkungsvolle Verkaufstexte für Werbezwecke und vieles mehr – und das alles aus bloßen „Eingabeaufforderungen“, die beschreiben, was der Benutzer erhalten möchte.

All dies geschieht mit generativer KI.

„Generative KI“ bezieht sich auf Systeme, die von betrieben werden tiefe neuronale Netze das Gerät Large Language Models (LLM), um erstellen irgendeine Art von Inhalt. Hier sage ich „erschaffen“, was bedeutet, dass es sich nicht um eine Kopie von etwas bereits Existierendem handelt, nicht im philosophischen Sinne (was ist überhaupt eine „Schöpfung“?).

In dieser schönen neuen Welt entstehen große neue Unternehmen Jasper, das sowohl die Erstellung von Verkaufstexten als auch von Bildern für die Werbung ermöglicht: Jasper hat mittlerweile einen Wert von mehr als einer Milliarde Dollar und wird über Nacht zum Einhorn.

Die erste generative KI-Plattform, die wirklich Furore machte, war GPT-3 – erst vor ein paar Jahren veröffentlicht! Danach ist eine Reihe von Veröffentlichungen mehrerer Akteure auf diesem Gebiet (OpenAI, Google, StableDiffusion, Google, DeepMind und andere) in einem atemberaubenden Tempo erschienen, so dass es schwierig ist, auf dem Laufenden zu bleiben.

Aber abgesehen davon, wie lustig und fantastisch es ist, mit Midjourney eine Zeit lang Bilder aus unseren Eingabeaufforderungen zu erstellen, fällt es vielen Technikbegeisterten schwer, diese Welle der generativen KI zu verstehen.

Ist Generative IA ein solider Trend oder nur eine Modeerscheinung?

Ich werde gehen für „solider TrendDenn es wird im Laufe dieses Jahrzehnts Tausende von Berufs- und Freizeitaktivitäten verändern. Lassen Sie mich mit einem Beispiel beginnen.

Ich bin ein großer Tennisfan (zumindest im TV-Sinn). Aber Live-Tennisspiele dauern Stunden, und ich habe andere Aktivitäten und Interessen, deshalb schaue ich mir normalerweise Wiederholungen oder nur Highlights-Videos mit den unterhaltsamsten etwa vier Minuten eines Spiels an.

Was aber, wenn ich statt eines 4-Minuten-Videos ein 10- oder 15-Minuten-Video möchte? Oder ob ich jeden Punkt in die Tiebreaks einbeziehen möchte? Ich habe derzeit kein Glück.

Setzen Sie nun Ihren Generative-IA-Hut ein: Ein Generative-IA-Sportvideogenerator würde ein Video erstellen nur für dich gemäß den Vorgaben, die Sie formlos in einer Textaufforderung wie der folgenden eingeben:

"Etwa 15-minütiges Video mit den unterhaltsamsten Punkten des Spiels Rafa Nadal gegen Tommy Paul in Paris Bercy 2022, einschließlich vollständiger Tiebreaks, falls vorhanden, sowie aller umgewandelten Breakpoints"

Das ist es. Sie erhalten einen Link zu Ihrem personalisierten Video, das sich von dem Video unterscheidet, das sich jemand anderes auf der Welt ansieht. Und dieser Videodienst wäre wirtschaftlich genauso machbar wie DALL-E und Midjourney.

Forschung unterscheidet sich von Innovation. Bei Ersterem geht es um veröffentlichte Originalergebnisse, bei Letzterem geht es mehr darum, herauszufinden, wie man aus diesen Ergebnissen ein Unternehmen aufbauen kann: Bei Innovation geht es nicht um Originalität, sondern um Wachstum, Vertretbarkeit, Kapitalrendite usw.

Oftmals wird es verwirrend, weil die Recherche von Unternehmen wie Google durchgeführt wird, die im Prinzip darauf abzielen, Gewinne zu erwirtschaften – aber sie wissen, dass es sich bei ihrem Geschäft um High-Tech handelt, und Technologie ist ohne Forschung nicht hoch. Daher beteiligen sie sich an der Finanzierung der Forschung und rücken gleichzeitig in die Nähe der Wissenschaft – viele ihrer Spitzenforscher wurden von der Wissenschaft angeheuert. Da ich selbst Forscher bin, wurde ich vor einigen Jahren zu einem Fakultätsgipfel in deren Hauptsitz in Mountain View eingeladen, und sie brachten mich in einer Suite im Four Seasons Hotel unter – alles, was nötig ist, um in der akademischen Gemeinschaft einen guten Eindruck zu hinterlassen!

Aber auch wenn es schwierig – und sogar künstlich – sein könnte, eine klare Trennung zwischen Forschung und Innovation zu machen, ist der Unterschied hier entscheidend, denn im Fall der generativen KI werden beide von verschiedenen Akteuren entwickelt und sind miteinander verbunden mit zwei verschiedenen Schichten im Software-Stack –as darauf hingewiesen von J. Currier:

  1. Die unterste Softwareschicht ist die Deep-Learning-Modell, basierend auf Implementierungen von Large Language Models (LLM) oder einer gleichwertigen internen Darstellung. Modelle stellen den Grundbaustein dar, auf dem Anwendungen entwickelt werden können.
  2. Die oberste Softwareschicht ist die Anwendung eines, das auf dem Deep-Learning-Modell aufbaut, um eine bestimmte Aufgabe zu erfüllen, beispielsweise die Ausgabe eines Bildes aus einer Textaufforderung.

Diese zweischichtige Architektur wird eine neue Ära beschleunigter Innovation einläuten, denn sobald die unterste Schicht von sehr großen Unternehmen wie Google, OpenAI und anderen entwickelt wird, werden kleinere Unternehmen die Anwendungsschicht bereitstellen – was natürlich zu einer Gewinnkürzung führt an den untersten Anbieter.

Derzeit wurde die untere Schicht rasch verbessert – und häufig wurde sie zusammen mit einer darüber liegenden Anwendung verteilt. Beispielsweise bieten LaMDA und PaLM sofort einsatzbereite Dialogfunktionen, während DALL-E und Midjourney Prompt-to-Image-Dienste bieten. Aber bald wird es die Verbreitung von Open-Source-Alternativen für die unterste Schicht ermöglichen, nur die oberste Anwendungsschicht zu entwickeln und sie in eine bereits verfügbare untere Schicht einzubinden. Das ist natürlich leichter gesagt als getan, aber Tatsache ist, dass die unterste Schicht um Größenordnungen komplexer ist als die obere.

Ich würde argumentieren, dass Generative IA wird nahezu jede einzelne Wissensarbeit und Freizeitbeschäftigung durchdringen weil es Werkzeuge bereitstellt, mit denen sich die Komplexität früher schwieriger Aktivitäten verringern lässt, und weil es eine ganz neue Ebene der Personalisierung bieten kann, die ich „generative Personalisierung“ nennen würde.

Was „generative Personalisierung“ ist, können Sie am Beispiel des Sportvideos oben sehen: Jeder Benutzer erhält ein brandneues und einzigartiges Highlights-Video, anstatt nur eine Auswahl zwischen zwei oder drei Optionen.

Die kumulativen Auswirkungen aller generativen IA-Anwendungen sind kaum zu überschätzen:

  1. Die einfache Grafikerstellung ist mit Tools wie DALL-E, Midjourney und Stable Diffusion auch für Nicht-Profis bereits möglich, zumindest für einfache nützliche Zwecke wie das Erstellen eines Header-Bildes für diesen Beitrag. Vor diesem Jahr war ich überhaupt nicht in der Lage, meine eigenen Bilder zu zeichnen, und Blog-Experten rieten davon ab, Zeit mit Grafikdesign für eigene Geschichten zu verschwenden.
  2. Benutzer der Fotobearbeitung müssen keine schwierige Lernkurve durchlaufen, um die komplizierten Werkzeuge von Photoshop oder Affinity Photo zu beherrschen (ich verwende Letzteres und es ist so komplex, dass ich YouTube-Tutorials zu Rate ziehen muss, um zu lernen, wie man die meisten Anpassungen vornimmt). Mit generativer KI fordern Benutzer die Software einfach auf, eine bestimmte Transformation durchzuführen, und voilà! Das Bild wird repariert. Wenn es Adobe mit seinen Tools nicht gelingt, generative KI bereitzustellen, werden sie durch neue Startups, die diese anbieten, gestört und werden den Weg des Blockbusters einschlagen.
  3. Präsentationstools wie PowerPoint stellen nicht mehr wie bisher nur Vorlagen zur Verfügung, sondern erstellen und verfeinern ganze Präsentationen auf professionellem Niveau aus Ideenskizzen. Derzeit ist der Unterschied zwischen professionellen und Amateurpräsentationen riesig – das wird nicht mehr der Fall sein.
  4. Das Schreiben von Texten wird ein Prozess sein, der durch generative KI-Tools stark verbessert wird. Viele Formen des Schreibens erhalten bereits Hilfe durch hochentwickelte Tools wie Grammarly, aber die generative KI wird Autoren ein qualitativ neues Maß an Hilfe bieten, indem sie beispielsweise eine vollständige erste Version eines Blogs generiert. Das Schreiben wird ein kollaborativer Prozess zwischen Menschen und dem KI-Tool sein.
  5. Jede für einen Endbenutzer bestimmte Software muss einfach zu verwenden sein und Text- oder Sprachanweisungen enthalten. Benutzerhandbücher und Anleitungsvideos werden der Vergangenheit angehören, und sobald sich Benutzer an die neue einfache Art der Softwarenutzung gewöhnt haben, müssen sie alles bieten, um relevant zu bleiben.
  6. Das Erlernen von Sprachen wird hauptsächlich mit Hilfe von Sprachassistenten erfolgen, die – Sie haben es richtig erraten – von generativer KI unterstützt werden. Sprachassistenten, die wie persönliche Sprachtrainer fungieren, werden ihre erstaunlichen Dialogfähigkeiten in natürlicher Sprache nutzen, die erstmals in Systemen wie LaMDA von Google zu sehen waren, um den menschlichen Sprachlerner dabei zu unterstützen, sich Vokabeln und Ausdrücke anzueignen, die Aussprache zu verbessern usw. Sprachunterricht Sprachassistenten sind keine futuristische Fantasie – sie machen zum jetzigen Zeitpunkt nur wirtschaftlich Sinn.
  7. Sogar Hardwareprodukte (wie Autos) werden über dialogbasierte Hilfesysteme mit generativer KI verfügen. Haben Sie schon einmal versucht, einen komplexen Vorgang wie die Anpassung des Displays in modernen Autos durchzuführen? Nicht einfach, das kann ich dir sagen. Anstatt in komplexen Handbüchern zu wühlen, bitten Sie einfach den Sprachassistenten, entweder Anweisungen einzuholen oder die Anpassungen direkt vorzunehmen.

Viele Berufe werden sich bis zur Unkenntlichkeit verändern. Grafikdesigner spüren bereits den Schmerz dieser Störung. Ganze Berufe werden verschwinden und andere werden geschaffen. Mächtige Unternehmen werden bankrott gehen und neue werden dominant, je nachdem, wie gut sie mit den durch die generative KI verursachten technischen Störungen umgehen.

Und das alles wird noch in diesem Jahrzehnt geschehen.

Vielleicht irre ich mich, aber es scheint mir, dass es selbst für erfahrene Technikexperten schwierig war, die enormen Fähigkeiten der aktuellen Bild- und Textgeneratoren vorherzusagen: Vor ein paar Jahren war es nicht klar, dass riesige Modelle und Trainingssets dies tun würden zu qualitativ unterschiedlichen Fähigkeiten führen.

Ich würde sogar sagen, dass es ein glücklicher, fast zufälliger Fund war. Aber da wir nun über generative Werkzeuge verfügen, sind die Tore für innovative Unternehmen geöffnet, die in rasantem Tempo eine Anwendung nach der anderen entwickeln: Es geht vor allem darum, herauszufinden, was radikal verbessert werden kann, und das geeignete Geschäftsmodell zu finden, aus dem sich ein Unternehmen aufbaut eine generative IA-Idee.

Vor ein paar Jahren sah es so aus, als würden andere Technologietrends wie selbstfahrende Autos, VR oder Blockchain bald die Oberhand gewinnen, doch selbstfahrende Technologien wurden durch gesetzliche Hürden eingeschränkt, Blockchain wurde vom wirtschaftlichen Abschwung getroffen und VR Die Akzeptanz wird durch die hohen Hardwarekosten begrenzt. Generative KI hingegen ist noch nicht gesetzlich eingeschränkt (hey, das Polieren einer PowerPoint-Präsentation oder das Erstellen eines Sportvideos ist keine Frage von Leben und Tod) und erfordert keine teure Hardware, die vom Benutzer gekauft werden muss.

Und wir hätten nicht gedacht, dass die kreativen Aktivitäten so schnell zum Erliegen kommen würden. Aber sie waren es.

Wir treten in neue und manchmal seltsame Zeiten ein, in denen sich die menschliche Kreativität mit den neuen Fähigkeiten der Maschinen so sehr vermischt, dass es schwierig ist, sie voneinander zu unterscheiden. Als J. Currier weist darauf hin:

„Heute und in den nächsten Jahren wird sich das überraschend und in vielerlei Hinsicht beängstigend anfühlen. Denn diese kreativen Momente, in denen man von null auf die ersten Ideen übergeht, haben sich immer so einzigartig menschlich angefühlt, weil es so geheimnisvoll war.“

Wie generative IA alles im aktuellen Jahrzehnt stören wird. Neuveröffentlichung aus der Quelle https://towardsdatascience.com/how-generative-ia-will-disrupt-everything-in-the-current-decade-b4e8ce7dd4f1?source=rss—-7f60cf5620c9— 4 über https://towardsdatascience.com/feed

<!–

->

Zeitstempel:

Mehr von Blockchain-Berater