Meta enthüllt KI-Emu-Video und Emu-Edit der nächsten Generation

Meta enthüllt KI-Emu-Video und Emu-Edit der nächsten Generation

Meta stellt KI-Emu-Video der nächsten Generation und Emu Edit PlatoBlockchain Data Intelligence vor. Vertikale Suche. Ai.

Der Bereich der generativen KI erlebt rasante Fortschritte, wobei das Jahr 2023 einen bedeutenden Schritt in diesem Bereich darstellt. Meta, ehemals Facebook, hat auf der diesjährigen Meta Connect-Veranstaltung Emu vorgestellt, ein bahnbrechendes Basismodell für die Bildgenerierung. Das Technologie unterstützt zahlreiche KI-Erlebnisse in der gesamten App-Familie von Meta, insbesondere in den KI-Bildbearbeitungstools von Instagram. Mit diesen Tools können Benutzer Fotos transformieren, indem sie ihren visuellen Stil oder Hintergrund ändern. Darüber hinaus erleichtert die Imagine-Funktion in Meta AI die Generierung fotorealistischer Bilder in Nachrichten oder Gruppenchats.

Durchbrüche in der Videogenerierung: Emu Video

Emu Video stellt eine entscheidende Entwicklung dar und nutzt das Emu-Modell für die Text-zu-Video-Generierung. Dieser innovative Ansatz, der auf Diffusionsmodellen basiert, bietet eine einfache, aber effiziente Methode zur Erstellung hochwertiger Videos. Der Prozess umfasst zwei Phasen: zunächst die Generierung von Bildern aus Textaufforderungen und anschließend die Erstellung von Videos, die sowohl auf Text als auch auf Bildern basieren. Diese faktorisierte Methodik ermöglicht ein effizientes Training von Videogenerierungsmodellen. Die Überlegenheit von Emu Video ist offensichtlich, da es nur zwei Diffusionsmodelle benötigt, um 512×512-Videos mit 16 fps zu produzieren, ein starker Kontrast zu früheren Methoden, die mehrere Modelle erforderten. Menschliche Bewertungen haben gezeigt, dass Emu Video stark bevorzugt wird, da seine Leistung frühere Technologien sowohl in der Qualität als auch in der Einhaltung von Textaufforderungen übertrifft.

Revolutionierung der Bildbearbeitung: Emu Edit

Metas Emu Edit stellt einen Paradigmenwechsel in der Bildbearbeitung dar und konzentriert sich auf präzise Änderungen auf Pixelebene. Dieses Tool ermöglicht komplexe Bearbeitungsaufgaben wie lokale und globale Änderungen, Hintergrundanpassungen sowie Farb- und geometrische Transformationen. Emu Edit zeichnet sich dadurch aus, dass es sicherstellt, dass nur Pixel geändert werden, die für die Bearbeitungsanweisungen relevant sind, und die Integrität der nicht zielgerichteten Teile des Bildes gewahrt bleibt. Um Emu Edit zu trainieren, hat Meta einen umfangreichen Datensatz mit 10 Millionen synthetisierten Beispielen entwickelt, von denen jedes ein Eingabebild, eine Beschreibung der Bearbeitungsaufgabe und das angestrebte Ausgabebild enthält. Das Modell weist eine außergewöhnliche Leistung in Bezug auf Befehlstreue und Bildqualität auf.

Die Zukunft der generativen KI bei Meta

Diese Fortschritte in der generativen KI deuten auf eine Zukunft hin, in der der kreative Ausdruck zugänglicher und vielfältiger ist. Emu Video und Emu Edit könnten möglicherweise die Art und Weise revolutionieren, wie Menschen Medien erstellen und teilen. Sie bieten Werkzeuge für jeden, vom professionellen Künstler bis zum Gelegenheitsanwender, und ermöglichen neue Formen des Ausdrucks und der Kreativität. Obwohl sie kein Ersatz für professionelle Kreative sind, bieten sie eine Plattform für mehr Selbstdarstellung und kreative Erkundung.

Medienberichte betonen den optimierten Prozess von Emu Video und die präzise Bearbeitungsfunktion auf Pixelebene von Emu Edit. Hervorgehoben werden die Einfachheit und Effizienz der Technologie sowie ihr Potenzial, die Video- und Bildbearbeitung zu revolutionieren. Allerdings geht Meta angesichts der strengen Kontrolle durch die Regulierungsbehörden vorsichtig mit dem Einsatz dieser KI-Lösungen um. Meta hat klargestellt, dass seine KI-Funktionen nicht für Marketing- oder politische Kampagnen auf Facebook und Instagram verfügbar sein werden. Dennoch adressieren die grundlegenden Werbebestimmungen der Plattform derzeit nicht speziell KI.

Bildquelle: Shutterstock

Zeitstempel:

Mehr von Blockchain News