Meta presenta Emu Video y Emu Edit con IA de próxima generación

Meta presenta Emu Video y Emu Edit con IA de próxima generación

Meta presenta AI Emu Video de próxima generación y Emu Edit PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

El ámbito de la IA generativa está experimentando rápidos avances y el año 2023 marca un paso significativo en este ámbito. Meta, anteriormente Facebook, presentó Emu, un modelo fundamental innovador para la generación de imágenes, en el evento Meta Connect de este año. Este la tecnología sustenta numerosas experiencias de IA en toda la familia de aplicaciones de Meta, especialmente en las herramientas de edición de imágenes de IA de Instagram. Estas herramientas permiten a los usuarios transformar fotografías alterando su estilo visual o fondo. Además, la función Imagine en Meta AI facilita la generación de imágenes fotorrealistas dentro de mensajes o chats grupales.

Avances en la generación de vídeo: Emu Video

Emu Video surge como un desarrollo fundamental, que utiliza el modelo Emu para la generación de texto a video. Este enfoque innovador, basado en modelos de difusión, ofrece un método simple pero eficiente para crear videos de alta calidad. El proceso consta de dos fases: inicialmente generar imágenes a partir de indicaciones de texto y posteriormente crear videos condicionados tanto al texto como a las imágenes. Esta metodología factorizada permite un entrenamiento eficiente de modelos de generación de video. La superioridad de Emu Video es evidente, ya que sólo requiere dos modelos de difusión para producir vídeos de 512×512 a 16 fps, un marcado contraste con los métodos anteriores que requerían múltiples modelos. Las evaluaciones humanas han mostrado una fuerte preferencia por Emu Video, y su rendimiento eclipsa a las tecnologías anteriores tanto en calidad como en cumplimiento de las indicaciones de texto.

Revolucionando la edición de imágenes: Emu Edit

Emu Edit de Meta representa un cambio de paradigma en la edición de imágenes, centrándose en alteraciones precisas a nivel de píxeles. Esta herramienta permite tareas de edición complejas, como modificaciones locales y globales, ajustes de fondo y transformaciones geométricas y de color. Emu Edit se destaca por garantizar que solo se modifiquen los píxeles relevantes para las instrucciones de edición, manteniendo la integridad de las partes no específicas de la imagen. Para entrenar Emu Edit, Meta ha desarrollado un extenso conjunto de datos que comprende 10 millones de muestras sintetizadas, cada una de las cuales incluye una imagen de entrada, una descripción de la tarea de edición y la imagen de salida objetivo. El modelo exhibe un rendimiento excepcional en términos de fidelidad de instrucciones y calidad de imagen.

El futuro de la IA generativa en Meta

Estos avances en la IA generativa apuntan a un futuro en el que la expresión creativa será más accesible y diversa. Emu Video y Emu Edit podrían potencialmente revolucionar la forma en que las personas crean y comparten medios. Ofrecen herramientas para todos, desde artistas profesionales hasta usuarios ocasionales, lo que permite nuevas formas de expresión y creatividad. Si bien no sustituyen a los creadores profesionales, proporcionan una plataforma para mejorar la autoexpresión y la exploración creativa.

Los informes de los medios enfatizan el proceso simplificado de Emu Video y la capacidad de edición precisa a nivel de píxeles de Emu Edit. Se destaca la simplicidad y eficiencia de la tecnología, junto con su potencial para revolucionar la edición de vídeo e imágenes. Sin embargo, Meta aborda el despliegue de estas soluciones de IA con cautela, dado el riguroso escrutinio de los reguladores. Meta ha aclarado que sus capacidades de IA no estarán disponibles para campañas políticas o de marketing en Facebook e Instagram. Sin embargo, las regulaciones publicitarias básicas de la plataforma actualmente no abordan específicamente la IA.

Fuente de la imagen: Shutterstock

Sello de tiempo:

Mas de Blockchain Noticias