Meta revela vídeo AI Emu de última geração e edição de Emu

Meta revela vídeo AI Emu de última geração e edição de Emu

Meta revela AI Emu Video de última geração e Emu Edit PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

O domínio da IA ​​generativa está testemunhando avanços rápidos, com 2023 marcando um avanço significativo no domínio. Meta, antigo Facebook, apresentou o Emu, um modelo fundamental inovador para geração de imagens, no evento Meta Connect deste ano. Esse tecnologia sustenta inúmeras experiências de IA em toda a família de aplicativos Meta, principalmente nas ferramentas de edição de imagens de IA do Instagram. Essas ferramentas permitem aos usuários transformar fotos alterando seu estilo visual ou plano de fundo. Além disso, o recurso Imagine do Meta AI facilita a geração de imagens fotorrealistas em mensagens ou chats em grupo.

Avanços na geração de vídeo: Emu Video

O Emu Video surge como um desenvolvimento fundamental, utilizando o modelo Emu para geração de texto para vídeo. Esta abordagem inovadora, baseada em modelos de difusão, oferece um método simples mas eficiente para a criação de vídeos de alta qualidade. O processo envolve duas fases: inicialmente a geração de imagens a partir de prompts de texto e posteriormente a criação de vídeos condicionados a texto e imagens. Esta metodologia fatorada permite o treinamento eficiente de modelos de geração de vídeo. A superioridade do Emu Video é evidente, pois requer apenas dois modelos de difusão para produzir vídeos 512×512 a 16 fps, um forte contraste com os métodos anteriores que exigiam vários modelos. As avaliações humanas mostraram uma forte preferência pelo Emu Video, com seu desempenho superando as tecnologias anteriores em qualidade e aderência às instruções de texto.

Revolucionando a edição de imagens: Emu Edit

O Emu Edit da Meta representa uma mudança de paradigma na edição de imagens, com foco em alterações precisas no nível de pixel. Esta ferramenta permite tarefas de edição complexas, como modificações locais e globais, ajustes de fundo e transformações geométricas e de cores. O Emu Edit se destaca por garantir que apenas os pixels relevantes para as instruções de edição sejam alterados, mantendo a integridade das partes não alvo da imagem. Para treinar o Emu Edit, a Meta desenvolveu um extenso conjunto de dados compreendendo 10 milhões de amostras sintetizadas, cada uma incluindo uma imagem de entrada, uma descrição da tarefa de edição e a imagem de saída direcionada. O modelo apresenta desempenho excepcional em termos de fidelidade de instrução e qualidade de imagem.

O futuro da IA ​​generativa na Meta

Estes avanços na IA generativa sugerem um futuro onde a expressão criativa será mais acessível e diversificada. O Emu Video e o Emu Edit podem revolucionar a forma como as pessoas criam e compartilham mídia. Eles oferecem ferramentas para todos, desde artistas profissionais até usuários casuais, possibilitando novas formas de expressão e criatividade. Embora não substituam os criadores profissionais, fornecem uma plataforma para uma melhor auto-expressão e exploração criativa.

Os relatórios da mídia enfatizam o processo simplificado do Emu Video e a capacidade precisa de edição em nível de pixel do Emu Edit. A simplicidade e eficiência da tecnologia são destacadas, juntamente com o seu potencial para revolucionar a edição de vídeo e imagem. No entanto, a Meta aborda a implementação destas soluções de IA com cautela, dado o escrutínio rigoroso dos reguladores. A Meta esclareceu que seus recursos de IA não estarão disponíveis para marketing ou campanhas políticas no Facebook e Instagram. No entanto, os regulamentos básicos de publicidade da plataforma atualmente não abordam especificamente a IA.

Fonte da imagem: Shutterstock

Carimbo de hora:

Mais de Notícias do Blockchain