Sora AI produz vídeos impressionantes instantaneamente

Sora AI produz vídeos impressionantes instantaneamente

Sora AI produz vídeos impressionantes instantaneamente PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Sora, um novo e impressionante modelo de vídeo generativo criado pela OpenAI, pode pegar uma breve descrição de texto e transformá-la em um clipe de filme intrincado e de alta definição com um minuto de duração.

OpenAI, controladora do chatbot ChatGPT e do gerador de imagens estáticas DALL-E, está entre as muitas empresas que disputam para aprimorar esse gerador de vídeo instantâneo. Outras empresas incluem start-ups como Runway e gigantes da tecnologia como Google e Meta Platforms Inc., donos do Facebook e do Instagram.

A tecnologia tem o potencial de substituir completamente artistas digitais menos qualificados, ao mesmo tempo que acelera o trabalho de cineastas experientes.

Leia também: O cofundador da OpenAI, Andrej Karpathy, Steps Down, Eyes Personal Ventures

Liberando Sora

A OpenAI batizou seu novo sistema de Sora, a palavra japonesa para céu. A equipe de desenvolvimento da tecnologia, que inclui os pesquisadores Tim Brooks e Bill Peebles, escolheu o nome porque “evoca a ideia de potencial criativo ilimitado”.

Eles também disseram que a empresa ainda não havia divulgado o Sora ao público porque ainda estava investigando os riscos associados ao sistema. Em vez disso, a OpenAI está a partilhar a tecnologia com um grupo selecionado de académicos e outros investigadores externos que irão “equipar-se” com ela, um termo para descrever a procura de potenciais utilizações indevidas.

Segundo o Dr. Brooks, a intenção aqui é dar uma prévia do que está por vir para que as pessoas possam ver as capacidades dessa tecnologia e obter feedback.

OpenAI marca os vídeos

A OpenAI já marca vídeos criados pelo sistema com marcas d'água para indicar que foram gerados por inteligência artificial (IA). No entanto, a empresa reconhece que estes podem ser removidos. Eles acrescentaram que também podem ser difíceis de identificar.

De acordo com o OpenAI, eles estão ensinando inteligência artificial (IA) a compreender e simular o mundo físico em movimento, com o objetivo de treinar modelos que ajudem as pessoas a resolver problemas que exigem interação no mundo real.

Além disso, eles estão concedendo acesso a vários artistas visuais, designers e cineastas para obter feedback sobre como fazer o modelo avançar para ser mais útil para profissionais criativos.

Eles estão compartilhando o progresso de suas pesquisas antecipadamente para começar a trabalhar e obter feedback de pessoas fora da OpenAI e para dar ao público uma noção de quais capacidades de IA estão no horizonte.

Desenvolvendo Sora

O Mercado Pago não havia executado campanhas de Performance anteriormente nessas plataformas. Alcançar uma campanha de sucesso exigiria OpenAI recusou-se a divulgar o número de vídeos dos quais o sistema aprendeu ou de onde eles vieram. Afirmaram apenas que a formação incluía tanto vídeos disponíveis publicamente como vídeos licenciados por detentores de direitos de autor.

A empresa foi processada diversas vezes por usar conteúdo protegido por direitos autorais. Provavelmente está tentando manter vantagem sobre os concorrentes, por isso não divulga nada sobre os dados usados ​​para treinar suas tecnologias.

Além disso, o modelo tem uma profunda compreensão da linguagem, o que lhe permite interpretar com precisão as instruções e gerar personagens atraentes que transmitem emoções de forma vívida. Sora também pode gerar várias tomadas que mantêm a cena visual e o caráter em um único vídeo gerado.

OpenAI compartilhou o prompt para gerar um vídeo em seu identificador X, causando diversas reações dos usuários X.

As fraquezas do modelo

Segundo a OpenAI, o modelo atual apresenta pontos fracos. Pode precisar de ajuda para simular com precisão a física de uma cena complexa e pode precisar de ajuda para compreender instâncias específicas de causa e efeito. Por exemplo, uma pessoa pode morder um biscoito, mas depois o biscoito pode não ter marca de mordida.

O modelo também pode precisar esclarecer os detalhes espaciais de um prompt, por exemplo, misturando esquerda e direita, e pode precisar de ajuda com descrições precisas de eventos que ocorrem ao longo do tempo, como seguir uma trajetória específica de câmera.

Carimbo de hora:

Mais de MetaNotícias