O GPT-4 da OpenAI não rodará Doom, mas jogará mal

Republicado por Platão

seguidores: 0

Você pode acabar morando em uma cabana de espingarda. E você pode acabar trabalhando com GPT-4. E você pode se perguntar: “O GPT-4 rodará o Doom?” E você pode se perguntar: “Estou certo? Estou errado?"

Adrian de Wynter, principal cientista aplicado da Microsoft e pesquisador da Universidade de York, na Inglaterra, colocou essas questões em um artigo de pesquisa recente, “O GPT-4 executará o Doom?"

Infelizmente, GPT-4, um grande modelo de linguagem da OpenAI apoiada pela Microsoft, não tem capacidade para executar o código-fonte do Doom diretamente.

Mas sua variante multimodal, GPT-4V, que pode aceitar imagens como entrada e também texto, exibe a mesma cativante subcompetência de jogar doom como os modelos baseados em texto que lançaram inúmeras startups de IA.

“Na configuração do artigo, o GPT-4 (e o GPT-4 com visão, ou GPT-4V) não pode realmente rodar o Doom sozinho, porque é limitado pelo tamanho da entrada (e, obviamente, provavelmente apenas inventará coisas ; você realmente não quer que seu compilador tenha alucinações a cada cinco minutos)”, escreveu de Wynter em um comentário explicativo. nota sobre seu papel. “Dito isto, ele pode definitivamente atuar como um proxy para o motor, não muito diferente de outros 'ele rodará Doom?' implementações, como E. Coli or Bloco de notas. "

Ou seja, o GPT-4V não rodará Doom como um trator John Deere mas jogará Doom sem treinamento específico.

Para gerenciar isso, de Wynter projetou um componente Vision que chama GPT-4V, que captura capturas de tela do mecanismo de jogo e retorna descrições estruturais do estado do jogo. E ele combinou isso com um modelo de Agente que chama GPT-4 para tomar decisões com base na entrada visual e no histórico anterior. O modelo do Agente foi instruído a traduzir suas respostas em comandos de pressionamento de tecla que tenham significado para o mecanismo de jogo.

As interações são tratadas por meio de uma camada Manager que consiste em uma ligação Python de código aberto ao Motor C Doom rodando no Matplotlib.

Um gráfico mostrando o design do sistema GPT-4V para jogar DOOM

Diagrama de De Wynter mostrando o design de um sistema GPT-4V para jogar Doom… Clique para ampliar

Essa combinação de modelos e códigos de IA pode abrir portas, combater inimigos e disparar armas, de acordo com o jornal. E pode executar um conjunto mais amplo de instruções, como um passo a passo de nível, para melhorar seu próprio desempenho.

A principal deficiência deste sistema baseado em GPT-4V é a falta de permanência do objeto – ele se esquece dos zumbis do jogo quando eles saem da tela.

GPT-4 esquece o zumbi e segue em frente

“Por exemplo, seria muito comum o modelo ver um zumbi na tela e começar a atirar nele até acertá-lo (ou morrer)”, explica de Wynter. “Agora, esta é uma IA escrita para funcionar com hardware de 1993, então suponho que não tenha uma árvore de decisão super profunda. Então o zumbi atira em você e começa a correr pela sala.

“Qual é o problema aqui? Bem, primeiro o zumbi sai de vista. Pior, ainda está vivo e irá bater em você em algum momento. Então você tem que ir atrás, certo? Afinal, em Doom, é bater ou ser derrotado.

“Acontece que o GPT-4 se esquece do zumbi e segue em frente. Nota: o prompt diz explicitamente ao modelo o que fazer se estiver sofrendo danos e não puder ver um inimigo. Melhor ainda, ele simplesmente segue seu caminho alegre, fica preso em um canto e morre. Ele girou algumas vezes, mas em quase 50-60 corridas, eu observei… duas vezes, quero dizer.”

Além disso, o GPT-4 não consegue raciocinar muito bem. Quando solicitado a explicar as suas ações que eram geralmente corretas no contexto, as suas explicações eram pobres e muitas vezes incluíam alucinações (também conhecidas como informações incorretas).

De Wynter, no entanto, considera notável que o GPT-4 seja capaz de jogar Doom sem treinamento prévio.

Ao mesmo tempo, ele acha isso preocupante.

“No departamento de ética, é bastante preocupante como foi fácil para (a) eu construir código para fazer o modelo fotografar algo; e (b) para que o modelo fotografe algo com precisão, sem realmente questionar as instruções”, escreveu ele em sua postagem resumida.

“Portanto, embora esta seja uma exploração muito interessante em torno do planejamento e do raciocínio, e possa ter aplicações em testes automatizados de videogames, é bastante óbvio que este modelo não tem consciência do que está fazendo. Peço veementemente a todos que pensem sobre o que a implantação desses modelos [implica] para a sociedade e seu potencial uso indevido.”

E você pode dizer para si mesmo: “Meu Deus, o que eu fiz?” ®

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
Fonte: https://go.theregister.com/feed/www.theregister.com/2024/03/11/gpt4_wont_run_doom/

Carimbo de hora: 12 de março de 2024

Carimbo de hora: 29 de Outubro, 2022

O GPT-4 da OpenAI não rodará Doom, mas jogará mal

Republicado por Platão

Mais de O registro

Modelos de texto para imagem aprendem de forma mais eficiente com dados falsos

Construir pedaços de cérebro no laboratório mudará nossas mentes

AMD promete chips de IA compatíveis com exportação para o mercado chinês

Comportamento emergente do LLM descartado como 'uma miragem' por estudo

Microsoft disse estar em negociações para investir mais em OpenAI

China permite táxis robóticos – sem motoristas de backup – em partes de duas grandes cidades

Boffins cria ‘backdoor universal’ para modelos de imagem

CTO da Dell: As empresas terão GenAI em produção em 2024

Apple pisa no freio de carros autônomos e agora aponta para 2026

O órgão de vigilância da privacidade pede que as empresas abandonem o software de IA de análise emocional

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta