Os pesquisadores da Nvidia alcançaram um grande salto na destreza robótica graças a Eureka, um agente de IA que supostamente pode ensinar aos bots habilidades complexas, como truques de girar canetas, tão habilmente quanto os humanos.
A nova técnica, descrita em artigo publicado quinta-feira, baseia-se em avanços recentes em grandes modelos de linguagem, como GPA-4 do OpenAI. Eureka aproveita a IA generativa para escrever de forma autônoma algoritmos de recompensa sofisticados que permitem que os robôs aprendam por meio de aprendizagem por reforço por tentativa e erro. Esta abordagem provou ser 50% mais eficaz do que programas de autoria humana, descreve o artigo.
“Eureka também ensinou mãos quadrúpedes e hábeis, braços de cobot e outros robôs a abrir gavetas, usar tesouras, pegar bolas e quase 30 tarefas diferentes”, diz uma postagem no blog oficial da Nvidia.
Eureka é a mais recente demonstração do trabalho pioneiro da Nvidia em direcionar IA com modelos de linguagem. Recentemente, a empresa abriu o código-fonte SteerLM—um método que alinha os assistentes de IA para serem mais úteis, treinando-os com base no feedback humano.
Semelhante ao Eureka, o SteerLM também utiliza avanços em modelos de linguagem, mas os concentra em um desafio diferente: melhorar o alinhamento do assistente de IA. SteerLM treina assistentes fazendo-os praticar conversas, como um robô aprendendo fazendo. O sistema fornece feedback sobre as respostas do assistente por meio de atributos como utilidade, humor e qualidade.
Por exemplo, é como se um robô aprendesse a dançar a partir de vídeos rotulados como bons ou ruins, em vez de ter um humano revisando milhares de danças aleatórias e selecionando quais são boas ou não (que é o modo como você costuma fazer isso). Chatbots AI são treinados). Ao praticar repetidamente e obter feedback, os assistentes aprendem a fornecer respostas adaptadas às necessidades do usuário. Isso ajuda a tornar a IA mais benéfica para aplicações do mundo real.
O ponto comum é o uso de redes neurais avançadas de novas maneiras criativas, seja ensinando robôs ou chatbots. A Nvidia está ultrapassando os limites tanto nas frentes de hardware quanto de software.
Para Eureka, a chave foi combinar tecnologias de simulação como as da Academia Isaac com a capacidade de reconhecimento de padrões dos modelos de linguagem. Eureka efetivamente “aprende a aprender”, otimizando seus próprios algoritmos de recompensa em várias execuções de treinamento. Aceita até contribuições humanas para refinar suas recompensas.
Esta abordagem de auto-aperfeiçoamento provou ser altamente generalizável até agora, treinando robôs de todos os tipos – com pernas, rodas, mãos voadoras e hábeis.
Eureka e SteerLM da Nvidia não estão apenas quebrando barreiras, eles estão ensinando aos robôs e à IA a arte da sutileza e da interação perspicaz. A cada giro de caneta e bate-papo espirituoso, eles esboçam um futuro onde a IA não apenas imita, mas inova junto conosco.
Fique por dentro das notícias sobre criptomoedas, receba atualizações diárias em sua caixa de entrada.
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- Fonte: https://decrypt.co/202659/nvidia-eureka-ai-agent-allegedly-makes-robot-hands-dextrous-human-ones