Mãos robóticas podem combinar a destreza dos humanos com a nova inteligência de IA, afirma a Nvidia - Decrypt

Mãos robóticas podem combinar a destreza dos humanos com a nova inteligência de IA, afirma a Nvidia

Mãos robóticas podem combinar a destreza dos humanos com a nova inteligência de IA, afirma Nvidia - Decrypt PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Os pesquisadores da Nvidia alcançaram um grande salto na destreza robótica graças a Eureka, um agente de IA que supostamente pode ensinar aos bots habilidades complexas, como truques de girar canetas, tão habilmente quanto os humanos.

A nova técnica, descrita em artigo publicado quinta-feira, baseia-se em avanços recentes em grandes modelos de linguagem, como GPA-4 do OpenAI. Eureka aproveita a IA generativa para escrever de forma autônoma algoritmos de recompensa sofisticados que permitem que os robôs aprendam por meio de aprendizagem por reforço por tentativa e erro. Esta abordagem provou ser 50% mais eficaz do que programas de autoria humana, descreve o artigo.

“Eureka também ensinou mãos quadrúpedes e hábeis, braços de cobot e outros robôs a abrir gavetas, usar tesouras, pegar bolas e quase 30 tarefas diferentes”, diz uma postagem no blog oficial da Nvidia. 

Eureka é a mais recente demonstração do trabalho pioneiro da Nvidia em direcionar IA com modelos de linguagem. Recentemente, a empresa abriu o código-fonte SteerLM—um método que alinha os assistentes de IA para serem mais úteis, treinando-os com base no feedback humano.

Semelhante ao Eureka, o SteerLM também utiliza avanços em modelos de linguagem, mas os concentra em um desafio diferente: melhorar o alinhamento do assistente de IA. SteerLM treina assistentes fazendo-os praticar conversas, como um robô aprendendo fazendo. O sistema fornece feedback sobre as respostas do assistente por meio de atributos como utilidade, humor e qualidade.

Por exemplo, é como se um robô aprendesse a dançar a partir de vídeos rotulados como bons ou ruins, em vez de ter um humano revisando milhares de danças aleatórias e selecionando quais são boas ou não (que é o modo como você costuma fazer isso). Chatbots AI são treinados). Ao praticar repetidamente e obter feedback, os assistentes aprendem a fornecer respostas adaptadas às necessidades do usuário. Isso ajuda a tornar a IA mais benéfica para aplicações do mundo real.

O ponto comum é o uso de redes neurais avançadas de novas maneiras criativas, seja ensinando robôs ou chatbots. A Nvidia está ultrapassando os limites tanto nas frentes de hardware quanto de software.

Para Eureka, a chave foi combinar tecnologias de simulação como as da Academia Isaac com a capacidade de reconhecimento de padrões dos modelos de linguagem. Eureka efetivamente “aprende a aprender”, otimizando seus próprios algoritmos de recompensa em várias execuções de treinamento. Aceita até contribuições humanas para refinar suas recompensas.

Esta abordagem de auto-aperfeiçoamento provou ser altamente generalizável até agora, treinando robôs de todos os tipos – com pernas, rodas, mãos voadoras e hábeis.

Eureka e SteerLM da Nvidia não estão apenas quebrando barreiras, eles estão ensinando aos robôs e à IA a arte da sutileza e da interação perspicaz. A cada giro de caneta e bate-papo espirituoso, eles esboçam um futuro onde a IA não apenas imita, mas inova junto conosco.

Fique por dentro das notícias sobre criptomoedas, receba atualizações diárias em sua caixa de entrada.

Carimbo de hora:

Mais de Descifrar