로봇 손은 새로운 AI 스마트 기능으로 인간의 손재주를 따라잡을 수 있다고 Nvidia가 주장함 - Decrypt

로봇 손은 새로운 AI 스마트 기능으로 인간의 손재주를 따라잡을 수 있다고 Nvidia가 주장 – Decrypt

로봇 손은 인간의 민첩성을 새로운 AI 스마트와 일치시킬 수 있다고 Nvidia는 주장합니다. - PlatoBlockchain 데이터 인텔리전스를 해독합니다. 수직 검색. 일체 포함.

Nvidia 연구원들은 로봇의 민첩성 측면에서 큰 도약을 달성했습니다. 유레카, 인간만큼 능숙하게 펜 돌리기 기술과 같은 복잡한 기술을 봇에게 가르칠 수 있는 AI 에이전트입니다.

목요일에 발표된 논문에 설명된 새로운 기술은 다음과 같은 대규모 언어 모델의 최근 발전을 기반으로 합니다. OpenAI의 GPT-4. Eureka는 생성 ​​AI를 활용하여 로봇이 시행착오 강화 학습을 통해 학습할 수 있도록 하는 정교한 보상 알고리즘을 자율적으로 작성합니다. 이 접근 방식은 인간이 작성한 프로그램보다 50% 이상 더 효과적인 것으로 입증되었다고 논문에서는 설명합니다.

Nvidia의 공식 블로그 게시물에 따르면 "Eureka는 또한 네발 달린 민첩한 손, 협동로봇 팔 및 기타 로봇에게 서랍 열기, 가위 사용, 캐치볼 사용 및 거의 30가지 다양한 작업을 가르쳤습니다."라고 밝혔습니다. 

Eureka는 언어 모델을 사용하여 AI를 조종하는 Nvidia의 선구적인 작업을 보여주는 최신 데모입니다. 최근 회사에서 오픈소스로 스티어링LM- 인간의 피드백에 따라 AI 보조자를 훈련시켜 더 도움이 되도록 조정하는 방법입니다.

Eureka와 마찬가지로 SteerLM도 언어 모델의 발전을 활용하지만 AI 보조 정렬 개선이라는 다른 과제에 중점을 둡니다. SteerLM은 로봇이 행동을 통해 학습하는 것처럼 보조원이 대화를 연습하도록 하여 훈련시킵니다. 시스템은 유용성, 유머, 품질과 같은 속성을 통해 보조자의 응답에 대한 피드백을 제공합니다.

예를 들어, 인간이 무작위로 수천 개의 춤을 검토하고 어떤 춤이 좋은지 선택하는 대신 로봇이 좋음 또는 나쁨으로 분류된 비디오에서 춤추는 법을 배우는 것과 같습니다(이것이 일반적인 방식입니다). AI 챗봇 훈련을 받았습니다). 반복적으로 연습하고 피드백을 받으면서 어시스턴트는 사용자의 요구에 맞는 응답을 제공하는 방법을 배웁니다. 이는 AI를 실제 애플리케이션에 더욱 유용하게 만드는 데 도움이 됩니다.

공통점은 로봇을 가르치든 챗봇을 가르치든 창의적이고 새로운 방식으로 고급 신경망을 사용한다는 것입니다. Nvidia는 하드웨어와 소프트웨어 측면 모두에서 경계를 넓히고 있습니다.

유레카의 경우, 에서와 같은 시뮬레이션 기술을 결합하는 것이 핵심이었습니다. 이삭 체육관 언어 모델의 패턴 인식 능력을 활용합니다. Eureka는 여러 번의 훈련 실행을 통해 자체 보상 알고리즘을 최적화하여 효과적으로 "학습하는 방법을 배웁니다". 보상을 개선하기 위해 인간의 입력도 받아들입니다.

이러한 자기 개선 접근 방식은 다리가 있고, 바퀴가 있고, 날고, 손이 능숙한 모든 종류의 로봇을 훈련시켜 지금까지 고도로 일반화 가능한 것으로 입증되었습니다.

Nvidia의 Eureka와 SteerLM은 단지 장벽을 허무는 것이 아니라 로봇과 AI에게 기교와 통찰력 있는 상호 작용의 기술을 가르치고 있습니다. 펜을 휘두르며 재치 있는 대화를 나누며 그들은 AI가 단지 흉내만 내는 것이 아니라 우리와 함께 혁신하는 미래를 그려가고 있습니다.

암호화 뉴스를 최신 상태로 유지하고 받은 편지함에서 매일 업데이트를 받으십시오.

타임 스탬프 :

더보기 해독