Nvidia tuyên bố bàn tay robot có thể sánh ngang với sự khéo léo của con người với trí thông minh AI mới

Nvidia tuyên bố bàn tay robot có thể sánh ngang với sự khéo léo của con người với trí thông minh AI mới

Bàn tay robot có thể sánh ngang với sự khéo léo của con người với trí thông minh AI mới, Nvidia tuyên bố - Giải mã trí thông minh dữ liệu PlatoBlockchain. Tìm kiếm dọc. Ái.

Các nhà nghiên cứu của Nvidia đã đạt được bước nhảy vọt lớn về sự khéo léo của robot nhờ Eureka, một đặc vụ AI được cho là có thể dạy cho bot những kỹ năng phức tạp như thủ thuật quay bút một cách khéo léo như con người.

Kỹ thuật mới, được nêu trong một bài báo xuất bản hôm thứ Năm, được xây dựng dựa trên những tiến bộ gần đây trong các mô hình ngôn ngữ lớn như GPT-4 của OpenAI. Eureka tận dụng trí tuệ nhân tạo để tự động viết các thuật toán khen thưởng phức tạp cho phép robot học hỏi thông qua học tăng cường thử và sai. Bài báo nêu rõ: Cách tiếp cận này đã được chứng minh là hiệu quả hơn 50% so với các chương trình do con người tạo ra.

Một bài đăng trên blog chính thức của Nvidia cho biết: “Eureka cũng đã dạy những bàn tay bốn chân khéo léo, cánh tay cobot và các robot khác cách mở ngăn kéo, sử dụng kéo, bắt bóng và gần 30 nhiệm vụ khác nhau”. 

Eureka là minh chứng mới nhất cho nỗ lực tiên phong của Nvidia trong việc điều khiển AI bằng các mô hình ngôn ngữ. Gần đây, công ty đã mở nguồn chỉ đạoLM—một phương pháp điều chỉnh các trợ lý AI để trở nên hữu ích hơn bằng cách đào tạo chúng dựa trên phản hồi của con người.

Tương tự như Eureka, SteerLM cũng sử dụng những tiến bộ trong mô hình ngôn ngữ nhưng tập trung chúng vào một thách thức khác—cải thiện sự liên kết của trợ lý AI. SteerLM đào tạo trợ lý bằng cách cho họ thực hành các cuộc trò chuyện, giống như một robot vừa học vừa làm. Hệ thống đưa ra phản hồi về phản hồi của trợ lý thông qua các thuộc tính như mức độ hữu ích, sự hài hước và chất lượng.

Ví dụ: nó giống như một robot học nhảy từ các video được gắn nhãn là tốt hay xấu, thay vì để con người đánh giá hàng nghìn điệu nhảy ngẫu nhiên và chọn xem điệu nhảy nào tốt hay không (đó là cách điển hình của bạn). Chatbot AI được đào tạo). Bằng cách liên tục thực hành và nhận phản hồi, trợ lý học cách đưa ra phản hồi phù hợp với nhu cầu của người dùng. Điều này giúp AI trở nên có lợi hơn cho các ứng dụng trong thế giới thực.

Chủ đề chung là việc sử dụng mạng lưới thần kinh tiên tiến theo những cách sáng tạo mới, cho dù là dạy robot hay chatbot. Nvidia đang vượt qua các ranh giới trên cả mặt trận phần cứng và phần mềm.

Đối với Eureka, điều quan trọng là kết hợp các công nghệ mô phỏng giống như công nghệ từ Phòng tập thể dục Isaac với khả năng nhận dạng mẫu của các mô hình ngôn ngữ. Eureka “học cách học” một cách hiệu quả, tối ưu hóa các thuật toán khen thưởng của riêng mình qua nhiều đợt đào tạo. Nó thậm chí còn chấp nhận đầu vào của con người để tinh chỉnh phần thưởng của mình.

Cho đến nay, cách tiếp cận tự cải thiện này đã được chứng minh là có tính tổng quát hóa cao, huấn luyện các loại robot—có chân, có bánh xe, biết bay và có bàn tay khéo léo.

Eureka và SteerLM của Nvidia không chỉ phá bỏ các rào cản mà còn dạy cho robot và AI nghệ thuật tương tác tinh tế và sâu sắc. Với mỗi ngòi bút và cuộc trò chuyện dí dỏm, họ đang phác thảo một tương lai nơi AI không chỉ bắt chước mà còn đổi mới cùng với chúng ta.

Luôn cập nhật tin tức về tiền điện tử, cập nhật hàng ngày trong hộp thư đến của bạn.

Dấu thời gian:

Thêm từ Giải mã