Trò chơi thủ công Genie AI của Google từ các hình ảnh đơn lẻ

Trò chơi thủ công Genie AI của Google từ các hình ảnh đơn lẻ

Google đã công bố Genie, một ứng dụng tạo trò chơi di động, như một phần trong kế hoạch đầu tư liên tục vào trí tuệ nhân tạo. 

Mô hình AI tổng quát Genie, được phát triển bởi công ty khởi nghiệp AI DeepMind của Google, đã trình diễn một bản demo trực tiếp. Genie tìm hiểu cơ chế trò chơi từ hàng trăm nghìn video cách chơi và có thể tạo ra các trò chơi có thể chơi được mà không cần nhiều lời nhắc.

Cũng đọc: Hình AI sẽ huy động được 675 triệu đô la cho Robot hình người giải quyết lao động

Ra mắt thần đèn

Như đã nêu trong DeepMind chính thức của Google blog đăng bài, Genie là một mô hình nền tảng của thế giới được đào tạo bằng các video trực tuyến. Mô hình có thể tạo ra “vô số thế giới có thể chơi được (có thể điều khiển bằng hành động) từ hình ảnh tổng hợp, ảnh chụp và thậm chí cả bản phác thảo”.

Genie, viết tắt của Môi trường tương tác sáng tạo, được phát triển với sự hợp tác giữa Google và Đại học British Columbia. Chỉ với một hình ảnh, nó có thể tạo ra các nền tảng 2D cuộn bên như Contra và Super Mario Brothers dựa trên lời nhắc của người dùng.

Tuy nhiên, Google DeepMind đã tuyên bố trong thông báo rằng họ đang giới thiệu một “mô hình mới” cho trí tuệ nhân tạo tổng hợp (AI) dưới dạng Genie. Ngoài ra, công ty thừa nhận sự xuất hiện của các mô hình AI có khả năng tạo ra nội dung mới và sáng tạo thông qua ngôn ngữ, hình ảnh và thậm chí cả video.

Theo Google, một phần đáng kể trong số 200,000 giờ video chơi game công cộng trên internet không được giám sát mà Genie được đào tạo là nền tảng 2D chứ không phải trò chơi thực tế ảo hoàn chỉnh.

Thông số kỹ thuật của Genie

Khi nói đến kích thước, Genie đứng ở mức 11 tỷ thông số. Công cụ mã thông báo video theo không gian, thời gian, mô hình động lực tự hồi quy và mô hình hành động tiềm ẩn đơn giản và có thể mở rộng cũng được đưa vào mô hình. Các thông số kỹ thuật này cho phép Genie hoạt động theo từng khung hình trong môi trường được tạo, ngay cả khi không có nhãn hoặc các yêu cầu dành riêng cho miền khác khi đào tạo.

Ngoài ra, Genie có thể được hướng dẫn để tạo ra một loạt các môi trường tương tác và có thể kiểm soát được, mặc dù được đào tạo về dữ liệu chỉ có video. Genie có thể tạo ra các môi trường có thể chơi được chỉ bằng một dấu nhắc hình ảnh, không giống như nhiều mô hình AI tổng quát có thể tạo ra nội dung sáng tạo bằng hình ảnh ngôn ngữ và thậm chí cả video.

Tuy nhiên, nhà phát triển Google DeepMind, Tim Rocktäschel cho biết trên X (trước đây là Twitter) rằng họ tập trung vào quy mô hơn là thêm các thành kiến ​​quy nạp.

Ông nói thêm rằng họ sử dụng tập dữ liệu gồm hơn 200 nghìn giờ video từ các nền tảng 2D và đào tạo mô hình thế giới 11B. Theo cách không bị giám sát, Genie học các hành động tiềm ẩn đa dạng để điều khiển nhân vật một cách nhất quán.

Trò chơi thủ công Genie AI của Google từ các hình ảnh đơn lẻ
Tín dụng hình ảnh: Google

Khả năng của Genie

Theo Google các nhà nghiên cứu, Genie được điều khiển bởi ba mô hình: một mô hình động dự đoán điều gì sẽ xảy ra trong khung hình tiếp theo, một mã thông báo video biến các khung hình video thô thành các mã thông báo rời rạc và một mô hình hành động tiềm ẩn có thể suy ra các hành động giữa các khung hình video.

Mô hình nền tảng của Genie có khả năng xác định nhân vật chính của trò chơi mà không cần đào tạo về hành động hoặc chú thích văn bản là một trong những tính năng độc đáo của nó. Nhờ các mô hình điều khiển nó, người dùng có thể dễ dàng điều khiển nhân vật trong một Do AI tạo môi trường thực tế ảo.

Rocktäschel cũng nói rằng Genie có thể biến các phương tiện khác thành trò chơi. Genie có thể được yêu cầu tạo ra nhiều thế giới ảo có thể điều khiển bằng hành động khác nhau từ nhiều nguồn đầu vào khác nhau trong tài liệu nghiên cứu Google DeepMind đi kèm.

Hơn nữa, Rocktäschel cho biết mô hình này có thể chuyển đổi bất kỳ hình ảnh nào thành thế giới 2D có thể chơi được. Theo anh, Genie có thể làm sống động những sáng tạo do con người thiết kế, chẳng hạn như các bản phác thảo, tác phẩm nghệ thuật tuyệt đẹp của Seneca và Caspian, hai trong số những nhà sáng tạo trẻ nhất thế giới từ trước đến nay.

Dấu thời gian:

Thêm từ MetaNews