เกม Genie AI Crafts ของ Google จากรูปภาพเดี่ยว

เกม Genie AI Crafts ของ Google จากรูปภาพเดี่ยว

Google ได้ประกาศเปิดตัว Genie ซึ่งเป็นแอปสำหรับสร้างเกมบนมือถือ ซึ่งเป็นส่วนหนึ่งของการลงทุนอย่างต่อเนื่องในด้านปัญญาประดิษฐ์ 

Genie โมเดล AI สร้างสรรค์ซึ่งพัฒนาโดย DeepMind สตาร์ทอัพด้าน AI ของ Google สาธิตการสาธิตสด Genie เรียนรู้กลไกของเกมจากวิดีโอเกมเพลย์นับแสนรายการ และสามารถสร้างเกมที่สามารถเล่นได้โดยใช้คำสั่งเพียงเล็กน้อย

ยังอ่าน: Figure AI จะระดมทุน 675 ล้านดอลลาร์สำหรับหุ่นยนต์ฮิวแมนนอยด์ที่แก้ปัญหาแรงงานได้

เปิดตัวจีนี่

ตามที่ระบุไว้ใน DeepMind อย่างเป็นทางการของ Google โพสต์บล็อกGenie คือโมเดลพื้นฐานของโลกที่ได้รับการฝึกฝนโดยใช้วิดีโอออนไลน์ “โลกที่เล่นได้ (ควบคุมแอ็กชั่นได้) ที่หลากหลายไม่รู้จบจากภาพสังเคราะห์ ภาพถ่าย และแม้แต่ภาพร่าง” สามารถสร้างขึ้นได้จากโมเดลนี้

Genie ย่อมาจาก Generative Interactive Environments ได้รับการพัฒนาโดยความร่วมมือระหว่าง Google และมหาวิทยาลัยบริติชโคลัมเบีย ด้วยภาพเพียงภาพเดียว ก็สามารถสร้างเกมแพลตฟอร์ม 2 มิติแบบเลื่อนด้านข้างได้ เช่น Contra และ Super Mario Brothers ตามการแจ้งเตือนของผู้ใช้

อย่างไรก็ตาม Google DeepMind ระบุในระหว่างการประกาศว่ากำลังเปิดตัว “กระบวนทัศน์ใหม่” สำหรับปัญญาประดิษฐ์เชิงสร้างสรรค์ (AI) ในรูปแบบของ Genie นอกจากนี้ บริษัทยังรับทราบถึงการเกิดขึ้นของโมเดล AI เจนเนอเรชั่นที่สามารถสร้างเนื้อหาแปลกใหม่และสร้างสรรค์ผ่านภาษา รูปภาพ และแม้แต่วิดีโอ

จากข้อมูลของ Google ส่วนสำคัญของวิดีโอเกมทางอินเทอร์เน็ตสาธารณะที่ไม่ได้รับการดูแลจำนวน 200,000 ชั่วโมงที่ Genie ได้รับการฝึกฝนนั้นเป็นเกมแพลตฟอร์ม 2 มิติแทนที่จะเป็นเกมเสมือนจริงเต็มรูปแบบ

ข้อมูลจำเพาะของจีนี่

เมื่อพูดถึงมิติข้อมูล Genie มีพารามิเตอร์ถึง 11 พันล้านพารามิเตอร์ โทเค็นไนเซอร์วิดีโอ spatiotemporal โมเดลไดนามิกอัตโนมัติ และโมเดลการกระทำแฝงที่เรียบง่ายและปรับขนาดได้รวมอยู่ในโมเดลนี้ด้วย ข้อกำหนดเหล่านี้ช่วยให้ Genie สามารถดำเนินการในสภาพแวดล้อมที่สร้างขึ้นแบบทีละเฟรม แม้ว่าจะไม่มีป้ายกำกับหรือข้อกำหนดเฉพาะโดเมนอื่น ๆ เมื่อฝึกอบรมก็ตาม

นอกจากนี้ Genie ยังสามารถได้รับคำสั่งให้สร้างชุดสภาพแวดล้อมแบบโต้ตอบและควบคุมได้ที่หลากหลาย แม้ว่าจะได้รับการฝึกอบรมเกี่ยวกับข้อมูลวิดีโอเท่านั้นก็ตาม Genie สามารถสร้างสภาพแวดล้อมที่สามารถเล่นได้ด้วยการแสดงภาพเพียงภาพเดียว ซึ่งแตกต่างจากโมเดล AI ทั่วไปจำนวนมากที่สามารถสร้างเนื้อหาเชิงสร้างสรรค์ด้วยภาพภาษาและแม้แต่วิดีโอ

อย่างไรก็ตาม Tim Rocktäschel นักพัฒนา Google DeepMind กล่าวใน X (ชื่อเดิม Twitter) ว่าพวกเขามุ่งเน้นไปที่ขนาดมากกว่าการเพิ่มอคติแบบอุปนัย

เขาเสริมว่าพวกเขาใช้ชุดข้อมูลวิดีโอมากกว่า 200 ชั่วโมงจากผู้สร้างแพลตฟอร์ม 2 มิติ และฝึกฝนโมเดลโลก 11B ในลักษณะที่ไม่ได้รับการดูแล Genie เรียนรู้การกระทำแฝงที่หลากหลายซึ่งควบคุมตัวละครอย่างสม่ำเสมอ

เกม Genie AI Crafts ของ Google จากรูปภาพเดี่ยว
เครดิตภาพ: Google

ความสามารถของจีนี่

ตามที่ Google นักวิจัย Genie ขับเคลื่อนด้วยโมเดล 3 แบบ ได้แก่ โมเดลแบบไดนามิกที่คาดการณ์สิ่งที่จะเกิดขึ้นในเฟรมถัดไป โทเค็นวิดีโอที่เปลี่ยนเฟรมวิดีโอ Raw ให้เป็นโทเค็นแยก และโมเดลการดำเนินการแฝงที่สามารถอนุมานการดำเนินการระหว่างเฟรมวิดีโอได้

ความสามารถของโมเดลพื้นฐานของ Genie ในการระบุตัวละครหลักของเกมโดยไม่ได้รับการฝึกฝนเกี่ยวกับการดำเนินการหรือคำอธิบายประกอบแบบข้อความเป็นหนึ่งในคุณสมบัติที่เป็นเอกลักษณ์ ต้องขอบคุณโมเดลที่ขับเคลื่อนมัน ผู้ใช้จึงสามารถควบคุมตัวละครในเกมได้อย่างง่ายดาย สร้างขึ้นโดย AI สภาพแวดล้อมเสมือนจริง

Rocktäschel ยังกล่าวอีกว่า Genie สามารถเปลี่ยนสื่ออื่น ๆ ให้เป็นเกมได้ สามารถขอให้ Genie สร้างโลกเสมือนจริงที่ควบคุมได้ด้วยการกระทำต่างๆ จากข้อมูลต่างๆ ในรายงานการวิจัยของ Google DeepMind ที่แนบมาด้วย

นอกจากนี้ Rocktäschel ยังกล่าวอีกว่าโมเดลนี้สามารถแปลงรูปภาพใดๆ ให้เป็นโลก 2 มิติที่สามารถเล่นได้ ตามที่เขาพูด Genie สามารถทำให้การสร้างสรรค์ที่ออกแบบโดยมนุษย์ เช่น ภาพร่าง งานศิลปะที่สวยงามจาก Seneca และ Caspian สองผู้สร้างที่อายุน้อยที่สุดในโลกมีชีวิตขึ้นมาได้

ประทับเวลา:

เพิ่มเติมจาก เมตานิวส์