ทารกเป็นลูกที่ร่าเริง น่ากอด น่าหัวเราะคิกคัก พวกเขายังเป็นเครื่องเรียนรู้ที่ทรงพลังอย่างมหาศาล เมื่ออายุได้สามเดือน พวกเขามีสัญชาตญาณว่าสิ่งต่างๆ รอบตัวมีพฤติกรรมอย่างไร โดยไม่มีใครสอนกฎของเกมให้ชัดเจน
ความสามารถนี้ซึ่งเรียกว่า "ฟิสิกส์ที่ใช้งานง่าย" ดูเหมือนเล็กน้อยมากบนพื้นผิว ถ้าฉันเติมน้ำลงในแก้วแล้ววางลงบนโต๊ะ ฉันรู้ว่าแก้วนั้นเป็นวัตถุ—บางสิ่งที่ฉันสามารถเอามือไปพันไว้ได้โดยไม่ละลายในฝ่ามือ มันจะไม่จมลงไปในโต๊ะ และถ้ามันเริ่มลอย ฉันจะจ้องแล้ววิ่งออกจากประตูทันที
ทารกพัฒนาความสามารถนี้อย่างรวดเร็วโดยการดูดซับข้อมูลจากสภาพแวดล้อมภายนอก ทำให้เกิด "สามัญสำนึก" เกี่ยวกับพลวัตของโลกทางกายภาพ เมื่อสิ่งต่าง ๆ ไม่เคลื่อนไหวตามที่คาดไว้ เช่น ในกลอุบายที่วัตถุหายไป สิ่งเหล่านี้จะสร้างความประหลาดใจ
สำหรับ AI มันเป็นเรื่องที่แตกต่างอย่างสิ้นเชิง ในขณะที่โมเดล AI ล่าสุดได้เอาชนะมนุษย์ไปแล้วตั้งแต่การเล่นเกมไปจนถึงการแก้ปัญหาที่มีอายุหลายสิบปี ปริศนาทางวิทยาศาสตร์พวกเขายังคงดิ้นรนเพื่อพัฒนาสัญชาตญาณเกี่ยวกับโลกทางกายภาพ
ในเดือนนี้ นักวิจัยจาก DeepMind ที่ Google เป็นเจ้าของได้รับแรงบันดาลใจจากจิตวิทยาพัฒนาการและ สร้างAI ที่ดึงกฎง่ายๆ เกี่ยวกับโลกผ่านการดูวิดีโออย่างเป็นธรรมชาติ Netflix และ Chill ไม่ทำงานด้วยตัวเอง โมเดล AI only เรียนรู้กฎของโลกทางกายภาพของเราเมื่อได้รับแนวคิดพื้นฐานของวัตถุ เช่น ขอบเขตของวัตถุ อยู่ที่ไหน และเคลื่อนที่อย่างไร คล้ายกับเด็กทารก AI แสดง "ความประหลาดใจ" เมื่อแสดงสถานการณ์มหัศจรรย์ที่ไม่สมเหตุสมผล เช่น ลูกบอลกลิ้งขึ้นทางลาด
ขนานนามว่า PLATO (สำหรับการเรียนรู้ฟิสิกส์ผ่านการเข้ารหัสอัตโนมัติและการติดตามวัตถุ) AI มีความยืดหยุ่นอย่างน่าประหลาดใจ ต้องการเพียงตัวอย่างเล็กๆ น้อยๆ ในการพัฒนา "สัญชาตญาณ" เมื่อเรียนรู้แล้ว ซอฟต์แวร์สามารถสรุปการคาดการณ์ว่าสิ่งต่าง ๆ เคลื่อนไหวและโต้ตอบกับวัตถุอื่นอย่างไร รวมถึงสถานการณ์ที่ไม่เคยพบมาก่อน
ในทางหนึ่ง PLATO เป็นจุดที่ลงตัวระหว่างธรรมชาติและการเลี้ยงดู นักจิตวิทยาพัฒนาการได้โต้เถียงกันมานานแล้วว่าการเรียนรู้ในทารกสามารถทำได้จากการค้นหารูปแบบข้อมูลจากประสบการณ์เพียงอย่างเดียวหรือไม่ เพลโตแนะนำว่าคำตอบคือไม่ อย่างน้อยก็ไม่ใช่สำหรับงานนี้โดยเฉพาะ ทั้งความรู้และประสบการณ์ที่มีอยู่แล้วภายในมีความสำคัญต่อการเติมเต็มเรื่องราวการเรียนรู้ทั้งหมด
เพื่อให้ชัดเจน PLATO ไม่ใช่แบบจำลองดิจิทัลของทารกอายุสามเดือน—และไม่เคยได้รับการออกแบบมาให้เป็น อย่างไรก็ตาม มันแสดงให้เห็นแวบเดียวว่าจิตใจของเราพัฒนาไปอย่างไร
“งาน…กำลังผลักดันขอบเขตของสิ่งที่ประสบการณ์ในชีวิตประจำวันสามารถทำได้และไม่สามารถอธิบายได้ในแง่ของความฉลาด” แสดงความคิดเห็น ดร. Susan Hespos และ Apoorva Shivaram จาก Northwestern University และ Western Sydney University ตามลำดับ ซึ่งไม่ได้เกี่ยวข้องกับการศึกษาวิจัย อาจ “บอกเราถึงวิธีสร้างแบบจำลองคอมพิวเตอร์ที่ดีขึ้นซึ่งจำลองความคิดของมนุษย์”
ปริศนาสามัญสำนึก
เมื่ออายุได้เพียง XNUMX เดือน ทารกส่วนใหญ่จะไม่สนใจหากทำของเล่นหล่นและตกลงพื้น พวกเขาได้หยิบเอาแนวคิดเรื่องแรงโน้มถ่วงขึ้นมาแล้ว
สิ่งที่เกิดขึ้นยังคงทำให้งงงัน แต่มีแนวคิดบางอย่าง ในวัยนั้น ทารกยังคงดิ้นดิ้นไปมา คลาน หรือเคลื่อนไหวอย่างอื่นไม่ได้ ข้อมูลจากโลกภายนอกส่วนใหญ่มาจากการสังเกต นั่นเป็นข่าวดีสำหรับ AI: แทนที่จะสร้างหุ่นยนต์เพื่อสำรวจสภาพแวดล้อมทางกายภาพ เป็นไปได้ที่จะใส่ความรู้สึกของฟิสิกส์ลงใน AI ผ่านวิดีโอ
เป็นทฤษฎีที่รับรองโดย Dr. Yann LeCun ผู้เชี่ยวชาญด้าน AI ชั้นนำและหัวหน้านักวิทยาศาสตร์ AI ของ Meta ในการพูดคุยตั้งแต่ปี 2019เขาตั้งข้อสังเกตว่าทารกน่าจะเรียนรู้ผ่านการสังเกต สมองของพวกเขาสร้างจากข้อมูลเหล่านี้เพื่อสร้างแนวความคิดเกี่ยวกับความเป็นจริง ในทางตรงกันข้าม แม้แต่โมเดลการเรียนรู้เชิงลึกที่ซับซ้อนที่สุดก็ยังพยายามดิ้นรนเพื่อสร้างความรู้สึกถึงโลกทางกายภาพของเรา ซึ่งจำกัดว่าพวกเขาสามารถมีส่วนร่วมกับโลกได้มากเพียงใด ทำให้พวกเขาแทบจะคิดอยู่ในกลุ่มเมฆ
คุณจะวัดความเข้าใจของทารกเกี่ยวกับฟิสิกส์ในชีวิตประจำวันได้อย่างไร “โชคดีสำหรับเรา นักจิตวิทยาด้านพัฒนาการใช้เวลาหลายสิบปีในการศึกษาสิ่งที่ทารกรู้เกี่ยวกับโลกทางกายภาพ” เขียน นักวิทยาศาสตร์นำ ดร.หลุยส์ ไพลอโต การทดสอบที่ทรงพลังอย่างหนึ่งคือกระบวนทัศน์การละเมิดความคาดหวัง (VoE) ให้ทารกเห็นลูกบอลกลิ้งขึ้นเขา หายตัวไปอย่างไม่ตั้งใจ หรือจู่ๆ ก็ไปในทิศทางตรงกันข้าม และทารกจะจ้องไปที่ความผิดปกตินั้นนานกว่าที่มันจะเกิดขึ้นเมื่อปฏิบัติตามความคาดหวังตามปกติ มีสิ่งแปลกปลอมเกิดขึ้น
พื้นที่ปกติ
ในการศึกษาใหม่ ทีมงานได้ปรับ VoE สำหรับการทดสอบ AI พวกเขาจัดการกับห้าแนวคิดทางกายภาพที่แตกต่างกันเพื่อสร้าง PLATO ในบรรดาสิ่งเหล่านี้มีความแข็งแกร่ง นั่นคือ วัตถุสองชิ้นไม่สามารถทะลุผ่านกันได้ และความต่อเนื่อง—แนวคิดที่ว่าสิ่งต่าง ๆ มีอยู่จริงและไม่กะพริบตาแม้ในขณะที่วัตถุอื่นซ่อนอยู่ (การทดสอบ “แอบดู”)
ในการสร้าง PLATO ทีมงานเริ่มต้นด้วยวิธีการมาตรฐานใน AI ด้วยวิธีสองง่าม องค์ประกอบหนึ่งคือโมเดลการรับรู้ นำข้อมูลภาพมาแยกวิเคราะห์วัตถุที่ไม่ต่อเนื่องในรูปภาพ ถัดไปคือตัวทำนายไดนามิกซึ่งใช้โครงข่ายประสาทเทียมเพื่อพิจารณาประวัติของวัตถุก่อนหน้าและทำนายพฤติกรรมของวัตถุถัดไป กล่าวอีกนัยหนึ่ง โมเดลสร้าง "เอ็นจิ้นฟิสิกส์" ที่จับคู่วัตถุหรือสถานการณ์และคาดเดาว่าบางสิ่งจะมีพฤติกรรมในชีวิตจริงอย่างไร การตั้งค่านี้ทำให้ PLATO มีแนวคิดเบื้องต้นเกี่ยวกับคุณสมบัติทางกายภาพของวัตถุ เช่น ตำแหน่งและความเร็วของวัตถุ
ต่อไปก็มาอบรม ทีมแสดงวิดีโอสังเคราะห์ของ PLATO ที่มีอายุต่ำกว่า 30 ชั่วโมงจาก an ชุดข้อมูลโอเพ่นซอร์ส. นี่ไม่ใช่วิดีโอจากเหตุการณ์ในชีวิตจริง ให้จินตนาการถึงแอนิเมชั่นบล็อกบล็อกเหมือน Nintendo แบบเก่าของลูกบอลกลิ้งไปตามทางลาด กระดอนเข้าไปในลูกบอลอีกลูกหนึ่ง หรือหายไปในทันใด ในที่สุด PLATO ก็เรียนรู้ที่จะคาดการณ์ว่าวัตถุชิ้นเดียวจะเคลื่อนที่อย่างไรในเฟรมวิดีโอถัดไป และยังอัปเดตหน่วยความจำของวัตถุนั้นด้วย ด้วยการฝึกฝน การคาดการณ์ใน "ฉาก" ถัดไปจึงแม่นยำยิ่งขึ้น
จากนั้นทีมงานก็ขว้างประแจเข้าไปในซี่ล้อ พวกเขานำเสนอเพลโตด้วยทั้งฉากปกติและฉากที่เป็นไปไม่ได้ เช่น ลูกบอลหายไปอย่างกะทันหัน เมื่อวัดความแตกต่างระหว่างเหตุการณ์จริงกับการคาดคะเนของ PLATO ทีมงานสามารถวัดระดับ "ความประหลาดใจ" ของ AI ซึ่งผ่านหลังคาสำหรับเหตุการณ์มหัศจรรย์
การเรียนรู้ทั่วไปกับวัตถุเคลื่อนไหวอื่น ๆ ท้าทายด้วย a ชุดข้อมูลที่แตกต่างอย่างสิ้นเชิง พัฒนาโดย MIT ซึ่งมีทั้งกระต่ายและพินโบว์ลิ่ง ซึ่ง PLATO ได้เลือกปฏิบัติอย่างเชี่ยวชาญระหว่างเหตุการณ์ที่เป็นไปไม่ได้และสมจริง เพลโตไม่เคย "เห็น" กระต่ายมาก่อน แต่หากไม่มีการฝึกซ้ำ มันสร้างความประหลาดใจเมื่อกระต่ายฝ่าฝืนกฎของฟิสิกส์ เช่นเดียวกับเด็กทารก PLATO สามารถจับภาพสัญชาตญาณทางกายภาพได้โดยใช้วิดีโอฝึกอบรมเพียง 28 ชั่วโมง
สำหรับ Hespos และ Shivaram "การค้นพบนี้มีลักษณะที่คล้ายคลึงกันที่เราเห็นในการศึกษาเกี่ยวกับทารก"
สัญชาตญาณดิจิทัล
PLATO ไม่ได้หมายถึงโมเดล AI สำหรับการให้เหตุผลของทารก แต่มันแสดงให้เห็นว่าการแตะเข้าไปในสมองของทารกที่กำลังเติบโตของเราสามารถสร้างแรงบันดาลใจให้คอมพิวเตอร์มีความรู้สึกทางกายภาพ แม้ว่า "สมอง" ของซอฟต์แวร์จะติดอยู่ในกล่องอย่างแท้จริง ไม่ใช่แค่การสร้างหุ่นยนต์ฮิวแมนนอยด์เท่านั้น จากอวัยวะเทียมไปจนถึงรถยนต์ที่ขับด้วยตนเอง ความเข้าใจโดยสัญชาตญาณของโลกทางกายภาพเชื่อมโยงโลกดิจิทัลที่ไม่เป็นรูปเป็นร่างของยุค 0 และ 1 เข้ากับทุก ๆ วัน ความเป็นจริงที่แทบไม่เคยเกิดขึ้นมาก่อน
นี่ไม่ใช่ครั้งแรกที่นักวิทยาศาสตร์ AI คิดที่จะเทอร์โบชาร์จจิตใจของเครื่องจักรด้วยความเฉลียวฉลาดของเด็กวัยหัดเดิน หนึ่งความคิด คือการทำให้ AI เข้าใจทฤษฎีของจิตใจ นั่นคือความสามารถในการแยกแยะตัวเองออกจากผู้อื่น และสามารถวาดภาพตัวเองในรองเท้าของผู้อื่นได้ เป็นความสามารถที่เป็นธรรมชาติสำหรับเด็กอายุประมาณ XNUMX ขวบ และหากฝังอยู่ในโมเดล AI ก็จะช่วยให้เข้าใจปฏิสัมพันธ์ทางสังคมได้อย่างมาก
การศึกษาใหม่นี้สร้างขึ้นในช่วงเดือนแรกๆ ของชีวิตในฐานะแหล่งข้อมูลที่สมบูรณ์สำหรับการพัฒนา AI ด้วยสามัญสำนึก สำหรับตอนนี้ ฟิลด์นี้ยังอยู่ในช่วงเริ่มต้น ผู้เขียนกำลังเผยแพร่ชุดข้อมูลของตนเพื่อให้ผู้อื่นสร้างและสำรวจความสามารถของโมเดล AI ในการโต้ตอบกับแนวคิดทางกายภาพที่ซับซ้อนยิ่งขึ้น รวมถึงวิดีโอจากโลกแห่งความเป็นจริง Hespos และ Shivaram กล่าวว่า "การศึกษาเหล่านี้สามารถใช้เป็นโอกาสร่วมกันใน AI และวิทยาศาสตร์เพื่อการพัฒนา"