AI เจเนอเรชั่นใหม่ 'ได้รับแรงบันดาลใจจากฟิสิกส์' เกินความคาดหมาย นิตยสารควอนต้า

AI เจเนอเรชั่นใหม่ 'ได้รับแรงบันดาลใจจากฟิสิกส์' เกินความคาดหมาย นิตยสารควอนต้า

AI เจเนอเรชั่นใหม่ 'ได้รับแรงบันดาลใจจากฟิสิกส์' เกินความคาดหมาย นิตยสาร Quanta PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

บทนำ

เครื่องมือของปัญญาประดิษฐ์ โดยเฉพาะโครงข่ายประสาทเทียม มีประโยชน์ต่อนักฟิสิกส์ เป็นเวลาหลายปีมาแล้วที่เทคโนโลยีนี้ได้ช่วยนักวิจัยสร้างวิถีการเคลื่อนที่ของอนุภาคในการทดลองด้วยเครื่องเร่ง ค้นหาหลักฐานของอนุภาคใหม่ และตรวจจับคลื่นความโน้มถ่วงและดาวเคราะห์นอกระบบ ในขณะที่เครื่องมือ AI สามารถทำอะไรได้มากมายสำหรับนักฟิสิกส์ แต่คำถามในตอนนี้ตามที่ Max Tegmark นักฟิสิกส์จากสถาบันเทคโนโลยีแมสซาชูเซตส์กล่าวไว้คือ: "เราจะให้อะไรคืนได้ไหม"

Tegmark เชื่อว่าเพื่อนร่วมงานนักฟิสิกส์ของเขาสามารถมีส่วนสนับสนุนอย่างมากต่อวิทยาศาสตร์ของ AI และเขาได้ให้ความสำคัญกับการวิจัยนี้เป็นอันดับแรก วิธีหนึ่งที่นักฟิสิกส์สามารถช่วยพัฒนาเทคโนโลยี AI ได้ เขากล่าวว่า คือการแทนที่อัลกอริธึม "กล่องดำ" ของโครงข่ายประสาทเทียม ซึ่งการทำงานส่วนใหญ่ไม่อาจเข้าใจได้ ด้วยสมการของกระบวนการทางกายภาพที่เข้าใจกันดี

ความคิดนี้ไม่ใช่เรื่องใหม่ โมเดล AI เจนเนอเรชั่น ขึ้นอยู่กับการแพร่กระจาย — กระบวนการที่ทำให้นมที่เทลงในถ้วยกาแฟแพร่กระจายอย่างสม่ำเสมอ เกิดขึ้นครั้งแรกในปี 2015 และคุณภาพของภาพที่สร้างขึ้นก็ดีขึ้นอย่างมากตั้งแต่นั้นมา เทคโนโลยีดังกล่าวขับเคลื่อนซอฟต์แวร์สร้างภาพยอดนิยม เช่น DALL·E 2 และ Midjourney ตอนนี้ Tegmark และเพื่อนร่วมงานของเขากำลังเรียนรู้ว่าแบบจำลองกำเนิดที่ได้รับแรงบันดาลใจจากฟิสิกส์อื่นๆ อาจทำงานได้ดีเช่นเดียวกับแบบจำลองที่อิงการแพร่กระจายหรือดีกว่านั้น

เมื่อปลายปีที่แล้ว ทีมงานของ Tegmark ได้เปิดตัววิธีการใหม่ที่มีแนวโน้มในการผลิตภาพที่เรียกว่า แบบจำลองกำเนิดการไหลของปัวซอง (พีเอฟจีเอ็ม). ในนั้น ข้อมูลจะแสดงด้วยอนุภาคที่มีประจุ ซึ่งรวมกันเพื่อสร้างสนามไฟฟ้าที่มีคุณสมบัติขึ้นอยู่กับการกระจายตัวของประจุ ณ เวลาใดก็ตาม มันถูกเรียกว่าแบบจำลองการไหลของปัวซอง เนื่องจากการเคลื่อนที่ของประจุถูกควบคุมโดยสมการปัวซอง ซึ่งมาจากหลักการที่ระบุว่าแรงไฟฟ้าสถิตระหว่างสองประจุแปรผกผันกับกำลังสองของระยะห่างระหว่างประจุทั้งสอง (คล้ายกับสูตรของแรงโน้มถ่วงของนิวตัน) .

กระบวนการทางกายภาพนั้นเป็นหัวใจสำคัญของ PFGM “แบบจำลองของเราสามารถแสดงลักษณะได้เกือบทั้งหมดด้วยความแรงและทิศทางของสนามไฟฟ้าในทุกจุดในอวกาศ” กล่าว ยี่หลุน ซูนักศึกษาระดับบัณฑิตศึกษาจาก MIT และผู้ร่วมเขียนรายงานฉบับนี้ “สิ่งที่โครงข่ายประสาทเทียมเรียนรู้ในระหว่างกระบวนการฝึกอบรมคือวิธีประเมินสนามไฟฟ้านั้น” และในการทำเช่นนั้น ก็สามารถเรียนรู้การสร้างภาพได้ เนื่องจากภาพในแบบจำลองนี้สามารถอธิบายได้อย่างกระชับด้วยสนามไฟฟ้า

บทนำ

PFGM สามารถสร้างภาพที่มีคุณภาพเดียวกันกับภาพที่ผลิตโดยวิธีการแบบกระจายและทำได้เร็วกว่า 10 ถึง 20 เท่า “มันใช้โครงสร้างทางกายภาพ นั่นคือสนามไฟฟ้า ในแบบที่เราไม่เคยเห็นมาก่อน” กล่าว ฮานาเนล ฮาซานนักวิทยาศาสตร์คอมพิวเตอร์แห่งมหาวิทยาลัยทัฟส์ “นั่นเป็นการเปิดประตูสู่ความเป็นไปได้ที่ปรากฏการณ์ทางกายภาพอื่น ๆ จะถูกควบคุมเพื่อปรับปรุงโครงข่ายประสาทเทียมของเรา”

แบบจำลองการแพร่กระจายและการไหลแบบปัวซองมีหลายอย่างที่เหมือนกัน นอกเหนือจากการขึ้นอยู่กับสมการที่นำเข้ามาจากฟิสิกส์ ในระหว่างการฝึก แบบจำลองการแพร่กระจายที่ออกแบบมาสำหรับการสร้างภาพมักจะเริ่มต้นด้วยรูปภาพ เช่น สุนัข จากนั้นจึงเพิ่มสัญญาณรบกวนทางภาพ โดยเปลี่ยนแต่ละพิกเซลด้วยวิธีสุ่มจนกระทั่งคุณลักษณะต่างๆ ถูกบดบังอย่างทั่วถึง (แม้ว่าจะไม่ได้ถูกกำจัดออกไปทั้งหมดก็ตาม) จากนั้นแบบจำลองจะพยายามย้อนกลับกระบวนการและสร้างสุนัขที่ใกล้เคียงกับต้นฉบับ เมื่อฝึกฝนแล้ว โมเดลจะสามารถสร้างสุนัขและภาพอื่นๆ ได้สำเร็จ โดยเริ่มต้นจากผืนผ้าใบที่ดูว่างเปล่า

แบบจำลองการไหลของปัวซองทำงานในลักษณะเดียวกันมาก ในระหว่างการฝึก มีกระบวนการส่งต่อ ซึ่งเกี่ยวข้องกับการเพิ่มสัญญาณรบกวนทีละขั้นให้กับภาพที่คมชัด และกระบวนการย้อนกลับที่แบบจำลองพยายามกำจัดสัญญาณรบกวนนั้นทีละขั้นตอน จนกว่าเวอร์ชันเริ่มต้นจะได้รับการกู้คืนเป็นส่วนใหญ่ เช่นเดียวกับการสร้างแบบกระจาย ในที่สุดระบบจะเรียนรู้ที่จะสร้างภาพที่ไม่เคยเห็นมาก่อนในการฝึก

แต่ฟิสิกส์ที่เป็นพื้นฐานของแบบจำลองปัวซองนั้นแตกต่างไปจากเดิมอย่างสิ้นเชิง การแพร่กระจายถูกขับเคลื่อนโดยแรงทางอุณหพลศาสตร์ ในขณะที่การไหลของปัวซองถูกขับเคลื่อนโดยแรงไฟฟ้าสถิต ส่วนหลังแสดงภาพที่มีรายละเอียดโดยใช้การจัดเรียงประจุที่สามารถสร้างสนามไฟฟ้าที่ซับซ้อนมากได้ อย่างไรก็ตาม ฟิลด์ดังกล่าวทำให้ประจุกระจายอย่างสม่ำเสมอมากขึ้นเมื่อเวลาผ่านไป เช่นเดียวกับที่นมกระจายตัวตามธรรมชาติในกาแฟหนึ่งแก้ว ผลลัพธ์ก็คือสนามมีความเรียบง่ายและสม่ำเสมอมากขึ้น แต่สนามเครื่องแบบที่เต็มไปด้วยเสียงรบกวนนี้ไม่ใช่กระดานชนวนที่ว่างเปล่าที่สมบูรณ์ มันยังคงมีเมล็ดข้อมูลที่สามารถประกอบภาพได้อย่างง่ายดาย

ในช่วงต้นปี 2023 ทีมงานได้อัปเกรดโมเดลปัวซอง ขยายมัน เพื่อรวมกลุ่มโมเดลทั้งหมด เวอร์ชันเสริม PFGM++ มีพารามิเตอร์ใหม่ Dซึ่งช่วยให้นักวิจัยสามารถปรับมิติของระบบได้ สิ่งนี้สามารถสร้างความแตกต่างได้มาก: ในพื้นที่สามมิติที่คุ้นเคย ความแรงของสนามไฟฟ้าที่เกิดจากประจุจะสัมพันธ์ผกผันกับกำลังสองของระยะห่างจากประจุนั้น แต่ในสี่มิติ ความแรงของสนามเป็นไปตามกฎลูกบาศก์ผกผัน และสำหรับทุกมิติของพื้นที่และทุกคุณค่าของ Dความสัมพันธ์นั้นแตกต่างออกไปบ้าง

บทนำ

นวัตกรรมเดียวดังกล่าวทำให้แบบจำลองการไหลของปัวซองมีความแปรปรวนมากขึ้น โดยกรณีที่รุนแรงนั้นให้ประโยชน์ที่แตกต่างกัน เมื่อไร D ตัวอย่างเช่น แบบจำลองมีความทนทานมากกว่า ซึ่งหมายความว่าทนทานต่อข้อผิดพลาดที่เกิดจากการประมาณค่าสนามไฟฟ้าได้ดีกว่า “แบบจำลองนี้ไม่สามารถทำนายสนามไฟฟ้าได้อย่างสมบูรณ์แบบ” กล่าว ซิหมิง หลิวนักศึกษาระดับบัณฑิตศึกษาอีกคนที่ MIT และผู้ร่วมเขียนบทความทั้งสองฉบับ “มีการเบี่ยงเบนอยู่เสมอ แต่ความทนทานหมายความว่าแม้ว่าการประมาณค่าของคุณจะผิดพลาดสูง คุณก็ยังสามารถสร้างภาพที่ดีได้” ดังนั้นคุณอาจไม่ได้จบลงด้วยสุนัขในฝันของคุณ แต่คุณก็ยังจบลงด้วยสิ่งที่คล้ายกับสุนัข

อีกด้านหนึ่งเมื่อ D หากอยู่ในระดับสูง โครงข่ายประสาทเทียมก็จะฝึกได้ง่ายขึ้น โดยต้องใช้ข้อมูลน้อยลงเพื่อฝึกฝนทักษะทางศิลปะ เหตุผลที่แน่ชัดไม่ใช่เรื่องง่ายที่จะอธิบาย แต่เป็นเพราะเมื่อมีมิติมากขึ้น แบบจำลองก็มีสนามไฟฟ้าที่ต้องติดตามน้อยลง และทำให้ข้อมูลดูดซึมน้อยลงด้วย

โมเดลที่ได้รับการปรับปรุง PFGM++ “ให้ความยืดหยุ่นแก่คุณในการประมาณค่าระหว่างความสุดขั้วทั้งสองนี้” กล่าว โรส ยูนักวิทยาศาสตร์คอมพิวเตอร์จากมหาวิทยาลัยแคลิฟอร์เนีย ซานดิเอโก

และจุดใดจุดหนึ่งในช่วงนี้มีความคุ้มค่าในอุดมคติอยู่ D ซึ่งทำให้เกิดความสมดุลระหว่างความแข็งแกร่งและความสะดวกในการฝึกฝน Xu กล่าว “เป้าหมายหนึ่งของการทำงานในอนาคตคือการหาวิธีอย่างเป็นระบบในการค้นหาจุดที่น่าสนใจนั้น เพื่อให้เราสามารถเลือกสิ่งที่ดีที่สุดเท่าที่จะเป็นไปได้ D สำหรับสถานการณ์ที่กำหนดโดยไม่ต้องอาศัยการลองผิดลองถูก”

เป้าหมายอีกประการหนึ่งสำหรับนักวิจัยของ MIT คือการค้นหากระบวนการทางกายภาพเพิ่มเติมที่สามารถเป็นพื้นฐานสำหรับตระกูลโมเดลกำเนิดใหม่ โดยผ่านโครงการที่เรียกว่า GenPhysทีมงานได้ระบุผู้สมัครที่มีศักยภาพคนหนึ่งแล้ว: ศักยภาพของ Yukawa ซึ่งเกี่ยวข้องกับแรงนิวเคลียร์ที่อ่อนแอ “มันแตกต่างจากแบบจำลองการไหลและการแพร่กระจายของปัวซอง ซึ่งจำนวนอนุภาคจะถูกอนุรักษ์ไว้เสมอ” หลิวกล่าว “ศักยภาพของ Yukawa ช่วยให้คุณสามารถทำลายอนุภาคหรือแยกอนุภาคออกเป็นสองส่วนได้ แบบจำลองดังกล่าวอาจจำลองระบบทางชีววิทยาโดยที่จำนวนเซลล์ไม่จำเป็นต้องเท่ากัน”

นี่อาจเป็นแนวทางการสอบสวนที่ประสบผลสำเร็จ หยูกล่าว “มันสามารถนำไปสู่อัลกอริธึมใหม่และโมเดลการสร้างใหม่พร้อมแอพพลิเคชั่นที่มีศักยภาพนอกเหนือจากการสร้างภาพ”

และ PFGM++ เพียงอย่างเดียวก็เกินความคาดหมายดั้งเดิมของนักประดิษฐ์ไปแล้ว พวกเขาไม่ได้ตระหนักในตอนแรกว่าเมื่อใด D ถูกตั้งค่าเป็นอนันต์ แบบจำลองการไหลของปัวซองที่ขยายเพิ่มขึ้นจะแยกไม่ออกจากแบบจำลองการแพร่กระจาย หลิวค้นพบสิ่งนี้จากการคำนวณที่เขาดำเนินการเมื่อต้นปีนี้

เมิร์ต ปิลันชี่ซึ่งเป็นนักวิทยาศาสตร์คอมพิวเตอร์ที่มหาวิทยาลัยสแตนฟอร์ด ถือว่า "การรวมเป็นหนึ่ง" นี้เป็นผลลัพธ์ที่สำคัญที่สุดอันเนื่องมาจากงานของกลุ่ม MIT “รายงาน PFGM++” เขากล่าว “เผยให้เห็นว่าโมเดลทั้งสองนี้เป็นส่วนหนึ่งของกลุ่มที่กว้างกว่า ซึ่งทำให้เกิดคำถามที่น่าสนใจ: อาจมีโมเดลทางกายภาพอื่น ๆ สำหรับ generative AI ที่รอการค้นพบ ซึ่งบอกเป็นนัยถึงการรวมกันที่ยิ่งใหญ่กว่านี้หรือไม่? ”

ประทับเวลา:

เพิ่มเติมจาก ควอนทามากาซีน