DeepMind AI One-Ups นักคณิตศาสตร์ในการคำนวณที่สำคัญต่อการคำนวณ PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

DeepMind AI One-Ups นักคณิตศาสตร์ในการคำนวณที่สำคัญต่อการคำนวณ

DeepMind ได้ทำมันอีกครั้ง

หลังจากแก้ไขความท้าทายพื้นฐานทางชีววิทยา—ทำนายโครงสร้างโปรตีน-และ แก้ปริศนาคณิตศาสตร์ของทฤษฎีปมโดยมุ่งเป้าไปที่กระบวนการคำนวณพื้นฐานที่ฝังอยู่ภายในแอปพลิเคชันนับพันๆ ตัวในแต่ละวัน จากการแยกวิเคราะห์ภาพถึง การสร้างแบบจำลองสภาพอากาศ หรือแม้กระทั่งการตรวจสอบการทำงานภายในของโครงข่ายประสาทเทียม AI สามารถเร่งการคำนวณตามหลักวิชาในหลากหลายสาขา โดยเพิ่มประสิทธิภาพในขณะที่ลดการใช้พลังงานและค่าใช้จ่าย

แต่ที่ประทับใจกว่าคือ อย่างไร พวกเขาทำมัน อัลกอริธึมที่ทำลายสถิติซึ่งเรียกว่า AlphaTensor เป็นผลพลอยได้จาก อัลฟาซีโรซึ่งเอาชนะผู้เล่นที่เป็นมนุษย์ในหมากรุกและโก

“มีการใช้อัลกอริธึมทั่วทั้งอารยธรรมโลกเพื่อปฏิบัติการขั้นพื้นฐานเป็นเวลาหลายพันปี” เขียน ผู้เขียนร่วม Drs. Matej Balog และ Alhussein Fawzi ที่ DeepMind “อย่างไรก็ตาม การค้นพบอัลกอริธึมเป็นสิ่งที่ท้าทายอย่างมาก”

AlphaTensor เปิดเส้นทางสู่โลกใหม่ที่ AI ออกแบบโปรแกรมที่ทำงานได้ดีกว่าวิศวกรมนุษย์ ในขณะเดียวกันก็ปรับปรุง "สมอง" ของเครื่องจักรเอง

ดร. Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ Federico Levi บรรณาธิการอาวุโสของ ธรรมชาติซึ่ง การตีพิมพ์ การเรียน.

ป้อนการคูณเมทริกซ์

ปัญหาที่ AlphaTensor เผชิญคือการคูณเมทริกซ์ หากคุณกำลังนึกภาพแถวและคอลัมน์ของตัวเลขสีเขียวที่เลื่อนลงมาบนหน้าจอโดยกะทันหัน แสดงว่าคุณไม่ได้อยู่คนเดียว พูดโดยคร่าว ๆ เมทริกซ์ก็ประมาณนั้น—ตารางของตัวเลขที่แสดงข้อมูลที่คุณเลือกแบบดิจิทัล อาจเป็นพิกเซลในภาพ ความถี่ของคลิปเสียง หรือรูปลักษณ์และการกระทำของตัวละครในวิดีโอเกม

การคูณเมทริกซ์ใช้ตัวเลขสองตารางแล้วคูณด้วยอีกอันหนึ่ง เป็นการคำนวณที่มักสอนในโรงเรียนมัธยมศึกษาตอนปลาย แต่ก็มีความสำคัญต่อระบบคอมพิวเตอร์ด้วยเช่นกัน ในที่นี้ แถวของตัวเลขในเมทริกซ์หนึ่งจะถูกคูณด้วยคอลัมน์ในอีกคอลัมน์หนึ่ง ผลลัพธ์จะสร้างผลลัพธ์ เช่น คำสั่งเพื่อซูมเข้าหรือเอียงมุมมองของฉากวิดีโอเกม แม้ว่าการคำนวณเหล่านี้จะดำเนินการภายใต้ประทุน ทุกคนที่ใช้โทรศัพท์หรือคอมพิวเตอร์ขึ้นอยู่กับผลลัพธ์ของตนทุกวัน

คุณสามารถดูได้ว่าปัญหาเกิดขึ้นได้ยากยิ่ง รวดเร็วมากได้อย่างไร การคูณเมทริกซ์ขนาดใหญ่นั้นใช้พลังงานและเวลามากอย่างไม่น่าเชื่อ แต่ละคู่ของตัวเลขจะต้องคูณกันเพื่อสร้างเมทริกซ์ใหม่ เมื่อเมทริกซ์เติบโตขึ้น ปัญหาจะกลายเป็นสิ่งที่ป้องกันไม่ได้ มากไปกว่าการทำนายหมากรุกที่ดีที่สุดหรือท่า Go ผู้เชี่ยวชาญบางคนประเมินว่ามี วิธีเพิ่มเติม เพื่อแก้การคูณเมทริกซ์มากกว่าจำนวนอะตอมในจักรวาล

ย้อนกลับไปในปี 1969 Volker Strassen นักคณิตศาสตร์ชาวเยอรมัน แสดงให้เห็นว่ามีวิธีตัดมุม เฉือนการคูณเมทริกซ์แบบสองต่อสองหนึ่งรอบจาก รวมแปดถึงเจ็ด. อาจฟังดูไม่น่าประทับใจ แต่วิธีการของ Strassen แสดงให้เห็นว่าสามารถเอาชนะมาตรฐานการดำเนินงานที่มีมายาวนาน ซึ่งก็คืออัลกอริธึม สำหรับการคูณเมทริกซ์ วิธีการของเขาคืออัลกอริธึม Strassen ได้ครองราชย์เป็นแนวทางที่มีประสิทธิภาพมากที่สุดมานานกว่า 50 ปี

แต่ถ้ามีวิธีที่มีประสิทธิภาพมากกว่านี้ล่ะ? “ไม่มีใครรู้อัลกอริธึมที่ดีที่สุดในการแก้ปัญหา” ดร.ฟรองซัว เลอ กัล จากมหาวิทยาลัยนาโกย่าในญี่ปุ่น ซึ่งไม่ได้มีส่วนร่วมในงานนี้ บอก จากเอ็มไอทีเทคโนโลยี. “มันเป็นหนึ่งในปัญหาเปิดที่ใหญ่ที่สุดในวิทยาการคอมพิวเตอร์”

AI ไล่อัลกอริทึม

หากสัญชาตญาณของมนุษย์สะดุด ทำไมไม่ลองใช้จิตใจที่เป็นกลไกดูล่ะ?

ในการศึกษาใหม่ ทีม DeepMind ได้เปลี่ยนการคูณเมทริกซ์เป็นเกม คล้ายกับ AlphaZero รุ่นก่อน AlphaTensor ใช้การเรียนรู้การเสริมแรงเชิงลึก ซึ่งเป็นวิธีการเรียนรู้ของเครื่องที่ได้รับแรงบันดาลใจจากวิธีที่สมองทางชีววิทยาเรียนรู้ ที่นี่ เอเจนต์ AI (มักเป็นโครงข่ายประสาทเทียม) โต้ตอบกับสภาพแวดล้อมเพื่อแก้ปัญหาหลายขั้นตอน หากทำสำเร็จ จะได้รับ “รางวัล” นั่นคือ พารามิเตอร์เครือข่ายของ AI ได้รับการอัปเดต ดังนั้นจึงมีแนวโน้มที่จะประสบความสำเร็จอีกครั้งในอนาคต

เหมือนเรียนพลิกแพนเค้ก จำนวนมากจะตกลงบนพื้น แต่ในที่สุดโครงข่ายประสาทของคุณจะเรียนรู้การเคลื่อนไหวของแขนและมือเพื่อการพลิกที่สมบูรณ์แบบ

สนามฝึกซ้อมสำหรับ AlphaTensor เป็นเกมกระดานสามมิติ มันเป็นปริศนาสำหรับผู้เล่นคนเดียวโดยพื้นฐานแล้วคล้ายกับซูโดกุ AI ต้องคูณตารางของตัวเลขด้วยขั้นตอนน้อยที่สุดเท่าที่จะเป็นไปได้ ในขณะที่เลือกจากการเคลื่อนไหวที่อนุญาตได้มากมาย มากกว่าล้านล้านรายการ

การเคลื่อนไหวที่อนุญาตเหล่านี้ได้รับการออกแบบอย่างพิถีพิถันใน AlphaTensor ในการแถลงข่าว ผู้ร่วมเขียน Dr. Hussain Fawzi อธิบายว่า: "การกำหนดพื้นที่ของการค้นพบอัลกอริทึมนั้นซับซ้อนมาก ... ที่ยากกว่านั้นคือ เราจะนำทางในพื้นที่นี้ได้อย่างไร"

กล่าวอีกนัยหนึ่ง เมื่อต้องเผชิญกับตัวเลือกมากมายที่เหลือเชื่อ เราจะจำกัดตัวเลือกเหล่านั้นให้แคบลงเพื่อเพิ่มโอกาสในการค้นหาเข็มในกองฟางได้อย่างไร และเราจะวางกลยุทธ์ได้ดีที่สุดเพื่อไปที่เข็มโดยไม่ต้องขุดผ่านกองหญ้าทั้งหมดได้อย่างไร

เคล็ดลับหนึ่งที่ทีมรวมไว้ใน AlphaTensor คือวิธีการที่เรียกว่าการค้นหาต้นไม้ แทนที่จะพูดเชิงเปรียบเทียบ สุ่มขุดผ่านกองหญ้า ในที่นี้ AI จะสำรวจ "ถนน" ที่อาจนำไปสู่ผลลัพธ์ที่ดีกว่า การเรียนรู้ระดับกลางจะช่วยให้ AI วางแผนก้าวต่อไปเพื่อเพิ่มโอกาสในการประสบความสำเร็จ ทีมงานยังได้แสดงตัวอย่างอัลกอริทึมของเกมที่ประสบความสำเร็จ เช่น การสอนเด็กเกี่ยวกับท่าเปิดของหมากรุก ในที่สุด เมื่อ AI ค้นพบการเคลื่อนไหวอันมีค่า ทีมงานก็อนุญาตให้จัดลำดับการดำเนินการเหล่านั้นใหม่เพื่อการเรียนรู้ที่ปรับให้เหมาะสมยิ่งขึ้นเพื่อค้นหาผลลัพธ์ที่ดีขึ้น

ทำลายพื้นใหม่

AlphaTensor เล่นได้ดี ในชุดการทดสอบ ทีมงานได้ท้าทาย AI ให้ค้นหาวิธีแก้ปัญหาที่มีประสิทธิภาพมากที่สุดสำหรับเมทริกซ์ที่มีขนาดไม่เกิน XNUMX ต่อ XNUMX กล่าวคือ โดยให้ตัวเลข XNUMX ตัวต่อกันในแถวหรือคอลัมน์

อัลกอริธึมค้นพบการแฮ็กดั้งเดิมของ Strassen อีกครั้งอย่างรวดเร็ว แต่แล้วมันก็แซงหน้าโซลูชันทั้งหมดที่คิดไว้ก่อนหน้านี้โดยจิตใจของมนุษย์ การทดสอบ AI ด้วยเมทริกซ์ขนาดต่างๆ AlphaTensor พบโซลูชันที่มีประสิทธิภาพมากกว่า 70 แบบ "ในความเป็นจริง AlphaTensor ค้นพบอัลกอริธึมนับพันสำหรับเมทริกซ์แต่ละขนาด" ทีมงานกล่าว “มันช่างเหลือเชื่อ”

ในกรณีหนึ่ง การคูณเมทริกซ์แบบ 80 ต่อ 76 กับ 919 ต่อ 896 นั้น AI ได้เฉือนสถิติการคูณ XNUMX ตัวก่อนหน้าก่อนหน้านี้เหลือเพียง XNUMX ครั้ง นอกจากนี้ ยังแสดงเมทริกซ์ที่ใหญ่ขึ้นด้วย ซึ่งช่วยลดจำนวนการคำนวณที่จำเป็นสำหรับสอง เมทริกซ์ XNUMX คูณ XNUMX จาก XNUMX ถึง XNUMX

พิสูจน์แนวคิดในมือ ทีมงานหันไปใช้งานจริง ชิปคอมพิวเตอร์มักได้รับการออกแบบมาเพื่อเพิ่มประสิทธิภาพการคำนวณที่แตกต่างกัน เช่น GPU สำหรับกราฟิกหรือ ชิป AI สำหรับแมชชีนเลิร์นนิง—และการจับคู่อัลกอริธึมกับฮาร์ดแวร์ที่เหมาะสมที่สุดจะช่วยเพิ่มประสิทธิภาพ

ในที่นี้ ทีมใช้ AlphaTensor เพื่อค้นหาอัลกอริทึมสำหรับชิปยอดนิยมสองตัวในการเรียนรู้ของเครื่อง ได้แก่ NVIDIA V100 GPU และ Google TPU อัลกอริธึมที่พัฒนาโดย AI ช่วยเพิ่มความเร็วในการคำนวณได้ถึง 20 เปอร์เซ็นต์

เป็นการยากที่จะบอกว่า AI สามารถเพิ่มความเร็วให้กับสมาร์ทโฟน แล็ปท็อป หรืออุปกรณ์อื่นๆ ในชีวิตประจำวันได้หรือไม่ อย่างไรก็ตาม ดร. เวอร์จิเนีย วิลเลียมส์แห่ง MIT กล่าวว่า “การพัฒนานี้จะน่าตื่นเต้นมากหากนำไปใช้ได้จริง “การเพิ่มประสิทธิภาพจะช่วยปรับปรุงแอพพลิเคชั่นได้มากมาย”

จิตใจของ AI

แม้ว่า AlphaTensor จะทำลายสถิติมนุษย์ล่าสุดสำหรับการคูณเมทริกซ์ แต่ทีม DeepMind ก็ยังไม่สามารถอธิบายได้ว่าทำไม

Dr. Pushmeet Kohli นักวิทยาศาสตร์ของ DeepMind และผู้เขียนร่วมกล่าวว่า "มีสัญชาตญาณที่น่าทึ่งนี้ด้วยการเล่นเกมเหล่านี้

อัลกอริธึมที่พัฒนาขึ้นไม่จำเป็นต้องเป็นมนุษย์กับเครื่องจักร

แม้ว่า AlphaTensor จะก้าวไปสู่อัลกอริธึมที่เร็วกว่า “เนื่องจากจำเป็นต้องจำกัดการค้นหาเฉพาะอัลกอริธึมในรูปแบบเฉพาะ จึงอาจพลาดอัลกอริธึมประเภทอื่นที่อาจมีประสิทธิภาพมากกว่า” Balog และ Fawzi เขียน

บางทีเส้นทางที่น่าสนใจยิ่งกว่านั้นอาจรวมสัญชาตญาณของมนุษย์และเครื่องจักรเข้าด้วยกัน “คงจะดีถ้าคิดให้ออกว่าวิธีการใหม่นี้มีผลกับวิธีก่อนหน้าทั้งหมดจริง ๆ หรือว่าคุณสามารถรวมมันเข้าด้วยกันและได้สิ่งที่ดียิ่งขึ้นไปอีก” กล่าวว่า วิลเลียมส์. ผู้เชี่ยวชาญคนอื่นเห็นด้วย ด้วยอัลกอริธึมที่มีอยู่มากมาย นักวิทยาศาสตร์สามารถเริ่มวิเคราะห์พวกมันเพื่อหาเบาะแสว่าอะไรที่ทำให้โซลูชั่นของ AlphaTensor ทำงาน ปูทางไปสู่ความก้าวหน้าครั้งถัดไป

เครดิตภาพ: DeepMind

ประทับเวลา:

เพิ่มเติมจาก Hub เอกพจน์