แบบจำลองภาษาขนาดใหญ่ทำนายวิธีสร้างสารประกอบอนินทรีย์ – โลกฟิสิกส์

แบบจำลองภาษาขนาดใหญ่ทำนายวิธีสร้างสารประกอบอนินทรีย์ – โลกฟิสิกส์

แผนผังแสดงให้เห็นว่าทีมฝึกอบรมโมเดลใหม่อย่างไร

นักวิจัยในประเทศจีนได้ปรับแต่งโมเดลภาษาขนาดใหญ่ (LLM) ที่มีอยู่อย่างละเอียดเพื่อสร้างระบบที่สามารถทำนายขั้นตอนที่จำเป็นในการสังเคราะห์สารประกอบอนินทรีย์ แม้ว่าโมเดลใหม่ซึ่งมีชื่อว่า MatChat จำเป็นต้องได้รับการปรับปรุงเพิ่มเติมก่อนจึงจะสามารถนำไปใช้ในห้องปฏิบัติการได้ นักพัฒนากล่าวว่าโมเดลนี้แสดงให้เห็นถึงความพยายามที่สำคัญในช่วงแรกๆ ในการประยุกต์ใช้ปัญญาประดิษฐ์เชิงกำเนิดในบริบททางวิทยาศาสตร์

LLM เป็นปัญญาประดิษฐ์ประเภทหนึ่งที่แยกความหมายออกจากลำดับข้อความ เมื่อต้องการทำเช่นนี้ พวกเขาจะต้องได้รับการฝึกอบรมเกี่ยวกับข้อมูลจำนวนมหาศาลก่อน อย่างไรก็ตาม การฝึกอบรมนี้สามารถดำเนินการได้โดยไม่มีผู้ดูแล ซึ่งหมายความว่า LLM ถือเป็นการเรียนรู้ด้วยตนเอง พวกเขายังมีความยืดหยุ่นมาก สามารถทำงานต่างๆ ได้ เช่น การตอบคำถาม การเขียนข้อความ การแปลภาษา และการทำประโยคให้สมบูรณ์ ตัวอย่างที่รู้จักกันดี ได้แก่ โมเดล GPT-3 ของ Open AI และ ChatGPT ที่แยกออกมาซึ่งสามารถเข้าถึงได้ ซึ่งสามารถคาดการณ์ได้จากอินพุตหรือ "พร้อมท์" จำนวนที่ค่อนข้างน้อยอยู่แล้ว

เพื่อสร้าง LLM ที่ "เข้าใจ" การสังเคราะห์อนินทรีย์ นักวิจัยนำโดย เหมียวหลิว, นักฟิสิกส์ที่ สถาบันฟิสิกส์, Chinese Academy of Sciences, ปักกิ่ง และผู้ก่อตั้ง อะตอมลี่.เน็ตได้จัดหา LLM โอเพ่นซอร์สชั้นนำที่เรียกว่า LLaMA2-7B พร้อมข้อมูลทางวิทยาศาสตร์เพิ่มเติม ในการทำเช่นนั้น Liu กล่าวว่าพวกเขา "ให้อำนาจ [แก้ไข] ให้คิดคล้ายกับการรับรู้ของมนุษย์โดยใช้ชุดข้อมูลขั้นต่ำ" พวกเขาฝึกแบบจำลองโดยใช้โปรโตคอลการสังเคราะห์ทางเคมีที่สกัดจากสารประกอบอนินทรีย์ 13 รายการ ซึ่งได้มาจากคอลเลกชันสิ่งพิมพ์ทางวิทยาศาสตร์มากกว่าสี่ล้านฉบับที่รวบรวมโดย คริสติน ซีเดอร์ และเพื่อนร่วมงานที่ ห้องปฏิบัติการแห่งชาติ Lawrence Berkeley ในสหรัฐอเมริกา.

“ข้อมูลการฝึกอบรมนี้ช่วยให้แบบจำลองเข้าใจและตอบคำถามการสังเคราะห์อนินทรีย์ในลักษณะเดียวกับที่ผู้เชี่ยวชาญที่มีความรู้ทำ” Liu อธิบาย “ตัวอย่างเช่น เมื่อถามเกี่ยวกับการสังเคราะห์ LiMnO2MatChat สามารถให้คำตอบโดยละเอียดซึ่งรวมถึงสารตั้งต้นของปฏิกิริยา สมการ และการอ้างอิงเชิงสัมพันธ์ในวรรณกรรม”

เขากล่าวว่าการแลกเปลี่ยนโดยทั่วไปอาจมีลักษณะดังนี้:

คำถาม: จะสังเคราะห์ LiMnO2 ได้อย่างไร

คำตอบ: LiMnO2 สามารถทำจาก Li2CO3 และ MnO2 ผ่านปฏิกิริยาโซลิดสเตต สมการปฏิกิริยาเคมีคือ (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2) สารตั้งต้นถูกผสม, เผาที่ 800.0°C ในอากาศเป็นเวลา 2.0 ชั่วโมง, ผสม, เผาที่ 800.0°C ในอากาศเป็นเวลา 2.0 ชั่วโมง สูตรโดยละเอียดสามารถพบได้ในวรรณคดี...

แนวคิดโครงการใหม่

Liu ได้รับแนวคิดสำหรับโครงการ MatChat ในเดือนสิงหาคม 2023 หลังจากที่เขาเข้าร่วมการประชุมที่ Intel จัดในหัวข้อเทคโนโลยีสารสนเทศและ AI “แม้ว่าการประชุมจะไม่เกี่ยวข้องกับวิทยาศาสตร์ แต่ฉันได้เรียนรู้มากมายเกี่ยวกับหัวข้อที่กำลังมาแรงใน AI และการใช้งานของมัน” Liu กล่าว “มันเป็นแรงบันดาลใจให้ฉันใช้ LLM กับการทำนายสูตรการสังเคราะห์”

เพื่อให้โครงการนี้เกิดขึ้น Liu ได้ร่วมมือกับเพื่อนร่วมงานคนหนึ่ง จงกัวหวางและนักศึกษาปริญญาเอก ฟานไคเซี่ย. ขณะที่ Xie ฝึกโมเดลนี้ Wang ได้สร้างโมเดล แพลตฟอร์มออนไลน์ที่ใช้ได้ฟรี ที่ทำให้สามารถโต้ตอบกับผู้ใช้ได้

“แม้ว่า MatChat อาจไม่ใช่ทางออกที่ดีที่สุดสำหรับแอปพลิเคชันประเภทนี้ แต่งานของเราถือเป็นความพยายามในช่วงแรกๆ ในการใช้ LLM ในบริบททางวิทยาศาสตร์” Liu กล่าว โลกฟิสิกส์. “เราหวังว่าการศึกษาของเราจะทำหน้าที่เป็นตัวเร่งสำหรับการสร้างเครื่องมือ AI ที่คล้ายกันในหลากหลายสาขา”

เมื่อมองไปข้างหน้า นักวิจัยวางแผนที่จะปรับปรุงความสามารถของ MatChat ด้วยการขยายชุดข้อมูลและบูรณาการข้อมูลการคำนวณและการทดลองจากฐานข้อมูลด้านวัสดุศาสตร์ที่กว้างขวางของพวกเขาเองอย่าง atomly.net รวมถึงห้องปฏิบัติการหุ่นยนต์อิสระที่กำลังจะมีขึ้นสำหรับการสังเคราะห์วัสดุอนินทรีย์ “ด้วยการใช้ประโยชน์จากทรัพยากรเหล่านี้ เรามุ่งมั่นที่จะพัฒนาเครื่องมือ AI ขั้นสูงสำหรับสาขานี้ต่อไป” Liu กล่าว

โมเดล AI ใหม่มีรายละเอียดอยู่ใน ฟิสิกส์จีน ข, และปรากฏในแบบพิมพ์ล่วงหน้าบน arXiv ในช่วงเวลาเดียวกับก พิมพ์ล่วงหน้าจากนักวิจัยที่ Microsoft ซึ่งแสดงให้เห็นถึงความสำเร็จที่คล้ายกันโดยใช้ ChatGPT4 LLM ยอดนิยม

ประทับเวลา:

เพิ่มเติมจาก โลกฟิสิกส์

GMT หรือ TMT? ชะตากรรมของกล้องโทรทรรศน์เจเนอเรชันหน้าตกเป็นของคณะผู้เชี่ยวชาญที่ก่อตั้งโดยมูลนิธิวิทยาศาสตร์แห่งชาติสหรัฐอเมริกา - โลกฟิสิกส์

โหนดต้นทาง: 1972644
ประทับเวลา: May 10, 2024