สรุปสัญญาและข้อผิดพลาด – ตอนที่สี่ » บล็อก CCC

สรุปสัญญาและข้อผิดพลาด – ตอนที่สี่ » บล็อก CCC

CCC สนับสนุนการประชุมทางวิทยาศาสตร์สามครั้งในการประชุมประจำปี AAAS ประจำปีนี้ สัปดาห์นี้เราจะมาสรุปไฮไลท์ของเซสชั่นนี้กัน”AI กำเนิดในทางวิทยาศาสตร์: คำสัญญาและข้อผิดพลาด.” แผงนี้กลั่นกรองโดย ดร.แมทธิว เติร์ก, ประธานสถาบันเทคโนโลยีโตโยต้าที่ชิคาโก) กล่าวถึง ดร.รีเบคก้า วิลเล็ตต์ศาสตราจารย์ด้านสถิติและวิทยาการคอมพิวเตอร์ที่มหาวิทยาลัยชิคาโก ดร.มาร์คุส บูห์เลอร์ศาสตราจารย์ด้านวิศวกรรมที่สถาบันเทคโนโลยีแมสซาชูเซตส์ และ ดร.ดันแคน วัตสัน-แพริสผู้ช่วยศาสตราจารย์ที่ Scripps Institution of Oceanography และ Halıcıoğlu Data Science Institute ที่ UC San Diego ในส่วนที่สี่ เราจะสรุปส่วนถามตอบของการอภิปราย 

ช่วงถามตอบตามการนำเสนอของผู้อภิปราย และดร. แมทธิว เติร์กเป็นผู้เริ่มต้นการสนทนา “'คำสัญญาและหลุมพราง' อยู่ในชื่อของแผงนี้ เราได้หารือเกี่ยวกับคำมั่นสัญญาหลายประการแล้ว แต่เราไม่ได้แก้ไขข้อผิดพลาดหลายประการ คุณกังวลอะไรเกี่ยวกับอนาคตของ generative AI”

“ความน่าเชื่อถือและความน่าเชื่อถือของโมเดลเหล่านี้ถือเป็นข้อกังวลใหญ่” ดร. รีเบคก้า วิลเล็ตต์เริ่มต้น “แบบจำลองเหล่านี้สามารถทำนายสิ่งต่าง ๆ ที่เป็นไปได้ แต่ขาดองค์ประกอบหลักที่สำคัญ ในฐานะมนุษย์ ฉันสามารถรับรู้ได้ไหมว่ามีบางอย่างขาดหายไปที่นั่น”

ดร. มาร์คุส บูห์เลอร์ กล่าวเพิ่มเติมว่าการคาดการณ์จริงของแบบจำลองอาจใช้เวลาเพียงวินาทีเดียว แต่กระบวนการทดลองเพื่อตรวจสอบความถูกต้องอาจใช้เวลาเป็นเดือนหรือหนึ่งปี หรือนานกว่านั้น แล้วเราจะดำเนินการอย่างไรในระหว่างนี้เมื่อเรายังไม่ได้ตรวจสอบผลลัพธ์? “เรายังจำเป็นต้องให้ความรู้แก่นักพัฒนา AI รุ่นต่อไปด้วย เพื่อที่พวกเขาจะได้ออกแบบแบบจำลองที่น่าเชื่อถือและตรวจสอบได้ และเราสามารถใช้ข้อมูลเชิงลึกตามฟิสิกส์ในการสร้างแบบจำลองเหล่านี้ได้”

ดร. ดันแคน วัตสัน-แพริส กล่าวถึงประเด็นทั้งสองก่อนหน้านี้ว่า "เนื่องจากแบบจำลองเหล่านี้ได้รับการออกแบบมาเพื่อสร้างผลลัพธ์ที่น่าเชื่อถือ เราจึงไม่สามารถเพียงแต่ดูผลลัพธ์เพื่อยืนยันความถูกต้องของโมเดลเหล่านั้นได้ นักวิจัย AI รุ่นใหม่จำเป็นต้องมีความเข้าใจอย่างลึกซึ้งเกี่ยวกับวิธีการทำงานของแบบจำลองเหล่านี้เพื่อตรวจสอบผลลัพธ์ ซึ่งเป็นเหตุผลว่าทำไมการให้ความรู้แก่คนรุ่นต่อไปอย่างถูกต้องจึงมีความสำคัญมาก”

สมาชิกผู้ชม: “ในสาขาวัสดุศาสตร์ เรารู้ทิศทางไปข้างหน้าสำหรับการศึกษาวัสดุบางอย่าง แต่สำหรับวัสดุอื่นๆ เช่น ตัวนำยิ่งยวดที่อุณหภูมิห้อง เราไม่รู้ว่าจะก้าวไปข้างหน้าอย่างไร คุณคิดว่าเส้นทางข้างหน้าในการศึกษาสื่อที่ไม่รู้จักเหล่านี้จะเป็นอย่างไร และการวิจัยประเภทนี้ควรเปิดใช้งานอย่างไรจากจุดยืนด้านกฎระเบียบ”

“ฉันไม่ใช่ผู้เชี่ยวชาญด้านการวิจัยตัวนำยิ่งยวด” ดร.บูห์เลอร์กล่าว “ดังนั้นฉันจะไม่พูดโดยตรงเกี่ยวกับเรื่องนั้น แต่ฉันสามารถพูดโดยทั่วไปเกี่ยวกับวิธีที่เราสร้างความก้าวหน้าในด้านวัสดุศาสตร์ โดยเฉพาะในด้านโปรตีนของฉัน และการพัฒนาวัสดุชีวภาพ วิธีที่เราก้าวหน้าคือการมีความสามารถในการผลักดันขอบเขต เราทำการทดลองใหม่ๆ และทดสอบแนวคิดและทฤษฎีแปลกๆ และดูว่าอันไหนได้ผลและเพราะเหตุใด สำหรับวิธีที่เราควรเปิดใช้งานการวิจัยนี้ เราต้องการโมเดลโอเพ่นซอร์สเพิ่มเติมพร้อมการเข้าถึงโดยรวม ฉันขอแนะนำให้นักการเมืองอย่าควบคุมเทคโนโลยีเหล่านี้มากเกินไป เพื่อให้นักวิจัยและสาธารณชนสามารถเข้าถึงแบบจำลองประเภทนี้ได้ ฉันไม่คิดว่าเป็นความคิดที่ดีที่จะป้องกันไม่ให้ผู้คนใช้แบบจำลองเหล่านี้ โดยเฉพาะอย่างยิ่งเมื่อเราสามารถระดมความคิดและการพัฒนาจากมวลชน และแนะนำความรู้จากกิจกรรมของมนุษย์ในสาขาต่างๆ ตัวอย่างเช่น เมื่อมีการประดิษฐ์แท่นพิมพ์ เจ้าหน้าที่พยายามจำกัดความพร้อมของเทคโนโลยีนี้เพื่อให้สามารถอ่านหนังสือได้ไม่กี่เล่มพร้อมกัน แต่ความพยายามนี้ล้มเหลวอย่างน่าสังเวช วิธีที่ดีที่สุดในการปกป้องสาธารณะคือการอำนวยความสะดวกในการเข้าถึงโมเดลเหล่านี้ในลักษณะที่เราสามารถพัฒนา สำรวจ และประเมินโมเดลเหล่านี้อย่างกว้างขวางเพื่อประโยชน์สูงสุดของสังคม”

สมาชิกผู้ชม: “โมเดล AI ที่สร้างมากที่สุดในปัจจุบันคือโมเดลการถดถอยที่เน้นไปที่การจำลองหรือจำลองสถานการณ์ต่างๆ อย่างไรก็ตาม การค้นพบทางวิทยาศาสตร์นั้นขับเคลื่อนด้วยสมมติฐานและการทำนายที่เราฝันไว้ แล้วเราจะสร้างแบบจำลองที่มีจุดประสงค์เพื่อสร้างการคาดการณ์ใหม่ได้อย่างไร แทนที่จะเป็นแบบจำลองปัจจุบันซึ่งส่วนใหญ่ใช้สำหรับการทดลอง”

Dr. Buehler ตอบก่อนว่า "คุณพูดถูก โมเดลแมชชีนเลิร์นนิงแบบดั้งเดิมส่วนใหญ่มักมีพื้นฐานจากการถดถอย แต่โมเดลที่เราพูดถึงในวันนี้ทำงานแตกต่างออกไป เมื่อคุณรวบรวมระบบหลายตัวแทนที่มีความสามารถมากมาย ระบบเหล่านั้นจะเริ่มสำรวจสถานการณ์ใหม่ๆ และเริ่มให้เหตุผลและคาดการณ์ตามการทดสอบที่พวกเขาดำเนินการ พวกเขากลายเป็นมนุษย์มากขึ้น คุณในฐานะนักวิจัย จะไม่ทำการทดสอบและเพิ่งเสร็จสิ้น คุณจะทำการทดสอบ จากนั้นเริ่มดูข้อมูล ตรวจสอบความถูกต้อง และทำการคาดการณ์ใหม่โดยอิงจากข้อมูลนี้ เพื่อเชื่อมโยงจุดต่างๆ และคาดการณ์โดย สร้างสมมติฐานและจินตนาการว่าสถานการณ์ใหม่จะเผยออกมาอย่างไร คุณจะทดลอง รวบรวมข้อมูลใหม่ พัฒนาทฤษฎี และเสนอกรอบการทำงานแบบบูรณาการเกี่ยวกับเรื่องที่สนใจโดยเฉพาะ จากนั้น คุณจะปกป้องความคิดของคุณจากการวิพากษ์วิจารณ์ของเพื่อนร่วมงาน และอาจแก้ไขสมมติฐานของคุณเมื่อมีการใช้ข้อมูลใหม่ นี่คือวิธีการทำงานของระบบปฏิปักษ์แบบหลายตัวแทน แต่แน่นอนว่าระบบเหล่านี้เสริมทักษะของมนุษย์ด้วยความสามารถในการให้เหตุผลมากกว่าข้อมูลจำนวนมหาศาลและการเป็นตัวแทนความรู้ แบบจำลองเหล่านี้สามารถสร้างสมมติฐานใหม่ๆ ที่ขยายขอบเขตไปไกลเกินกว่าที่ได้มีการศึกษามาแล้ว ซึ่งเป็นการเพิ่มกระบวนการทางวิทยาศาสตร์ในการค้นพบและนวัตกรรม”

“ฉันจะเสริมสิ่งนั้น” ดร. วิลเล็ตต์แทรก “โดยขอบเขตของการค้นพบความสมบูรณ์และการถดถอยเชิงสัญลักษณ์เป็นอีกพื้นที่หนึ่งที่มุ่งเป้าไปที่การสร้างสมมติฐานมากกว่ามาก มีงานต่อเนื่องมากมายในพื้นที่นี้”

สมาชิกผู้ชม: “เราจะเพิ่มการเข้าถึงโมเดลประเภทนี้และเอาชนะอุปสรรค เช่น โมเดลส่วนใหญ่ที่สร้างขึ้นสำหรับผู้พูดภาษาอังกฤษได้อย่างไร”

ดร. รีเบคก้า วิลเลตต์ตอบว่า "ผู้คนจำนวนมากสามารถเข้าถึงการใช้โมเดลเหล่านี้ แต่การออกแบบและการฝึกอบรมโมเดลเหล่านี้มีค่าใช้จ่ายหลายล้านดอลลาร์ หากมีเพียงองค์กรกลุ่มเล็กๆ เท่านั้นที่สามารถจัดทำแบบจำลองเหล่านี้ได้ ก็แสดงว่ามีเพียงคนกลุ่มเล็กๆ เท่านั้นที่ทำการตัดสินใจและจัดลำดับความสำคัญในชุมชนวิทยาศาสตร์ และบ่อยครั้งที่ลำดับความสำคัญขององค์กรและบุคคลเหล่านี้มักขับเคลื่อนด้วยผลกำไร ที่กล่าวว่าฉันคิดว่าภูมิทัศน์กำลังเริ่มเปลี่ยนแปลง องค์กรต่างๆ เช่น NSF กำลังพยายามสร้างโครงสร้างพื้นฐานที่ชุมชนวิทยาศาสตร์ในวงกว้างสามารถเข้าถึงได้ ความพยายามนี้คล้ายคลึงกับการพัฒนาซูเปอร์คอมพิวเตอร์ในยุคแรกๆ ในช่วงแรกๆ นักวิจัยต้องส่งข้อเสนอที่ยาวเพื่อเข้าถึงซูเปอร์คอมพิวเตอร์ ฉันคิดว่าเราจะได้เห็นกระบวนทัศน์ที่เกิดขึ้นใหม่ที่คล้ายกันใน AI และ AI เชิงสร้างสรรค์”

“ฉันเห็นด้วย” ดร. วัตสัน-แพร์ริสกล่าว “นอกเหนือจากนั้นในด้านกฎระเบียบ ฉันไม่คิดว่าเราควรควบคุมการวิจัยขั้นพื้นฐาน บางทีอาจเป็นพื้นที่การใช้งาน แต่ไม่ใช่ตัวงานวิจัยเอง”

ขอขอบคุณอย่างยิ่งที่อ่าน และโปรดติดตามบทสรุปของการอภิปรายอีก 2024 หัวข้อของเราที่ AAAS XNUMX

ประทับเวลา:

เพิ่มเติมจาก บล็อก CCC

CCC ตอบสนองต่อคำขอของ NTIA สำหรับข้อมูลเกี่ยวกับโมเดล AI พื้นฐานการใช้งานคู่ที่มีน้ำหนักโมเดลที่มีจำหน่ายอย่างกว้างขวาง » บล็อก CCC

โหนดต้นทาง: 1961172
ประทับเวลา: เมษายน 2, 2024