สรุปสัญญาและข้อผิดพลาด – ส่วนที่หนึ่ง

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

CCC สนับสนุนเซสชันทางวิทยาศาสตร์สามเซสชันในการประชุมประจำปี AAAS ประจำปีนี้ และในกรณีที่คุณไม่สามารถเข้าร่วมด้วยตนเองได้ เราจะสรุปเซสชันแต่ละเซสชัน สัปดาห์นี้เราจะมาสรุปไฮไลท์ของเซสชั่นนี้กัน”AI กำเนิดในทางวิทยาศาสตร์: คำสัญญาและข้อผิดพลาด” ในส่วนที่หนึ่ง เราจะสรุปการแนะนำและการนำเสนอโดย Dr. Rebecca Willett

คณะกรรมการ AAAS แห่งแรกของ CCC ในการประชุมประจำปี 2024 จัดขึ้นในวันศุกร์ที่ 16 กุมภาพันธ์ ซึ่งเป็นวันที่สองของการประชุม คณะผู้กลั่นกรองโดย คสช. เอง ดร.แมทธิว เติร์กประธานสถาบันเทคโนโลยีโตโยต้าที่ชิคาโก ประกอบด้วยผู้เชี่ยวชาญที่ใช้ปัญญาประดิษฐ์กับสาขาวิทยาศาสตร์ที่หลากหลาย ดร.รีเบคก้า วิลเล็ตต์ศาสตราจารย์ด้านสถิติและวิทยาการคอมพิวเตอร์ที่มหาวิทยาลัยชิคาโก เน้นการนำเสนอของเธอเกี่ยวกับวิธีการใช้แบบจำลองเชิงกำเนิดในทางวิทยาศาสตร์ และเหตุใดแบบจำลองที่มีจำหน่ายทั่วไปจึงไม่เพียงพอที่จะนำไปใช้กับการวิจัยทางวิทยาศาสตร์ ดร.มาร์คุส บูห์เลอร์ศาสตราจารย์ด้านวิศวกรรมที่สถาบันเทคโนโลยีแมสซาชูเซตส์ พูดถึงแบบจำลองเชิงกำเนิดที่ประยุกต์ใช้กับวัสดุศาสตร์ และ ดร.ดันแคน วัตสัน-แพริส, ผู้ช่วยศาสตราจารย์ที่ Scripps Institution of Oceanography และHalıcıoğlu Data Science Institute ที่ UC San Diegoอภิปรายว่าแบบจำลองเชิงกำเนิดสามารถนำมาใช้ในการศึกษาวิทยาศาสตร์ภูมิอากาศได้อย่างไร

ดร.เติร์ก ผู้เชี่ยวชาญด้านคอมพิวเตอร์วิทัศน์และการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ เริ่มต้นการอภิปรายโดยแยกความแตกต่างระหว่าง Generative AI ออกจาก AI ทั้งหมด “หัวใจหลักของแอปพลิเคชัน generative AI คือโมเดลกำเนิดที่ประกอบด้วยโครงข่ายประสาทเทียมเชิงลึกที่เรียนรู้โครงสร้างของข้อมูลการฝึกอบรมอันมากมาย จากนั้นจึงสร้างข้อมูลใหม่ตามสิ่งที่พวกเขาได้เรียนรู้”

ดร. เติร์กยังได้สรุปข้อกังวลยอดนิยมเกี่ยวกับระบบกำเนิด ทั้งจากความล้มเหลวของระบบเอง เช่น ข้อกังวลที่อ้างถึงบทสรุปทางกฎหมายที่ไม่มีอยู่จริง และเนื่องจากผู้ไม่ประสงค์ดีใช้สิ่งเหล่านั้นเพื่อสร้างเนื้อหาปลอม เช่น เสียงปลอมหรือ วิดีโอของนักการเมืองหรือคนดัง

“โดยเฉพาะอย่างยิ่ง” ดร. เติร์กกล่าว “เซสชั่นนี้จะมุ่งเน้นไปที่การใช้ generative AI ในทางวิทยาศาสตร์ ทั้งในฐานะที่เป็นพลังในการเปลี่ยนแปลงในการแสวงหาวิทยาศาสตร์และยังเป็นความเสี่ยงที่อาจเกิดการหยุดชะงัก”

ดร. Rebecca Willett เริ่มการนำเสนอของเธอโดยสรุปว่า AI เชิงกำเนิดสามารถใช้ประโยชน์จากการสนับสนุนกระบวนการค้นพบทางวิทยาศาสตร์ได้อย่างไร อันดับแรกเธอมุ่งเน้นไปที่วิธีการทำงานของโมเดลเชิงกำเนิด รูปภาพด้านล่างจากสไลด์ของ Dr. Willett แสดงให้เห็นว่าแบบจำลองภาษา เช่น ChatGPT ประเมินความน่าจะเป็นของคำที่เกิดขึ้นอย่างไร โดยพิจารณาจากชุดคำก่อนหน้า และวิธีที่แบบจำลองการสร้างภาพ เช่น DALL-E 2 สร้างภาพ จากการแจ้งเตือนที่กำหนดโดยใช้การแจกแจงความน่าจะเป็นที่เรียนรู้จากรูปภาพนับพันล้านภาพระหว่างการฝึก

สรุปสัญญาและข้อผิดพลาด - ตอนที่หนึ่ง » บล็อก CCC PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

“การใช้หลักการของการแจกแจงความน่าจะเป็นซึ่งรองรับแบบจำลองกำเนิดทั้งหมด แบบจำลองเหล่านี้สามารถนำไปใช้กับแนวคิดสำคัญทางวิทยาศาสตร์ เช่น การสร้างสถานการณ์สภาพภูมิอากาศที่เป็นไปได้โดยพิจารณาจากสภาพอากาศในปัจจุบันและนโยบายที่เป็นไปได้ หรือการสร้างไมโครไบโอมใหม่ที่มีฟังก์ชันการทำงานที่เป็นเป้าหมาย เช่น ที่มีประสิทธิภาพอย่างยิ่งในการสลายพลาสติก” ดร. วิลเลตต์กล่าว

อย่างไรก็ตาม การใช้เครื่องมือสร้างที่มีจำหน่ายทั่วไป เช่น ChatGPT หรือ DALL-E 2 สำหรับการวิจัยทางวิทยาศาสตร์นั้นไม่เพียงพอ เครื่องมือเหล่านี้ถูกสร้างขึ้นในสภาพแวดล้อมที่แตกต่างจากบริบทที่นักวิทยาศาสตร์ใช้งานอย่างมาก ความแตกต่างที่ชัดเจนอย่างหนึ่งระหว่างแบบจำลองกำเนิดที่มีจำหน่ายทั่วไปและแบบจำลองทางวิทยาศาสตร์คือข้อมูล ในทางวิทยาศาสตร์ มักมีข้อมูลน้อยมากที่จะใช้เป็นฐานสมมติฐาน ข้อมูลทางวิทยาศาสตร์มักมาจากการจำลองและการทดลอง ซึ่งทั้งสองอย่างนี้มักจะมีราคาแพงและใช้เวลานาน เนื่องจากข้อจำกัดเหล่านี้ นักวิทยาศาสตร์จึงต้องเลือกอย่างระมัดระวังว่าจะทำการทดลองใด และวิธีการเพิ่มประสิทธิภาพและประโยชน์ของระบบเหล่านี้ให้สูงสุด ในทางตรงกันข้าม โมเดลที่มีจำหน่ายทั่วไปให้ความสำคัญกับแหล่งที่มาของข้อมูลน้อยกว่ามาก โดยเลือกที่จะเพิ่มปริมาณข้อมูลให้สูงสุดที่สามารถใช้งานได้ ในด้านวิทยาศาสตร์ ความแม่นยำของชุดข้อมูลและที่มาของชุดข้อมูลมีความสำคัญอย่างยิ่ง เนื่องจากนักวิทยาศาสตร์จำเป็นต้องพิสูจน์ผลการวิจัยด้วยหลักฐานเชิงประจักษ์ที่แข็งแกร่ง

“นอกจากนี้ ในด้านวิทยาศาสตร์ เป้าหมายของเราแตกต่างจากการผลิตสิ่งที่เป็นไปได้” ดร. วิลเลตต์กล่าว “เราต้องเข้าใจวิธีการทำงานของสิ่งต่าง ๆ ที่อยู่นอกขอบเขตของสิ่งที่เราสังเกตเห็นมาจนถึงตอนนี้” วิธีการนี้ขัดแย้งกับโมเดล AI เชิงสร้างสรรค์ที่ปฏิบัติต่อข้อมูลในฐานะตัวแทนของการสังเกตที่เป็นไปได้ทั้งหมด การรวมแบบจำลองทางกายภาพและข้อจำกัดเข้ากับ generative AI ช่วยให้มั่นใจได้ว่าจะนำเสนอปรากฏการณ์ทางกายภาพได้ดีขึ้น

แบบจำลองทางวิทยาศาสตร์จะต้องสามารถจับภาพเหตุการณ์ที่เกิดขึ้นได้ยากด้วย “เราสามารถเพิกเฉยต่อเหตุการณ์ที่เกิดขึ้นได้ยากจำนวนมากได้อย่างปลอดภัยเมื่อเราฝึก ChatGPT แต่ในทางกลับกัน เหตุการณ์ที่เกิดขึ้นได้ยากมักเป็นสิ่งที่เราใส่ใจมากที่สุดในบริบทของวิทยาศาสตร์ เช่น ในแบบจำลองสภาพภูมิอากาศที่คาดการณ์เหตุการณ์สภาพอากาศที่เกิดขึ้นได้ยาก หากเราใช้แบบจำลองกำเนิดที่หลีกเลี่ยงเหตุการณ์ที่เกิดขึ้นไม่บ่อยนัก เช่น ไม่เคยทำนายพายุเฮอริเคน แบบจำลองนี้จะไม่มีประโยชน์มากนักในทางปฏิบัติ”

ความท้าทายที่เกี่ยวข้องคือการพัฒนาแบบจำลอง AI เชิงสร้างสรรค์สำหรับกระบวนการที่วุ่นวาย ซึ่งมีความไวต่อสภาวะเริ่มต้น ดร.วิลเล็ตต์ฉายวิดีโอด้านล่าง ซึ่งแสดงให้เห็นอนุภาคสองตัวเคลื่อนที่ในอวกาศตามสมการลอเรนซ์ 63 สมการเหล่านี้เป็นสมการที่กำหนดได้ ไม่ใช่แบบสุ่ม แต่เมื่อพิจารณาจากตำแหน่งเริ่มต้นสองแห่งที่แตกต่างกันเล็กน้อย คุณจะเห็นว่า ณ เวลาใดก็ตาม อนุภาคทั้งสองอาจอยู่ในตำแหน่งที่ต่างกันมาก การพัฒนาแบบจำลอง AI เชิงกำเนิดที่ทำนายทิศทางที่แน่นอนของกระบวนการดังกล่าว ซึ่งเกิดขึ้นในวิทยาศาสตร์ภูมิอากาศ ความปั่นป่วน และพลวัตของเครือข่าย นั้นเป็นพื้นฐานที่ยาก แต่แนวทางใหม่ในการสร้างแบบจำลองเชิงกำเนิดสามารถรับประกันได้ว่ากระบวนการที่สร้างขึ้นจะมีลักษณะทางสถิติที่สำคัญร่วมกับข้อมูลทางวิทยาศาสตร์ที่แท้จริง

[เนื้อหาฝัง]

สุดท้ายนี้ ดร. วิลเลตต์กล่าวถึงข้อเท็จจริงที่ว่าข้อมูลทางวิทยาศาสตร์มักครอบคลุมขอบเขตกว้างใหญ่ทั้งเชิงพื้นที่และเชิงเวลา ตัวอย่างเช่น ในสาขาวัสดุศาสตร์ นักวิจัยศึกษาวัสดุในระดับนาโนเมตรสำหรับคำที่ใช้นามแฝง ไปจนถึงระบบขนาดใหญ่ เช่น เครื่องบินทั้งลำ “ช่วงของเครื่องชั่งนั้นแตกต่างอย่างมากจากข้อมูลที่ใช้ในแบบจำลองที่มีจำหน่ายทั่วไป และเราจำเป็นต้องพิจารณาว่าเราจะสร้างแบบจำลองกำเนิดเหล่านี้อย่างไรในลักษณะที่ส่งผลต่อปฏิสัมพันธ์ระหว่างเครื่องชั่งเหล่านี้อย่างแม่นยำ”

“แบบจำลองเจนเนอเรชั่นคืออนาคตของวิทยาศาสตร์” ดร.วิลเล็ตต์กล่าว “แต่เพื่อให้แน่ใจว่าแบบจำลองเหล่านี้จะถูกนำมาใช้อย่างมีประสิทธิภาพ เราจำเป็นต้องสร้างความก้าวหน้าขั้นพื้นฐานใน AI และไปไกลกว่าการเสียบข้อมูลเข้ากับ ChatGPT”

ขอบคุณมากที่อ่าน และโปรดติดตามอ่านสรุปการนำเสนอของ Dr. Markus Buehler เรื่อง Generative AI ใน Mechanobiology ได้ในวันพรุ่งนี้