ผู้ช่วยที่เป็นประโยชน์ คู่รักแสนโรแมนติก หรือนักต้มตุ๋น? ส่วนที่สอง » บล็อก CCC

ผู้ช่วยที่เป็นประโยชน์ คู่รักแสนโรแมนติก หรือนักต้มตุ๋น? ส่วนที่สอง » บล็อก CCC

CCC สนับสนุนเซสชันทางวิทยาศาสตร์สามเซสชันในการประชุมประจำปี AAAS ประจำปีนี้ และในกรณีที่คุณไม่สามารถเข้าร่วมด้วยตนเองได้ เราจะสรุปเซสชันแต่ละเซสชัน วันนี้เราจะมาสรุปไฮไลท์ของช่วงถามตอบในเซสชั่นนี้กัน”โมเดลภาษาขนาดใหญ่: ผู้ช่วยที่เป็นประโยชน์ คู่หูโรแมนติก หรือนักต้มตุ๋น?” แผงนี้กลั่นกรองโดย ดร.มาเรีย จินี่, สมาชิกสภา CCC และศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์และวิศวกรรมศาสตร์จากมหาวิทยาลัยมินนิโซตา กล่าวถึง ดร.เอซี คามาร์กรรมการผู้จัดการ AI Frontiers ที่ Microsoft Research ดร.ฮัล เดาเมที่ 3, ศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์ที่ University of Maryland และ ดร.โจนาธาน เมย์, ศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์ที่ University of Southern California Information Sciences Institute

ด้านล่างนี้เป็นบทสรุปที่น่าสนใจของส่วนถามตอบของ "โมเดลภาษาขนาดใหญ่: ผู้ช่วยที่เป็นประโยชน์ คู่หูโรแมนติก หรือนักต้มตุ๋น?"แผงหน้าปัด. AI สามารถรักได้หรือไม่? โมเดลเหล่านี้อาจส่งผลต่อเด็กๆ อย่างไรบ้าง ความสามารถด้าน AI ของสหรัฐอเมริกามีความโดดเด่นอย่างไร ค้นหาด้านล่าง:

ถาม: เมื่อปรับใช้โมเดลภาษา AI ในบริบทหลายภาษาและหลากหลายวัฒนธรรม เราควรทำอย่างไร

ดร.เมย์: ในการพัฒนาเทคโนโลยีและการลดกำแพง ควรทำให้ผู้คนทำสิ่งที่ต้องการได้ง่ายขึ้น สิ่งที่ทุกคนต้องการทำไม่ใช่แค่ฉัน ขอบคุณ AI ดีมากที่ได้ให้ความสำคัญกับฉัน แต่เราควรให้ความสนใจกับส่วนอื่นๆ ของโลกโดยทั่วไป

ถาม: ปัญหาทั่วไปบางประการเหล่านี้ – นี่ไม่ใช่ครั้งแรกที่มีการหยิบยกประเด็นเหล่านี้ขึ้นมา ดูเหมือนว่าชุมชนจะไม่มาสิ่งเหล่านี้ด้วยตัวเอง ฉันสงสัยว่าพวกคุณทุกคนมีความคิดเกี่ยวกับวิธีนำบทสนทนาเหล่านี้ไปสู่การปฏิบัติหรือไม่?

ดร. คามาร์: มีหลายฝ่ายให้เล่น การประเมินมีความสำคัญอย่างมากในการเป็นตัวแทนของวัฒนธรรมและประชากรที่แตกต่างกัน เมื่อชุดข้อมูลไม่มีความหลากหลายในการเป็นตัวแทนของโลก ระบบผลลัพธ์ก็ไม่ได้เป็นตัวแทน จำเป็นต้องมีการทำงานอีกมากเพื่อสร้างแนวทางปฏิบัติที่ดีที่สุดในการประเมิน กฎระเบียบ และมาตรการการปฏิบัติตามข้อกำหนด ทำเนียบขาวได้ให้คำมั่นสัญญา และพิมพ์เขียวสำหรับร่างพระราชบัญญัติสิทธิด้าน AI กำลังเริ่มต้นขึ้น มีกระบวนการต่างๆ ที่เกิดขึ้นทั่วทั้งอุตสาหกรรม โดยมีผู้มีความคิดสร้างสรรค์มากมายทำงานร่วมกัน (ไม่สมบูรณ์แบบ แต่การสรุปทั่วทั้งอุตสาหกรรมนั้นมีศักยภาพ) มีการประชุมเพื่อให้มาบรรจบกันโดยเริ่มเป็นมาตรฐานในปัจจุบัน อาจจะอยู่ในกฎระเบียบในอนาคต เราจะประเมิน วิเคราะห์ความปลอดภัย ฯลฯ อย่างไร? บทสนทนาเหล่านี้ไม่มีความหลากหลายเท่าที่ควรอยู่ในห้อง ลองนึกถึงผู้ที่ต้องอยู่ในห้องเมื่อมีการตัดสินใจ

ดร. Daumé: ฉันคิดว่าเวลาที่ผู้คนพูดถึงกฎระเบียบ โดยเฉพาะในด้าน AI ทุกคนจะคิดถึงกฎระเบียบที่เป็นการลงโทษ แต่นี่อาจเป็นการจูงใจให้เกิดกฎระเบียบได้เช่นกัน ผู้กำหนดนโยบายด้านเงินทุนและ NSF สามารถส่งเสริมเครื่องมือการพัฒนาที่ช่วยเราในฐานะประเทศชาติและโลก

ถาม: เงินทุนสำหรับ AI ในสหรัฐอเมริกาล้าหลังมากเมื่อเทียบกับที่อื่นๆ ในโลก การลงทุนใหม่โดย NSF มีมูลค่า 20 ล้านบางอย่าง ซึ่งถือเป็นการลงทุนถั่วลิสงเมื่อเทียบกับการลงทุนในอุตสาหกรรม รัฐบาลกลางได้เผยแพร่รายงานจากการศึกษาวิจัยมาหลายปีแล้ว และสรุปก็คือ สหรัฐฯ จะต้องเดินหน้าต่อไป ฉันชอบการเปรียบเทียบการเปลี่ยนเฟสของ Ece ขีดจำกัดทางอุณหพลศาสตร์ด้วยตัวเลขกำลังเพิ่มขึ้น เราต้องการเปิด AI ใครจะยอมจ่าย? มีเงินไม่เพียงพอ ข้อเสนอแนะของคุณคืออะไร? เปิดเอไอ? แต่เราไม่มีการเผยแพร่แบบเปิดด้วยซ้ำ คุณจะแนะนำให้ประธานาธิบดีไม่มีกฎหมายหรือไม่?

ดร.เมย์: ฉันคิดว่ามีเงินนะ มีคนสังเกตเห็นฉันว่าคุณสามารถโน้มน้าวรัฐบาลให้หมุนอนุภาคไปรอบๆ ได้ แต่ไม่สามารถเปลี่ยนเส้นทางให้เราได้

ดร. คามาร์: เหตุผลที่บริษัทต่างๆ ที่กำลังสร้างโมเดลเหล่านี้ได้รับผลลัพธ์เหล่านี้ก็มาจากการรวมศูนย์ทรัพยากร มีหลายสิ่งที่คุณได้รับจากขนาด ควรคิดถึงวิธีที่เรารวมศูนย์การลงทุนในด้านวิชาการเพื่อให้ได้รับทรัพยากรร่วมกัน แทนที่จะมีโมเดลที่แตกต่างกันมากมาย เราเห็นว่ามันไม่ใช่แค่เรื่องขนาดเท่านั้น ไม่ใช่สิ่งที่เราต้องทำตอนนี้ แต่สถาปัตยกรรมปัจจุบันยังไม่ดีนัก การมีความสามารถด้าน AI ที่ดีไม่ควรเป็นเพียงเรื่องเงินและพลังที่มากขึ้นเท่านั้น

ถาม: อคติในคำตอบมากเกินไป เรารู้ไหมว่ามันมาจากไหน? ฉันเป็นคนคณิต และความคิดของฉันก็คือการรวมข้อผิดพลาดในการปัดเศษที่เพิ่มความลำเอียง หากการเป็นตัวแทนเท่ากัน ฉันคิดว่ามันจะแสดงผลการเป็นตัวแทนที่เท่ากัน หรือมันจะยังคงอยู่ตรงนั้น?

ดร.เมย์: มีหลายสิ่งหลายอย่างที่เกี่ยวข้องกับฟังก์ชั่นที่พุ่งสูงขึ้น Soft Maximum เป็นส่วนสำคัญของการฝึกซ้อม สูงสุดอยากเป็นที่ 1 ไม่ใช่ว่าจะมีผลลัพธ์ทางภาษาที่สมบูรณ์แบบ แต่เราต้องการให้มีอคติบ้าง เราเพียงต้องการลดอันตรายต่อผู้คนให้เหลือน้อยที่สุด และหลายครั้งเราไม่ตระหนักถึงสิ่งเหล่านี้ การปรับใช้โดยไม่เข้าใจเป็นปัญหา 

ดร. Daumé: หนึ่งในความท้าทายของโมเดลเหล่านี้ก็คือไม่มีโมเดล AI แบบแคบอีกต่อไป พวกเขาบอกว่าสามารถทำได้ทุกอย่าง ดังนั้นจึงเป็นการยากที่จะทดสอบทุกอย่าง

ถาม: คุณบอกว่า AI เป็นเครื่องมือหรือสิ่งทดแทน คุณคิดว่า AI เป็นอย่างไร

ดร. โดเม: มีเงินเข้ามาทดแทนอีกมาก

ถาม: ชื่อเรื่องกล่าวถึง AI โรแมนติก ฉันต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนั้น

ดร. เมย์: แบบจำลองเหล่านี้มีเจตนาไม่เพียงพอที่จะทดแทนความโรแมนติกได้ แต่แบบจำลองเหล่านั้นก็เก่งพอๆ กับมนุษย์ในการจดจำรูปแบบต่างๆ แม้ว่าจะไม่มีอยู่จริงก็ตาม

ดร. คามาร์: ผมแนะนำว่าอย่าคิดถึง AI อย่างที่มันเป็นอยู่ตอนนี้ ลองจินตนาการถึงอนาคต ลองจินตนาการว่าในอีกไม่กี่ปีข้างหน้า ระบบเหล่านี้จะถูกปรับให้เหมาะกับคุณโดยเฉพาะ คุณจะมีความสัมพันธ์อย่างไรกับระบบนั้น?

ดร.เมย์ : แต่มันจะรักคุณมั้ย?

ดร.คามาร์: มันจะบอกคุณว่ามันรักคุณ

ดร.เมย์: แต่มันเพียงพอแล้วเหรอ?

ถาม: ฉันต้องการฟังคำแนะนำสำหรับคนที่ไม่เกี่ยวกับ AI เราจะมีส่วนร่วมกับเครื่องมือเหล่านี้ได้อย่างไร? เราควรรู้อะไรบ้าง?

ดร. Daumé: ที่มหาวิทยาลัยแมริแลนด์ เรามีบทสนทนาเหล่านี้บ่อยมาก มันง่ายสำหรับฉันที่จะบอกว่าการสื่อสารมวลชนจะแตกต่างออกไปใน 5 ปี และสาขาอื่นๆ ด้วย คงไม่สบายใจที่จะบอกว่าบทบาทของศาสตราจารย์จะแตกต่างออกไปใน 5 ปีข้างหน้า แต่ก็จะเป็นเช่นนั้น ฉันมีเพื่อนร่วมงานที่ใช้ปลั๊กอิน LLM ที่แตกต่างกันสำหรับข้อเสนอและเอกสาร มันกำลังเกิดขึ้นแล้ว ฉันมีคำถามข้อสอบที่เขียนโดยเครื่องมือเป็นประจำ แต่ต้องตรวจสอบความถูกต้อง การเขียนคำถามสอบไม่ได้ทำให้ฉันมีความสุข ดังนั้น AI จึงสามารถทำให้ฉันเข้าใจได้ ในระดับอุดมศึกษาเราต้องคิดให้มากขึ้น มันเปลี่ยนแปลงงานของเราอย่างไร? มีการพูดคุยกันมากมายในมหาวิทยาลัย แต่ไม่มีการรวบรวมทรัพยากรมากนัก

ถาม: AI ยินดีแค่ไหนที่จะถูกตัดสินในอนาคตเมื่อพิจารณาการสมัครทางทหาร ไม่มีการเอ่ยถึงการสมัครทางทหารในเซสชั่นนี้ ฉันรู้ว่าหากฉันอ่านคนได้ถูกต้องครึ่งทาง ความคิดเห็นในหัวข้อนั้นก็มีความแตกต่างกัน

ดร.เมย์: กองทัพมีวงกว้าง งานส่วนใหญ่ของฉันได้รับการสนับสนุนจากกระทรวงกลาโหม ยากที่จะตอบโดยเฉพาะ โดยทั่วไปแล้ว กระทรวงกลาโหม (ไม่ได้พูดแทน) ดูเหมือนจะให้ความสำคัญกับความปลอดภัยและความมั่นคงของสหรัฐฯ และจะยังคงทำเช่นนั้นต่อไป และใช้ประโยชน์จาก LLM และ AI เพื่อช่วยให้สหรัฐฯ ปลอดภัย

ดร. คามาร์: เรายังต้องพูดถึงการใช้สองทางด้วย หากคุณทำงานด้านการทหารในด้านชีววิทยาหรือความปลอดภัยทางไซเบอร์ เราสามารถใช้เครื่องมือที่มีแนวโน้มดีที่เรามีในขณะนี้และใช้งานได้เนื่องจากเราต้องการระบบที่ปลอดภัยและยาตัวใหม่ แต่เมื่อใช้ดีทุกครั้ง คุณก็ย่อมได้รับผลเสีย กรณีการใช้งานใดบ้างที่เราไม่ต้องการให้ใช้ AI ? ในแอปพลิเคชันโอเพ่นซอร์ส ผู้คนสามารถจำลองโมเดลเหล่านี้ได้ เราจะป้องกันไม่ให้ผู้คนทำอันตรายในกรณีเหล่านี้ได้อย่างไร

ถาม: เมื่อมีปฏิสัมพันธ์กับแบบจำลองภาษา ผู้ใหญ่จะเข้าใจว่าไม่มีชีวิตหรือตระหนักรู้ในตนเอง แต่จะเป็นอย่างไรในอีกหลายชั่วอายุคนในภายหลัง เด็ก ๆ ที่มีมันตั้งแต่จำการเข้าสังคมได้? พวกเขามีครูสอนพิเศษหรือครูที่เป็น AI เต็มรูปแบบ ระบบฝังตัวอยู่กับผู้สอน พวกเขาสามารถสร้างความผูกพันกับคำสั่ง คิดว่าพวกเขามีความสัมพันธ์ที่ดี จากนั้นโปรแกรมจะถูกลบ จิตวิทยาเด็กของความผูกพันทางอารมณ์ทางสังคมกับเอนทิตีที่ไม่ใช่บุคคลคืออะไร?

ดร. คามาร์: เราต้องการการวิจัย การวิจัยแบบสหวิทยาการ และเราต้องการมันอย่างรวดเร็ว ภายใน 5 ปี เราอาจจะได้คำตอบเหล่านี้ แต่ในเวลานั้น AI อาจกลายเป็นส่วนสำคัญในชีวิตของลูก 10 ขวบของฉัน คำถามของคุณมีความสำคัญอย่างยิ่ง มีงานวิจัยที่แสดงให้เห็นว่าแม้แต่ระบบที่บริสุทธิ์ก็อาจมีแบ็คดอร์ เราจำเป็นต้องมีผู้เชี่ยวชาญด้านความปลอดภัยและผู้เชี่ยวชาญด้านพัฒนาการเด็กมาพูดคุยกันในวันนี้

ดร. โดเม: ฉันไม่รู้ว่ามีใครจำการสอดแนมบาร์บี้ได้ไหม มีปัญหาความเป็นส่วนตัวใหญ่ที่นี่ นับเป็นประเด็นทางสังคมที่น่าสนใจยิ่งขึ้น คำตอบได้รับการปรับให้เป็นเชิงบวกมากเกินไป เด็กๆ จะพูดเหมือนว่าฉันโกรธเพราะแซลลี่ไม่ได้เล่นกับฉัน และไม่ให้คำแนะนำที่เหมาะสมต่อสังคม ฉันกังวลเกี่ยวกับตัวแทนที่มีทัศนคติเชิงบวก เพราะทัศนคติเชิงบวกไม่ใช่คำตอบที่ถูกต้องเสมอไป

ขอขอบคุณอย่างยิ่งที่อ่าน และโปรดติดตามสรุปการอภิปรายกลุ่มที่ 2024 ซึ่งเป็นกลุ่มสุดท้ายที่งาน AAAS XNUMX

ประทับเวลา:

เพิ่มเติมจาก บล็อก CCC