ในการศึกษาบุกเบิก ทีมงานจากมหาวิทยาลัยนอร์ธแคโรไลนา แชเปิลฮิลล์ ได้ให้ความกระจ่างเกี่ยวกับปัญหาเร่งด่วนของการเก็บรักษาข้อมูลในรูปแบบภาษาขนาดใหญ่ (LLM) เช่น ChatGPT ของ OpenAI และ Bard ของ Google
แม้จะมีความพยายามในการลบ แต่ความซับซ้อนของโมเดล AI เหล่านี้ยังคงสำรอกออกมา ข้อมูลที่ละเอียดอ่อนปลุกเร้าการสนทนาที่รุนแรงเกี่ยวกับความปลอดภัยของข้อมูลและจริยธรรมของ AI
ปริศนาข้อมูล 'ไม่สามารถลบได้'
นักวิจัยได้เริ่มภารกิจเพื่อตรวจสอบการกำจัดข้อมูลที่ละเอียดอ่อนจาก LLM อย่างไรก็ตาม พวกเขาสะดุดกับการเปิดเผย การลบข้อมูลดังกล่าวเป็นเรื่องยาก แต่การตรวจสอบการลบก็มีความท้าทายไม่แพ้กัน เมื่อได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่กว้างขวางแล้ว ยักษ์ใหญ่ด้าน AI เหล่านี้จะเก็บข้อมูลไว้ภายในเขาวงกตที่ซับซ้อนของพารามิเตอร์และน้ำหนัก
สถานการณ์นี้จะกลายเป็นลางร้ายเมื่อ โมเดล AI เผยแพร่ข้อมูลที่ละเอียดอ่อนโดยไม่ตั้งใจ เช่น ตัวระบุส่วนบุคคลหรือบันทึกทางการเงิน ซึ่งอาจวางรากฐานสำหรับการใช้งานที่ชั่วร้าย
นักวิจัยพบ LLM เช่น ChatGPT ส่งออกข้อมูลที่ละเอียดอ่อน แม้ว่าจะถูก 'ลบ' แล้วก็ตาม – https://t.co/P5QG8eGxwE
— ⚡️John The Collector⚡️ (@JohnTheCollectr) ตุลาคม 2, 2023
นอกจากนี้ ประเด็นหลักของปัญหายังอยู่ที่พิมพ์เขียวการออกแบบของรุ่นเหล่านี้ ขั้นตอนเบื้องต้นเกี่ยวข้องกับการฝึกอบรมเกี่ยวกับฐานข้อมูลขนาดใหญ่และการปรับแต่งอย่างละเอียดเพื่อให้แน่ใจว่าผลลัพธ์จะสอดคล้องกัน คำศัพท์เฉพาะทาง “Generative Pretrained Transformer” ที่ห่อหุ้มอยู่ใน GPT ช่วยให้มองเห็นกลไกนี้ได้คร่าวๆ
นักวิชาการของ UNC ชี้แจงสถานการณ์สมมติที่ LLM ซึ่งได้รับข้อมูลทางธนาคารที่ละเอียดอ่อนมากมาย กลายเป็นภัยคุกคามที่อาจเกิดขึ้น ราวกั้นร่วมสมัยที่นักพัฒนา AI ใช้งานนั้นไม่สามารถบรรเทาข้อกังวลนี้ได้
มาตรการป้องกันเหล่านี้ เช่น การแจ้งแบบฮาร์ดโค้ดหรือกระบวนทัศน์ที่เรียกว่าการเรียนรู้การเสริมกำลังจากผลตอบรับของมนุษย์ (RLHF) มีบทบาทสำคัญในการควบคุมผลลัพธ์ที่ไม่พึงประสงค์ อย่างไรก็ตาม พวกเขายังคงทิ้งข้อมูลที่ซ่อนตัวอยู่ในก้นบึ้งของแบบจำลอง และพร้อมที่จะถูกอัญเชิญโดยใช้เพียงถ้อยคำใหม่ของการแจ้ง
การเชื่อมช่องว่างด้านความปลอดภัย
แม้จะใช้วิธีการแก้ไขโมเดลที่ล้ำสมัย เช่น การแก้ไขโมเดลอันดับ 38 แต่ทีมงาน UNC ก็ค้นพบว่าข้อมูลข้อเท็จจริงที่สำคัญยังคงสามารถเข้าถึงได้ การค้นพบของพวกเขาเผยให้เห็นว่าข้อเท็จจริงสามารถฟื้นคืนชีพได้ประมาณ 29% และ XNUMX% ของเวลาโดยการโจมตีด้วยไวท์บ็อกซ์และแบล็คบ็อกซ์ ตามลำดับ
ในภารกิจนี้ นักวิจัยได้ใช้แบบจำลองที่เรียกว่า GPT-J ด้วยพารามิเตอร์ถึง 6 พันล้านพารามิเตอร์ ถือว่าเล็กเมื่อเทียบกับ GPT-3.5 ขนาดมหึมา โมเดลพื้นฐานสำหรับ ChatGPT ด้วยพารามิเตอร์ 170 พันล้านพารามิเตอร์ ความแตกต่างที่ชัดเจนนี้บ่งบอกถึงความท้าทายที่ยิ่งใหญ่ในการฆ่าเชื้อโมเดลขนาดใหญ่ เช่น GPT-3.5 จากข้อมูลที่ไม่ได้รับอนุญาต
นอกจากนี้ นักวิชาการของ UNC ยังได้สร้างวิธีการป้องกันแบบใหม่เพื่อปกป้อง LLM จาก "การโจมตีแบบสกัดกั้น" โดยเฉพาะ แผนการชั่วร้ายเหล่านี้ใช้ประโยชน์จากราวกั้นของโมเดลเพื่อหาข้อมูลที่ละเอียดอ่อน อย่างไรก็ตาม บทความนี้มีนัยเป็นลางไม่ดีถึงเกมแมวจับหนูตลอดกาล โดยที่กลยุทธ์การป้องกันจะไล่ตามกลยุทธ์การโจมตีที่พัฒนาอยู่ตลอดไป
Microsoft มอบหมายทีมนิวเคลียร์เพื่อสนับสนุน AI
ในบันทึกที่เกี่ยวข้อง ขอบเขตที่ขยายตัวอย่างรวดเร็วของ AI ได้ผลักดันให้ยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Microsoft เข้าสู่ดินแดนที่ไม่คุ้นเคย การจัดตั้งทีมงานพลังงานนิวเคลียร์เมื่อเร็วๆ นี้ของ Microsoft เพื่อสนับสนุนความคิดริเริ่มด้าน AI ตอกย้ำความต้องการที่เพิ่มมากขึ้นและอนาคตที่เชื่อมโยงกันของ AI และทรัพยากรพลังงาน เมื่อโมเดล AI พัฒนาขึ้น ความกระหายในพลังงานก็เพิ่มมากขึ้น ซึ่งปูทางไปสู่โซลูชันที่เป็นนวัตกรรมเพื่อสนองความต้องการที่เพิ่มขึ้นนี้
Microsoft จัดตั้งทีมพลังงานนิวเคลียร์เพื่อรองรับ AI: Reporthttps://t.co/OvAGclfMnt#ข่าว #crypto #Bitcoin #แมชชีนเลิร์นนิง #Microsoft #ข่าว #technology https://t.co/OvAGclfMnt
- ข่าวด่วนของ Crypto: ข่าว Crypto และ Bitcoin ล่าสุด (@CryptoBreakNews) ตุลาคม 1, 2023
วาทกรรมเกี่ยวกับการเก็บรักษาและการลบข้อมูลใน LLM ก้าวข้ามเส้นทางวิชาการ โดยเรียกร้องให้มีการตรวจสอบอย่างละเอียดและหารือกันทั่วทั้งอุตสาหกรรมเพื่อส่งเสริมกรอบการทำงานที่แข็งแกร่งซึ่งรับประกันความปลอดภัยของข้อมูล ในขณะเดียวกันก็รักษาการเติบโตและศักยภาพของ AI
การร่วมทุนโดยนักวิจัยของ UNC ครั้งนี้ถือเป็นความก้าวหน้าครั้งสำคัญในการทำความเข้าใจและแก้ไขปัญหาข้อมูลที่ 'ไม่สามารถลบออกได้' ในที่สุด ซึ่งถือเป็นก้าวสำคัญในการทำให้ AI กลายเป็นเครื่องมือที่ปลอดภัยยิ่งขึ้นในยุคดิจิทัล
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://metanews.com/llms-like-chatgpt-persistently-leak-sensitive-data-despite-deletion-efforts/
- :มี
- :เป็น
- :ที่ไหน
- 1
- 7
- a
- นักวิชาการ
- สามารถเข้าถึงได้
- หลังจาก
- อายุ
- AI
- โมเดล AI
- an
- และ
- ความอยากอาหาร
- รอบ
- AS
- At
- การโจมตี
- ความพยายามในการ
- การธนาคาร
- BE
- จะกลายเป็น
- รับ
- เบฮีมอธ
- พันล้าน
- Bitcoin
- ข่าว Bitcoin
- พิมพ์เขียว
- หนุน
- หมดสภาพ
- ข่าว
- ที่กำลังบูม
- แต่
- by
- แมว
- ท้าทาย
- การไล่ล่า
- ChatGPT
- ใกล้ชิด
- สอดคล้องกัน
- เมื่อเทียบกับ
- ซับซ้อน
- กังวล
- ร่วมสมัย
- ต่อ
- ตรงกันข้าม
- การสนทนา
- แกน
- ได้
- ที่สร้างขึ้น
- การเข้ารหัสลับ
- การเหนี่ยวรั้ง
- ข้อมูล
- ความปลอดภัยของข้อมูล
- ฐานข้อมูล
- ชุดข้อมูล
- ป้องกัน
- การป้องกัน
- รับมอบสิทธิ์
- ความต้องการ
- ความต้องการ
- ปรับใช้
- ออกแบบ
- นักพัฒนา
- บทสนทนา
- ดิจิตอล
- ยุคดิจิตอล
- สนทนา
- ค้นพบ
- ลงมือ
- การจ้างงาน
- ห่อหุ้ม
- พลังงาน
- ทำให้มั่นใจ
- เพื่อให้แน่ใจ
- เท่ากัน
- จริยธรรม
- แม้
- ในที่สุด
- คาย
- การพัฒนา
- ไพศาล
- เอาเปรียบ
- ข้อเท็จจริง
- ตก
- ข้อเสนอแนะ
- ทางการเงิน
- หา
- ผลการวิจัย
- ปลา
- สำหรับ
- ตลอดไป
- ฟอร์ม
- การสร้าง
- อุปถัมภ์
- กรอบ
- ราคาเริ่มต้นที่
- อนาคต
- เกม
- เหลือบ
- ของ Google
- รากฐาน
- การเจริญเติบโต
- การเจริญเติบโต
- ท่าเรือ
- มี
- คำแนะนำ
- อย่างไรก็ตาม
- HTTPS
- เป็นมนุษย์
- ตัวบ่งชี้
- in
- โดยไม่ตั้งใจ
- ข้อมูล
- ความปลอดภัยของข้อมูล
- ความคิดริเริ่ม
- นวัตกรรม
- พัน
- เข้าไป
- ความซับซ้อน
- สอบสวน
- ปัญหา
- IT
- ITS
- ที่รู้จักกัน
- ภาษา
- ใหญ่
- ที่มีขนาดใหญ่
- ล่าสุด
- รั่วไหล
- การเรียนรู้
- ทิ้ง
- เบา
- กดไลก์
- LLM
- การทำ
- มาตรการ
- กลไก
- Mers
- วิธีการ
- ไมโครซอฟท์
- แบบ
- โมเดล
- ถาวร
- ใหม่
- ข่าว
- ทางทิศเหนือ
- North Carolina
- นิวเคลียร์
- พลังงานนิวเคลียร์
- บำรุง
- of
- น่ารังเกียจ
- เสนอ
- on
- ครั้งเดียว
- or
- ออก
- เอาท์พุต
- กระดาษ
- ตัวอย่าง
- พารามิเตอร์
- ปู
- รูปแบบไฟล์ PDF
- ตลอดกาล
- เสมอต้นเสมอปลาย
- ส่วนบุคคล
- ระยะ
- การสำรวจ
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- เล่น
- โพสท่า
- ที่มีศักยภาพ
- ที่อาจเกิดขึ้น
- อำนาจ
- การกด
- ปัญหา
- ขับเคลื่อน
- ป้องกัน
- การแสวงหา
- พร้อม
- ดินแดน
- เมื่อเร็ว ๆ นี้
- บันทึก
- ที่เกี่ยวข้อง
- ยังคงอยู่
- นักวิจัย
- แหล่งข้อมูล
- ตามลำดับ
- ความจำ
- เปิดเผย
- การเปิดเผย
- แข็งแรง
- บทบาท
- ปลอดภัยมากขึ้น
- สถานการณ์
- รูปแบบ
- นักวิชาการ
- ความปลอดภัย
- มีความละเอียดอ่อน
- รุนแรง
- เพิง
- โล่
- สั้น
- สำคัญ
- โซลูชัน
- การแก้
- โดยเฉพาะ
- สิ้นเชิง
- รัฐของศิลปะ
- ขั้นตอน
- ยังคง
- กลยุทธ์
- ก้าวย่าง
- ศึกษา
- เป็นกอบเป็นกำ
- อย่างเช่น
- สนับสนุน
- กลยุทธ์
- ทีม
- เทคโนโลยี
- คำศัพท์
- ดินแดน
- ที่
- พื้นที่
- ของพวกเขา
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- พวกเขา
- นี้
- การคุกคาม
- ตลอด
- เวลา
- ไปยัง
- เครื่องมือ
- ไปทาง
- ผ่านการฝึกอบรม
- การฝึกอบรม
- ฟันฝ่า
- หม้อแปลงไฟฟ้า
- จริง
- ผลัดกัน
- ไม่จดที่แผนที่
- ขีด
- ความเข้าใจ
- มหาวิทยาลัย
- เมื่อ
- ใช้
- ใช้
- กว้างใหญ่
- บริษัท ร่วมทุน
- การตรวจสอบ
- จำเป็น
- ทาง..
- เมื่อ
- ในขณะที่
- กับ
- ภายใน
- จะ
- ลมทะเล