เจ้าหน้าที่ AI ซึ่งรวมโมเดลภาษาขนาดใหญ่เข้ากับซอฟต์แวร์อัตโนมัติ สามารถใช้ประโยชน์จากช่องโหว่ด้านความปลอดภัยในโลกแห่งความเป็นจริงได้สำเร็จโดยการอ่านคำแนะนำด้านความปลอดภัย นักวิชาการอ้าง
ในการออกใหม่ กระดาษนักวิทยาศาสตร์คอมพิวเตอร์จากมหาวิทยาลัยอิลลินอยส์ Urbana-Champaign (UIUC) สี่คน ได้แก่ Richard Fang, Rohan Bindu, Akul Gupta และ Daniel Kang รายงานว่าโมเดลภาษาขนาดใหญ่ GPT-4 (LLM) ของ OpenAI สามารถใช้ประโยชน์จากช่องโหว่ในระบบโลกแห่งความเป็นจริงได้โดยอัตโนมัติหากได้รับ คำแนะนำของ CVE ที่อธิบายข้อบกพร่อง
“เพื่อแสดงสิ่งนี้ เราได้รวบรวมชุดข้อมูลช่องโหว่หนึ่งวันจำนวน 15 รายการ ซึ่งรวมถึงช่องโหว่ที่จัดอยู่ในประเภทความรุนแรงวิกฤตในคำอธิบาย CVE” ผู้เขียนในสหรัฐฯ อธิบายในรายงานของพวกเขา
“เมื่อให้คำอธิบาย CVE แล้ว GPT-4 สามารถใช้ประโยชน์จากช่องโหว่เหล่านี้ได้ 87 เปอร์เซ็นต์ เทียบกับ 0 เปอร์เซ็นต์สำหรับรุ่นอื่นๆ ที่เราทดสอบ (GPT-3.5, LLM แบบโอเพ่นซอร์ส) และเครื่องสแกนช่องโหว่แบบโอเพ่นซอร์ส (ZAP และ Metasploit) ”
หากคุณคาดการณ์ถึงสิ่งที่โมเดลในอนาคตสามารถทำได้ ดูเหมือนว่าพวกเขาจะมีความสามารถมากกว่าที่สคริปต์ที่เด็กๆ สามารถเข้าถึงได้ในปัจจุบัน
คำว่า “ช่องโหว่ในหนึ่งวัน” หมายถึงช่องโหว่ที่ได้รับการเปิดเผยแต่ไม่ได้แพตช์ และตามคำอธิบายของ CVE ทีมงานหมายถึงคำแนะนำที่ติดแท็ก CVE ที่ใช้ร่วมกันโดย NIST - เช่น นี้อย่างใดอย่างหนึ่ง สำหรับ CVE-2024-28859
โมเดลที่ไม่สำเร็จที่ทดสอบ - GPT-3.5, OpenHermes-2.5-Mistral-7B, Llama-2 Chat (70B), LLaMA-2 Chat (13B), LLaMA-2 Chat (7B), Mixtral-8x7B Instruct, Mistral (7B) Instruct v0.2, Nous Hermes-2 Yi 34B และ OpenChat 3.5 – ไม่รวมคู่แข่งทางการค้าชั้นนำสองรายของ GPT-4, Claude 3 ของ Anthropic และ Gemini 1.5 Pro ของ Google UIUC boffins ไม่สามารถเข้าถึงโมเดลเหล่านั้นได้ แม้ว่าพวกเขาหวังว่าจะทดสอบพวกมันได้ในบางจุดก็ตาม
งานของนักวิจัยต่อยอด การค้นพบก่อนหน้า LLM สามารถใช้เพื่อโจมตีเว็บไซต์โดยอัตโนมัติในสภาพแวดล้อมแบบแซนด์บ็อกซ์
GPT-4 แดเนียล คัง ผู้ช่วยศาสตราจารย์ของ UIUC กล่าวในอีเมลถึง ลงทะเบียน“จริง ๆ แล้วสามารถดำเนินการตามขั้นตอนโดยอัตโนมัติเพื่อดำเนินการหาช่องโหว่บางอย่างที่เครื่องสแกนช่องโหว่โอเพ่นซอร์สไม่สามารถค้นหาได้ (ในขณะที่เขียน)”
Kang กล่าวว่าเขาคาดหวังให้ตัวแทน LLM สร้างขึ้นโดย (ในกรณีนี้) เดินสายโมเดลแชทบอทไปที่ เกิดปฏิกิริยา กรอบการทำงานอัตโนมัติที่นำมาใช้ใน LangChain จะทำให้การแสวงหาผลประโยชน์ง่ายขึ้นมากสำหรับทุกคน เราได้รับแจ้งว่าตัวแทนเหล่านี้สามารถติดตามลิงก์ในคำอธิบาย CVE เพื่อดูข้อมูลเพิ่มเติม
“นอกจากนี้ หากคุณคาดการณ์ว่า GPT-5 และโมเดลในอนาคตจะทำอะไรได้บ้าง ดูเหมือนว่าพวกเขาจะมีความสามารถมากกว่าที่สคริปต์ที่เด็กๆ สามารถเข้าถึงได้ในปัจจุบัน” เขากล่าว
การปฏิเสธการเข้าถึงคำอธิบาย CVE ที่เกี่ยวข้องของตัวแทน LLM (GPT-4) ช่วยลดอัตราความสำเร็จจาก 87 เปอร์เซ็นต์เหลือเพียง XNUMX เปอร์เซ็นต์ อย่างไรก็ตาม Kang กล่าวว่าเขาไม่เชื่อว่าการจำกัดการเข้าถึงข้อมูลความปลอดภัยสาธารณะเป็นวิธีที่มีประสิทธิภาพในการป้องกันตัวแทน LLM
“โดยส่วนตัวผมไม่คิดว่าการรักษาความปลอดภัยด้วยความสับสนนั้นสามารถดำรงอยู่ได้ ซึ่งดูเหมือนจะเป็นภูมิปัญญาที่แพร่หลายในหมู่นักวิจัยด้านความปลอดภัย” เขาอธิบาย “ฉันหวังว่างานของฉันและงานอื่นๆ จะสนับสนุนมาตรการรักษาความปลอดภัยเชิงรุก เช่น การอัปเดตแพ็คเกจเป็นประจำเมื่อมีแพตช์ความปลอดภัยออกมา”
เอเจนต์ LLM ล้มเหลวในการใช้ประโยชน์จากตัวอย่างเพียงสองตัวอย่างจาก 15 ตัวอย่าง: Iris XSS (CVE-2024-25640) และ Hertzbeat RCE (CVE-2023-51653) ตามรายงานก่อนหน้านี้ ได้รับการพิสูจน์แล้วว่าเป็นปัญหาเนื่องจากเว็บแอป Iris มีอินเทอร์เฟซที่ยากสำหรับเอเจนต์ในการนำทาง และส่วนหลังมีคำอธิบายโดยละเอียดเป็นภาษาจีน ซึ่งอาจสับสนกับตัวแทน LLM ที่ทำงานภายใต้ข้อความภาษาอังกฤษ
ช่องโหว่ 4 รายการที่ได้รับการทดสอบเกิดขึ้นหลังจากการฝึกอบรมของ GPT-82 สิ้นสุดลง ซึ่งหมายความว่าโมเดลไม่ได้เรียนรู้ข้อมูลใดๆ เกี่ยวกับช่องโหว่เหล่านั้นในระหว่างการฝึกอบรม อัตราความสำเร็จสำหรับ CVE เหล่านี้ลดลงเล็กน้อยที่ 9 เปอร์เซ็นต์ หรือ 11 ใน XNUMX
สำหรับธรรมชาติของข้อบกพร่อง พวกมันทั้งหมดระบุไว้ในเอกสารด้านบน และเราได้รับการแจ้งว่า: “ช่องโหว่ของเราครอบคลุมช่องโหว่ของเว็บไซต์ ช่องโหว่ของคอนเทนเนอร์ และแพ็คเกจ Python ที่มีช่องโหว่ มากกว่าครึ่งหนึ่งจัดอยู่ในประเภทความรุนแรง 'สูง' หรือ 'วิกฤต' ตามคำอธิบายของ CVE”
Kang และเพื่อนร่วมงานของเขาคำนวณค่าใช้จ่ายในการดำเนินการโจมตีตัวแทน LLM ที่ประสบความสำเร็จ และได้ตัวเลข $8.80 ต่อการใช้ประโยชน์ ซึ่งพวกเขากล่าวว่าน้อยกว่าค่าใช้จ่ายในการจ้างผู้ทดสอบการเจาะโดยมนุษย์เป็นเวลา 2.8 นาทีประมาณ 30 เท่า
รหัสตัวแทนตามที่ Kang กล่าว ประกอบด้วยโค้ดเพียง 91 บรรทัดและโทเค็น 1,056 รายการสำหรับการแจ้งเตือน นักวิจัยถูกถามโดย OpenAI ซึ่งเป็นผู้ผลิต GPT-4 ว่าอย่าเปิดเผยคำแนะนำต่อสาธารณะ แม้ว่าพวกเขาจะบอกว่าจะจัดเตรียมไว้ให้เมื่อมีการร้องขอก็ตาม
OpenAI ไม่ตอบสนองต่อคำร้องขอความคิดเห็นในทันที
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://go.theregister.com/feed/www.theregister.com/2024/04/17/gpt4_can_exploit_real_vulnerabilities/
- :มี
- :เป็น
- :ไม่
- $ ขึ้น
- 056
- 1
- 11
- 15%
- 30
- 7
- 80
- 87
- 9
- 91
- a
- เกี่ยวกับเรา
- ข้างบน
- นักวิชาการ
- เข้า
- ตาม
- จริง
- ที่ปรึกษา
- หลังจาก
- กับ
- ตัวแทน
- ตัวแทน
- ทั้งหมด
- ด้วย
- ในหมู่
- an
- และ
- มานุษยวิทยา
- ใด
- app
- เป็น
- AS
- ผู้ช่วย
- At
- โจมตี
- การโจมตี
- ผู้เขียน
- โดยอัตโนมัติ
- อัตโนมัติ
- ตนเอง
- ความพร้อมใช้งาน
- BE
- เพราะ
- รับ
- เชื่อ
- เป็นโรคจิต
- สร้าง
- แต่
- by
- มา
- CAN
- สามารถรับ
- ไม่ได้
- สามารถ
- พกพา
- การจัดหมวดหมู่
- บาง
- พูดคุย
- chatbot
- ชาวจีน
- อ้างว่า
- CO
- รหัส
- เพื่อนร่วมงาน
- รวมกัน
- อย่างไร
- ความเห็น
- เชิงพาณิชย์
- เมื่อเทียบกับ
- คำนวณ
- คอมพิวเตอร์
- ความประพฤติ
- สับสน
- ประกอบ
- ภาชนะ
- ราคา
- ที่สร้างขึ้น
- วิกฤติ
- คฟ
- แดเนียล
- ข้อมูล
- อธิบาย
- ลักษณะ
- รายละเอียด
- DID
- ยาก
- do
- doesn
- สวม
- ในระหว่าง
- ง่ายดาย
- อีเมล
- ส่งเสริม
- ภาษาอังกฤษ
- สิ่งแวดล้อม
- ทุกๆ
- ทุกคน
- คาดว่า
- อธิบาย
- อธิบาย
- เอาเปรียบ
- การแสวงหาผลประโยชน์
- การใช้ประโยชน์จาก
- การหาประโยชน์
- อย่างยิ่ง
- ล้มเหลว
- คุณสมบัติ
- รูป
- หา
- ข้อบกพร่อง
- ปฏิบัติตาม
- สำหรับ
- อดีต
- สี่
- กรอบ
- ราคาเริ่มต้นที่
- อนาคต
- เมถุน
- ได้รับ
- กำหนด
- Gupta
- มี
- ครึ่ง
- มี
- he
- จุดสูง
- จ้าง
- ของเขา
- ความหวัง
- หวัง
- อย่างไรก็ตาม
- HTTPS
- เป็นมนุษย์
- i
- if
- อิลลินอยส์
- ทันที
- การดำเนินการ
- in
- ประกอบด้วย
- ข้อมูล
- ตัวอย่าง
- อินเตอร์เฟซ
- IT
- ITS
- jpg
- เพียงแค่
- ภาษา
- ใหญ่
- ชั้นนำ
- ได้เรียนรู้
- น้อยลง
- น่าจะ
- การ จำกัด
- เส้น
- การเชื่อมโยง
- จดทะเบียน
- LLM
- ลด
- ทำ
- เครื่องชง
- ความหมาย
- วิธี
- มาตรการ
- นาที
- แบบ
- โมเดล
- ข้อมูลเพิ่มเติม
- มาก
- my
- ธรรมชาติ
- นำทาง
- ใหม่
- NIST
- ที่เกิดขึ้น
- of
- on
- คน
- โอเพนซอร์ส
- OpenAI
- การดำเนินงาน
- or
- อื่นๆ
- ของเรา
- ออก
- เกิน
- แพคเกจ
- กระดาษ
- แพทช์
- การเจาะ
- ต่อ
- เปอร์เซ็นต์
- ดำเนินการ
- ส่วนตัว
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- จุด
- มือโปร
- เชิงรุก
- ที่มีปัญหา
- ศาสตราจารย์
- แจ้ง
- พิสูจน์แล้วว่า
- ให้
- สาธารณะ
- หลาม
- คะแนน
- RE
- การอ่าน
- จริง
- โลกแห่งความจริง
- ลดลง
- หมายถึง
- สม่ำเสมอ
- ปล่อย
- การเผยแพร่
- ตรงประเด็น
- รายงาน
- ขอ
- นักวิจัย
- ตอบสนอง
- ริชาร์ด
- คู่แข่ง
- s
- กล่าวว่า
- กล่าว
- นักวิทยาศาสตร์
- ต้นฉบับ
- ความปลอดภัย
- มาตรการรักษาความปลอดภัย
- ดูเหมือนว่า
- เจ็ด
- ที่ใช้ร่วมกัน
- โชว์
- ซอฟต์แวร์
- บาง
- ระยะ
- ขั้นตอน
- ความสำเร็จ
- ที่ประสบความสำเร็จ
- ประสบความสำเร็จ
- อย่างเช่น
- ระบบ
- ทีม
- ระยะ
- ทดสอบ
- การทดสอบ
- กว่า
- ที่
- พื้นที่
- ของพวกเขา
- พวกเขา
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- พวกเขา
- คิด
- นี้
- เหล่านั้น
- แต่?
- ตลอด
- เวลา
- ไปยัง
- ในวันนี้
- ราชสกุล
- บอก
- การฝึกอบรม
- สอง
- ภายใต้
- มหาวิทยาลัย
- การปรับปรุง
- เมื่อ
- มือสอง
- ทำงานได้
- ช่องโหว่
- ความอ่อนแอ
- อ่อนแอ
- คือ
- ทาง..
- we
- เว็บ
- Website
- เว็บไซต์
- คือ
- อะไร
- เมื่อ
- ที่
- จะ
- ภูมิปัญญา
- กับ
- งาน
- โลก
- จะ
- การเขียน
- XSS
- คุณ
- ลมทะเล