LLaMA ซึ่งเป็นรูปแบบภาษาขนาดใหญ่ล่าสุดของ Meta รั่วไหลทางออนไลน์และพร้อมให้ดาวน์โหลด แม้ว่าจะมีความพยายามจำกัดการเข้าถึงเพื่อวัตถุประสงค์ในการวิจัยเท่านั้น
เจ้าของเฟสบุ๊ค ประกาศ ในเดือนกุมภาพันธ์ ได้มีการเปิดตัวโมเดลในลักษณะที่จำกัดเพื่อคัดเลือกนักวิชาการ ประเภทรัฐบาล และบริษัทที่จะเล่นด้วยท่ามกลางความกลัว โทร อาจถูกนำไปใช้ในทางที่ผิด แต่ข้อมูลต้องการเป็นอิสระ หรืออย่างน้อยก็มีบางคนต้องการให้เป็นเช่นนั้น และการสร้าง Meta ก็ได้หาทางออนไลน์อยู่ดี โดยเริ่มจากการรั่วไหลของฝนตกหนัก
โมเดลภาษาขนาดใหญ่ที่ใช้ทำนายประโยค ซึ่งสร้างข้อความจากข้อความแจ้งอินพุตได้พัฒนาอย่างต่อเนื่อง ตั้งแต่การเขียนข้อความอัตโนมัติไปจนถึงแชทบอทที่สามารถทำงานเมื่อถูกขอให้ใช้ภาษาธรรมชาติ
ผู้เชี่ยวชาญเตือนว่าเทคโนโลยีนี้สามารถใช้เพื่อผลิตข่าวปลอม สแปม อีเมลฟิชชิ่ง ข้อมูลบิดเบือน การยุยง จำนวนมากโดยอัตโนมัติ ในอีกหลายปีข้างหน้า องค์กรที่สร้างโมเดลเหล่านี้มักจะเก็บซอฟต์แวร์ไว้ภายใต้การแรป อยู่เบื้องหลัง API หรือปล่อยเวอร์ชันจำกัดหรือการสาธิต
“ยังมีงานวิจัยอีกมากที่ต้องทำเพื่อจัดการกับความเสี่ยงของอคติ ความคิดเห็นที่เป็นพิษ และอาการประสาทหลอนในรูปแบบภาษาขนาดใหญ่” Meta กล่าวว่า อาทิตย์ที่แล้ว.
“เช่นเดียวกับรุ่นอื่นๆ LLaMA แบ่งปันความท้าทายเหล่านี้ ในฐานะที่เป็นรุ่นพื้นฐาน LLaMA ได้รับการออกแบบให้ใช้งานได้หลากหลายและสามารถนำไปใช้กับกรณีการใช้งานต่างๆ มากมาย เทียบกับรุ่นที่ปรับแต่งอย่างละเอียดซึ่งออกแบบมาสำหรับงานเฉพาะอย่าง
“เพื่อรักษาความสมบูรณ์และป้องกันการใช้งานในทางที่ผิด เราจึงเผยแพร่แบบจำลองของเราภายใต้ใบอนุญาตที่ไม่ใช่เชิงพาณิชย์ซึ่งมุ่งเน้นไปที่กรณีการใช้งานการวิจัย การเข้าถึงแบบจำลองจะได้รับเป็นกรณีไปสำหรับนักวิจัยทางวิชาการ ผู้ที่สังกัดองค์กรภาครัฐ ภาคประชาสังคม และภาควิชาการ และห้องปฏิบัติการวิจัยอุตสาหกรรมทั่วโลก”
คู่มือวิธีใช้
แต่ความพยายามของ Meta ในการควบคุมการเข้าถึง LLaMA ดูเหมือนจะไร้ผล หรือเป็นเช่นนั้น ไม่นานหลังจากแชร์โมเดลกับโบฟฟินที่เลือก รวมถึงผู้ที่อยู่ในอุตสาหกรรมและภาคประชาสังคม มีคนใน 4Chan โพสต์รายละเอียดเกี่ยวกับวิธีรับโมเดลทั้งหมดผ่านการแชร์ไฟล์แบบเพียร์ทูเพียร์ และในที่สุด คำแนะนำในการดาวน์โหลดทั้งหมด ถูกเผยแพร่บน GitHub
เช่นเคย ใช้ความระมัดระวังเมื่อเรียกข้อมูลเหล่านี้จาก torrents เผื่อว่ามีคนแอบซ่อนสิ่งชั่วร้ายไว้ในนั้น เราได้รับแจ้งว่าโมเดล 65 พันล้านพารามิเตอร์ใช้พื้นที่ดิสก์ประมาณ 220GB
สำเนาของ LLaMA ที่มีอยู่ใน GitHub ดูเหมือนจะถูกต้องตามกฏหมาย ชอว์น เพรสเซอร์ อ วิศวกร AI ผู้เขียนคำแนะนำการดาวน์โหลดบนเว็บไซต์แบ่งปันโค้ดของ Microsoft แสดงภาพหน้าจอของเขาที่สร้างข้อความจากแบบจำลองได้สำเร็จ เขาเชื่อว่านักวิจัยที่ได้รับสิทธิ์เข้าถึงแบบจำลองจาก Meta ได้รั่วไหลออกมา ซึ่งนำไปสู่การเผยแพร่ที่กว้างกว่าที่คาดไว้
เริ่มกลไกทฤษฎีสมคบคิดของคุณ
Presser คิดว่าการปล่อยโมเดลอย่างอิสระโดยไม่มีข้อแม้นั้นดีกว่าการจำกัดไว้เฉพาะนักวิชาการที่ได้รับการอนุมัติเท่านั้น “ฉันคิดว่าความดีจะมีมากกว่าความเลว อย่างน้อยสิบเท่า อาจจะเกือบถึง 100x” เขากล่าว ลงทะเบียน.
การฝึกอบรมและเรียกใช้โมเดลภาษาขนาดใหญ่ที่ล้ำสมัยนั้นมีราคาแพง โดยทั่วไปแล้ว เฉพาะองค์กรที่สามารถเข้าถึงกอง GPU และโครงสร้างพื้นฐานอื่น ๆ เท่านั้นที่อยู่ในตำแหน่งที่จะสร้าง ปรับแต่ง และทดสอบได้ นักวิจัย AI ที่ Meta สร้าง LLaMA ให้มีขนาดเล็กลงทำให้มีขนาดกะทัดรัดกว่าโมเดลเชิงพาณิชย์ในปัจจุบัน และทำให้เข้าถึงได้มากขึ้นสำหรับนักวิชาการและนักพัฒนาโดยไม่ต้องมีงบประมาณด้านไอทีที่ไม่จำเป็น
กูรูด้านแมชชีนเลิร์นนิงของ Meta อ้างว่าระบบของพวกเขามีประสิทธิภาพดีกว่า GPT-3 ของ OpenAI และดีพอๆ กับโมเดลภาษาขนาดใหญ่อื่นๆ เช่น PaLM 540 พันล้านพารามิเตอร์ของ Google หรือ Chinchilla 70 พันล้านพารามิเตอร์ของ DeepMind ขนาดที่เล็กลงหมายความว่าควรใช้ได้ง่ายกว่าสำหรับนักวิทยาศาสตร์ที่มีทรัพยากรในการคำนวณน้อย และใช่ มีโมเดลภาษามากมายเหลือเฟือจากรูปร่างและขนาดทั้งหมด มันเป็นมากกว่า OpenAI และ Facebook
LLaMA ยังคงต้องการพื้นที่จัดเก็บหลายร้อยกิกะไบต์และการประมวลผลในปริมาณที่เหมาะสมในการขับเคลื่อน การนำโมเดลขึ้นและใช้งานไม่ได้ตรงไปตรงมา เว้นแต่คุณจะเคยชินกับการจัดการระบบประเภทนี้ และการนำไปใช้ใหม่สำหรับกิจกรรมที่เลวร้ายยิ่งกว่านั้นยังต้องการความเชี่ยวชาญด้านเทคนิคเพิ่มเติมอีกด้วย แม้ว่าแบบจำลองจะรั่วไหล แต่ Meta กล่าวว่าจะยังคงแบ่งปัน LLaMA กับนักวิจัยที่ได้รับการคัดเลือกเท่านั้น
เราเชื่อว่ากลยุทธ์การเปิดตัวปัจจุบันช่วยให้เราสร้างสมดุลระหว่างความรับผิดชอบและความใจกว้าง
“เป้าหมายของ Meta คือการแบ่งปันโมเดล AI ที่ล้ำสมัยกับสมาชิกของชุมชนการวิจัยเพื่อช่วยเราประเมินและปรับปรุงโมเดลเหล่านั้น” โฆษกกล่าว ลงทะเบียน.
“LLaMA ถูกแชร์เพื่อวัตถุประสงค์ในการวิจัย ซึ่งสอดคล้องกับวิธีที่เราแชร์โมเดลภาษาขนาดใหญ่ก่อนหน้านี้ แม้ว่าโมเดลจะไม่สามารถเข้าถึงได้สำหรับทุกคน และบางคนพยายามหลีกเลี่ยงกระบวนการอนุมัติ เราเชื่อว่ากลยุทธ์การเปิดตัวในปัจจุบันช่วยให้เรารักษาสมดุลของความรับผิดชอบและความเปิดกว้างได้”
กล่าวอีกนัยหนึ่งกลุ่ม Facebook ยืนหยัดในแนวทางการเผยแพร่เทคโนโลยีของตน
ความพยายามล่าสุดของ Meta ในการเปิดตัวโมเดลภาษาขนาดใหญ่ไม่ได้เป็นไปอย่างราบรื่น ปีที่แล้ว BlenderBot ช่างพูดช่างพูด วิพากษ์วิจารณ์ สำหรับการเผยแพร่ข้อมูลที่ผิดและมุมมองต่อต้านกลุ่มเซมิติก Galactica ถูกออกแบบมาเพื่อสรุปความรู้ทางวิทยาศาสตร์ ลบออก สามวันหลังจากเปิดตัวเนื่องจากสร้างเนื้อหาปลอมและเหยียดเชื้อชาติ ®
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตบล็อคเชน Web3 Metaverse ข่าวกรอง ขยายความรู้. เข้าถึงได้ที่นี่.
- ที่มา: https://go.theregister.com/feed/www.theregister.com/2023/03/08/meta_llama_ai_leak/
- :เป็น
- $ ขึ้น
- 7
- a
- เกี่ยวกับเรา
- สถาบันการศึกษา
- นักวิชาการ
- เข้า
- สามารถเข้าถึงได้
- กิจกรรม
- ที่อยู่
- ในเครือ
- หลังจาก
- AI
- ทั้งหมด
- ช่วยให้
- เสมอ
- ท่ามกลาง
- จำนวน
- จำนวน
- และ
- APIs
- เห็นได้ชัด
- ปรากฏ
- ประยุกต์
- เข้าใกล้
- การอนุมัติ
- ได้รับการอนุมัติ
- เป็น
- รอบ
- AS
- At
- ความพยายามในการ
- โดยอัตโนมัติ
- ใช้ได้
- ไม่ดี
- ยอดคงเหลือ
- รากฐาน
- BE
- หลัง
- กำลัง
- เชื่อ
- เชื่อ
- ดีกว่า
- อคติ
- งบประมาณ
- สร้าง
- การก่อสร้าง
- by
- CAN
- สามารถ
- กรณี
- กรณี
- บาง
- ความท้าทาย
- chatbots
- อ้างว่า
- ใกล้ชิด
- CO
- อย่างไร
- ความคิดเห็น
- เชิงพาณิชย์
- ชุมชน
- บริษัท
- คำนวณ
- คงเส้นคงวา
- การกบฏ
- เนื้อหา
- ต่อ
- ควบคุม
- ได้
- การสร้าง
- ปัจจุบัน
- วัน
- Deepmind
- การสาธิต
- ได้รับการออกแบบ
- แม้จะมี
- รายละเอียด
- นักพัฒนา
- ต่าง
- บิดเบือน
- กระจาย
- การกระจาย
- ดาวน์โหลด
- ละคร
- ขับรถ
- ง่ายดาย
- ความพยายาม
- อีเมล
- เครื่องยนต์
- ประเมินค่า
- ในที่สุด
- วิวัฒน์
- การออกกำลังกาย
- แพง
- ความชำนาญ
- เทียม
- ข่าวปลอม
- แฟชั่น
- ความกลัว
- กุมภาพันธ์
- เนื้อไม่มีมัน
- มุ่งเน้น
- สำหรับ
- ข้างหน้า
- พบ
- รากฐาน
- ฟรี
- ราคาเริ่มต้นที่
- ต่อไป
- โดยทั่วไป
- สร้าง
- การสร้าง
- ได้รับ
- GitHub
- กำหนด
- เป้าหมาย
- ดี
- รัฐบาล
- GPUs
- รับ
- บัญชีกลุ่ม
- การจัดการ
- มี
- ช่วย
- ซ่อนเร้น
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTTPS
- ร้อย
- i
- ปรับปรุง
- in
- อุตสาหกรรม
- ข้อมูล
- โครงสร้างพื้นฐาน
- อินพุต
- คำแนะนำการใช้
- ความสมบูรณ์
- IT
- ITS
- jpg
- เก็บ
- ชนิด
- ความรู้
- ภาษา
- ใหญ่
- ชื่อสกุล
- ปีที่แล้ว
- ล่าสุด
- เปิดตัว
- ชั้นนำ
- รั่วไหล
- การรั่วไหล
- Legit
- License
- กดไลก์
- LIMIT
- ถูก จำกัด
- ดูรายละเอียด
- เก็บรักษา
- การทำ
- หลาย
- วิธี
- เมกะ
- สมาชิก
- Meta
- ไมโครซอฟท์
- ข้อมูลที่ผิด
- แบบ
- โมเดล
- ข้อมูลเพิ่มเติม
- ชื่อ
- โดยธรรมชาติ
- ความต้องการ
- ข่าว
- ได้รับ
- of
- on
- ONE
- ออนไลน์
- OpenAI
- ความใจกว้าง
- องค์กร
- อื่นๆ
- เจ้าของ
- ปาล์ม
- เพื่อนเพื่อเพื่อน
- คน
- ที่มีประสิทธิภาพ
- บางที
- ฟิชชิ่ง
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- เล่น
- มากมายเหลือเฟือ
- ตำแหน่ง
- โพสต์
- ป้องกัน
- ก่อน
- อาจ
- กระบวนการ
- การตีพิมพ์
- วัตถุประสงค์
- RE
- เมื่อเร็ว ๆ นี้
- ปล่อย
- ต้องการ
- ต้อง
- การวิจัย
- นักวิจัย
- นักวิจัย
- แหล่งข้อมูล
- ความรับผิดชอบ
- ความเสี่ยง
- วิ่ง
- s
- กล่าวว่า
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- ภาพหน้าจอ
- เลือก
- รูปร่าง
- Share
- ที่ใช้ร่วมกัน
- หุ้น
- ใช้งานร่วมกัน
- ในไม่ช้า
- น่า
- เว็บไซต์
- ขนาด
- ขนาด
- มีขนาดเล็กกว่า
- อย่างราบรื่น
- So
- สังคม
- ซอฟต์แวร์
- บาง
- บางคน
- บางสิ่งบางอย่าง
- ช่องว่าง
- สแปม
- การพูด
- โดยเฉพาะ
- โฆษก
- การแพร่กระจาย
- ยืน
- ที่เริ่มต้น
- รัฐของศิลปะ
- ยังคง
- การเก็บรักษา
- ตรง
- กลยุทธ์
- ประสบความสำเร็จ
- อย่างเช่น
- สรุป
- ระบบ
- ระบบ
- ใช้เวลา
- งาน
- งาน
- เทคโนโลยี
- วิชาการ
- เทคโนโลยี
- ทดสอบ
- ที่
- พื้นที่
- โลก
- ของพวกเขา
- พวกเขา
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- สาม
- ไปยัง
- ในวันนี้
- ฝนตกหนัก
- ชนิด
- ภายใต้
- us
- ใช้
- ไร้สาระ
- อเนกประสงค์
- กับ
- ผ่านทาง
- ยอดวิว
- ทาง..
- สัปดาห์
- ที่
- ในขณะที่
- WHO
- ทั้งหมด
- จะ
- กับ
- ไม่มี
- คำ
- โลก
- การเขียน
- ปี
- ปี
- คุณ
- ของคุณ
- ลมทะเล