Microsoft อ้างว่าการจุติใหม่ของโมเดล Phi-3 Mini AI ที่มีน้ำหนักเบาเป็นคู่แข่งกับคู่แข่งเช่น GPT-3.5 ในขณะที่มีขนาดเล็กพอที่จะปรับใช้บนโทรศัพท์
Phi-3 Mini เป็นโมเดลภาษาที่มีพารามิเตอร์ 3.8 พันล้านพารามิเตอร์ที่ฝึกฝนบนโทเค็น 3.3 ล้านล้านโทเค็น ตัวเลขนี้เพิ่มขึ้นจากพารามิเตอร์ของ Phi-2.7 ที่ 2 พันล้าน ซึ่งไมโครซอฟต์ แนะนำ 2023 ในเดือนธันวาคม
แทนที่จะยัดเยียดลงในโมเดลการฝึกอบรมให้มากที่สุดเท่าที่จะเป็นไปได้ จุดเน้นอยู่ที่การใช้เหตุผล Microsoft กล่าวว่า: “ตามตัวอย่าง ผลลัพธ์ของเกมในพรีเมียร์ลีกในวันใดวันหนึ่งอาจเป็นข้อมูลการฝึกอบรมที่ดีสำหรับโมเดลชายแดน แต่เราจำเป็นต้องลบข้อมูลดังกล่าวออกเพื่อให้เหลือความจุของโมเดลมากขึ้นสำหรับ 'เหตุผล' สำหรับโมเดลขนาดเล็ก ”
แนวทางที่กำหนดเป้าหมายหมายความว่าแม้ว่า Phi-3 อาจไม่มีความรู้ที่กว้างไกลจากคู่แข่ง แต่อย่างน้อยก็ดีพอๆ กัน หากไม่ดีขึ้น เมื่อพูดถึงการให้เหตุผล หรือกล่าวอ้าง Microsoft ใน รายงานการวิจัย [PDF] Microsoft ตั้งข้อสังเกตว่าสิ่งนี้อนุญาตให้โมเดลภาษาขนาดเล็ก “เข้าถึงระดับของโมเดลที่มีความสามารถสูง เช่น GPT-3.5 หรือ Mixtral โดยมีพารามิเตอร์ทั้งหมดเพียง 3.8B (ในขณะที่ Mixtral มีพารามิเตอร์ทั้งหมด 45B เป็นต้น)”
การวิจัยยังตั้งข้อสังเกตอีกว่าข้อมูลการฝึกอบรมที่ใช้ประกอบด้วย “ข้อมูลเว็บที่ถูกกรองอย่างหนัก … จากแหล่งอินเทอร์เน็ตแบบเปิดต่างๆ” และข้อมูลที่สร้างโดย LLM แหล่งข้อมูลที่ใช้ในการฝึกอบรม LLM เป็นหัวข้อของ หลายคดี.
ขนาดที่เล็กของ Phi-3 Mini หมายความว่าสามารถทำงานแบบออฟไลน์บนสมาร์ทโฟนได้ นักวิจัยกล่าวว่าอาจใช้พื้นที่หน่วยความจำประมาณ 1.8 GB และทดลองใช้งานแบบออฟไลน์บน iPhone 14 โดยใช้ชิป A16 Bionic ที่ทำงานบนอุปกรณ์ ในรายงานนี้ นักวิจัยได้แสดงภาพหน้าจอของ Phi-3 Mini ที่เขียนบทกวีและแนะนำกิจกรรมน่าสนใจในฮูสตัน
นักวิจัยยังเน้นย้ำถึงข้อเสียของการมุ่งเน้นไปที่ความเข้าใจภาษาและการใช้เหตุผล “แบบจำลองไม่มีความสามารถในการจัดเก็บ 'ความรู้ข้อเท็จจริง' มากเกินไป” ซึ่งเป็นสิ่งที่สามารถบรรเทาลงได้ในระดับหนึ่งโดยเสริมด้วยเครื่องมือค้นหา อย่างไรก็ตาม นั่นจะทำลายจุดที่สามารถเรียกใช้แบบออฟไลน์ได้
ภาษาส่วนใหญ่จำกัดเฉพาะภาษาอังกฤษในปัจจุบัน และปัญหาที่มีอยู่ใน LLM ส่วนใหญ่ เช่น ภาพหลอน การขยายอคติ และการสร้างเนื้อหาที่ไม่เหมาะสม ก็สามารถพบได้ใน Phi-3 Mini
นักวิจัยกล่าวในบทความนี้ว่า “มีงานสำคัญรออยู่ข้างหน้าเพื่อจัดการกับความท้าทายเหล่านี้อย่างเต็มที่”
โมเดลขนาดใหญ่กว่านั้นก็ได้รับการประกาศในรูปแบบของ Phi-3 Small และ Phi-3 Medium ด้วยพารามิเตอร์ 7 และ 14 พันล้านตามลำดับ
Victor Botev, CTO และผู้ร่วมก่อตั้งที่ ไอริส.aiบอกกับเราว่า: “การประกาศเปิดตัวโมเดล Phi-3 ของ Microsoft แสดงให้เห็นถึงแนวโน้มการพัฒนา AI อย่างต่อเนื่อง แทนที่จะไล่ตามโมเดลที่ใหญ่กว่าเดิม Microsoft กำลังพัฒนาเครื่องมือที่มีข้อมูลที่รวบรวมไว้อย่างรอบคอบและการฝึกอบรมเฉพาะทางมากขึ้น ซึ่งช่วยให้สามารถปรับปรุงประสิทธิภาพและความสามารถในการให้เหตุผลโดยไม่ต้องเสียค่าใช้จ่ายในการคำนวณจำนวนมากของแบบจำลองที่มีพารามิเตอร์หลายล้านล้านรายการ การปฏิบัติตามคำสัญญานี้จะหมายถึงการทลายกำแพงการยอมรับอันใหญ่หลวงสำหรับธุรกิจที่กำลังมองหาโซลูชัน AI
“Microsoft มองข้ามกรอบความคิดที่ว่า 'ใหญ่กว่าดีกว่า' อย่างชาญฉลาด สำหรับแอปพลิเคชัน AI ของธุรกิจและผู้บริโภคที่แพร่หลาย ความเป็นไปได้และความเฉพาะเจาะจงมีความสำคัญมากกว่าการนับพารามิเตอร์จำนวนมาก โมเดลอย่าง Phi-3 แสดงให้เห็นอย่างชัดเจนว่าด้วยข้อมูลที่ถูกต้องและแนวทางการฝึกอบรม ความสามารถด้าน AI ขั้นสูงไม่จำเป็นต้องสร้างโมเดลที่ใหญ่กว่าเดิม ซึ่งเป็นปัจจัยในการตัดสินใจสำหรับธุรกิจที่อัตราส่วนต้นทุนต่อคุณภาพเป็นสิ่งสำคัญ”
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://go.theregister.com/feed/www.theregister.com/2024/04/23/microsoft_phi_3_mini/
- :มี
- :เป็น
- :ไม่
- :ที่ไหน
- $ ขึ้น
- 1
- 14
- 2023
- 7
- 8
- a
- ความสามารถ
- สามารถ
- ที่อยู่
- การนำมาใช้
- สูง
- ก่อน
- AI
- อนุญาตให้
- ช่วยให้
- ด้วย
- การขยาย
- an
- และ
- ประกาศ
- การประกาศ
- การใช้งาน
- เข้าใกล้
- ประมาณ
- เป็น
- AS
- At
- อุปสรรค
- BE
- รับ
- กำลัง
- ดีกว่า
- เกิน
- อคติ
- ที่ใหญ่กว่า
- พันล้าน
- ความกว้าง
- การก่อสร้าง
- ธุรกิจ
- ธุรกิจ
- แต่
- by
- CAN
- ความสามารถในการ
- สามารถ
- ความจุ
- รอบคอบ
- บาง
- ความท้าทาย
- ชิป
- การเรียกร้อง
- อย่างเห็นได้ชัด
- CO
- ผู้ร่วมก่อตั้ง
- มา
- คู่แข่ง
- การคำนวณ
- ผู้บริโภค
- เนื้อหา
- อย่างต่อเนื่อง
- ค่าใช้จ่าย
- ได้
- วิกฤติ
- CTO
- curated
- ข้อมูล
- วัน
- ธันวาคม
- กำลังตัดสินใจ
- สาธิต
- นำไปใช้
- ที่กำลังพัฒนา
- พัฒนาการ
- เครื่อง
- do
- ทำ
- ลง
- ข้อเสีย
- เครื่องยนต์
- ภาษาอังกฤษ
- พอ
- ตัวอย่าง
- ขอบเขต
- ปัจจัย
- ความเป็นไปได้
- รูป
- โฟกัส
- โดยมุ่งเน้น
- สำหรับ
- ฟอร์ม
- พบ
- ราคาเริ่มต้นที่
- ชายแดน
- การตอบสนอง
- อย่างเต็มที่
- เกม
- รุ่น
- ดี
- มี
- หนัก
- เน้น
- อย่างสูง
- ฮูสตัน
- อย่างไรก็ตาม
- ที่ http
- HTTPS
- ใหญ่
- if
- สำคัญ
- การปรับปรุง
- in
- ข้อมูล
- โดยธรรมชาติ
- อินเทอร์เน็ต
- เข้าไป
- iPhone
- iPhone 14
- IT
- ITS
- jpg
- ความรู้
- ภาษา
- ล่าสุด
- พันธมิตร
- น้อยที่สุด
- ทิ้ง
- ชั้น
- มีน้ำหนักเบา
- กดไลก์
- ที่ต้องการหา
- ทำ
- มาก
- หมายความ
- วิธี
- กลาง
- หน่วยความจำ
- ไมโครซอฟท์
- อาจ
- Mindset
- แบบ
- โมเดล
- ข้อมูลเพิ่มเติม
- มากที่สุด
- ส่วนใหญ่
- มาก
- โดยกำเนิด
- จำเป็นต้อง
- หมายเหตุ / รายละเอียดเพิ่มเติม
- of
- ออฟไลน์
- on
- เพียง
- เปิด
- or
- ออก
- กระดาษ
- พารามิเตอร์
- ในสิ่งที่สนใจ
- รูปแบบไฟล์ PDF
- การปฏิบัติ
- โทรศัพท์
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- จุด
- เป็นไปได้
- นายกรัฐมนตรี
- นำเสนอ
- ปัญหาที่เกิดขึ้น
- คำมั่นสัญญา
- ค่อนข้าง
- อัตราส่วน
- RE
- มาถึง
- สัมพัทธ์
- เอาออก
- แสดงให้เห็นถึง
- ต้องการ
- การวิจัย
- นักวิจัย
- ตามลำดับ
- หวงห้าม
- ผล
- ขวา
- คู่แข่ง
- วิ่ง
- วิ่ง
- s
- กล่าวว่า
- กล่าว
- ภาพหน้าจอ
- ค้นหา
- เครื่องมือค้นหา
- โชว์
- สำคัญ
- ง่ายดาย
- ขนาด
- เล็ก
- มาร์ทโฟน
- So
- โซลูชัน
- บางสิ่งบางอย่าง
- แหล่งที่มา
- การพูด
- เฉพาะ
- ความจำเพาะ
- จัดเก็บ
- หรือ
- อย่างเช่น
- เป้าหมาย
- กว่า
- ที่
- พื้นที่
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- สิ่ง
- นี้
- ไปยัง
- ราชสกุล
- บอก
- เกินไป
- เครื่องมือ
- รวม
- รถไฟ
- ผ่านการฝึกอบรม
- การฝึกอบรม
- เทรนด์
- พยายาม
- ล้านล้าน
- ล้านล้าน
- ความเข้าใจ
- us
- มือสอง
- ต่างๆ
- คือ
- we
- เว็บ
- เมื่อ
- ที่
- ในขณะที่
- แพร่หลาย
- ชาญฉลาด
- กับ
- ไม่มี
- งาน
- จะ
- การเขียน
- ลมทะเล