AI ใหม่ของ Meta สามารถเลือกและตัดวัตถุใดๆ ในรูปภาพได้ แม้กระทั่งวัตถุที่ไม่เคยเห็นมาก่อน

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

AI ใหม่ของ Meta สามารถเลือกและตัดวัตถุใดๆ ในรูปภาพได้ แม้กระทั่งวัตถุที่ไม่เคยเห็นมาก่อน PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

การเลือกวัตถุที่แยกจากกันในฉากภาพดูเหมือนเป็นเรื่องง่ายสำหรับเรา แต่เครื่องจักรมีปัญหากับงานนี้ ตอนนี้โมเดล AI ใหม่จาก Meta ได้พัฒนาแนวคิดกว้างๆ ว่าวัตถุคืออะไร ทำให้สามารถแยกวัตถุออกได้แม้ว่าจะไม่เคยเห็นมาก่อนก็ตาม

อาจดูเหมือนเป็นงานคอมพิวเตอร์วิทัศน์ที่ค่อนข้างธรรมดา แต่ความสามารถในการแยกวิเคราะห์ภาพและหาจุดที่วัตถุหนึ่งสิ้นสุดและอีกวัตถุหนึ่งเริ่มต้นขึ้นนั้นเป็นทักษะพื้นฐานที่ดี หากปราศจากงานที่ซับซ้อนกว่านี้มากมายก็จะไม่สามารถแก้ไขได้

“การแบ่งส่วนวัตถุ” ไม่ใช่เรื่องใหม่ นักวิจัยด้าน AI ได้ทำงานเกี่ยวกับมันมาหลายปีแล้ว แต่โดยทั่วไปแล้ว การสร้างโมเดลเหล่านี้เป็นกระบวนการที่กินเวลามากซึ่งต้องใช้คำอธิบายประกอบรูปภาพจำนวนมากและทรัพยากรคอมพิวเตอร์จำนวนมาก และโดยทั่วไปแล้ว โมเดลที่ได้จะมีความเฉพาะเจาะจงสูงสำหรับกรณีการใช้งานเฉพาะ

แม้ว่าตอนนี้ นักวิจัยที่ Meta ได้เปิดตัว Segment Anything Model (SAM) ซึ่งสามารถตัดวัตถุใดๆ ออกจากฉากใดๆ ก็ตาม โดยไม่คำนึงว่าเคยเห็นอะไรแบบนี้มาก่อนหรือไม่ แบบจำลองยังสามารถตอบสนองต่อข้อความแจ้งต่างๆ ที่หลากหลาย ตั้งแต่คำอธิบายข้อความ การคลิกเมาส์ หรือแม้แต่ข้อมูลการติดตามการมอง

“SAM ได้เรียนรู้แนวคิดทั่วไปว่าวัตถุคืออะไร และมันสามารถสร้างหน้ากากสำหรับวัตถุใดๆ ในภาพหรือวิดีโอใดๆ ก็ได้” นักวิจัยระบุใน บล็อก เสา. “เราเชื่อว่าความเป็นไปได้นั้นกว้าง และเรารู้สึกตื่นเต้นกับกรณีการใช้งานที่เป็นไปได้มากมายที่เรายังไม่เคยคิดมาก่อน”

กุญแจสำคัญในการพัฒนาโมเดลคือชุดข้อมูลใหม่จำนวน 1.1 พันล้านมาสก์การแบ่งส่วน ซึ่งหมายถึงบริเวณของภาพที่ถูกแยกออกและใส่คำอธิบายประกอบเพื่อแสดงว่ามีวัตถุใดวัตถุหนึ่ง สร้างขึ้นจากการผสมผสานระหว่างการใส่คำอธิบายประกอบโดยมนุษย์สำหรับรูปภาพและกระบวนการอัตโนมัติ และเป็นคอลเลกชันที่ใหญ่ที่สุดของประเภทนี้ที่รวบรวมมาจนถึงปัจจุบัน

นักวิจัยของ Meta กล่าวว่าได้พัฒนาแนวคิดทั่วไปว่าวัตถุคืออะไร ซึ่งทำให้สามารถแบ่งกลุ่มสิ่งที่ไม่เคยเห็นมาก่อนได้ด้วยการฝึกอบรมชุดข้อมูลขนาดใหญ่ดังกล่าว ความสามารถในการสรุปนี้ทำให้นักวิจัยขนานนาม SAM ว่า "แบบจำลองพื้นฐาน" คำที่ขัดแย้ง ใช้เพื่ออธิบายโมเดลสำเร็จรูปขนาดใหญ่อื่นๆ เช่น GPT ของ OpenAI ซีรีส์ซึ่งมีความสามารถทั่วไปที่สามารถใช้เป็นรากฐานสำหรับโฮสต์ของแอปพลิเคชัน

การแบ่งส่วนภาพเป็นองค์ประกอบหลักในงานด้านการมองเห็นด้วยคอมพิวเตอร์ที่หลากหลาย หากคุณไม่สามารถแยกองค์ประกอบต่างๆ ของฉากออกจากกันได้ ก็ยากที่จะทำอะไรที่ซับซ้อนกว่านี้ได้ ในบล็อกของพวกเขา นักวิจัยกล่าวว่าสามารถพิสูจน์ได้ว่ามีประโยชน์อย่างมากในการตัดต่อวิดีโอและรูปภาพ หรือช่วยในการวิเคราะห์ภาพทางวิทยาศาสตร์

บางทีอาจเกี่ยวข้องกับความทะเยอทะยานของ metaverse ของบริษัทมากกว่า พวกเขามีการสาธิตวิธีการใช้ร่วมกับชุดหูฟังความเป็นจริงเสมือนเพื่อเลือกวัตถุเฉพาะตามการจ้องมองของผู้ใช้ พวกเขายังกล่าวอีกว่าอาจจับคู่กับโมเดลภาษาขนาดใหญ่เพื่อสร้างระบบหลายโมดอลที่สามารถเข้าใจทั้งเนื้อหาภาพและข้อความของหน้าเว็บ

ความสามารถในการจัดการกับการแจ้งเตือนที่หลากหลายทำให้ระบบมีความยืดหยุ่นเป็นพิเศษ ใน หน้าเว็บ สาธิตโมเดลใหม่ บริษัทแสดงให้เห็นว่าหลังจากวิเคราะห์ภาพแล้ว สามารถแยกวัตถุเฉพาะออกได้ด้วยการคลิกด้วยเคอร์เซอร์ของเมาส์ พิมพ์สิ่งที่คุณต้องการแบ่งกลุ่ม หรือเพียงแค่แบ่งภาพทั้งหมดออกเป็น แยกวัตถุ

และที่สำคัญที่สุดคือ บริษัทเปิดแหล่งที่มาทั้งโมเดลและชุดข้อมูลเพื่อวัตถุประสงค์ในการวิจัย เพื่อให้ผู้อื่นสามารถต่อยอดจากผลงานของตนได้ นี่เป็นแนวทางเดียวกับที่บริษัทใช้กับโมเดลภาษาขนาดใหญ่ของ LLaMA ซึ่งนำไปสู่การเกิดขึ้นอย่างรวดเร็ว รั่วออนไลน์ และกระตุ้นก คลื่นแห่งการทดลอง โดยมือสมัครเล่นและแฮกเกอร์

สิ่งเดียวกันนี้จะเกิดขึ้นกับ SAM หรือไม่ แต่ทั้งสองวิธีถือเป็นของขวัญสำหรับชุมชนการวิจัย AI ที่สามารถเร่งความคืบหน้าเกี่ยวกับปัญหาการมองเห็นคอมพิวเตอร์ที่สำคัญ

เครดิตภาพ: เมตาเอไอ

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
เพลโตบล็อคเชน Web3 Metaverse ข่าวกรอง ขยายความรู้. เข้าถึงได้ที่นี่.
ที่มา: https://singularityhub.com/2023/04/10/metas-new-ai-can-identify-and-remove-objects-in-images/

ประทับเวลา: April 10, 2023

ประทับเวลา: Mar 20, 2023

AI ใหม่ของ Meta สามารถเลือกและตัดวัตถุใดๆ ในรูปภาพได้ แม้แต่วัตถุที่ไม่เคยเห็นมาก่อน

เผยแพร่ซ้ำโดยเพลโต

เพิ่มเติมจาก Hub เอกพจน์

สิ่งเหล่านี้คือเรื่องราว Singularity Hub ที่มีผู้อ่านมากที่สุด 10 อันดับแรกของปี 2022

DARPA ต้องการพัฒนายาเพื่อทำให้ผู้คนทนต่อความเย็นจัดได้

เทคโนโลยี Night Vision ใหม่ช่วยให้ AI มองเห็นในความมืดมิดได้ราวกับเป็นกลางวันแสกๆ

ตัวถอดรหัสกิจกรรมสมองนี้แปลความคิดเป็นข้อความโดยใช้การสแกนเท่านั้น

เรื่องราวเทคโนโลยีสุดเจ๋งประจำสัปดาห์นี้จากทั่วทั้งเว็บ (จนถึงวันที่ 9 ธันวาคม)

บริษัทนี้กำลังปลูกตับขนาดเล็กในตัวผู้คนเพื่อต่อสู้กับโรคตับ

การแก้ไขยีน CRISPR มีความก้าวหน้าตลอดปี และเพิ่งเริ่มต้นเท่านั้น

โรงงานดักจับคาร์บอนขนาดใหญ่ในไวโอมิงจะดึงคาร์บอนไดออกไซด์ 5 ล้านตันจากอากาศในแต่ละปี

แผงโซลาร์เซลล์ที่ลอยอยู่บนอ่างเก็บน้ำสามารถให้พลังงานไฟฟ้าได้หนึ่งในสามของโลก

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้