มือหุ่นยนต์สามารถจับคู่ความชำนาญของมนุษย์กับ AI Smarts ใหม่ได้อ้างว่า Nvidia – ถอดรหัส

มือหุ่นยนต์สามารถจับคู่ความชำนาญของมนุษย์กับ AI Smarts ใหม่ได้อ้างว่า Nvidia – ถอดรหัส

มือหุ่นยนต์สามารถจับคู่ความชำนาญของมนุษย์กับ AI Smarts ใหม่ได้อ้างว่า Nvidia - ถอดรหัสข้อมูลอัจฉริยะของ PlatoBlockchain ค้นหาแนวตั้ง AI.

นักวิจัยของ Nvidia ประสบความสำเร็จอย่างก้าวกระโดดในด้านความชำนาญของหุ่นยนต์ ยูเรซึ่งเป็นตัวแทน AI ที่ถูกกล่าวหาว่าสามารถสอนทักษะที่ซับซ้อนให้กับบอท เช่น เทคนิคการหมุนปากกาได้อย่างคล่องแคล่วเช่นเดียวกับมนุษย์

เทคนิคใหม่นี้ ซึ่งสรุปไว้ในบทความที่เผยแพร่เมื่อวันพฤหัสบดี เป็นการต่อยอดจากความก้าวหน้าล่าสุดในโมเดลภาษาขนาดใหญ่ เช่น GPT-4 . ของ OpenAI. Eureka ใช้ประโยชน์จาก Generative AI เพื่อเขียนอัลกอริธึมการให้รางวัลที่ซับซ้อนโดยอัตโนมัติ ซึ่งช่วยให้หุ่นยนต์สามารถเรียนรู้ผ่านการเรียนรู้แบบเสริมกำลังแบบลองผิดลองถูก แนวทางนี้ได้พิสูจน์แล้วว่ามีประสิทธิภาพมากกว่าโปรแกรมที่เขียนโดยมนุษย์มากกว่า 50%

“ยูเรก้ายังได้สอนมือสี่ส่วนและคล่องแคล่ว แขนโคบอท และหุ่นยนต์อื่นๆ เพื่อเปิดลิ้นชัก ใช้กรรไกร จับลูกบอล และงานต่างๆ เกือบ 30 งาน” โพสต์ในบล็อกอย่างเป็นทางการของ Nvidia กล่าว 

Eureka เป็นการสาธิตล่าสุดของผลงานบุกเบิกของ Nvidia ในการควบคุม AI ด้วยโมเดลภาษา ล่าสุดบริษัทได้เปิดแหล่งที่มา คัดท้ายLM—วิธีการจัดผู้ช่วย AI ให้มีประโยชน์มากขึ้นโดยการฝึกอบรมพวกเขาเกี่ยวกับการตอบสนองของมนุษย์

เช่นเดียวกับ Eureka SteerLM ยังใช้ความก้าวหน้าในโมเดลภาษา แต่มุ่งเน้นไปที่ความท้าทายที่แตกต่าง นั่นคือการปรับปรุงการจัดตำแหน่งของผู้ช่วย AI SteerLM ฝึกผู้ช่วยโดยให้พวกเขาฝึกการสนทนา เหมือนหุ่นยนต์เรียนรู้จากการกระทำ ระบบจะให้คำติชมเกี่ยวกับคำตอบของผู้ช่วยผ่านคุณลักษณะต่างๆ เช่น ความช่วยเหลือ อารมณ์ขัน และคุณภาพ

ตัวอย่างเช่น มันเหมือนกับหุ่นยนต์เรียนรู้ที่จะเต้นจากวิดีโอที่มีป้ายกำกับว่าดีหรือไม่ดี แทนที่จะให้มนุษย์ตรวจสอบการเต้นรำแบบสุ่มหลายพันครั้งแล้วเลือกว่าอันไหนดีหรือไม่ (ซึ่งเป็นวิธีปกติของคุณ AI แชทบอท ได้รับการฝึกอบรม) ด้วยการฝึกฝนและรับข้อเสนอแนะซ้ำๆ ผู้ช่วยจะเรียนรู้ที่จะให้การตอบสนองที่เหมาะกับความต้องการของผู้ใช้ สิ่งนี้ช่วยให้ AI มีประโยชน์มากขึ้นสำหรับการใช้งานในโลกแห่งความเป็นจริง

หัวข้อทั่วไปคือการใช้โครงข่ายประสาทเทียมขั้นสูงในรูปแบบใหม่ที่สร้างสรรค์ ไม่ว่าจะเป็นการสอนหุ่นยนต์หรือแชทบอท Nvidia กำลังขยายขอบเขตทั้งด้านฮาร์ดแวร์และซอฟต์แวร์

สำหรับยูเรก้า สิ่งสำคัญคือการรวมเทคโนโลยีการจำลองแบบต่างๆ เข้าด้วยกัน ไอแซค ยิม ด้วยความสามารถในการจดจำรูปแบบของแบบจำลองภาษา ยูเรก้า "เรียนรู้ที่จะเรียนรู้" อย่างมีประสิทธิภาพ โดยปรับอัลกอริธึมการให้รางวัลของตัวเองให้เหมาะสมผ่านการฝึกหลายครั้ง มันยังยอมรับข้อมูลจากมนุษย์เพื่อปรับแต่งรางวัลอีกด้วย

จนถึงขณะนี้ วิธีการพัฒนาตนเองนี้ได้รับการพิสูจน์แล้วว่าสามารถนำไปใช้ได้ทั่วไปในการฝึกหุ่นยนต์ทุกประเภท ไม่ว่าจะเป็นมือที่มีขา มีล้อ มีล้อ บินได้ และคล่องแคล่ว

Eureka และ SteerLM ของ Nvidia ไม่เพียงแต่ทำลายอุปสรรคเท่านั้น แต่ยังสอนหุ่นยนต์และ AI ถึงศิลปะแห่งการโต้ตอบที่เฉียบแหลมและชาญฉลาด ทุกครั้งที่หมุนปากกาและพูดคุยอย่างมีไหวพริบ พวกเขากำลังวาดภาพอนาคตที่ AI ไม่เพียงเลียนแบบเท่านั้น แต่ยังสร้างสรรค์สิ่งใหม่ๆ เคียงข้างเราอีกด้วย

ติดตามข่าวสาร crypto รับการอัปเดตทุกวันในกล่องจดหมายของคุณ

ประทับเวลา:

เพิ่มเติมจาก ถอดรหัส