การเรียนรู้แบบ Active Grasp แบบหลายนิ้ว

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

นี่คือการทบทวนบทความวิชาการปี 2020 เกี่ยวกับการใช้ระบบการเรียนรู้เพื่อฝึกแขนและมือของหุ่นยนต์ให้จับวัตถุ

แนวทางการเรียนรู้ที่เน้นการวางแผนอย่างเข้าใจเป็นที่ต้องการมากกว่าวิธีการวิเคราะห์เนื่องจากความสามารถในการทำความเข้าใจกับวัตถุใหม่ที่สังเกตได้บางส่วนได้ดีขึ้น อย่างไรก็ตาม การรวบรวมข้อมูลยังคงเป็นปัญหาคอขวดที่ใหญ่ที่สุดประการหนึ่งสำหรับวิธีการเรียนรู้แบบเข้าใจ โดยเฉพาะอย่างยิ่งสำหรับมือหลายนิ้ว พื้นที่การกำหนดค่ามิติที่ค่อนข้างสูงของมือประกอบกับความหลากหลายของวัตถุทั่วไปในชีวิตประจำวันต้องการตัวอย่างจำนวนมากเพื่อสร้างตัวแยกประเภทความสำเร็จที่แข็งแกร่งและมั่นใจ ในบทความนี้ นักวิจัยได้นำเสนอแนวทางการเรียนรู้เชิงลึกเชิงรุกแบบเชิงรุกเป็นครั้งแรกในการจับที่ค้นหาพื้นที่การกำหนดค่าของการจับและความเชื่อมั่นของลักษณนามในลักษณะที่เป็นเอกภาพ นักวิจัยยึดแนวทางของพวกเขาจากความสำเร็จล่าสุดในการวางแผนการหยิบจับแบบหลายนิ้วเป็นการอนุมานเชิงความน่าจะเป็นด้วยฟังก์ชันความน่าจะเป็นของโครงข่ายประสาทเทียมที่เรียนรู้ พวกเขาฝังสิ่งนี้ไว้ในสูตรการเลือกตัวอย่างของกลุ่มโจรหลายอาวุธ พวกเขาแสดงให้เห็นว่าวิธีการเรียนรู้แบบเข้าใจเชิงรุกของพวกเขาใช้ตัวอย่างการฝึกอบรมน้อยลงเพื่อสร้างอัตราความสำเร็จในการเข้าใจที่เทียบได้กับวิธีการเรียนรู้แบบมีผู้ดูแลแบบพาสซีฟซึ่งได้รับการฝึกฝนด้วยข้อมูลแบบเข้าใจที่สร้างโดยนักวางแผนเชิงวิเคราะห์ ในปี 2020 นักวิจัยยังแสดงให้เห็นว่าการจับที่เกิดจากผู้เรียนที่กระตือรือร้นนั้นมีความหลากหลายในเชิงคุณภาพและเชิงปริมาณมากกว่า

Arxiv – การเรียนรู้แบบ Active Grasp แบบหลายนิ้ว

การวางแผนการเข้าใจโดยใช้การเรียนรู้ได้รับความนิยมในช่วงทศวรรษที่ผ่านมา เนื่องจากความสามารถในการสรุปภาพรวมของวัตถุแปลกใหม่ด้วยข้อมูลวัตถุมุมมองเพียงบางส่วนเท่านั้น วิธีการเหล่านี้ต้องการข้อมูลจำนวนมากสำหรับการฝึกอบรม โดยเฉพาะอย่างยิ่งวิธีการที่ใช้โครงข่ายประสาทเทียมเชิงลึก อย่างไรก็ตาม การรวบรวมข้อมูลขนาดใหญ่ยังคงเป็นความท้าทายสำหรับการหยิบจับหลายนิ้ว เนื่องจาก (1)
วัตถุทั่วไปในชีวิตประจำวันมีการเปลี่ยนแปลงมากในแง่ของรูปทรงเรขาคณิต พื้นผิว คุณสมบัติเฉื่อย และรูปลักษณ์; และ
(2) มิติที่ค่อนข้างสูงของการกำหนดค่าแบบ multi-fingered grasp (เช่น 22 มิติสำหรับการกำหนดค่าของ
มือและข้อมือในบทความนี้)

วิธีการเรียนรู้แบบแอคทีฟที่ใหม่กว่า เรียนรู้แบบโต้ตอบแบบเข้าใจที่ครอบคลุมพื้นที่การกำหนดค่าแบบเข้าใจข้ามวัตถุต่างๆ ได้ดีขึ้นโดยใช้ตัวอย่างน้อยลงเมื่อเทียบกับผู้เรียนแบบเข้าใจแบบพาสซีฟภายใต้การดูแล แทนที่จะกระตุ้นสมมติฐานอย่างเฉยเมยเพื่ออธิบายข้อมูลการฝึกอบรมที่มีอยู่เช่นเดียวกับการเรียนรู้ภายใต้การดูแลมาตรฐาน การเรียนรู้แบบแอคทีฟจะพัฒนาและทดสอบสมมติฐานใหม่อย่างต่อเนื่องและมีการโต้ตอบ

การเรียนรู้แบบแอคทีฟจะเหมาะสมที่สุดเมื่อ 1) ตัวอย่างข้อมูลที่ไม่มีป้ายกำกับมีจำนวนมาก 2) จำเป็นต้องมีข้อมูลที่มีป้ายกำกับจำนวนมากเพื่อฝึกระบบการเรียนรู้แบบมีผู้สอนที่ถูกต้อง และ 3) สามารถรวบรวมหรือสังเคราะห์ตัวอย่างข้อมูลได้ง่าย การเรียนรู้ของ Grasp เป็นไปตามเงื่อนไขเหล่านี้: 1) มี Grasp ที่เป็นไปได้มากมายไม่จำกัด 2) จำเป็นต้องมีตัวอย่างการฝึกจับฉลากจำนวนมากเพื่อให้ครอบคลุมพื้นที่ และ 3) หุ่นยนต์เป็นออราเคิลของตัวเอง—มันสามารถลองจับและตรวจจับความสำเร็จหรือความล้มเหลวโดยอัตโนมัติโดยไม่ต้องติดฉลากโดยมนุษย์

Tesla มีการติดฉลากอัตโนมัติของวัตถุในโลกทางกายภาพแล้ว

Brian Wang เป็นผู้นำทางความคิดแห่งอนาคตและบล็อกเกอร์วิทยาศาสตร์ยอดนิยมที่มีผู้อ่าน 1 ล้านคนต่อเดือน บล็อก Nextbigfuture.com ของเขาอยู่ในอันดับที่ 1 บล็อกข่าววิทยาศาสตร์ ครอบคลุมเทคโนโลยีและแนวโน้มที่ก่อกวนมากมาย เช่น อวกาศ วิทยาการหุ่นยนต์ ปัญญาประดิษฐ์ การแพทย์ เทคโนโลยีชีวภาพต่อต้านวัย และนาโนเทคโนโลยี

เขาเป็นที่รู้จักในด้านการระบุเทคโนโลยีล้ำสมัย ปัจจุบันเขาเป็นผู้ร่วมก่อตั้งบริษัทสตาร์ทอัพและผู้ระดมทุนสำหรับบริษัทระยะเริ่มต้นที่มีศักยภาพสูง เขาเป็นหัวหน้าฝ่ายวิจัยเพื่อการจัดสรรสำหรับการลงทุนด้านเทคโนโลยีระดับลึกและเป็น Angel Investor ที่ Space Angels

เขาเป็นวิทยากรประจำในองค์กร เขาเป็นวิทยากร TEDx เป็นวิทยากรของ Singularity University และเป็นแขกรับเชิญในการสัมภาษณ์หลายครั้งทางวิทยุและพอดแคสต์ เขาเปิดให้พูดในที่สาธารณะและให้คำปรึกษา

ประทับเวลา: September 6, 2022September 7, 2022