หุ่นยนต์ตัวนี้ทำนายว่าคุณจะยิ้มเมื่อใด จากนั้นยิ้มกลับไปตามคิว

หุ่นยนต์ตัวนี้ทำนายว่าคุณจะยิ้มเมื่อใด จากนั้นยิ้มกลับไปตามคิว

หุ่นยนต์ตัวนี้ทำนายว่าคุณจะยิ้มเมื่อใด จากนั้นยิ้มกลับไปทาง Cue PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

คลับแสดงตลกเป็นสถานที่ท่องเที่ยวสุดสัปดาห์ที่ฉันชอบ ชวนเพื่อนฝูง หยิบเครื่องดื่มสักแก้ว และเมื่อมีเรื่องตลกเกิดขึ้นสำหรับเราทุกคน ก็มีช่วงเวลาที่มหัศจรรย์เมื่อเราสบตากัน และเราก็แบ่งปันรอยยิ้มหน้าด้านกัน

การยิ้มสามารถเปลี่ยนคนแปลกหน้าให้กลายเป็นเพื่อนรักที่สุดได้ มันเดือย พบปะ-น่ารัก แผนการของฮอลลีวู้ด ซ่อมแซมความสัมพันธ์ที่แตกหัก และเชื่อมโยงกับความรู้สึกสนุกสนานอันคลุมเครือและอบอุ่นอย่างแยกไม่ออก

อย่างน้อยก็สำหรับคน สำหรับหุ่นยนต์ ความพยายามในการยิ้มอย่างจริงใจมักจะตกอยู่ในหุบเขาลึกลับ ซึ่งใกล้พอที่จะดูเหมือนมนุษย์ แต่ทำให้เกิดความไม่สบายใจ ตามหลักเหตุผลแล้ว คุณรู้ว่าพวกเขากำลังพยายามทำอะไร แต่ความรู้สึกสัญชาตญาณบอกคุณว่ามีบางอย่างไม่ถูกต้อง

อาจเป็นเพราะจังหวะเวลา หุ่นยนต์ได้รับการฝึกฝนให้เลียนแบบการแสดงออกทางสีหน้าของรอยยิ้ม แต่พวกเขาไม่รู้ว่าเมื่อไรควรยิ้ม เมื่อมนุษย์เชื่อมต่อกัน เราจะยิ้มไปด้วยกันอย่างแท้จริงโดยไม่ต้องวางแผนล่วงหน้า หุ่นยนต์ต้องใช้เวลาในการวิเคราะห์การแสดงออกทางสีหน้าของบุคคลเพื่อสร้างรอยยิ้ม สำหรับมนุษย์ ความล่าช้าแม้แต่เสี้ยววินาทีก็ทำให้ผมขึ้นที่หลังคอ เหมือนหนังสยองขวัญ มีบางอย่างที่ให้ความรู้สึกบิดเบือนและผิด

เมื่อสัปดาห์ที่แล้ว ทีมงานจากมหาวิทยาลัยโคลัมเบีย แสดงให้เห็นอัลกอริธึม ที่สอนให้หุ่นยนต์แบ่งปันรอยยิ้มให้กับผู้ปฏิบัติงานที่เป็นมนุษย์ AI วิเคราะห์การเปลี่ยนแปลงใบหน้าเล็กน้อยเพื่อคาดการณ์การแสดงออกของผู้ปฏิบัติงานประมาณ 800 มิลลิวินาทีก่อนที่จะเกิดขึ้น ซึ่งเป็นเวลาที่เพียงพอให้หุ่นยนต์ยิ้มกลับ

ทีมงานได้ฝึกใบหน้าหุ่นยนต์คล้ายมนุษย์ที่อ่อนนุ่มที่เรียกว่าอีโม เพื่อคาดการณ์และจับคู่สีหน้าของมนุษย์ ด้วยใบหน้าซิลิโคนที่แต้มสีฟ้า ทำให้อีโมดูเหมือนมนุษย์ต่างดาวในนิยายวิทยาศาสตร์ในยุค 60 แต่มันก็ยิ้มพร้อมกับคู่มนุษย์ที่มี "อารมณ์" แบบเดียวกัน

หุ่นยนต์ฮิวแมนนอยด์มักจะเทอะทะและจองหองเมื่อสื่อสารกับมนุษย์ เขียน ดร. Rachael Jack จากมหาวิทยาลัยกลาสโกว์ ซึ่งไม่ได้เกี่ยวข้องกับการศึกษาวิจัยนี้ ChatGPT และอัลกอริธึมภาษาขนาดใหญ่อื่นๆ สามารถทำให้คำพูดของ AI ฟังดูเป็นมนุษย์ได้แล้ว แต่การสื่อสารที่ไม่ใช้คำพูดนั้นยากที่จะทำซ้ำ

การเขียนโปรแกรมทักษะทางสังคม – อย่างน้อยสำหรับการแสดงออกทางสีหน้า – ลงในหุ่นยนต์ทางกายภาพเป็นก้าวแรกในการช่วยให้ “หุ่นยนต์สังคมเข้าร่วมโลกสังคมมนุษย์” เธอเขียน

ภายใต้ฮูด

จาก หุ่นยนต์ ไปยังเซิร์ฟเวอร์โรโบที่นำอาหารและเครื่องดื่มมาให้คุณ หุ่นยนต์อิสระ เข้ามาในชีวิตเรามากขึ้นเรื่อยๆ

ในลอนดอน นิวยอร์ก มิวนิก และโซล โดยเป็นอิสระ หุ่นยนต์ ลัดเลาะไปตามสนามบินที่วุ่นวายโดยให้ความช่วยเหลือลูกค้า เช่น เช็คอิน ค้นหาประตูขึ้นเครื่อง หรือเก็บสัมภาระที่สูญหาย ในสิงคโปร์ มีหุ่นยนต์สูง 360 ฟุตหลายตัวที่มีวิสัยทัศน์ XNUMX องศา เดินเตร่สนามบิน แจ้งปัญหาด้านความปลอดภัยที่อาจเกิดขึ้น ในช่วงที่เกิดโรคระบาด สุนัขหุ่นยนต์ บังคับใช้มาตรการเว้นระยะห่างทางสังคม

แต่หุ่นยนต์สามารถทำได้มากกว่านั้น สำหรับงานที่เป็นอันตราย เช่น การทำความสะอาดซากบ้านหรือสะพานที่ถูกทำลาย พวกเขาสามารถบุกเบิกความพยายามช่วยเหลือและเพิ่มความปลอดภัยให้กับผู้เผชิญเหตุคนแรก เนื่องจากประชากรโลกมีอายุมากขึ้น พวกเขาสามารถช่วยเหลือพยาบาลในการดูแลผู้สูงอายุได้

ปัจจุบัน หุ่นยนต์ฮิวแมนนอยด์ เป็นการ์ตูนที่น่ารัก แต่องค์ประกอบหลักสำหรับหุ่นยนต์ที่จะเข้าสู่โลกของเราคือความไว้วางใจ ในขณะที่นักวิทยาศาสตร์สร้างหุ่นยนต์ที่มีใบหน้าเหมือนมนุษย์มากขึ้น เราต้องการให้การแสดงออกของพวกมันตรงกับความคาดหวังของเรา มันไม่ใช่แค่การเลียนแบบการแสดงออกทางสีหน้าเท่านั้น การยิ้มอย่างจริงใจว่า “ใช่ ฉันรู้” เหนือเรื่องตลกที่น่าประจบประแจงจะก่อให้เกิดความผูกพัน

การสื่อสารที่ไม่ใช่คำพูด เช่น การแสดงออก ท่าทางมือ ท่าทางร่างกาย เป็นเครื่องมือที่เราใช้เพื่อแสดงตัวตนของเรา ด้วย ChatGPT และอื่นๆ AI กำเนิดเครื่องจักรสามารถ “สื่อสารทั้งทางวิดีโอและทางวาจา” ได้แล้ว กล่าวว่า ผู้เขียนการศึกษา ดร. ฮอด ลิปสัน ถึง วิทยาศาสตร์.

แต่เมื่อพูดถึงโลกแห่งความเป็นจริง การมอง การขยิบตา และรอยยิ้มสามารถสร้างความแตกต่างได้ มันคือ “ช่องทางที่ขาดหายไปในขณะนี้” ลิปสันกล่าว “การยิ้มผิดเวลาอาจส่งผลย้อนกลับได้ [แม้จะช้าไปสักสองสามมิลลิวินาที] รู้สึกเหมือนว่าคุณกำลังเดินเตร่อยู่”

พูดชีส

เพื่อให้หุ่นยนต์ดำเนินการโดยไม่ใช้คำพูด ทีมงานมุ่งเน้นไปที่ด้านหนึ่ง นั่นคือรอยยิ้มที่แบ่งปัน การศึกษาก่อนหน้านี้มีหุ่นยนต์ที่ตั้งโปรแกรมไว้ล่วงหน้าเพื่อเลียนแบบรอยยิ้ม แต่เนื่องจากไม่ได้เกิดขึ้นเอง จึงทำให้เกิดความล่าช้าเล็กน้อยแต่สังเกตได้ชัดเจน และทำให้รอยยิ้มดูปลอม

“มีหลายสิ่งหลายอย่างที่เกี่ยวข้องกับการสื่อสารโดยไม่ใช้คำพูด” ซึ่งยากจะระบุจำนวนได้ Lipson กล่าว “เหตุผลที่เราต้องพูดว่า 'ชีส' เวลาถ่ายรูปก็เพราะจริงๆ แล้วการยิ้มตามคำสั่งนั้นค่อนข้างยาก”

การศึกษาใหม่เน้นเรื่องจังหวะเวลา

ทีมงานได้ออกแบบอัลกอริธึมที่คาดการณ์รอยยิ้มของบุคคลและทำให้ใบหน้าที่เหมือนแอนิเมโทรนิกเหมือนมนุษย์ยิ้มไปพร้อมๆ กัน ใบหน้าหุ่นยนต์ที่เรียกว่า Emo มี 26 เกียร์ หรือที่เรียกว่ากล้ามเนื้อเทียม ห่อหุ้มด้วย "ผิวหนัง" ที่เป็นซิลิโคนที่ยืดได้ เกียร์แต่ละตัวจะติดอยู่กับ "โครงกระดูก" ของหุ่นยนต์หลักด้วยแม่เหล็กเพื่อขยับคิ้ว ตา ปาก และคอ ดวงตาของอีโมมีกล้องในตัวเพื่อบันทึกสภาพแวดล้อมและควบคุมการเคลื่อนไหวของลูกตาและการกะพริบตา

อีโมสามารถติดตามการแสดงออกทางสีหน้าของตัวเองได้ด้วยตัวเอง เป้าหมายของการศึกษาใหม่คือการช่วยตีความอารมณ์ของผู้อื่น ทีมงานใช้เคล็ดลับที่วัยรุ่นเก็บตัวอาจรู้: พวกเขาขอให้อีโมมองในกระจกเพื่อเรียนรู้วิธีควบคุมเกียร์และสร้างการแสดงออกทางสีหน้าที่สมบูรณ์แบบ เช่น รอยยิ้ม หุ่นยนต์ค่อยๆ เรียนรู้ที่จะจับคู่สีหน้ากับคำสั่งมอเตอร์ เช่น “ยกแก้ม” จากนั้นทีมงานได้ลบโปรแกรมใดๆ ที่อาจยืดใบหน้ามากเกินไปจนทำให้ผิวหนังซิลิคอนของหุ่นยนต์ได้รับบาดเจ็บ

“ปรากฎว่า…[การสร้าง] ใบหน้าหุ่นยนต์ที่สามารถยิ้มได้ถือเป็นความท้าทายอย่างเหลือเชื่อจากมุมมองทางกล มันยากกว่าการสร้างมือหุ่นยนต์” ลิปสันกล่าว “เราเก่งมากในการแยกแยะรอยยิ้มที่ไม่จริงใจ ดังนั้นเราจึงอ่อนไหวต่อสิ่งนั้นมาก”

เพื่อตอบโต้หุบเขาลึกลับ ทีมงานได้ฝึกอีโมให้คาดเดาการเคลื่อนไหวของใบหน้าโดยใช้วิดีโอที่มนุษย์หัวเราะ ประหลาดใจ ขมวดคิ้ว ร้องไห้ และแสดงสีหน้าอื่นๆ อารมณ์เป็นสิ่งสากล: เมื่อคุณยิ้ม มุมปากจะขดเป็นรูปพระจันทร์เสี้ยว เมื่อคุณร้องไห้ คิ้วจะขมวดเข้าหากัน

AI วิเคราะห์การเคลื่อนไหวใบหน้าของแต่ละฉากแบบเฟรมต่อเฟรม ด้วยการวัดระยะห่างระหว่างดวงตา ปาก และ "จุดสังเกตบนใบหน้า" อื่นๆ พบว่าสัญญาณปากโป้งที่สอดคล้องกับอารมณ์บางอย่าง ตัวอย่างเช่น การที่มุมปากของคุณยกขึ้นบ่งบอกถึงการยิ้ม ในขณะที่การเคลื่อนไหวลดลงอาจ ลงไปขมวดคิ้ว

เมื่อได้รับการฝึกฝนแล้ว AI จะใช้เวลาไม่ถึงหนึ่งวินาทีในการจดจำจุดสังเกตบนใบหน้าเหล่านี้ เมื่อเปิดใช้งาน Emo ใบหน้าหุ่นยนต์สามารถคาดหวังรอยยิ้มตามปฏิสัมพันธ์ของมนุษย์ภายในไม่กี่วินาที เพื่อที่จะยิ้มกับผู้เข้าร่วม

เพื่อให้ชัดเจน AI จะไม่ "รู้สึก" แต่มันจะมีพฤติกรรมเหมือนมนุษย์เวลาหัวเราะคิกคักเมื่อยืนขึ้นอย่างตลกขบขันพร้อมรอยยิ้มที่ดูจริงใจ

การแสดงออกทางสีหน้าไม่ใช่สัญญาณเดียวที่เราสังเกตเห็นเมื่อมีปฏิสัมพันธ์กับผู้คน การสั่นศีรษะเล็กน้อย พยักหน้า เลิกคิ้ว หรือทำท่าทางมือล้วนสร้างความแตกต่าง ไม่ว่าวัฒนธรรมจะเป็นเช่นไร “อืม” “อ่า” และ “ชอบ” หรือสิ่งที่คล้ายกัน จะถูกรวมเข้ากับปฏิสัมพันธ์ในชีวิตประจำวัน สำหรับตอนนี้ อีโมก็เหมือนกับเด็กทารกที่เรียนรู้ที่จะยิ้ม ยังไม่เข้าใจบริบทอื่นๆ

“ยังมีอีกมากที่ต้องไป” กล่าวว่า ลิปสัน. เราแค่เริ่มต้นการสื่อสารแบบไม่ใช้คำพูดสำหรับ AI แต่ “ถ้าคุณคิดว่าการมีส่วนร่วมกับ ChatGPT นั้นน่าสนใจ เพียงรอจนกว่าสิ่งเหล่านี้จะกลายเป็นเรื่องที่จับต้องได้ และการเดิมพันทั้งหมดก็จะสิ้นสุดลง”

เครดิตภาพ: Yuhang Hu วิศวกรรมโคลัมเบียผ่าน YouTube

ประทับเวลา:

เพิ่มเติมจาก Hub เอกพจน์