এই রোবটটি ভবিষ্যদ্বাণী করে যে আপনি কখন হাসবেন-তারপর কিউতে ফিরে হাসে

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

এই রোবট ভবিষ্যদ্বাণী করে যে আপনি কখন হাসবেন—তারপর ক্যু প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সে ডানদিকে ফিরে হাসে। উল্লম্ব অনুসন্ধান. আ.

কমেডি ক্লাব আমার প্রিয় সপ্তাহান্তে আউটিং হয়. কিছু বন্ধুদের সমাবেশ করুন, কিছু পানীয় পান করুন, এবং যখন একটি কৌতুক আমাদের সকলের জন্য অবতীর্ণ হয়—একটি যাদুকর মুহূর্ত আসে যখন আমাদের চোখ মিলিত হয়, এবং আমরা একটি হাসিখুশি হাসি শেয়ার করি।

হাসি অপরিচিতদের সবচেয়ে প্রিয় বন্ধুতে পরিণত করতে পারে। এটা spurs দেখা-সুন্দর হলিউডের প্লট, ভাঙা সম্পর্ক মেরামত করে এবং অস্পষ্ট, আনন্দের উষ্ণ অনুভূতির সাথে অঙ্গাঙ্গীভাবে জড়িত।

অন্তত মানুষের জন্য। রোবটদের জন্য, প্রকৃত হাসির জন্য তাদের প্রচেষ্টা প্রায়শই অদ্ভুত উপত্যকায় পড়ে—মানুষের মতো দেখতে যথেষ্ট কাছাকাছি, কিন্তু অস্বস্তির স্পর্শ ঘটায়। যৌক্তিকভাবে, আপনি জানেন তারা কি করার চেষ্টা করছে। কিন্তু অন্ত্রের অনুভূতি আপনাকে বলে যে কিছু সঠিক নয়।

এটা সময়ের কারণে হতে পারে। রোবটদের একটি হাসির মুখের অভিব্যক্তি অনুকরণ করতে প্রশিক্ষণ দেওয়া হয়। কিন্তু তারা জানে না কখন হাসতে হবে। যখন মানুষ সংযুক্ত হয়, তখন আমরা সত্যিকার অর্থে কোনো সচেতন পরিকল্পনা ছাড়াই টেন্ডেমে হাসি। রোবটরা হাসি পুনরুত্পাদন করতে একজন ব্যক্তির মুখের অভিব্যক্তি বিশ্লেষণ করতে সময় নেয়। একজন মানুষের কাছে, এমনকি মিলিসেকেন্ড বিলম্ব ঘাড়ের পিছনে চুল বাড়ায় - একটি হরর সিনেমার মতো, কিছু হেরফের এবং ভুল মনে হয়।

গত সপ্তাহে কলম্বিয়া বিশ্ববিদ্যালয়ের একটি দল ড একটি অ্যালগরিদম দেখান যা রোবটকে তাদের মানব অপারেটরদের সাথে হাসি ভাগাভাগি করতে শেখায়। AI তার অপারেটরদের অভিব্যক্তিগুলি হওয়ার আগে প্রায় 800 মিলিসেকেন্ডের পূর্বাভাস দেওয়ার জন্য সামান্য মুখের পরিবর্তনগুলি বিশ্লেষণ করে - রোবটটির হাসতে যথেষ্ট সময়।

দলটি ইমো নামক একটি নরম রোবোটিক হিউম্যানয়েড মুখকে প্রশিক্ষিত করেছে যাতে তার মানব সঙ্গীর অভিব্যক্তি অনুমান করা যায়। একটি সিলিকন মুখ নীল রঙে রঙ করা, ইমোকে 60-এর দশকের কল্পবিজ্ঞানের এলিয়েনের মতো দেখাচ্ছে৷ কিন্তু এটি তার মানব সঙ্গীর সাথে একই "আবেগজনক" তরঙ্গদৈর্ঘ্যের সাথে সহজেই হাসে।

মানুষের সাথে যোগাযোগ করার সময় হিউম্যানয়েড রোবটগুলি প্রায়শই চঞ্চল এবং স্তব্ধ হয়, লিখেছেন গ্লাসগো বিশ্ববিদ্যালয়ের ড. রাচেল জ্যাক, যিনি গবেষণায় জড়িত ছিলেন না। চ্যাটজিপিটি এবং অন্যান্য বৃহৎ ভাষার অ্যালগরিদমগুলি ইতিমধ্যেই একটি এআই-এর বক্তৃতাকে মানবিক করে তুলতে পারে, তবে অ-মৌখিক যোগাযোগগুলি প্রতিলিপি করা কঠিন।

সামাজিক দক্ষতা প্রোগ্রামিং - অন্তত মুখের অভিব্যক্তির জন্য - শারীরিক রোবটগুলিতে "সামাজিক রোবটকে মানব সামাজিক বিশ্বে যোগদান করতে সহায়তা করার প্রথম পদক্ষেপ," তিনি লিখেছেন।

হুড অধীনে

থেকে রোবোট্যাক্সিস রোবো-সার্ভারগুলিতে যা আপনাকে খাবার এবং পানীয় নিয়ে আসে, স্বায়ত্তশাসিত রোবট ক্রমশ আমাদের জীবনে প্রবেশ করছে।

লন্ডন, নিউইয়র্ক, মিউনিখ এবং সিউল, স্বায়ত্তশাসিত রোবট বিশৃঙ্খল বিমানবন্দরের মাধ্যমে জিপ করুন যা গ্রাহক সহায়তা প্রদান করে—চেক ইন করা, একটি গেট খুঁজে পাওয়া, বা হারানো লাগেজ পুনরুদ্ধার করা। সিঙ্গাপুরে, 360-ডিগ্রি দৃষ্টি সহ বেশ কয়েকটি সাত ফুট লম্বা রোবট একটি বিমানবন্দর ঘোরাঘুরি সম্ভাব্য নিরাপত্তা সমস্যা পতাকাঙ্কিত। মহামারী চলাকালীন, রোবট কুকুর সামাজিক দূরত্ব প্রয়োগ করা হয়েছে।

কিন্তু রোবট আরো কিছু করতে পারে। বিপজ্জনক কাজের জন্য - যেমন ধ্বংসপ্রাপ্ত বাড়ি বা সেতুর ধ্বংসাবশেষ পরিষ্কার করা - তারা উদ্ধার প্রচেষ্টা অগ্রগামী করতে পারে এবং প্রথম প্রতিক্রিয়াকারীদের জন্য নিরাপত্তা বাড়াতে পারে। ক্রমবর্ধমান বয়স্ক বিশ্ব জনসংখ্যার সাথে, তারা বয়স্কদের সমর্থন করতে নার্সদের সাহায্য করতে পারে।

বর্তমান হিউম্যানয়েড রোবট cartoonishly আরাধ্য হয়. কিন্তু আমাদের পৃথিবীতে রোবট প্রবেশের প্রধান উপাদান হল বিশ্বাস। যেহেতু বিজ্ঞানীরা ক্রমবর্ধমান মানুষের মতো মুখ দিয়ে রোবট তৈরি করছেন, আমরা চাই তাদের অভিব্যক্তি আমাদের প্রত্যাশার সাথে মেলে। এটি কেবল মুখের অভিব্যক্তি অনুকরণ করার বিষয়ে নয়। একটি খাঁটি ভাগ করা "হ্যাঁ আমি জানি" একটি ক্রুঞ্জ-যোগ্য কৌতুকের উপর হাসি একটি বন্ধন গঠন করে।

অ-মৌখিক যোগাযোগ—অভিব্যক্তি, হাতের অঙ্গভঙ্গি, শরীরের ভঙ্গি—আমরা নিজেদেরকে প্রকাশ করার জন্য ব্যবহার করি। ChatGPT এবং অন্যান্য সহ জেনারেটিভ এআই, মেশিনগুলি ইতিমধ্যেই "ভিডিওতে এবং মৌখিকভাবে যোগাযোগ করতে পারে," বলেছেন গবেষণা লেখক ড. হড লিপসন থেকে বিজ্ঞান.

কিন্তু যখন বাস্তব জগতের কথা আসে-যেখানে এক নজর, এক পলক এবং হাসি সব পার্থক্য করতে পারে-এটি হল "একটি চ্যানেল যা এই মুহূর্তে অনুপস্থিত," বলেছেন লিপসন৷ "ভুল সময়ে হাসি পাল্টাপাল্টি হতে পারে। [যদি এমনকি কয়েক মিলিসেকেন্ড খুব দেরি হয়], মনে হয় আপনি হয়তো প্যান্ডারিং করছেন।"

বল পনির

রোবটকে অ-মৌখিক অ্যাকশনে আনার জন্য, দলটি একটি দিকে মনোনিবেশ করেছে—একটি ভাগ করা হাসি। পূর্ববর্তী গবেষণায় একটি হাসি অনুকরণ করার জন্য প্রি-প্রোগ্রাম করা রোবট রয়েছে। কিন্তু যেহেতু তারা স্বতঃস্ফূর্ত নয়, এটি একটি সামান্য কিন্তু লক্ষণীয় বিলম্ব ঘটায় এবং হাসিকে জাল দেখায়।

লিপসন বলেন, "অমৌখিক যোগাযোগের মধ্যে অনেক কিছু আছে" যা পরিমাপ করা কঠিন। "ছবি তোলার সময় আমাদের 'পনির' বলার কারণ হল কারণ চাহিদা অনুযায়ী হাসি আসলে বেশ কঠিন।"

নতুন গবেষণা সময় উপর দৃষ্টি নিবদ্ধ করে.

দলটি এমন একটি অ্যালগরিদম তৈরি করেছে যা একজন ব্যক্তির হাসির পূর্বাভাস দেয় এবং মানুষের মতো অ্যানিমেট্রনিক মুখের হাসির মতো করে তোলে৷ ইমো বলা হয়, রোবোটিক ফেসটিতে 26টি গিয়ার রয়েছে—চিন্তা করুন কৃত্রিম পেশী—একটি প্রসারিত সিলিকন "ত্বক" এ আবৃত। প্রতিটি গিয়ার প্রধান রোবোটিক "কঙ্কাল" এর সাথে ভ্রু, চোখ, মুখ এবং ঘাড় সরানোর জন্য চুম্বক সহ সংযুক্ত থাকে। ইমোর চোখে বিল্ট-ইন ক্যামেরা রয়েছে যাতে এর পরিবেশ রেকর্ড করা যায় এবং চোখের বলের নড়াচড়া এবং ব্লিঙ্কিং গতি নিয়ন্ত্রণ করা যায়।

নিজেই, ইমো তার নিজের মুখের অভিব্যক্তি ট্র্যাক করতে পারে। নতুন গবেষণার লক্ষ্য ছিল এটি অন্যদের আবেগ ব্যাখ্যা করতে সাহায্য করা। দলটি এমন একটি কৌশল ব্যবহার করেছে যা যে কোনও অন্তর্মুখী কিশোর-কিশোরীর জানা থাকতে পারে: তারা ইমোকে আয়নার দিকে তাকাতে বলেছিল কীভাবে এর গিয়ারগুলি নিয়ন্ত্রণ করতে হয় এবং হাসির মতো একটি নিখুঁত মুখের অভিব্যক্তি তৈরি করতে হয়। রোবটটি ধীরে ধীরে মোটর কমান্ডের সাথে তার অভিব্যক্তি মেলাতে শিখেছে—বলুন, "গাল তুলুন।" দলটি তখন এমন কোনও প্রোগ্রামিং সরিয়ে দেয় যা সম্ভাব্যভাবে মুখকে খুব বেশি প্রসারিত করতে পারে, রোবটের সিলিকন ত্বকে আঘাত করতে পারে।

“আউট হয়ে গেছে...[বানান] একটি রোবট মুখ যা হাসতে পারে যা যান্ত্রিক দৃষ্টিকোণ থেকে অবিশ্বাস্যভাবে চ্যালেঞ্জিং ছিল। এটি একটি রোবোটিক হাত তৈরির চেয়ে কঠিন,” লিপসন বলেছিলেন। “আমরা অপ্রমাণিত হাসি দেখতে খুব ভালো। তাই আমরা এর প্রতি খুবই সংবেদনশীল।”

অস্বাভাবিক উপত্যকাকে প্রতিহত করার জন্য, দলটি মানুষের হাসি, অবাক, ভ্রুকুটি, কান্না এবং অন্যান্য অভিব্যক্তি তৈরির ভিডিও ব্যবহার করে মুখের গতিবিধি ভবিষ্যদ্বাণী করার জন্য ইমোকে প্রশিক্ষণ দিয়েছে। আবেগ সর্বজনীন: আপনি যখন হাসেন, তখন আপনার মুখের কোণগুলি একটি অর্ধচন্দ্রের মতো কুঁকড়ে যায়। আপনি যখন কাঁদেন, তখন ভ্রু একত্রিত হয়।

এআই প্রতিটি দৃশ্যের ফ্রেম-বাই-ফ্রেমের মুখের গতিবিধি বিশ্লেষণ করেছে। চোখ, মুখ এবং অন্যান্য "মুখের ল্যান্ডমার্ক" এর মধ্যে দূরত্ব পরিমাপ করে, এটি একটি নির্দিষ্ট আবেগের সাথে মিলিত বলে আলামত চিহ্নগুলি খুঁজে পেয়েছে-উদাহরণস্বরূপ, আপনার মুখের কোণে একটি ঊর্ধ্বমুখী হাসির ইঙ্গিত দেয়, যেখানে একটি নিম্নগামী গতি হতে পারে একটি ভ্রুকুটি মধ্যে নামা

একবার প্রশিক্ষিত হলে, AI এই মুখের ল্যান্ডমার্কগুলি চিনতে এক সেকেন্ডেরও কম সময় নেয়। ইমো পাওয়ার সময়, রোবট মুখটি এক সেকেন্ডের মধ্যে মানুষের মিথস্ক্রিয়াগুলির উপর ভিত্তি করে একটি হাসি অনুমান করতে পারে, যাতে এটি তার অংশগ্রহণকারীর সাথে হাসতে পারে।

স্পষ্ট করে বলতে গেলে, AI "অনুভূতি" করে না। বরং, এটি একজন মানুষের মতো আচরণ করে যখন একটি সত্যিকারের-আদর্শিত হাসির সাথে একটি মজার স্ট্যান্ড-আপে হাঁসি।

মানুষের সাথে মিথস্ক্রিয়া করার সময় আমরা শুধুমাত্র মুখের অভিব্যক্তিই লক্ষ্য করি না। সূক্ষ্ম মাথা নাড়ানো, মাথা নাড়ানো, ভ্রু তোলা বা হাতের অঙ্গভঙ্গি সবই একটি চিহ্ন তৈরি করে। সংস্কৃতি নির্বিশেষে, "ums," "ahhs," এবং "পছন্দ"—বা তাদের সমতুল্য—প্রতিদিনের মিথস্ক্রিয়ায় একত্রিত হয়। আপাতত, ইমো একটি শিশুর মতো যে হাসতে শিখেছে। এটি এখনও অন্যান্য প্রসঙ্গ বুঝতে পারে না।

"আরও অনেক কিছু যেতে হবে," বলেছেন লিপসন। আমরা শুধু এআই-এর জন্য অ-মৌখিক যোগাযোগের পৃষ্ঠকে স্ক্র্যাচ করছি। কিন্তু "আপনি যদি ChatGPT-এর সাথে জড়িত হওয়া আকর্ষণীয় মনে করেন, তবে এই জিনিসগুলি শারীরিক হয়ে ওঠা পর্যন্ত অপেক্ষা করুন এবং সমস্ত বাজি বন্ধ হয়ে যায়।"

চিত্র ক্রেডিট: ইউহাং হু, ইউটিউবের মাধ্যমে কলম্বিয়া ইঞ্জিনিয়ারিং