এই ডিপমাইন্ড এআই দ্রুত মানুষ দেখে নতুন দক্ষতা শিখে

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

এই ডিপমাইন্ড এআই দ্রুত মানুষের প্ল্যাটোব্লকচেন ডেটা বুদ্ধিমত্তা দেখে নতুন দক্ষতা শিখে। উল্লম্ব অনুসন্ধান. আ.

মানুষের অনুকরণ করার জন্য অ্যালগরিদম শেখানোর জন্য সাধারণত শত শত বা হাজার হাজার উদাহরণের প্রয়োজন হয়। কিন্তু গুগল ডিপমাইন্ডের একটি নতুন এআই উড়তে থাকা মানব প্রদর্শকদের কাছ থেকে নতুন দক্ষতা নিতে পারে।

মানবতার সবচেয়ে বড় কৌশলগুলির মধ্যে একটি হল আমাদের একে অপরের কাছ থেকে দ্রুত এবং দক্ষতার সাথে জ্ঞান অর্জন করার ক্ষমতা। এই ধরনের সামাজিক শিক্ষা, যাকে প্রায়ই সাংস্কৃতিক ট্রান্সমিশন বলা হয়, যা আমাদের সহকর্মীকে দেখাতে দেয় যে কীভাবে একটি নতুন টুল ব্যবহার করতে হয় বা আমাদের বাচ্চাদের নার্সারি রাইম শেখাতে হয়।

এতে অবাক হওয়ার কিছু নেই যে গবেষকরা মেশিনে প্রক্রিয়াটি প্রতিলিপি করার চেষ্টা করেছেন। অনুকরণ শিক্ষা, যেখানে AI একজন মানুষকে একটি কাজ সম্পূর্ণ করতে দেখে এবং তারপর তাদের আচরণ অনুকরণ করার চেষ্টা করে, রোবটদের প্রশিক্ষণের জন্য দীর্ঘদিন ধরে জনপ্রিয় পদ্ধতি। কিন্তু এমনকি আজকের সবচেয়ে উন্নত ডিপ লার্নিং অ্যালগরিদমগুলিকে তাদের প্রশিক্ষকদের সফলভাবে অনুলিপি করার আগে সাধারণত অনেক উদাহরণ দেখতে হবে।

মানুষ যখন অনুকরণের মাধ্যমে শেখে, তখন তারা প্রায়শই কিছু কিছু প্রদর্শনের পরে নতুন কাজ নিতে পারে। এখন, Google DeepMind গবেষকরা AI-তে দ্রুত সামাজিক শিক্ষার দিকে একটি পদক্ষেপ নিয়েছেন এমন এজেন্টদের সাথে যারা বাস্তব সময়ে মানুষের কাছ থেকে একটি ভার্চুয়াল বিশ্ব নেভিগেট করতে শেখে।

"আমাদের এজেন্টরা কোনো প্রাক-সংগৃহীত মানুষের তথ্য ব্যবহার না করেই উপন্যাসের প্রেক্ষাপটে একজন মানুষের বাস্তব-সময়ের অনুকরণে সফল হয়," গবেষকরা লিখেছেন কাগজ প্রকৃতি যোগাযোগ. "আমরা সাংস্কৃতিক ট্রান্সমিশন তৈরির জন্য যথেষ্ট উপাদানগুলির একটি আশ্চর্যজনকভাবে সহজ সেট সনাক্ত করি।"

গবেষকরা তাদের এজেন্টদেরকে GoalCycle3D নামে একটি বিশেষভাবে ডিজাইন করা সিমুলেটরে প্রশিক্ষণ দিয়েছেন। সিমুলেটরটি কীভাবে সিমুলেশন পরিচালনা করা উচিত এবং এর কোন দিকগুলি পরিবর্তিত হওয়া উচিত সে সম্পর্কে নিয়মের উপর ভিত্তি করে প্রায় অন্তহীন সংখ্যক বিভিন্ন পরিবেশ তৈরি করতে একটি অ্যালগরিদম ব্যবহার করে।

প্রতিটি পরিবেশে, ছোট ব্লব মত এআই এজেন্ট একটি নির্দিষ্ট ক্রমে রঙিন গোলকের একটি সিরিজের মধ্য দিয়ে যেতে অসম ভূখণ্ড এবং বিভিন্ন বাধা নেভিগেট করতে হবে। ভূখণ্ডের আড়ষ্টতা, বাধার ঘনত্ব এবং গোলকের কনফিগারেশন পরিবেশের মধ্যে পরিবর্তিত হয়।

এজেন্টদের ব্যবহার করে নেভিগেট করার প্রশিক্ষণ দেওয়া হয় শক্তিবৃদ্ধি শেখার. তারা সঠিক ক্রমে গোলকের মধ্য দিয়ে যাওয়ার জন্য একটি পুরষ্কার অর্জন করে এবং অনেক পরীক্ষায় তাদের কর্মক্ষমতা উন্নত করতে এই সংকেতটি ব্যবহার করে। কিন্তু উপরন্তু, পরিবেশে একজন বিশেষজ্ঞ এজেন্টও রয়েছে-যা হয় হার্ড-কোডেড বা একজন মানুষের দ্বারা নিয়ন্ত্রিত-যা ইতিমধ্যেই কোর্সের মাধ্যমে সঠিক পথ জানে।

অনেক প্রশিক্ষণ চলাকালীন, এআই এজেন্টরা পরিবেশ কীভাবে কাজ করে তার মৌলিক বিষয়গুলিই শিখে না, বরং প্রতিটি সমস্যা সমাধানের দ্রুততম উপায় হল বিশেষজ্ঞের অনুকরণ করা। এজেন্টরা কেবলমাত্র কোর্সগুলি মুখস্থ করার পরিবর্তে অনুকরণ করতে শিখছে তা নিশ্চিত করার জন্য, দলটি তাদের এক সেট পরিবেশে প্রশিক্ষণ দেয় এবং তারপরে অন্যটিতে পরীক্ষা করে। অত্যন্ত গুরুত্বপূর্ণভাবে, প্রশিক্ষণের পরে, দলটি দেখিয়েছে যে তাদের এজেন্টরা একজন বিশেষজ্ঞকে অনুকরণ করতে পারে এবং বিশেষজ্ঞ ছাড়াও পথ অনুসরণ করতে পারে।

এর জন্য স্ট্যান্ডার্ড রিইনফোর্সমেন্ট লার্নিং পন্থাগুলির জন্য কয়েকটি পরিবর্তনের প্রয়োজন।

গবেষকরা অ্যালগরিদমটিকে বিশেষজ্ঞের উপর ফোকাস করে এটি অন্য এজেন্টের অবস্থানের পূর্বাভাস দিয়ে। তারা এটিকে একটি মেমরি মডিউলও দিয়েছে। প্রশিক্ষণের সময়, বিশেষজ্ঞ পরিবেশের মধ্যে এবং বাইরে চলে যাবেন, এজেন্টকে তার ক্রিয়াগুলি মুখস্থ করতে বাধ্য করবে যখন এটি আর উপস্থিত থাকবে না। এআই পরিবেশের একটি বিস্তৃত সেটেও প্রশিক্ষণ দিয়েছে, যা নিশ্চিত করেছে যে এটি সম্ভাব্য কাজগুলির একটি বিস্তৃত পরিসর দেখেছে।

যদিও আরও ব্যবহারিক ডোমেনে পদ্ধতির অনুবাদ করা কঠিন হতে পারে। একটি মূল সীমাবদ্ধতা হল যে গবেষকরা যখন পরীক্ষা করেছিলেন যে AI মানুষের প্রদর্শন থেকে শিখতে পারে, তখন সমস্ত প্রশিক্ষণ চলাকালীন বিশেষজ্ঞ এজেন্ট একজন ব্যক্তির দ্বারা নিয়ন্ত্রিত হয়েছিল। এটি এজেন্টরা বিভিন্ন লোকের কাছ থেকে শিখতে পারে কিনা তা জানা কঠিন করে তোলে।

আরও চাপের সাথে, প্রশিক্ষণের পরিবেশকে এলোমেলোভাবে পরিবর্তন করার ক্ষমতা বাস্তব জগতে পুনরায় তৈরি করা কঠিন হবে। এবং অন্তর্নিহিত কাজটি সহজ ছিল, কোন সূক্ষ্ম মোটর নিয়ন্ত্রণের প্রয়োজন নেই এবং অত্যন্ত নিয়ন্ত্রিত ভার্চুয়াল পরিবেশে ঘটছে।

তবুও, AI-তে সামাজিক শিক্ষার অগ্রগতি স্বাগত। যদি আমরা বুদ্ধিমান মেশিনের সাথে একটি বিশ্বে বাস করতে চাই, তাহলে তাদের সাথে আমাদের অভিজ্ঞতা এবং দক্ষতা ভাগ করে নেওয়ার জন্য দক্ষ এবং স্বজ্ঞাত উপায় খুঁজে পাওয়া গুরুত্বপূর্ণ হবে।

চিত্র ক্রেডিট: জুলিয়ানা ই মারিয়ানা আমোরিম / Unsplash

এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
PlatoData.Network উল্লম্ব জেনারেটিভ Ai. নিজেকে ক্ষমতায়িত করুন। এখানে প্রবেশ করুন.
প্লেটোএআইস্ট্রিম। Web3 ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
প্লেটোইএসজি। কার্বন, ক্লিনটেক, শক্তি, পরিবেশ সৌর, বর্জ্য ব্যবস্থাপনা. এখানে প্রবেশ করুন.
প্লেটো হেলথ। বায়োটেক এবং ক্লিনিক্যাল ট্রায়াল ইন্টেলিজেন্স। এখানে প্রবেশ করুন.
উত্স: https://singularityhub.com/2023/12/01/this-deepmind-ai-rapidly-learns-new-skills-just-by-watching-humans/

সময় স্ট্যাম্প: ডিসেম্বর 1, 2023

সময় স্ট্যাম্প: ফেব্রুয়ারী 24, 2024

প্লেটো দ্বারা প্রকাশিত

ওয়েব থেকে এই সপ্তাহের দুর্দান্ত প্রযুক্তির গল্প (11 নভেম্বর পর্যন্ত)

এমআইটি গবেষকরা জৈবিকের চেয়ে 10,000 গুণ দ্রুত কৃত্রিম সিন্যাপ্স তৈরি করেন

ওয়েব থেকে এই সপ্তাহের দুর্দান্ত প্রযুক্তির গল্প (27 জানুয়ারী পর্যন্ত)

লোসাল উলি ম্যামথকে পুনরুজ্জীবিত করার অনুসন্ধানে প্রথমবারের মতো হাতির স্টেম সেল তৈরি করে

এই ট্রান্সফরমার-এর মতো রোবট রোল, উড়তে, দাঁড়াতে, হাঁটতে এবং আরও অনেক কিছু করতে পারে

ওয়েব থেকে এই সপ্তাহের দুর্দান্ত প্রযুক্তির গল্প (ফেব্রুয়ারি 11 পর্যন্ত)

ওয়েব থেকে এই সপ্তাহের দুর্দান্ত প্রযুক্তির গল্প (ফেব্রুয়ারি 24 পর্যন্ত)

আমাদের সম্পর্কে

উল্লম্ব অনুসন্ধান এবং আই

প্ল্যাটফর্ম

যোগাযোগ রেখো

হিসাব