স্ব-শিক্ষিত AI কীভাবে মস্তিষ্ক কাজ করে প্লাটোব্লকচেন ডেটা বুদ্ধিমত্তার সাথে মিল দেখায়। উল্লম্ব অনুসন্ধান. আ.

স্ব-শিক্ষিত এআই মস্তিষ্ক কীভাবে কাজ করে তার সাথে মিল দেখায়

এখন এক দশক ধরে, অনেক চিত্তাকর্ষক কৃত্রিম বুদ্ধিমত্তা সিস্টেমগুলি লেবেলযুক্ত ডেটার বিশাল ইনভেন্টরি ব্যবহার করে শেখানো হয়েছে। একটি চিত্রকে "ট্যাবি বিড়াল" বা "বাঘ বিড়াল" লেবেল করা হতে পারে, উদাহরণস্বরূপ, একটি কৃত্রিম নিউরাল নেটওয়ার্ককে "প্রশিক্ষণ" দেওয়ার জন্য একটি ট্যাবিকে বাঘ থেকে সঠিকভাবে আলাদা করতে৷ কৌশলটি দর্শনীয়ভাবে সফল এবং দুর্ভাগ্যজনকভাবে ঘাটতি উভয়ই হয়েছে।

এই ধরনের "তত্ত্বাবধানে" প্রশিক্ষণের জন্য মানুষের দ্বারা শ্রমসাধ্যভাবে লেবেল করা ডেটা প্রয়োজন, এবং নিউরাল নেটওয়ার্কগুলি প্রায়শই শর্টকাট নেয়, লেবেলগুলিকে ন্যূনতম এবং কখনও কখনও সুপারফিশিয়াল তথ্যের সাথে যুক্ত করতে শেখে। উদাহরণস্বরূপ, একটি নিউরাল নেটওয়ার্ক একটি গরুর ছবি চিনতে ঘাসের উপস্থিতি ব্যবহার করতে পারে, কারণ গরু সাধারণত মাঠের ছবি তোলা হয়।

"আমরা অ্যালগরিদমের একটি প্রজন্ম গড়ে তুলছি যেগুলি আন্ডারগ্র্যাডদের মতো [যারা] পুরো সেমিস্টারে ক্লাসে আসেনি এবং তারপর ফাইনালের আগের রাতে, তারা ক্র্যাম করছে," বলেছেন আলেক্সি ইফ্রোস, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের একজন কম্পিউটার বিজ্ঞানী, বার্কলে। "তারা আসলে উপাদান শিখে না, কিন্তু তারা পরীক্ষায় ভাল করে।"

প্রাণী এবং যন্ত্রের বুদ্ধিমত্তার সংযোগে আগ্রহী গবেষকদের জন্য, এই "তত্ত্বাবধানে শিক্ষা" জৈবিক মস্তিষ্ক সম্পর্কে যা প্রকাশ করতে পারে তাতে সীমিত হতে পারে। প্রাণী - মানুষ সহ - শিখতে লেবেলযুক্ত ডেটা সেট ব্যবহার করে না। বেশিরভাগ অংশের জন্য, তারা নিজেরাই পরিবেশ অন্বেষণ করে, এবং এটি করার মাধ্যমে, তারা বিশ্বের একটি সমৃদ্ধ এবং শক্তিশালী উপলব্ধি অর্জন করে।

এখন কিছু গণনামূলক নিউরোসায়েন্টিস্ট নিউরাল নেটওয়ার্কগুলি অন্বেষণ করতে শুরু করেছেন যেগুলিকে খুব কম বা কোন মানব-লেবেলযুক্ত ডেটা দিয়ে প্রশিক্ষিত করা হয়েছে। এই "স্ব-তত্ত্বাবধানে শেখার" অ্যালগরিদমগুলি অত্যন্ত সফলভাবে প্রমাণিত হয়েছে৷ মানুষের ভাষা মডেলিং এবং, আরও সম্প্রতি, চিত্র স্বীকৃতি। সাম্প্রতিক কাজগুলিতে, স্ব-তত্ত্বাবধানে শেখার মডেলগুলি ব্যবহার করে নির্মিত স্তন্যপায়ী ভিজ্যুয়াল এবং শ্রবণ সিস্টেমের গণনামূলক মডেলগুলি তাদের তত্ত্বাবধানে-শেখানো অংশগুলির তুলনায় মস্তিষ্কের কার্যকারিতার সাথে ঘনিষ্ঠ সঙ্গতি দেখিয়েছে। কিছু স্নায়ুবিজ্ঞানীদের কাছে, মনে হচ্ছে কৃত্রিম নেটওয়ার্কগুলি আমাদের মস্তিষ্ক শেখার জন্য ব্যবহার করে এমন কিছু বাস্তব পদ্ধতি প্রকাশ করতে শুরু করেছে।

ত্রুটিপূর্ণ তত্ত্বাবধান

কৃত্রিম নিউরাল নেটওয়ার্ক দ্বারা অনুপ্রাণিত মস্তিষ্কের মডেলগুলি প্রায় 10 বছর আগে বয়সে এসেছিল, প্রায় একই সময়ে একটি নিউরাল নেটওয়ার্ক নামে অ্যালেক্সনেট অজানা ইমেজ শ্রেণীবিভাগের কাজ বিপ্লব. সেই নেটওয়ার্ক, সমস্ত নিউরাল নেটওয়ার্কের মতো, কৃত্রিম নিউরনের স্তর দিয়ে তৈরি হয়েছিল, গণনামূলক একক যা একে অপরের সাথে সংযোগ তৈরি করে যা শক্তিতে পরিবর্তিত হতে পারে বা "ওজন"। যদি একটি নিউরাল নেটওয়ার্ক একটি ইমেজকে সঠিকভাবে শ্রেণীবদ্ধ করতে ব্যর্থ হয়, তাহলে শেখার অ্যালগরিদম নিউরনের মধ্যে সংযোগের ওজন আপডেট করে যাতে প্রশিক্ষণের পরবর্তী রাউন্ডে সেই ভুল শ্রেণীবিভাগের সম্ভাবনা কম হয়। নেটওয়ার্কের ত্রুটির হার গ্রহণযোগ্যভাবে কম না হওয়া পর্যন্ত অ্যালগরিদম সমস্ত প্রশিক্ষণ চিত্র, টুইকিং ওজন সহ এই প্রক্রিয়াটি বহুবার পুনরাবৃত্তি করে।

প্রায় একই সময়ে, স্নায়ুবিজ্ঞানীরা প্রথম গণনামূলক মডেল তৈরি করেন প্রাইমেট ভিজ্যুয়াল সিস্টেমঅ্যালেক্সনেট এবং এর উত্তরসূরির মতো নিউরাল নেটওয়ার্ক ব্যবহার করে। ইউনিয়নটি প্রতিশ্রুতিশীল লাগছিল: যখন বানর এবং কৃত্রিম নিউরাল নেটগুলি একই চিত্র দেখানো হয়েছিল, উদাহরণস্বরূপ, বাস্তব নিউরন এবং কৃত্রিম নিউরনগুলির কার্যকলাপ একটি আকর্ষণীয় চিঠিপত্র দেখিয়েছিল। শ্রবণ এবং গন্ধ সনাক্তকরণের কৃত্রিম মডেল অনুসরণ করা হয়েছে।

কিন্তু ক্ষেত্রের অগ্রগতি হিসাবে, গবেষকরা তত্ত্বাবধানে প্রশিক্ষণের সীমাবদ্ধতা উপলব্ধি করেছেন। উদাহরণস্বরূপ, 2017 সালে, লিওন গ্যাটিস, জার্মানির ইউনিভার্সিটি অফ টুবিনজেন-এর একজন কম্পিউটার বিজ্ঞানী, এবং তার সহকর্মীরা ফোর্ড মডেল টি-এর একটি ছবি তুলেছিলেন, তারপর সেই ফটো জুড়ে একটি চিতাবাঘের চামড়ার প্যাটার্ন ঢেকে দিয়েছিলেন, যা একটি উদ্ভট কিন্তু সহজে চেনা যায় এমন চিত্র তৈরি করেছিল . একটি নেতৃস্থানীয় কৃত্রিম নিউরাল নেটওয়ার্ক সঠিকভাবে আসল চিত্রটিকে একটি মডেল টি হিসাবে শ্রেণীবদ্ধ করেছে, কিন্তু পরিবর্তিত চিত্রটিকে একটি চিতাবাঘ বলে মনে করেছে। এটি টেক্সচারের উপর স্থির ছিল এবং একটি গাড়ির আকৃতি (বা একটি চিতাবাঘ, সেই বিষয়ে) কোন বোঝার ছিল না।

স্ব-তত্ত্বাবধানে শেখার কৌশলগুলি এই ধরনের সমস্যা এড়াতে ডিজাইন করা হয়েছে। এই পদ্ধতিতে, মানুষ ডেটা লেবেল করে না। বরং, "লেবেলগুলি ডেটা থেকেই আসে," বলেছেন৷ ফ্রিডেম্যান জেনকে, সুইজারল্যান্ডের বাসেলের বায়োমেডিকাল রিসার্চের জন্য ফ্রেডরিখ মিশার ইনস্টিটিউটের একজন গণনামূলক স্নায়ুবিজ্ঞানী। স্ব-তত্ত্বাবধানে থাকা অ্যালগরিদমগুলি মূলত ডেটাতে ফাঁক তৈরি করে এবং নিউরাল নেটওয়ার্ককে শূন্যস্থান পূরণ করতে বলে। একটি তথাকথিত বৃহৎ ভাষার মডেলে, উদাহরণস্বরূপ, প্রশিক্ষণ অ্যালগরিদম নিউরাল নেটওয়ার্ককে একটি বাক্যের প্রথম কয়েকটি শব্দ দেখাবে এবং পরবর্তী শব্দের পূর্বাভাস দিতে বলবে। ইন্টারনেট থেকে সংগ্রহ করা টেক্সট একটি বিশাল কর্পাস সঙ্গে প্রশিক্ষিত যখন, মডেল শিখতে দেখা যাচ্ছে ভাষার সিনট্যাকটিক গঠন, চিত্তাকর্ষক ভাষাগত ক্ষমতা প্রদর্শন করে — সবই বাহ্যিক লেবেল বা তত্ত্বাবধান ছাড়াই।

কম্পিউটার ভিশনেও অনুরূপ প্রচেষ্টা চলছে। 2021 সালের শেষের দিকে, কাইমিং তিনি এবং সহকর্মীরা তাদের প্রকাশ করেছে "মুখোশযুক্ত অটো-এনকোডার,” যা একটি উপর তৈরি করে প্রযুক্তি 2016 সালে Efros' টিম দ্বারা অগ্রণী। স্ব-তত্ত্বাবধানে শেখার অ্যালগরিদম এলোমেলোভাবে ছবিগুলিকে মাস্ক করে, প্রতিটির প্রায় তিন-চতুর্থাংশ অস্পষ্ট করে। মুখোশযুক্ত স্বয়ংক্রিয়-এনকোডার মুখোশহীন অংশগুলিকে সুপ্ত উপস্থাপনায় পরিণত করে — সংকুচিত গাণিতিক বিবরণ যা একটি বস্তু সম্পর্কে গুরুত্বপূর্ণ তথ্য ধারণ করে। (একটি চিত্রের ক্ষেত্রে, সুপ্ত উপস্থাপনা একটি গাণিতিক বর্ণনা হতে পারে যা চিত্রের একটি বস্তুর আকারকে ক্যাপচার করে।

স্ব-তত্ত্বাবধানে শেখার অ্যালগরিদম এনকোডার-ডিকোডার সংমিশ্রণকে মাস্ক করা ছবিগুলিকে তাদের সম্পূর্ণ সংস্করণে পরিণত করতে প্রশিক্ষণ দেয়। বাস্তব চিত্র এবং পুনর্গঠিত ছবিগুলির মধ্যে যে কোনও পার্থক্য তা শিখতে সাহায্য করার জন্য সিস্টেমে ফিরে আসে। এই প্রক্রিয়াটি প্রশিক্ষণ চিত্রের একটি সেটের জন্য পুনরাবৃত্তি হয় যতক্ষণ না সিস্টেমের ত্রুটির হার উপযুক্তভাবে কম হয়। একটি উদাহরণে, যখন একটি প্রশিক্ষিত মুখোশযুক্ত স্বয়ংক্রিয়-এনকোডারকে একটি বাসের পূর্বে অদেখা ছবি দেখানো হয়েছিল যার প্রায় 80% অস্পষ্ট ছিল, সিস্টেমটি সফলভাবে বাসের কাঠামো পুনর্গঠন করেছিল।

"এটি একটি খুব, খুব চিত্তাকর্ষক ফলাফল," Efros বলেন.

একটি সিস্টেমে তৈরি করা সুপ্ত উপস্থাপনাগুলি পূর্ববর্তী কৌশলগুলির তুলনায় যথেষ্ট গভীর তথ্য ধারণ করে বলে মনে হয়। সিস্টেমটি একটি গাড়ির আকৃতি শিখতে পারে, উদাহরণস্বরূপ - বা একটি চিতাবাঘ - এবং কেবল তাদের প্যাটার্ন নয়। "এবং এটি সত্যিই স্ব-তত্ত্বাবধানে শিক্ষার মৌলিক ধারণা - আপনি নিচ থেকে আপনার জ্ঞান গড়ে তোলেন," Efros বলেছেন। পরীক্ষায় উত্তীর্ণ হওয়ার জন্য কোনো শেষ মুহূর্তের ঝাঁকুনি নেই।

স্ব-তত্ত্বাবধানে মস্তিষ্ক

এই ধরনের সিস্টেমে, কিছু স্নায়ুবিজ্ঞানী আমরা কীভাবে শিখি তার প্রতিধ্বনি দেখতে পান। "আমি মনে করি এতে কোন সন্দেহ নেই যে মস্তিষ্ক যা করে তার 90% হল স্ব-তত্ত্বাবধানে শিক্ষা," বলেছেন ব্লেক রিচার্ডস, ম্যাকগিল বিশ্ববিদ্যালয়ের একজন কম্পিউটেশনাল নিউরোসায়েন্টিস্ট এবং মিলা, কুইবেক কৃত্রিম বুদ্ধিমত্তা ইনস্টিটিউট। জৈবিক মস্তিষ্কগুলি ক্রমাগত ভবিষ্যদ্বাণী করে বলে মনে করা হয়, বলুন, একটি বস্তুর ভবিষ্যত অবস্থানের সাথে এটি নড়াচড়া করে, বা একটি বাক্যে পরবর্তী শব্দ, ঠিক যেমন একটি স্ব-তত্ত্বাবধানে শিক্ষার অ্যালগরিদম একটি চিত্র বা পাঠ্যের একটি অংশের ফাঁক ভবিষ্যদ্বাণী করার চেষ্টা করে। এবং মস্তিস্ক তাদের ভুল থেকে নিজেরাও শেখে - আমাদের মস্তিষ্কের প্রতিক্রিয়ার শুধুমাত্র একটি ছোট অংশ একটি বাহ্যিক উত্স থেকে আসে, মূলত, "ভুল উত্তর।"

উদাহরণস্বরূপ, মানুষ এবং অন্যান্য প্রাইমেটদের ভিজ্যুয়াল সিস্টেম বিবেচনা করুন। এগুলি সমস্ত প্রাণীর সংবেদনশীল সিস্টেমের মধ্যে সর্বোত্তম অধ্যয়ন করা হয়, তবে স্নায়ুবিজ্ঞানীরা ব্যাখ্যা করার জন্য লড়াই করেছেন কেন তারা দুটি পৃথক পথ অন্তর্ভুক্ত করে: ভেন্ট্রাল ভিজ্যুয়াল স্ট্রীম, যা বস্তু এবং মুখগুলি সনাক্ত করার জন্য দায়ী এবং ডোরসাল ভিজ্যুয়াল স্ট্রিম, যা আন্দোলন প্রক্রিয়া করে (" কি" এবং "কোথায়" পথ, যথাক্রমে)।

রিচার্ডস এবং তার দল একটি স্ব-তত্ত্বাবধানে মডেল তৈরি করেছে যা একটি উত্তরের ইঙ্গিত দেয়। তারা প্রশিক্ষিত একটি AI যা দুটি ভিন্ন নিউরাল নেটওয়ার্ককে একত্রিত করেছে: প্রথমটি, যাকে বলা হয় ResNet আর্কিটেকচার, চিত্র প্রক্রিয়াকরণের জন্য ডিজাইন করা হয়েছিল; দ্বিতীয়টি, একটি পুনরাবৃত্ত নেটওয়ার্ক হিসাবে পরিচিত, পরবর্তী প্রত্যাশিত ইনপুট সম্পর্কে পূর্বাভাস দেওয়ার জন্য পূর্বের ইনপুটগুলির একটি ক্রম ট্র্যাক রাখতে পারে। সম্মিলিত AI-কে প্রশিক্ষণ দেওয়ার জন্য, দলটি একটি ভিডিও থেকে 10টি ফ্রেমের একটি ক্রম দিয়ে শুরু করেছিল এবং ResNet-কে একে একে প্রক্রিয়া করতে দেয়। পুনরাবৃত্ত নেটওয়ার্ক তারপর 11 তম ফ্রেমের সুপ্ত প্রতিনিধিত্বের ভবিষ্যদ্বাণী করেছিল, যখন কেবল প্রথম 10টি ফ্রেমের সাথে মেলে না। স্ব-তত্ত্বাবধানে শেখার অ্যালগরিদম ভবিষ্যদ্বাণীটিকে প্রকৃত মানের সাথে তুলনা করে এবং ভবিষ্যদ্বাণীটি আরও ভাল করার জন্য নিউরাল নেটওয়ার্কগুলিকে তাদের ওজন আপডেট করার নির্দেশ দেয়।

রিচার্ডসের দল দেখেছে যে একটি একক ResNet এর সাথে প্রশিক্ষিত একটি AI বস্তুর স্বীকৃতিতে ভাল, কিন্তু আন্দোলনকে শ্রেণীবদ্ধ করার ক্ষেত্রে নয়। কিন্তু যখন তারা একক রেসনেটকে দুই ভাগে বিভক্ত করে, দুটি পথ তৈরি করে (নিউরনের মোট সংখ্যা পরিবর্তন না করে), AI একটিতে বস্তুর জন্য এবং অন্যটিতে চলাচলের জন্য উপস্থাপনা তৈরি করে, এই বৈশিষ্ট্যগুলির নিম্নধারার শ্রেণীকরণ সক্ষম করে — ঠিক যেমন আমাদের মস্তিষ্ক সম্ভবত করতে

এআইকে আরও পরীক্ষা করার জন্য, দলটি এটিকে ভিডিওর একটি সেট দেখিয়েছিল যা সিয়াটেলের অ্যালেন ইনস্টিটিউট ফর ব্রেন সায়েন্সের গবেষকরা ইঁদুরকে দেখিয়েছিলেন। প্রাইমেটদের মতো, ইঁদুরের মস্তিষ্কের অঞ্চলগুলি স্থির চিত্র এবং নড়াচড়ার জন্য বিশেষায়িত। অ্যালেন গবেষকরা মাউসের ভিজ্যুয়াল কর্টেক্সে স্নায়বিক কার্যকলাপ রেকর্ড করেছিলেন যখন প্রাণীরা ভিডিওগুলি দেখেছিল।

এখানেও, রিচার্ডসের দল AI এবং জীবন্ত মস্তিষ্কের ভিডিওগুলির প্রতিক্রিয়াতে মিল খুঁজে পেয়েছে। প্রশিক্ষণের সময়, কৃত্রিম নিউরাল নেটওয়ার্কের একটি পথ মাউসের মস্তিষ্কের ভেন্ট্রাল, অবজেক্ট-সনাক্তকারী অঞ্চলগুলির সাথে আরও সাদৃশ্যপূর্ণ হয়ে ওঠে এবং অন্য পথটি আন্দোলন-কেন্দ্রিক পৃষ্ঠীয় অঞ্চলগুলির অনুরূপ হয়ে ওঠে।

ফলাফলগুলি পরামর্শ দেয় যে আমাদের ভিজ্যুয়াল সিস্টেমের দুটি বিশেষ পথ রয়েছে কারণ তারা চাক্ষুষ ভবিষ্যতের পূর্বাভাস দিতে সহায়তা করে, রিচার্ডস বলেছেন; একটি একক পথ যথেষ্ট ভাল নয়।

মানুষের শ্রবণ ব্যবস্থার মডেলগুলি একই রকম গল্প বলে। জুন মাসে একটি দলের নেতৃত্বে ড জিন-রেমি কিং, মেটা এআই-এর একজন গবেষণা বিজ্ঞানী, Wav2Vec 2.0 নামে একটি এআই প্রশিক্ষিত, যা অডিওকে সুপ্ত উপস্থাপনায় রূপান্তর করতে একটি নিউরাল নেটওয়ার্ক ব্যবহার করে। গবেষকরা এই উপস্থাপনাগুলির মধ্যে কিছু মুখোশ রাখেন, যা তারপরে ট্রান্সফরমার নামে অন্য একটি উপাদান নিউরাল নেটওয়ার্কে ফিড করে। প্রশিক্ষণের সময়, ট্রান্সফরমার মুখোশযুক্ত তথ্যের পূর্বাভাস দেয়। প্রক্রিয়ায় পুরো AI শব্দগুলিকে সুপ্ত উপস্থাপনায় পরিণত করতে শেখে — আবার, কোনও লেবেলের প্রয়োজন নেই। দলটি নেটওয়ার্ককে প্রশিক্ষণ দেওয়ার জন্য প্রায় 600 ঘন্টার বক্তৃতা ডেটা ব্যবহার করেছে, "যা প্রায় একজন শিশু [প্রথম দুই বছরের অভিজ্ঞতায়] পেতে পারে," কিং বলেন।

একবার সিস্টেমটি প্রশিক্ষিত হয়ে গেলে, গবেষকরা এটিকে ইংরেজি, ফরাসি এবং ম্যান্ডারিন ভাষায় অডিওবুকের অংশগুলি চালান। গবেষকরা তারপরে 412 জনের ডেটার সাথে AI-এর কার্যকারিতা তুলনা করেছেন - তিনটি ভাষার স্থানীয় ভাষাভাষীদের মিশ্রণ যারা এফএমআরআই স্ক্যানারে তাদের মস্তিষ্কের ছবি তোলার সময় একই প্রসারিত অডিও শুনেছিল। কিং বলেছিলেন যে তার নিউরাল নেটওয়ার্ক এবং মানুষের মস্তিষ্ক, কোলাহলপূর্ণ এবং কম-রেজোলিউশনের এফএমআরআই চিত্র থাকা সত্ত্বেও, "শুধু একে অপরের সাথে সম্পর্কযুক্ত নয়, তবে তারা একটি পদ্ধতিগত ফ্যাশনে সম্পর্কযুক্ত": এআই এর প্রাথমিক স্তরগুলির কার্যকলাপ কার্যকলাপের সাথে সারিবদ্ধ। প্রাথমিক শ্রবণ কর্টেক্সে, যেখানে AI এর গভীরতম স্তরগুলির কার্যকলাপ মস্তিষ্কের উচ্চ স্তরগুলির কার্যকলাপের সাথে সারিবদ্ধ হয়, এই ক্ষেত্রে প্রিফ্রন্টাল কর্টেক্স। "এটি সত্যিই সুন্দর তথ্য," রিচার্ডস বলেন. "এটি চূড়ান্ত নয়, তবে [এটি] আরেকটি বাধ্যতামূলক প্রমাণের একটি অংশ যা পরামর্শ দেয় যে, প্রকৃতপক্ষে, আমরা যেভাবে ভাষা শিখি তা বড় অংশে পরবর্তী জিনিসগুলির ভবিষ্যদ্বাণী করার চেষ্টা করে যা বলা হবে।"

আনকিউরড প্যাথলজিস

সবাই বিশ্বাসী নয়। জোশ ম্যাকডারমট, ম্যাসাচুসেটস ইন্সটিটিউট অফ টেকনোলজির একজন কম্পিউটেশনাল নিউরোসায়েন্টিস্ট, তত্ত্বাবধানে এবং স্ব-তত্ত্বাবধানে শিক্ষা উভয় ব্যবহার করে দৃষ্টি এবং শ্রবণ উপলব্ধির মডেলগুলিতে কাজ করেছেন। তার ল্যাব ডিজাইন করেছে যাকে সে "মেটামার" বলে, সংশ্লেষিত অডিও এবং ভিজ্যুয়াল সিগন্যাল যা একজন মানুষের জন্য ঠিক অস্পষ্ট শব্দ. একটি কৃত্রিম নিউরাল নেটওয়ার্কে, তবে, মেটামারগুলি বাস্তব সংকেত থেকে আলাদা করা যায় না। এটি পরামর্শ দেয় যে নিউরাল নেটওয়ার্কের গভীর স্তরগুলিতে যে উপস্থাপনাগুলি তৈরি হয়, এমনকি স্ব-তত্ত্বাবধানে শেখার সাথেও, আমাদের মস্তিষ্কের উপস্থাপনাগুলির সাথে মেলে না। এই স্ব-তত্ত্বাবধানে শেখার পদ্ধতিগুলি "এই অর্থে অগ্রগতি যে আপনি উপস্থাপনাগুলি শিখতে সক্ষম হন যা এই সমস্ত লেবেলের প্রয়োজন ছাড়াই অনেকগুলি স্বীকৃতির আচরণকে সমর্থন করতে পারে," ম্যাকডারমট বলেছেন। "তবে তাদের এখনও তত্ত্বাবধানে থাকা মডেলগুলির অনেক প্যাথলজি রয়েছে।"

অ্যালগরিদমগুলিকেও আরও কাজ করতে হবে। উদাহরণ স্বরূপ, Meta AI-এর Wav2Vec 2.0-এ, AI শুধুমাত্র কয়েক দশ মিলিসেকেন্ডের শব্দের জন্য সুপ্ত প্রতিনিধিত্বের ভবিষ্যদ্বাণী করে — একটি শব্দের কথাই ছেড়ে দিন, একটি উপলব্ধিগতভাবে স্বতন্ত্র শব্দ উচ্চারণ করতে যতটা সময় লাগে তার চেয়ে কম। "মস্তিষ্ক যা করে তার অনুরূপ কিছু করার জন্য অনেক কিছু করতে হবে," কিং বলেছিলেন।

সত্যিকার অর্থে মস্তিষ্কের কার্যকারিতা বোঝার জন্য স্ব-তত্ত্বাবধানে শিক্ষার চেয়ে বেশি প্রয়োজন। একটি জিনিসের জন্য, মস্তিষ্ক প্রতিক্রিয়া সংযোগে পূর্ণ, যখন বর্তমান মডেলগুলিতে এমন কয়েকটি সংযোগ রয়েছে, যদি থাকে। একটি সুস্পষ্ট পরবর্তী পদক্ষেপ হল অত্যন্ত পুনরাবৃত্ত নেটওয়ার্কগুলিকে প্রশিক্ষণ দেওয়ার জন্য স্ব-তত্ত্বাবধানে শিক্ষা ব্যবহার করা - একটি কঠিন প্রক্রিয়া - এবং দেখুন কিভাবে এই জাতীয় নেটওয়ার্কগুলির কার্যকলাপ বাস্তব মস্তিষ্কের কার্যকলাপের সাথে তুলনা করে। অন্য গুরুত্বপূর্ণ পদক্ষেপটি হবে স্ব-তত্ত্বাবধানে শেখার মডেলগুলিতে কৃত্রিম নিউরনের কার্যকলাপকে পৃথক জৈবিক নিউরনের কার্যকলাপের সাথে মেলানো। "আশা করি, ভবিষ্যতে, [আমাদের] ফলাফলগুলি একক-কোষ রেকর্ডিংয়ের সাথেও নিশ্চিত করা হবে," কিং বলেছেন।

যদি মস্তিষ্ক এবং স্ব-তত্ত্বাবধানে শেখার মডেলগুলির মধ্যে পর্যবেক্ষিত মিলগুলি অন্যান্য সংবেদনশীল কাজের জন্য ধরে থাকে তবে এটি আরও শক্তিশালী ইঙ্গিত হবে যে আমাদের মস্তিষ্ক যা যা যা করতে সক্ষম তার জন্য কিছু আকারে স্ব-তত্ত্বাবধানে শিক্ষার প্রয়োজন। "যদি আমরা ব্যাপকভাবে বিভিন্ন সিস্টেমের মধ্যে পদ্ধতিগত মিল খুঁজে পাই, তবে এটি [হবে] যে সম্ভবত একটি বুদ্ধিমান ফ্যাশনে তথ্য প্রক্রিয়া করার এতগুলি উপায় নেই," কিং বলেছিলেন। "অন্তত, এটি এমন একটি সুন্দর অনুমান যার সাথে আমরা কাজ করতে চাই।"

সময় স্ট্যাম্প:

থেকে আরো কোয়ান্টাম্যাগাজিন