কম্পিউটার বিজ্ঞানী আরও ভাল প্লেটোব্লকচেন ডেটা বুদ্ধিমত্তা শিখতে AI কে চ্যালেঞ্জ করছেন৷ উল্লম্ব অনুসন্ধান. আ.

কম্পিউটার বিজ্ঞানী এআইকে আরও ভালোভাবে শেখার জন্য চ্যালেঞ্জ করছেন

কৃত্রিম বুদ্ধিমত্তার অ্যালগরিদমগুলি উপযুক্ত এবং শুরুতে শেখার জন্য ডিজাইন করা হয়েছে৷ মানুষের মতো করে সময়ের সাথে সাথে তাদের জ্ঞানের ভিত্তি ক্রমাগত আপডেট করার পরিবর্তে, অ্যালগরিদমগুলি শুধুমাত্র প্রশিক্ষণের পর্যায়ে শিখতে পারে। এরপর তাদের জ্ঞান হিমায়িত থাকে; তারা যে কাজটি করার জন্য প্রশিক্ষিত হয়েছিল তা তারা সম্পাদন করতে সক্ষম না হয়েও শেখার মতো করে। এমনকি একটি নতুন জিনিস শিখতে, অ্যালগরিদমগুলিকে স্ক্র্যাচ থেকে আবার প্রশিক্ষণ দিতে হবে। এটি এমন যেন প্রতিবার আপনি যখনই একজন নতুন ব্যক্তির সাথে সাক্ষাত করেন, তখন আপনি তার নাম শিখতে পারেন একমাত্র উপায় আপনার মস্তিষ্ক পুনরায় চালু করা।

স্ক্র্যাচ থেকে প্রশিক্ষণ একটি বিপর্যয়মূলক ভুলে যাওয়া হিসাবে পরিচিত একটি আচরণের দিকে নিয়ে যেতে পারে, যেখানে একটি মেশিন ইতিমধ্যেই শেখা প্রায় সমস্ত কিছু ভুলে যাওয়ার মূল্যে নতুন জ্ঞান অন্তর্ভুক্ত করে। আজকের সবচেয়ে শক্তিশালী এআই অ্যালগরিদম, যাকে নিউরাল নেটওয়ার্ক বলা হয়, নতুন জিনিস শেখার কারণে এই পরিস্থিতির উদ্ভব হয়।

এই অ্যালগরিদমগুলি আমাদের মস্তিষ্কের উপর ঢিলেঢালাভাবে ভিত্তি করে, যেখানে শেখার সাথে নিউরনের মধ্যে সংযোগের শক্তি পরিবর্তন করা জড়িত। কিন্তু এই প্রক্রিয়া কঠিন হয়ে যায়। নিউরাল সংযোগগুলি অতীতের জ্ঞানকেও উপস্থাপন করে, তাই তাদের খুব বেশি পরিবর্তন করা ভুলে যাওয়ার কারণ হবে।

জৈবিক নিউরাল নেটওয়ার্কগুলি লক্ষ লক্ষ বছর ধরে কৌশলগুলিকে বিকশিত করেছে যাতে গুরুত্বপূর্ণ তথ্য স্থিতিশীল থাকে। কিন্তু আজকের কৃত্রিম নিউরাল নেটওয়ার্কগুলি নতুন এবং পুরানো জ্ঞানের মধ্যে একটি ভাল ভারসাম্য বজায় রাখার জন্য সংগ্রাম করে। নেটওয়ার্ক যখন নতুন ডেটা দেখে তখন তাদের সংযোগগুলি খুব সহজেই ওভাররাইট হয়ে যায়, যার ফলে অতীতের তথ্য সনাক্ত করতে হঠাৎ এবং গুরুতর ব্যর্থতা হতে পারে।

এটি মোকাবেলায় সহায়তা করার জন্য, ক্রিস্টোফার কানন, রচেস্টার বিশ্ববিদ্যালয়ের একজন 41 বছর বয়সী কম্পিউটার বিজ্ঞানী, AI গবেষণার একটি নতুন ক্ষেত্র প্রতিষ্ঠা করতে সাহায্য করেছেন যা ক্রমাগত শিক্ষা হিসাবে পরিচিত। তার লক্ষ্য হল AI-এর জন্য ডেটার ক্রমাগত স্ট্রীম থেকে নতুন জিনিস শেখা এবং আগে যা কিছু এসেছে তা ভুলে না গিয়ে তা করা।

কানন প্রায় সারাজীবন যন্ত্রের বুদ্ধিমত্তার সাথে খেলছেন। গ্রামীণ ওকলাহোমায় একটি শিশু হিসাবে যিনি কেবল মেশিনের সাথে মজা করতে চেয়েছিলেন, তিনি বটকে প্রথম দিকে মাল্টি-প্লেয়ার কম্পিউটার গেম খেলতে শিখিয়েছিলেন। এটি তাকে কৃত্রিম সাধারণ বুদ্ধিমত্তার সম্ভাবনা সম্পর্কে বিস্মিত করেছিল - একটি যন্ত্র যা প্রতিটি উপায়ে মানুষের মতো চিন্তা করার ক্ষমতা রাখে। এটি তাকে মন কীভাবে কাজ করে সে সম্পর্কে আগ্রহী করে তোলে এবং স্নাতক অধ্যয়ন তাকে ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, সান দিয়েগোতে নিয়ে যাওয়ার আগে তিনি ওকলাহোমা স্টেট ইউনিভার্সিটিতে দর্শন এবং কম্পিউটার বিজ্ঞানে মেজর হন।

এখন কানন শুধু ভিডিও গেমেই নয়, তার প্রায় 2-বছর বয়সী মেয়েকে বিশ্ব সম্পর্কে শিখতে দেখে অনুপ্রেরণা খুঁজে পায়, প্রতিটি নতুন শেখার অভিজ্ঞতা শেষের দিকে তৈরি করে। তার এবং অন্যদের কাজের কারণে, বিপর্যয়কর ভুলে যাওয়া আর ততটা বিপর্যয়কর নয়।

কোয়ান্টা কাননের সাথে মেশিনের স্মৃতি, নিউরাল নেটওয়ার্ক প্রশিক্ষণের নিয়ম ভঙ্গ করা এবং এআই কখনও মানব-স্তরের শিক্ষা অর্জন করবে কিনা সে সম্পর্কে কথা বলেছেন। সাক্ষাত্কারটি সংক্ষিপ্ত এবং স্পষ্টতার জন্য সম্পাদনা করা হয়েছে।

দর্শনে আপনার প্রশিক্ষণ কীভাবে আপনার কাজ সম্পর্কে চিন্তাভাবনাকে প্রভাবিত করে?

এটি একজন শিক্ষাবিদ হিসাবে আমাকে খুব ভালভাবে পরিবেশন করেছে। দর্শন আপনাকে শেখায়, "আপনি কীভাবে যুক্তিযুক্ত যুক্তি তৈরি করেন," এবং "আপনি কীভাবে অন্যদের যুক্তি বিশ্লেষণ করেন?" যে আপনি বিজ্ঞান অনেক কি. টিউরিং পরীক্ষার ব্যর্থতা এবং এই জাতীয় জিনিসগুলি সম্পর্কে আমার কাছে এখনও প্রবন্ধ রয়েছে। এবং তাই এই জিনিসগুলি আমি এখনও অনেক চিন্তা করি।

আমার ল্যাব প্রশ্ন জিজ্ঞাসা করে অনুপ্রাণিত হয়েছে: আচ্ছা, আমরা যদি X করতে না পারি, তাহলে আমরা কীভাবে Y করতে সক্ষম হব? আমরা সময়ের সাথে সাথে শিখি, কিন্তু নিউরাল নেটওয়ার্ক, সাধারণভাবে, তা করে না। আপনি একবার তাদের প্রশিক্ষণ দিন। এর পরে এটি একটি স্থির সত্তা। এবং এটি একটি মৌলিক বিষয় যা আপনাকে সমাধান করতে হবে যদি আপনি একদিন কৃত্রিম সাধারণ বুদ্ধিমত্তা তৈরি করতে চান। যদি এটি তার মস্তিষ্ককে স্ক্র্যাম্বল না করে এবং স্ক্র্যাচ থেকে পুনরায় চালু না করে শিখতে না পারে তবে আপনি সত্যিই সেখানে যেতে পারবেন না, তাই না? এটা আমার জন্য একটি পূর্বশর্ত ক্ষমতা.

কীভাবে গবেষকরা এখন পর্যন্ত বিপর্যয়কর ভুলে যাওয়া মোকাবেলা করেছেন?

সবচেয়ে সফল পদ্ধতি, যাকে রিপ্লে বলা হয়, অতীতের অভিজ্ঞতা সঞ্চয় করে এবং তারপর নতুন উদাহরণ সহ প্রশিক্ষণের সময় সেগুলিকে পুনরায় খেলায়, যাতে সেগুলি হারিয়ে না যায়। এটি আমাদের মস্তিষ্কে স্মৃতি একত্রীকরণ দ্বারা অনুপ্রাণিত, যেখানে ঘুমের সময় দিনের ক্রিয়াকলাপের উচ্চ-স্তরের এনকোডিংগুলি "পুনরায় প্লে" হয় কারণ নিউরনগুলি পুনরায় সক্রিয় হয়।

অন্য কথায়, অ্যালগরিদমগুলির জন্য, নতুন শিক্ষা অতীতের শিক্ষাকে সম্পূর্ণরূপে নির্মূল করতে পারে না যেহেতু আমরা সঞ্চিত অতীত অভিজ্ঞতার সাথে মিশ্রিত করছি।

এটি করার জন্য তিনটি শৈলী আছে। সবচেয়ে সাধারণ স্টাইল হল "ভেরিডিকাল রিপ্লে", যেখানে গবেষকরা কাঁচা ইনপুটগুলির একটি উপসেট সংরক্ষণ করেন - উদাহরণস্বরূপ, একটি বস্তু শনাক্তকরণ কাজের জন্য আসল চিত্রগুলি - এবং তারপরে অতীতের সেই সঞ্চিত চিত্রগুলিকে নতুন চিত্রগুলির সাথে মিশ্রিত করে যা শেখা হবে৷ দ্বিতীয় পদ্ধতিটি চিত্রগুলির সংকুচিত উপস্থাপনাগুলিকে পুনরায় প্লে করে। তৃতীয় একটি খুব কম সাধারণ পদ্ধতি হল "জেনারেটিভ রিপ্লে।" এখানে, একটি কৃত্রিম নিউরাল নেটওয়ার্ক আসলে অতীতের অভিজ্ঞতার একটি সিন্থেটিক সংস্করণ তৈরি করে এবং তারপর সেই কৃত্রিম উদাহরণটিকে নতুন উদাহরণের সাথে মিশ্রিত করে। আমার ল্যাব পরবর্তী দুটি পদ্ধতির উপর দৃষ্টি নিবদ্ধ করেছে।

দুর্ভাগ্যবশত, যদিও, রিপ্লে একটি খুব সন্তোষজনক সমাধান নয়।

কেন না?

নতুন কিছু শেখার জন্য, নিউরাল নেটওয়ার্ককে অতীতে শেখা প্রতিটি ধারণা সম্পর্কে অন্তত কিছু তথ্য সংরক্ষণ করতে হবে। এবং একটি নিউরোসায়েন্টিফিক দৃষ্টিকোণ থেকে, অনুমানটি হল যে আপনি এবং আমি একটি তুলনামূলকভাবে সাম্প্রতিক অভিজ্ঞতার রিপ্লে করেছি — আমাদের শৈশবে ঘটেছিল এমন কিছু নয় — সেই সাম্প্রতিক অভিজ্ঞতাকে ভুলে যাওয়া রোধ করতে। যেখানে আমরা গভীর নিউরাল নেটওয়ার্কে এটি করি, এটি সত্য নয়। এটি অগত্যা এটি যা দেখেছে তা সঞ্চয় করতে হবে না, তবে এটি রিপ্লে ব্যবহার করার জন্য অতীতে শেখা প্রতিটি কাজ সম্পর্কে কিছু সঞ্চয় করতে হবে। এবং এটা কি সংরক্ষণ করা উচিত তা অস্পষ্ট. তাই রিপ্লে করুন যেভাবে এটি করা হয়েছে আজও মনে হচ্ছে এটি সেখানে নেই।

আমরা যদি বিপর্যয়কর ভুলে যাওয়াকে সম্পূর্ণরূপে সমাধান করতে পারি, তাহলে এর অর্থ কি এআই সময়ের সাথে সাথে ক্রমাগত নতুন জিনিস শিখতে পারে?

বেপারটা এমন না. আমি মনে করি ক্রমাগত শিক্ষার ক্ষেত্রে বড়, বড়, বড় খোলা প্রশ্নগুলি বিপর্যয়কর ভুলে যাওয়া নয়। আমি যে বিষয়ে সত্যিই আগ্রহী তা হল: অতীতের শিক্ষা কীভাবে ভবিষ্যতের শিক্ষাকে আরও দক্ষ করে তোলে? এবং কীভাবে ভবিষ্যতে কিছু শেখা অতীতের শিক্ষাকে সংশোধন করে? এগুলি এমন জিনিস যা খুব বেশি লোক পরিমাপ করে না, এবং আমি মনে করি এটি করা ক্ষেত্রটিকে এগিয়ে নিয়ে যাওয়ার একটি গুরুত্বপূর্ণ অংশ কারণ সত্যিই, এটি কেবল জিনিসগুলি ভুলে যাওয়ার বিষয়ে নয়। এটি একটি ভাল ছাত্র হয়ে উঠছে সম্পর্কে.

সেখানেই আমি মনে করি মাঠটি গাছের জন্য বনের অনুপস্থিত। সম্প্রদায়ের বেশিরভাগই এমনভাবে সমস্যাটি স্থাপন করছে যা আকর্ষণীয় জৈবিক প্রশ্ন বা আকর্ষণীয় ইঞ্জিনিয়ারিং অ্যাপ্লিকেশনগুলির সাথে মেলে না। আমরা সবাই সবসময় একই খেলনা সমস্যা করতে পারে না. আপনাকে বলতে হবে: আমাদের গন্টলেট টাস্ক কি? আমরা কিভাবে এগিয়ে জিনিস ধাক্কা না?

তাহলে আপনি কেন মনে করেন যে বেশিরভাগ লোকেরা সেই সাধারণ সমস্যাগুলির দিকে মনোনিবেশ করছে?

আমি শুধু অনুমান করতে পারি। বেশিরভাগ কাজ ছাত্রদের দ্বারা করা হয় যারা অতীতের কাজ অনুসরণ করছে। তারা অন্যরা যা করেছে তার সেটআপ অনুলিপি করছে এবং একই পরিমাপের সাথে পারফরম্যান্সে কিছু ছোটখাটো লাভ দেখাচ্ছে। নতুন অ্যালগরিদম তৈরি করার ফলে একটি প্রকাশনা হওয়ার সম্ভাবনা বেশি, এমনকি যদি সেই অ্যালগরিদমগুলি আমাদের ক্রমাগত শেখার ক্ষেত্রে উল্লেখযোগ্য অগ্রগতি করতে সক্ষম না করে। যা আমাকে অবাক করে তা হল যে একই ধরণের কাজ বড় কোম্পানিগুলি দ্বারা উত্পাদিত হয় যাদের একই প্রণোদনা নেই, ইন্টার্ন-চালিত কাজ ছাড়া।

এছাড়াও, এই কাজ অতুচ্ছ. আমাদের সঠিক পরীক্ষা এবং অ্যালগরিদমিক সেটআপ স্থাপন করতে হবে যা পরিমাপ করতে হবে যে অতীতের শিক্ষা ভবিষ্যতের শিক্ষাকে সাহায্য করে কিনা। বড় সমস্যা হল আমাদের এই মুহূর্তে ক্রমাগত শেখার অধ্যয়নের জন্য ভাল ডেটা সেট নেই। আমি বলতে চাচ্ছি, আমরা মূলত বিদ্যমান ডেটা সেটগুলি নিচ্ছি যেগুলি প্রথাগত মেশিন লার্নিংয়ে ব্যবহৃত হয় এবং সেগুলিকে পুনরায় ব্যবহার করা হয়।

মূলত, মেশিন লার্নিং এর মতবাদে (বা অন্তত যখনই আমি মেশিন লার্নিং শেখানো শুরু করি), আমাদের একটি প্রশিক্ষণ সেট আছে, আমাদের একটি পরীক্ষা সেট আছে — আমরা প্রশিক্ষণ সেটে প্রশিক্ষণ দিই, আমরা পরীক্ষার সেটে পরীক্ষা করি। ক্রমাগত শিক্ষা সেই নিয়মগুলিকে ভঙ্গ করে। আপনার প্রশিক্ষণ সেটটি তখন এমন কিছু হয়ে ওঠে যা শিক্ষার্থীর শেখার সাথে সাথে বিকশিত হয়। কিন্তু আমরা এখনও বিদ্যমান ডেটা সেটে সীমাবদ্ধ। আমাদের এই বিষয়ে কাজ করতে হবে। আমাদের সত্যিই একটি ভাল ক্রমাগত শেখার পরিবেশ দরকার যেখানে আমরা সত্যিই নিজেদেরকে ধাক্কা দিতে পারি।

আদর্শ ক্রমাগত শেখার পরিবেশ কেমন হবে?

এটি কি নয় তার চেয়ে আপনাকে বলা সহজ। আমি একটি প্যানেলে ছিলাম যেখানে আমরা এটিকে একটি জটিল সমস্যা হিসাবে চিহ্নিত করেছি, কিন্তু এটি এমন নয় যেখানে আমি মনে করি যে কারো কাছে অবিলম্বে উত্তর আছে৷

আমি আপনাকে এটা থাকতে পারে বৈশিষ্ট্য বলতে পারেন. তাই আপাতত, ধরা যাক AI অ্যালগরিদমগুলি নয়৷ মূর্ত এজেন্ট সিমুলেশনে তারপরে অন্ততপক্ষে, আদর্শভাবে, আমরা ভিডিওগুলি থেকে শিখছি, বা এরকম কিছু, যেমন মাল্টিমোডাল ভিডিও স্ট্রীম, এবং আশা করছি কেবল শ্রেণীবিভাগের চেয়ে আরও বেশি কিছু করছি [স্থির চিত্রগুলির]।

এ নিয়ে অনেক খোলামেলা প্রশ্ন রয়েছে। আমি কয়েক বছর আগে একটি ক্রমাগত শেখার কর্মশালায় ছিলাম এবং আমার মতো কিছু লোক বলছিল, "আমাদের MNIST নামে একটি ডেটা সেট ব্যবহার করা বন্ধ করতে হবে, এটি খুব সহজ।" এবং তারপরে কেউ বলেছিল, "ঠিক আছে, আচ্ছা, আসুন [কৌশল-ভিত্তিক ভিডিও গেম] স্টারক্রাফ্টের ক্রমবর্ধমান শিক্ষা করি।" এবং আমি এটিও এখন বিভিন্ন কারণে করছি, কিন্তু আমি মনে করি না যে এটি সত্যিই এটি পায়। স্টারক্রাফ্ট খেলা শেখার চেয়ে জীবন অনেক সমৃদ্ধ জিনিস।

আপনার ল্যাব কীভাবে অ্যালগরিদম ডিজাইন করার চেষ্টা করেছে যা সময়ের সাথে সাথে শেখা রাখতে পারে?

আমার প্রাক্তন ছাত্র টাইলার হেইসের সাথে, আমি একটি ক্রমাগত শেখার টাস্ক অগ্রগামী সাদৃশ্যমূলক যুক্তির জন্য। আমরা ভেবেছিলাম যে স্থানান্তর শেখার ধারণা অধ্যয়ন করার জন্য এটি একটি ভাল ক্ষেত্র হবে, যেখানে আপনি দক্ষতা অর্জন করবেন এবং এখন আরও জটিল সমস্যা সমাধানের জন্য আরও জটিল দক্ষতা ব্যবহার করতে হবে। বিশেষত, আমরা পশ্চাৎমুখী স্থানান্তর পরিমাপ করেছি — অতীতে কিছু শেখা ভবিষ্যতে আপনাকে কতটা সাহায্য করে এবং এর বিপরীতে। এবং আমরা স্থানান্তরের জন্য ভাল প্রমাণ পেয়েছি, বস্তুর স্বীকৃতির মতো একটি সাধারণ কাজের চেয়ে অনেক বেশি তাৎপর্যপূর্ণ।

আপনার ল্যাবটি একটি সময়ে একটি উদাহরণ থেকে বা খুব ছোট উদাহরণ থেকে ক্রমাগত শেখার জন্য প্রশিক্ষণ অ্যালগরিদমগুলিতেও ফোকাস করে৷ কিভাবে যে সাহায্য করে?

অনেক ক্রমাগত শেখার সেটআপ এখনও উদাহরণের খুব বড় ব্যাচ ব্যবহার করে। তাই তারা মূলত অ্যালগরিদমকে বলবে, “এখানে 100,000 জিনিস আছে; তাদের শিখুন। এখানে পরবর্তী 100,000 জিনিস; তাদের শিখুন।" আমি যা বলব তা বাস্তব-বিশ্বের অ্যাপ্লিকেশনটির সাথে এটি সত্যিই মেলে না, যা হল, “এখানে একটি নতুন জিনিস; এটা শিখো. এখানে আরেকটি নতুন জিনিস; এটা শিখো."

আমরা যদি চাই যে এআই আমাদের মতো আরও শিখুক, তবে আমাদের কি প্রতিলিপি করা উচিত যে কীভাবে মানুষ বিভিন্ন বয়সে বিভিন্ন জিনিস শিখে, সর্বদা আমাদের জ্ঞানকে পরিমার্জিত করে?

আমি মনে করি যে এই ক্ষেত্রে অগ্রগতি করার জন্য এটি একটি খুব ফলপ্রসূ উপায়। লোকেরা আমাকে বলে যে আমি এখন শুধুমাত্র বিকাশের প্রতি আচ্ছন্ন হয়েছি যে আমার একটি সন্তান আছে, কিন্তু আমি দেখতে পাচ্ছি যে আমার মেয়ে এক-শট শেখার জন্য সক্ষম, যেখানে সে আমাকে একবার কিছু করতে দেখে এবং সে অবিলম্বে তা অনুলিপি করতে পারে। এবং মেশিন লার্নিং অ্যালগরিদম আজকের মত কিছু করতে পারে না।

এটা সত্যিই আমার চোখ খুলে. আমাদের আধুনিক নিউরাল নেটওয়ার্কের তুলনায় আমাদের মাথায় আরও অনেক কিছু চলছে। এই কারণেই আমি মনে করি ক্ষেত্রটিকে সময়ের সাথে সাথে শেখার এই ধারণার দিকে যেতে হবে, যেখানে অ্যালগরিদমগুলি অতীতের অভিজ্ঞতার ভিত্তিতে আরও ভাল শিক্ষার্থী হয়ে ওঠে।

আপনি কি মনে করেন যে এআই কখনও মানুষের মতো একইভাবে শিখবে?

আমি মনে করি তারা করবে. স্পষ্টভাবে. এটি আজকে অনেক বেশি প্রতিশ্রুতিশীল কারণ সেখানে অনেক লোক কাজ করছে। তবে আমাদের আরও সৃজনশীলতা দরকার। মেশিন লার্নিং সম্প্রদায়ের সংস্কৃতির অনেকটাই একটি অনুসরণীয়-নেতা পদ্ধতি।

আমি আমাদেরকে শুধু জৈব রাসায়নিক মেশিন হিসাবে মনে করি, এবং অবশেষে আমরা খুঁজে বের করব কিভাবে সঠিক আর্কিটেকচারের জন্য আমাদের অ্যালগরিদমগুলি তৈরি করা যায় যা আমি মনে করি তাদের আজকের তুলনায় আমাদের ক্ষমতা বেশি থাকবে। আমার পক্ষে কোন বিশ্বাসযোগ্য যুক্তি নেই যা বলে যে এটি অসম্ভব।

সময় স্ট্যাম্প:

থেকে আরো কোয়ান্টাম্যাগাজিন