কিছু নিউরাল নেটওয়ার্ক মানুষের মত ভাষা শিখে | কোয়ান্টা ম্যাগাজিন

কিছু নিউরাল নেটওয়ার্ক মানুষের মত ভাষা শিখে | কোয়ান্টা ম্যাগাজিন

Some Neural Networks Learn Language Like Humans | Quanta Magazine PlatoBlockchain Data Intelligence. Vertical Search. Ai.

ভূমিকা

মস্তিষ্ক কিভাবে শিখে? এটি একটি রহস্য, যা আমাদের মাথার খুলির স্পঞ্জী অঙ্গ এবং আমাদের মেশিনে তাদের ডিজিটাল প্রতিরূপ উভয় ক্ষেত্রেই প্রযোজ্য। যদিও কৃত্রিম নিউরাল নেটওয়ার্ক (ANNs) কৃত্রিম নিউরনের বিস্তৃত জাল থেকে তৈরি করা হয়, আমাদের মস্তিষ্ক যেভাবে তথ্য প্রক্রিয়া করে তা দৃশ্যত অনুকরণ করে, আমরা জানি না তারা একইভাবে ইনপুট প্রক্রিয়া করে কিনা।   

"মানুষের মতো স্নায়ু নেটওয়ার্কগুলি একইভাবে শেখে কিনা তা নিয়ে দীর্ঘকাল ধরে বিতর্ক রয়েছে," বলেছেন ভেসেভোলোড কাপাতসিনস্কি, ওরেগন বিশ্ববিদ্যালয়ের একজন ভাষাবিদ।

এখন, একটি গবেষণা প্রকাশিত গত মাসে পরামর্শ দেয় যে প্রাকৃতিক এবং কৃত্রিম নেটওয়ার্কগুলি একইভাবে শেখে, অন্তত যখন এটি ভাষার ক্ষেত্রে আসে। গবেষক-এর নেতৃত্বে ড গ্যাস্পার বেগুস, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের একজন কম্পিউটেশনাল ভাষাবিদ, বার্কলে — মানুষের মস্তিষ্কের তরঙ্গ একটি সাধারণ শব্দ শোনার সাথে একই শব্দ বিশ্লেষণ করে একটি নিউরাল নেটওয়ার্ক দ্বারা উত্পাদিত সংকেতের সাথে তুলনা করেছেন। ফলাফল অস্বাভাবিকভাবে একই ছিল. "আমাদের জানামতে," বেগুস এবং তার সহকর্মীরা লিখেছেন, একই উদ্দীপকের পর্যবেক্ষণ প্রতিক্রিয়াগুলি "এখন পর্যন্ত রিপোর্ট করা সবচেয়ে অনুরূপ মস্তিষ্ক এবং ANN সংকেত।"

সবচেয়ে উল্লেখযোগ্যভাবে, গবেষকরা সাধারণ-উদ্দেশ্য নিউরনগুলি দিয়ে তৈরি নেটওয়ার্কগুলি পরীক্ষা করেছেন যা বিভিন্ন কাজের জন্য উপযুক্ত। "তারা দেখায় যে এমনকি খুব সাধারণ নেটওয়ার্কগুলি, যেগুলির বক্তৃতা বা অন্য কোনও শব্দের জন্য কোনও বিবর্তিত পক্ষপাত নেই, তবুও মানুষের স্নায়ু কোডিংয়ের সাথে একটি সঙ্গতি দেখায়," বলেন গ্যারি লুপিয়ান, উইসকনসিন, ম্যাডিসন বিশ্ববিদ্যালয়ের একজন মনোবিজ্ঞানী যিনি কাজের সাথে জড়িত ছিলেন না। ফলাফলগুলি কেবল ANNগুলি কীভাবে শেখে তা রহস্যময় করতে সহায়তা করে না, তবে এটিও পরামর্শ দেয় যে মানুষের মস্তিষ্ক ইতিমধ্যে ভাষার জন্য বিশেষভাবে ডিজাইন করা হার্ডওয়্যার এবং সফ্টওয়্যার দিয়ে সজ্জিত নাও হতে পারে।

তুলনার মানবিক দিকটির জন্য একটি বেসলাইন স্থাপন করার জন্য, গবেষকরা 14 জন ইংরেজি ভাষাভাষী এবং 15 জন স্প্যানিশ স্পিকারের জন্য দুটি আট মিনিটের ব্লকে বারবার একটি একক সিলেবল - "বাহ" বাজালেন। এটি বাজানোর সময়, গবেষকরা প্রতিটি শ্রোতার মস্তিষ্কের নিউরনের গড় বৈদ্যুতিক কার্যকলাপে ওঠানামা রেকর্ড করেছেন - মস্তিষ্কের সেই অংশ যেখানে শব্দগুলি প্রথমে প্রক্রিয়া করা হয়।

উপরন্তু, গবেষকরা একই "বাহ" শব্দ দুটি ভিন্ন ভিন্ন সেট নিউরাল নেটওয়ার্কে খাওয়ান - একটি ইংরেজি শব্দে প্রশিক্ষিত, অন্যটি স্প্যানিশ ভাষায়। গবেষকরা তারপরে নিউরাল নেটওয়ার্কের প্রক্রিয়াকরণ কার্যকলাপ রেকর্ড করেন, নেটওয়ার্কের স্তরের কৃত্রিম নিউরনের উপর ফোকাস করে যেখানে শব্দগুলি প্রথমে বিশ্লেষণ করা হয় (মস্তিষ্কের রিডিংগুলিকে মিরর করার জন্য)। এই সংকেতগুলিই মানুষের মস্তিষ্কের তরঙ্গের সাথে ঘনিষ্ঠভাবে মিলেছিল।

গবেষকরা জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক (GAN) নামে পরিচিত এক ধরনের নিউরাল নেটওয়ার্ক আর্কিটেকচার বেছে নিয়েছেন, যা মূলত ছবি তৈরি করার জন্য 2014 সালে উদ্ভাবিত হয়েছিল। একটি GAN দুটি নিউরাল নেটওয়ার্কের সমন্বয়ে গঠিত - একটি বৈষম্যকারী এবং একটি জেনারেটর - যা একে অপরের বিরুদ্ধে প্রতিদ্বন্দ্বিতা করে। জেনারেটর একটি নমুনা তৈরি করে, যা একটি চিত্র বা একটি শব্দ হতে পারে। বৈষম্যকারী নির্ধারণ করে যে এটি একটি প্রশিক্ষণের নমুনার কতটা কাছাকাছি এবং প্রতিক্রিয়া প্রদান করে, যার ফলে জেনারেটর থেকে আরেকটি চেষ্টা করা হয় এবং যতক্ষণ না GAN পছন্দসই আউটপুট প্রদান করতে পারে।.

এই গবেষণায়, বৈষম্যকারীকে প্রাথমিকভাবে ইংরেজি বা স্প্যানিশ শব্দের সংগ্রহের উপর প্রশিক্ষণ দেওয়া হয়েছিল। তারপরে জেনারেটর - যা কখনও সেই শব্দগুলি শোনেনি - তাদের উত্পাদন করার একটি উপায় খুঁজে বের করতে হয়েছিল। এটি এলোমেলো শব্দ তৈরি করে শুরু হয়েছিল, কিন্তু বৈষম্যকারীর সাথে প্রায় 40,000 রাউন্ড মিথস্ক্রিয়া করার পরে, জেনারেটরটি আরও ভাল হয়ে ওঠে, অবশেষে সঠিক শব্দ তৈরি করে। এই প্রশিক্ষণের ফলস্বরূপ, বৈষম্যকারীও প্রকৃত এবং উত্পন্নের মধ্যে পার্থক্য করতে আরও ভাল হয়েছে।

এই মুহুর্তে, বৈষম্যকারীকে সম্পূর্ণভাবে প্রশিক্ষিত করার পরে, গবেষকরা এটিকে "বাহ" ধ্বনি বাজিয়েছিলেন। দলটি বৈষম্যকারীর কৃত্রিম নিউরনের গড় কার্যকলাপের স্তরের ওঠানামা পরিমাপ করেছে, যা মানুষের মস্তিষ্কের তরঙ্গের মতোই সংকেত তৈরি করে।

মানব এবং মেশিনের কার্যকলাপের স্তরের মধ্যে এই সাদৃশ্যটি প্রস্তাব করেছে যে দুটি সিস্টেম একই ধরনের কার্যকলাপে জড়িত। "যেমন গবেষণায় দেখা গেছে যে যত্নশীলদের কাছ থেকে প্রতিক্রিয়া শিশুর শব্দের উত্পাদনকে আকার দেয়, তেমনি বৈষম্যকারী নেটওয়ার্ক থেকে প্রতিক্রিয়া জেনারেটর নেটওয়ার্কের শব্দ উত্পাদনকে আকার দেয়," বলেছেন কাপাতসিনস্কি, যিনি গবেষণায় অংশ নেননি।

পরীক্ষাটি মানুষ এবং মেশিনের মধ্যে আরেকটি আকর্ষণীয় সমান্তরাল প্রকাশ করেছে। মস্তিষ্কের তরঙ্গগুলি দেখায় যে ইংরেজি- এবং স্প্যানিশ-ভাষী অংশগ্রহণকারীরা "বাহ" শব্দটি ভিন্নভাবে শুনেছে (স্প্যানিশ ভাষাভাষীরা "পাহ" বেশি শুনেছেন), এবং GAN-এর সংকেতগুলিও দেখায় যে ইংরেজি-প্রশিক্ষিত নেটওয়ার্ক শব্দগুলিকে কিছুটা ভিন্নভাবে প্রক্রিয়া করে। স্প্যানিশ-প্রশিক্ষিত একজন।

"এবং এই পার্থক্যগুলি একই দিকে কাজ করে," বেগুস ব্যাখ্যা করেছিলেন। ইংরেজি ভাষাভাষীদের ব্রেনস্টেম স্প্যানিশ স্পিকারদের ব্রেইনস্টেমের চেয়ে কিছুটা আগে "বাহ" শব্দে সাড়া দেয় এবং ইংরেজিতে প্রশিক্ষিত GAN স্প্যানিশ-প্রশিক্ষিত মডেলের চেয়ে কিছুটা আগে একই শব্দে সাড়া দেয়। মানুষ এবং মেশিন উভয়ের মধ্যে, সময়ের পার্থক্য ছিল প্রায় অভিন্ন, মোটামুটি এক সেকেন্ডের এক হাজার ভাগ। এটি অতিরিক্ত প্রমাণ দিয়েছে, বেগুস বলেছেন, মানুষ এবং কৃত্রিম নেটওয়ার্কগুলি "সম্ভবত একই পদ্ধতিতে জিনিসগুলিকে প্রক্রিয়াজাত করছে।"

ভূমিকা

যদিও এটি এখনও স্পষ্ট নয় যে মস্তিষ্ক কীভাবে ভাষা প্রক্রিয়া করে এবং শেখে, ভাষাবিদ নোয়াম চমস্কি 1950-এর দশকে প্রস্তাব করেছিলেন যে মানুষ ভাষা বোঝার একটি সহজাত এবং অনন্য ক্ষমতা নিয়ে জন্মগ্রহণ করে। চমস্কি যুক্তি দিয়েছিলেন যে এই ক্ষমতাটি মানুষের মস্তিষ্কে আক্ষরিক অর্থে শক্তভাবে জড়িত।

নতুন কাজ, যা সাধারণ-উদ্দেশ্যের নিউরন ব্যবহার করে যা ভাষার জন্য ডিজাইন করা হয়নি, অন্যথায় পরামর্শ দেয়। "কাগজটি অবশ্যই এই ধারণার বিরুদ্ধে প্রমাণ সরবরাহ করে যে বক্তৃতার জন্য বিশেষ অন্তর্নির্মিত যন্ত্রপাতি এবং অন্যান্য স্বতন্ত্র বৈশিষ্ট্যগুলির প্রয়োজন হয়," কাপাতসিনস্কি বলেছিলেন।

বেগুস স্বীকার করেছেন যে এই বিতর্ক এখনও নিষ্পত্তি হয়নি। ইতিমধ্যে, তিনি পরীক্ষার মাধ্যমে মানব মস্তিষ্ক এবং নিউরাল নেটওয়ার্কগুলির মধ্যে সমান্তরালগুলি আরও অন্বেষণ করছেন, উদাহরণস্বরূপ, সেরিব্রাল কর্টেক্স থেকে আগত মস্তিষ্কের তরঙ্গগুলি (যা ব্রেনস্টেম তার অংশটি সম্পন্ন করার পরে শ্রবণ প্রক্রিয়া সম্পন্ন করে) গভীরতর দ্বারা উত্পাদিত সংকেতের সাথে সামঞ্জস্যপূর্ণ কিনা। GAN এর স্তরগুলি।

শেষ পর্যন্ত, বেগুস এবং তার দল একটি নির্ভরযোগ্য ভাষা-অধিগ্রহণ মডেল তৈরি করার আশা করে যা বর্ণনা করে যে কীভাবে মেশিন এবং মানুষ উভয়ই ভাষা শিখে, মানুষের বিষয়গুলির সাথে অসম্ভব হতে পারে এমন পরীক্ষার অনুমতি দেয়। "উদাহরণস্বরূপ, আমরা একটি প্রতিকূল পরিবেশ তৈরি করতে পারি [যেমন অবহেলিত শিশুদের সাথে দেখা যায়] এবং দেখতে পারি যে এটি ভাষার ব্যাধিগুলির মতো কিছুর দিকে নিয়ে যায় কিনা," বলেন ক্রিস্টিনা ঝাও, ওয়াশিংটন বিশ্ববিদ্যালয়ের একজন স্নায়ুবিজ্ঞানী যিনি বেগুসের সাথে নতুন গবেষণাপত্রটির সহ-লেখক এবং অ্যালান ঝু, জনস হপকিন্স বিশ্ববিদ্যালয়ের একজন ডক্টরেট ছাত্র।

"আমরা এখন দেখার চেষ্টা করছি যে আমরা কতদূর যেতে পারি, আমরা সাধারণ-উদ্দেশ্য নিউরনগুলির সাথে মানুষের ভাষার কতটা কাছাকাছি যেতে পারি," বেগুস বলেছিলেন। "আমরা কি আমাদের কম্পিউটেশনাল আর্কিটেকচারের সাথে মানবিক স্তরের পারফরম্যান্সে পৌঁছতে পারি - শুধুমাত্র আমাদের সিস্টেমগুলিকে আরও বড় এবং আরও শক্তিশালী করে - বা এটি কখনই সম্ভব হবে না?" যদিও আমরা নিশ্চিতভাবে জানতে পারার আগে আরও কাজ করা প্রয়োজন, তিনি বলেছিলেন, "আমরা অবাক হয়েছি, এমনকি এই অপেক্ষাকৃত প্রাথমিক পর্যায়ে, এই সিস্টেমগুলির অভ্যন্তরীণ কাজগুলি - মানব এবং এএনএন - কতটা একই রকম বলে মনে হচ্ছে।"

সময় স্ট্যাম্প:

থেকে আরো কোয়ান্টাম্যাগাজিন