دانشمند کامپیوتر هوش مصنوعی را برای یادگیری بهتر هوش داده پلاتو بلاک چین به چالش می کشد. جستجوی عمودی Ai.

دانشمند کامپیوتر هوش مصنوعی را برای یادگیری بهتر به چالش می کشد

الگوریتم های هوش مصنوعی به گونه ای طراحی شده اند که به طور همزمان یاد بگیرند. الگوریتم‌ها به‌جای به‌روزرسانی مداوم پایگاه دانش خود با اطلاعات جدید در طول زمان مانند انسان‌ها، فقط در مرحله آموزش می‌توانند یاد بگیرند. پس از آن، دانش آنها ثابت می ماند. آن‌ها وظیفه‌ای را که برای آن آموزش دیده‌اند، انجام می‌دهند، بدون اینکه بتوانند در حین انجام آن به یادگیری ادامه دهند. برای یادگیری حتی یک چیز جدید، الگوریتم ها باید دوباره از ابتدا آموزش داده شوند. گویی هر بار که با یک فرد جدید ملاقات می کنید، تنها راهی که می توانید نام او را یاد بگیرید این است که مغز خود را دوباره راه اندازی کنید.

آموزش از ابتدا می تواند منجر به رفتاری شود که به نام فراموشی فاجعه آمیز شناخته می شود، جایی که یک ماشین دانش جدید را به قیمت فراموش کردن تقریباً همه چیزهایی که قبلاً آموخته است، ترکیب می کند. این وضعیت به دلیل روشی است که قدرتمندترین الگوریتم‌های هوش مصنوعی امروزی، به نام شبکه‌های عصبی، چیزهای جدیدی را یاد می‌گیرند.

این الگوریتم‌ها بر اساس مغز ما هستند، جایی که یادگیری شامل تغییر قدرت اتصالات بین نورون‌ها می‌شود. اما این روند پیچیده می شود. ارتباطات عصبی نیز نشان دهنده دانش گذشته است، بنابراین تغییر بیش از حد آنها باعث فراموشی می شود.

شبکه‌های عصبی بیولوژیکی در طول صدها میلیون سال استراتژی‌هایی را برای اطمینان از پایدار ماندن اطلاعات مهم ایجاد کرده‌اند. اما شبکه های عصبی مصنوعی امروزی در تلاش هستند تا تعادل خوبی بین دانش جدید و قدیمی ایجاد کنند. هنگامی که شبکه داده های جدیدی را می بیند، اتصالات آنها به راحتی بازنویسی می شود، که می تواند منجر به شکست ناگهانی و شدید در شناسایی اطلاعات گذشته شود.

برای کمک به مقابله با این، کریستوفر کانانیک دانشمند کامپیوتر 41 ساله در دانشگاه روچستر، به ایجاد زمینه جدیدی از تحقیقات هوش مصنوعی به نام یادگیری مداوم کمک کرده است. هدف او این است که هوش مصنوعی به یادگیری چیزهای جدید از جریان‌های مداوم داده‌ها ادامه دهد و این کار را بدون فراموش کردن همه چیزهایی که قبلاً آمده است انجام دهد.

کانان تقریباً در تمام زندگی خود با هوش ماشینی بازی کرده است. به عنوان یک کودک در روستایی اوکلاهما که فقط می‌خواست با ماشین‌ها سرگرم شود، به ربات‌ها یاد داد تا بازی‌های رایانه‌ای چند نفره اولیه را انجام دهند. این باعث شد که او در مورد امکان هوش مصنوعی عمومی متعجب شود - ماشینی با توانایی تفکر مانند یک انسان از هر نظر. این باعث شد که او به نحوه کار ذهن علاقه مند شود و قبل از اینکه تحصیلات تکمیلی او را به دانشگاه کالیفرنیا در سن دیگو ببرد، در رشته فلسفه و علوم کامپیوتر در دانشگاه ایالتی اوکلاهاما تحصیل کرد.

اکنون کانان نه تنها در بازی‌های ویدیویی، بلکه در تماشای یادگیری دختر تقریباً ۲ ساله‌اش در مورد جهان، با هر تجربه یادگیری جدید، الهام می‌گیرد. به دلیل کار او و دیگران، فراموشی فاجعه آمیز دیگر به همان اندازه فاجعه آمیز نیست.

کوانتوم با کانان در مورد حافظه های ماشینی، شکستن قوانین آموزش شبکه های عصبی و اینکه آیا هوش مصنوعی هرگز به یادگیری در سطح انسانی دست می یابد صحبت کرد. مصاحبه برای وضوح فشرده و ویرایش شده است.

آموزش شما در فلسفه چگونه بر طرز فکر شما در مورد کارتان تأثیر می گذارد؟

این به من به عنوان یک دانشگاهی بسیار خوب خدمت کرده است. فلسفه به شما می‌آموزد: «چگونه استدلال‌های مستدل می‌سازید» و «چگونه استدلال‌های دیگران را تحلیل می‌کنید؟» این بسیاری از کارهایی است که شما در علم انجام می دهید. من هنوز مقالاتی از آن زمان در مورد شکست در آزمون تورینگ و چیزهایی از این دست دارم. و بنابراین به این چیزها من هنوز هم خیلی به آنها فکر می کنم.

آزمایشگاه من از پرسیدن این سوال الهام گرفته شده است: خوب، اگر ما نمی توانیم X را انجام دهیم، چگونه می توانیم Y را انجام دهیم؟ ما در طول زمان یاد می گیریم، اما شبکه های عصبی، به طور کلی، این کار را نمی کنند. شما یک بار آنها را آموزش می دهید. بعد از آن یک موجودیت ثابت است. و این یک چیز اساسی است که اگر بخواهید روزی هوش عمومی مصنوعی بسازید باید آن را حل کنید. اگر نتواند بدون به هم زدن مغزش و شروع مجدد از ابتدا یاد بگیرد، واقعاً به آنجا نخواهید رسید، درست است؟ این برای من یک قابلیت پیش نیاز است.

محققان تاکنون چگونه با فراموشی فاجعه آمیز برخورد کرده اند؟

موفق ترین روش، به نام replay، تجربیات گذشته را ذخیره می کند و سپس آنها را در طول آموزش با مثال های جدید بازپخش می کند تا گم نشوند. این از تثبیت حافظه در مغز ما الهام گرفته شده است، جایی که در طول خواب، رمزگذاری های سطح بالای فعالیت های روز با فعال شدن مجدد نورون ها "بازپخش" می شوند.

به عبارت دیگر، برای الگوریتم‌ها، یادگیری جدید نمی‌تواند به طور کامل یادگیری گذشته را از بین ببرد، زیرا ما در حال اختلاط در تجربیات ذخیره‌شده گذشته هستیم.

سه سبک برای انجام این کار وجود دارد. رایج‌ترین سبک، «بازپخش واقعی» است، که در آن محققان زیرمجموعه‌ای از ورودی‌های خام را ذخیره می‌کنند - به عنوان مثال، تصاویر اصلی برای یک کار تشخیص شی - و سپس آن تصاویر ذخیره‌شده از گذشته را با تصاویر جدید ترکیب می‌کنند تا یاد بگیرند. روش دوم بازنمودهای فشرده شده تصاویر را بازپخش می کند. سومین روش بسیار کمتر رایج «بازپخش مولد» است. در اینجا، یک شبکه عصبی مصنوعی در واقع یک نسخه مصنوعی از یک تجربه گذشته تولید می‌کند و سپس آن نمونه مصنوعی را با نمونه‌های جدید ترکیب می‌کند. آزمایشگاه من روی دو روش آخر تمرکز کرده است.

متاسفانه، با این حال، پخش مجدد راه حل چندان رضایت بخشی نیست.

چرا که نه؟

برای یادگیری چیزی جدید، شبکه عصبی باید حداقل برخی از اطلاعات را در مورد هر مفهومی که در گذشته یاد گرفته است ذخیره کند. و از منظر علم اعصاب، فرضیه این است که من و شما یک تجربه نسبتاً اخیر - نه چیزی که در دوران کودکی ما اتفاق افتاده است - را برای جلوگیری از فراموشی آن تجربه اخیر تکرار می کنیم. در حالی که به روشی که ما آن را در شبکه های عصبی عمیق انجام می دهیم، این درست نیست. لزوماً لازم نیست همه چیزهایی را که دیده است ذخیره کند، اما برای استفاده از پخش مجدد باید در مورد هر کاری که در گذشته یاد گرفته است چیزی را ذخیره کند. و معلوم نیست چه چیزی را باید ذخیره کند. بنابراین به نظر می‌رسد که بازپخش آن‌طور که امروز انجام می‌شود، هنوز تمام نشده است.

اگر بتوانیم فراموشی فاجعه بار را به طور کامل حل کنیم، آیا این بدان معناست که هوش مصنوعی می تواند به طور مداوم در طول زمان چیزهای جدیدی بیاموزد؟

نه دقیقا. فکر می‌کنم سؤالات باز بزرگ، بزرگ و بزرگ در زمینه یادگیری مستمر در فراموشی فاجعه‌بار نیستند. چیزی که من واقعاً به آن علاقه دارم این است: چگونه یادگیری گذشته یادگیری آینده را کارآمدتر می کند؟ و چگونه یادگیری چیزی در آینده، آموخته های گذشته را اصلاح می کند؟ اینها چیزهایی هستند که خیلی از مردم آن را اندازه گیری نمی کنند، و من فکر می کنم انجام این کار بخش مهمی از پیشبرد میدان است، زیرا در واقع، فقط فراموش کردن چیزها نیست. این در مورد تبدیل شدن به یک یادگیرنده بهتر است.

اینجاست که فکر می کنم مزرعه به نوعی جنگل را برای درختان تنگ کرده است. بسیاری از جامعه این مشکل را به گونه‌ای تنظیم می‌کنند که با پرسش‌های جالب بیولوژیکی یا کاربردهای مهندسی جالب مطابقت ندارد. ما نمی توانیم همه را مجبور کنیم که مشکل اسباب بازی یکسانی را برای همیشه انجام دهند. شما باید بگویید: تکلیف دستکش ما چیست؟ چگونه همه چیز را جلو ببریم؟

پس چرا فکر می کنید اکثر مردم بر روی آن مشکلات ساده تمرکز می کنند؟

من فقط می توانم حدس بزنم. بیشتر کارها توسط دانش آموزانی انجام می شود که کارهای گذشته را دنبال می کنند. آنها از تنظیمات کارهایی که دیگران انجام داده‌اند کپی می‌کنند و با همان اندازه‌گیری‌ها، دستاوردهای جزئی در عملکرد نشان می‌دهند. ایجاد الگوریتم‌های جدید به احتمال زیاد منجر به انتشار می‌شود، حتی اگر آن الگوریتم‌ها واقعاً ما را قادر به پیشرفت چشمگیر در یادگیری مداوم نکنند. چیزی که من را شگفت‌زده می‌کند این است که همین نوع کار توسط شرکت‌های بزرگی تولید می‌شود که انگیزه‌های یکسانی ندارند، به‌جز کارهای کارآموز.

همچنین این کار بی اهمیت است. برای سنجش اینکه آیا یادگیری گذشته به یادگیری آینده کمک می کند یا خیر، باید آزمایش صحیح و تنظیم الگوریتمی را ایجاد کنیم. مسئله بزرگ این است که در حال حاضر مجموعه داده های خوبی برای مطالعه یادگیری مستمر نداریم. منظورم این است که ما اساساً مجموعه داده‌های موجود را که در یادگیری ماشینی سنتی استفاده می‌شوند، می‌گیریم و آنها را تغییر کاربری می‌دهیم.

اساساً، در اصول یادگیری ماشینی (یا حداقل هر زمان که آموزش یادگیری ماشین را شروع می‌کنم)، ما یک مجموعه آموزشی داریم، یک مجموعه آزمایشی داریم - ما روی مجموعه آموزشی تمرین می‌کنیم، روی مجموعه تست آزمایش می‌کنیم. یادگیری مداوم این قوانین را زیر پا می گذارد. سپس مجموعه آموزشی شما به چیزی تبدیل می شود که با یادگیری زبان آموز تکامل می یابد. اما ما هنوز به مجموعه داده های موجود محدود هستیم. ما باید روی این موضوع کار کنیم. ما به یک محیط یادگیری مستمر واقعاً خوب نیاز داریم که در آن واقعاً بتوانیم خود را تحت فشار قرار دهیم.

محیط ایده آل یادگیری مداوم چگونه خواهد بود؟

گفتن این که چه چیزی نیست آسان تر است تا اینکه چه چیزی هست. من در یک پانل بودم که این مشکل را به‌عنوان یک مشکل مهم شناسایی کردیم، اما فکر می‌کنم کسی فوراً پاسخ آن را داشته باشد، این مشکلی نیست.

من می توانم خواص آن را به شما بگویم. بنابراین در حال حاضر، فرض کنیم الگوریتم‌های هوش مصنوعی اینطور نیستند عوامل تجسم یافته در شبیه سازی حداقل، در حالت ایده‌آل، ما از ویدیوها، یا چیزی شبیه به آن، مانند جریان‌های ویدیویی چندوجهی، یاد می‌گیریم، و امیدواریم چیزی فراتر از طبقه‌بندی [تصاویر استاتیک] انجام دهیم.

سوالات باز زیادی در این مورد وجود دارد. من چند سال پیش در یک کارگاه یادگیری مستمر بودم و برخی از افراد مانند من می‌گفتند، "ما باید استفاده از مجموعه داده‌ای به نام MNIST را متوقف کنیم، این خیلی ساده است." و سپس شخصی گفت: "خوب، خوب، بیایید آموزش تدریجی [بازی ویدئویی مبتنی بر استراتژی] StarCraft را انجام دهیم." و من هم اکنون به دلایل مختلف این کار را انجام می‌دهم، اما فکر نمی‌کنم واقعاً این کار را انجام دهم. زندگی چیز بسیار غنی تر از یادگیری بازی StarCraft است.

آزمایشگاه شما چگونه سعی کرده است الگوریتم هایی طراحی کند که بتواند در طول زمان به یادگیری ادامه دهد؟

با شاگرد سابقم تایلر هیز، من پیشگام یک کار یادگیری مستمر است برای استدلال قیاسی ما فکر کردیم که این زمینه خوبی برای مطالعه ایده یادگیری انتقالی است، جایی که شما مهارت‌ها را کسب می‌کنید و اکنون باید از مهارت‌های پیچیده‌تر برای حل مسائل پیچیده‌تر استفاده کنید. به طور خاص، ما انتقال به عقب را اندازه‌گیری کردیم - یادگیری چیزی در گذشته چقدر به شما در آینده کمک می‌کند و بالعکس. و ما شواهد خوبی برای انتقال پیدا کردیم، بسیار مهمتر از یک کار ساده مانند تشخیص شی.

آزمایشگاه شما همچنین بر الگوریتم‌های آموزشی تمرکز می‌کند تا به طور مداوم از یک مثال در یک زمان یا از مجموعه‌های بسیار کوچکی از مثال‌ها یاد بگیرد. چگونه کمک می کند؟

بسیاری از راه‌اندازی‌های یادگیری مستمر هنوز از نمونه‌های بسیار بزرگی استفاده می‌کنند. بنابراین آنها اساساً به الگوریتم خواهند گفت: «در اینجا 100,000 چیز وجود دارد. آنها را یاد بگیرند در اینجا 100,000 چیز بعدی آمده است. آنها را یاد بگیرید.» این واقعاً با آنچه که من می‌گویم برنامه دنیای واقعی است، مطابقت ندارد. یاد بگیر. در اینجا یک چیز جدید دیگر وجود دارد. یاد بگیر."

اگر می‌خواهیم هوش مصنوعی مانند ما بیشتر بیاموزد، آیا باید هدفمان این باشد که چگونه انسان‌ها در سنین مختلف چیزهای مختلف یاد می‌گیرند و همیشه دانش ما را اصلاح می‌کنند؟

من فکر می کنم این یک راه بسیار مفید برای پیشرفت در این زمینه است. مردم به من می گویند که الان که بچه دارم فقط وسواس رشد دارم، اما می توانم ببینم که دخترم توانایی یادگیری یکباره را دارد، جایی که می بیند من یک بار کاری انجام می دهم و بلافاصله می تواند آن را کپی کند. و امروزه الگوریتم های یادگیری ماشینی نمی توانند چنین کاری را انجام دهند.

واقعا چشمامو باز کرد باید در ذهن ما خیلی بیشتر از شبکه های عصبی مدرن ما اتفاق بیفتد. به همین دلیل است که فکر می‌کنم این رشته باید در طول زمان به سمت این ایده یادگیری برود، جایی که الگوریتم‌ها با ایجاد تجربیات گذشته، یادگیرندگان بهتری می‌شوند.

آیا فکر می‌کنید هوش مصنوعی هرگز به همان روشی که انسان‌ها یاد می‌گیرند، خواهد آموخت؟

من فکر می کنم آنها خواهند شد. قطعا. امروز بسیار امیدوارکننده‌تر است زیرا افراد زیادی در این زمینه کار می‌کنند. اما همچنان به خلاقیت بیشتری نیاز داریم. بسیاری از فرهنگ موجود در جامعه یادگیری ماشینی رویکرد پیرو رهبر است.

من ما را فقط ماشین‌های بیوشیمیایی می‌دانم و در نهایت خواهیم فهمید که چگونه الگوریتم‌هایمان را برای معماری‌های درست بسازیم که فکر می‌کنم توانایی‌های ما بیشتر از امروز است. هیچ استدلال قانع کننده ای برای من وجود ندارد که بگوید غیرممکن است.

تمبر زمان:

بیشتر از مجله کوانتاما