هوش مصنوعی جدید «الهام گرفته از فیزیک» فراتر از انتظارات است | مجله کوانتا

هوش مصنوعی جدید «الهام گرفته از فیزیک» فراتر از انتظارات است | مجله کوانتا

هوش مصنوعی جدید «الهام گرفته از فیزیک» فراتر از انتظارات است | Quanta Magazine PlatoBlockchain Data Intelligence. جستجوی عمودی Ai.

معرفی

ابزارهای هوش مصنوعی - به ویژه شبکه های عصبی - برای فیزیکدانان خوب بوده است. برای سال‌ها، این فناوری به محققان کمک کرده است تا مسیرهای ذرات را در آزمایش‌های شتاب‌دهنده بازسازی کنند، شواهدی از ذرات جدید را جستجو کنند و امواج گرانشی و سیارات فراخورشیدی را شناسایی کنند. در حالی که ابزارهای هوش مصنوعی به وضوح می توانند کارهای زیادی را برای فیزیکدانان انجام دهند، اکنون به گفته مکس تگمارک، فیزیکدان موسسه فناوری ماساچوست، سوال این است: "آیا می توانیم چیزی را پس بدهیم؟"

تگمارک بر این باور است که همتایان فیزیکدان او می توانند سهم قابل توجهی در علم هوش مصنوعی داشته باشند و او این را اولویت اصلی تحقیقاتی خود قرار داده است. به گفته او، یکی از راه‌هایی که فیزیکدانان می‌توانند به پیشرفت فناوری هوش مصنوعی کمک کنند، جایگزینی الگوریتم‌های «جعبه سیاه» شبکه‌های عصبی است که عملکرد آن تا حد زیادی غیرقابل درک است و معادلات فرآیندهای فیزیکی به خوبی درک شده است.

ایده کاملاً جدید نیست. مدل های مولد هوش مصنوعی بر اساس انتشار - فرآیندی که به عنوان مثال باعث می شود شیر ریخته شده در یک فنجان قهوه به طور یکنواخت پخش شود - اولین بار در سال 2015 ظاهر شد و کیفیت تصاویر تولید شده توسط آنها به طور قابل توجهی بهبود یافته است. این فناوری به نرم افزارهای تولید تصویر معروف مانند DALL·E 2 و Midjourney قدرت می دهد. اکنون، تگمارک و همکارانش در حال یادگیری هستند که آیا دیگر مدل‌های مولد الهام‌گرفته از فیزیک ممکن است به خوبی مدل‌های مبتنی بر انتشار یا حتی بهتر عمل کنند.

اواخر سال گذشته، تیم Tegmark یک روش جدید امیدوارکننده برای تولید تصاویر به نام the را معرفی کرد مدل مولد جریان پواسون (PFGM). در آن، داده ها با ذرات باردار نشان داده می شوند، که ترکیب می شوند و میدان الکتریکی ایجاد می کنند که خواص آن به توزیع بارها در هر لحظه بستگی دارد. این مدل جریان پواسون نامیده می شود زیرا حرکت بارها توسط معادله پواسون کنترل می شود، که از این اصل ناشی می شود که بیان می کند نیروی الکترواستاتیک بین دو بار برعکس مجذور فاصله بین آنها تغییر می کند (شبیه به فرمول گرانش نیوتنی). .

این فرآیند فیزیکی در قلب PFGM قرار دارد. مدل ما را می توان تقریباً به طور کامل با قدرت و جهت میدان الکتریکی در هر نقطه از فضا مشخص کرد ییلون شو، دانشجوی کارشناسی ارشد در MIT و یکی از نویسندگان مقاله. چیزی که شبکه عصبی در طول فرآیند آموزش می‌آموزد این است که چگونه میدان الکتریکی را تخمین بزند. و با انجام این کار، می‌تواند خلق تصاویر را بیاموزد، زیرا یک تصویر در این مدل را می‌توان به طور خلاصه با یک میدان الکتریکی توصیف کرد.

معرفی

PFGM می تواند تصاویری با همان کیفیتی که با رویکردهای مبتنی بر انتشار تولید می شود ایجاد کند و این کار را 10 تا 20 برابر سریعتر انجام دهد. گفت: «این یک ساختار فیزیکی، میدان الکتریکی، به گونه‌ای که قبلاً ندیده‌ایم، استفاده می‌کند.» هانانل هازان، دانشمند کامپیوتر در دانشگاه تافتس. "این دریچه را به روی امکان استفاده از پدیده های فیزیکی دیگر برای بهبود شبکه های عصبی ما باز می کند."

مدل‌های دیفیوژن و جریان پواسون، علاوه بر این که مبتنی بر معادلات وارد شده از فیزیک هستند، اشتراکات زیادی دارند. در طول آموزش، یک مدل انتشار که برای تولید تصویر طراحی شده است، معمولاً با یک تصویر شروع می‌شود - مثلاً یک سگ - و سپس نویز بصری اضافه می‌کند و هر پیکسل را به‌طور تصادفی تغییر می‌دهد تا زمانی که ویژگی‌های آن کاملاً پوشانده شود (البته کاملاً حذف نشود). سپس مدل تلاش می‌کند تا روند را معکوس کند و سگی نزدیک به نمونه اصلی تولید کند. پس از آموزش، این مدل می‌تواند با موفقیت سگ‌ها و سایر تصاویر را با شروع از یک بوم به ظاهر خالی خلق کند.

مدل‌های جریان پواسون تقریباً به همین شکل عمل می‌کنند. در طول آموزش، یک فرآیند رو به جلو وجود دارد که شامل اضافه کردن نویز، به صورت تدریجی، به یک تصویر یکبار شارپ، و یک فرآیند معکوس است که در آن مدل تلاش می‌کند تا آن نویز را گام به گام حذف کند تا زمانی که نسخه اولیه بیشتر بازیابی شود. همانند تولید مبتنی بر انتشار، سیستم در نهایت یاد می‌گیرد که تصاویری بسازد که هرگز در آموزش ندیده است.

اما فیزیک زیربنای مدل‌های پواسون کاملاً متفاوت است. انتشار توسط نیروهای ترمودینامیکی هدایت می شود، در حالی که جریان پواسون توسط نیروهای الکترواستاتیک هدایت می شود. دومی تصویری دقیق را با استفاده از آرایش بارها نشان می دهد که می تواند یک میدان الکتریکی بسیار پیچیده ایجاد کند. با این حال، این میدان باعث می شود که در طول زمان بارها به طور یکنواخت پخش شوند - درست همانطور که شیر به طور طبیعی در یک فنجان قهوه پخش می شود. نتیجه این است که خود میدان ساده تر و یکنواخت تر می شود. اما این میدان یکنواخت پر سر و صدا یک صفحه خالی کامل نیست. همچنان حاوی بذرهای اطلاعاتی است که می توان تصاویر را به آسانی جمع آوری کرد.

در اوایل سال 2023، تیم مدل پواسون خود را ارتقا داد. تمدید کردن آن یک خانواده کامل از مدل ها را در بر می گیرد. نسخه افزوده شده، PFGM++، شامل یک پارامتر جدید است، D، که به محققان اجازه می دهد ابعاد سیستم را تنظیم کنند. این می تواند تفاوت بزرگی ایجاد کند: در فضای سه بعدی آشنا، قدرت میدان الکتریکی تولید شده توسط یک بار با مجذور فاصله از آن بار رابطه معکوس دارد. اما در چهار بعد، قدرت میدان از قانون مکعب معکوس پیروی می کند. و برای هر بعد از فضا، و هر ارزشی از D، این رابطه تا حدودی متفاوت است.

معرفی

این نوآوری به مدل‌های جریان پواسون تنوع بسیار بیشتری داد، با موارد شدید که مزایای متفاوتی را ارائه می‌دهند. چه زمانی D پایین است، به عنوان مثال، مدل قوی تر است، به این معنی که نسبت به خطاهای ایجاد شده در تخمین میدان الکتریکی تحمل بیشتری دارد. گفت: «این مدل نمی‌تواند میدان الکتریکی را کاملاً پیش‌بینی کند زیمینگ لیو، یکی دیگر از دانشجویان فارغ التحصیل در MIT و یکی از نویسندگان هر دو مقاله. همیشه مقداری انحراف وجود دارد. اما استحکام به این معنی است که حتی اگر خطای تخمین شما زیاد باشد، باز هم می توانید تصاویر خوبی تولید کنید. بنابراین ممکن است در نهایت به سگ رویاهای خود نرسید، اما همچنان به چیزی شبیه سگ خواهید رسید.

در نهایت، زمانی که D بالا باشد، آموزش شبکه عصبی آسان‌تر می‌شود و برای تسلط بر مهارت‌های هنری خود به داده‌های کمتری نیاز دارد. توضیح دلیل دقیق آن آسان نیست، اما به این دلیل است که وقتی ابعاد بیشتری وجود دارد، مدل دارای میدان های الکتریکی کمتری برای پیگیری است - و در نتیجه داده های کمتری برای جذب دارد.

مدل پیشرفته، PFGM++، به شما انعطاف پذیری برای درون یابی بین این دو حد را می دهد. رز یو، دانشمند کامپیوتر در دانشگاه کالیفرنیا، سن دیگو.

و جایی در این محدوده یک مقدار ایده آل برای نهفته است D خو گفت که تعادل مناسبی بین استحکام و سهولت تمرین ایجاد می کند. یکی از اهداف کار آینده این خواهد بود که روشی منظم برای یافتن آن نقطه شیرین پیدا کنیم، تا بتوانیم بهترین راه ممکن را انتخاب کنیم. D برای یک موقعیت خاص بدون توسل به آزمون و خطا."

هدف دیگر محققان MIT شامل یافتن فرآیندهای فیزیکی بیشتر است که می‌تواند پایه‌ای را برای خانواده‌های جدید مدل‌های مولد فراهم کند. از طریق پروژه ای به نام GenPhys، تیم قبلاً یک نامزد امیدوار کننده را شناسایی کرده است: پتانسیل یوکاوا که به نیروی هسته ای ضعیف مربوط می شود. لیو گفت: «این با مدل‌های جریان و انتشار پواسون، که در آن تعداد ذرات همیشه حفظ می‌شود، متفاوت است. پتانسیل یوکاوا به شما امکان می دهد ذرات را از بین ببرید یا یک ذره را به دو قسمت تقسیم کنید. برای مثال، چنین مدلی می‌تواند سیستم‌های بیولوژیکی را شبیه‌سازی کند که در آن تعداد سلول‌ها نباید ثابت بماند.

یو گفت که این ممکن است یک خط تحقیق پربار باشد. این می تواند منجر به الگوریتم های جدید و مدل های مولد جدید با کاربردهای بالقوه فراتر از تولید تصویر شود.

و PFGM++ به تنهایی از انتظارات اولیه مخترعان خود فراتر رفته است. آنها ابتدا متوجه نشدند که چه زمانی D روی بی نهایت تنظیم شده است، مدل جریان پواسون تقویت شده آنها از یک مدل انتشار غیرقابل تشخیص می شود. لیو این را در محاسباتی که اوایل امسال انجام داد کشف کرد.

مرت پیلانچییک دانشمند کامپیوتر در دانشگاه استنفورد، این "یکپارچگی" را مهمترین نتیجه ناشی از کار گروه MIT می داند. او گفت: «مقاله PFGM++ نشان می‌دهد که هر دوی این مدل‌ها بخشی از یک کلاس وسیع‌تر هستند، [که] یک سوال جالب را ایجاد می‌کند: آیا ممکن است مدل‌های فیزیکی دیگری برای هوش مصنوعی مولد در انتظار کشف وجود داشته باشد که به یکپارچگی حتی بزرگ‌تر اشاره می‌کند؟ ”

تمبر زمان:

بیشتر از مجله کوانتاما