از پایین به بالا تا بالا به پایین: دانشمند محاسباتی آماندا بارنارد در مورد زیبایی شبیه سازی ها، یادگیری ماشین و نحوه تلاقی این دو - دنیای فیزیک

از پایین به بالا تا بالا به پایین: دانشمند محاسباتی آماندا بارنارد در مورد زیبایی شبیه سازی ها، یادگیری ماشین و نحوه تلاقی این دو - دنیای فیزیک

آماندا بارنارد
متخصص رابط آماندا بارنارد معاون مدیر و سرپرست علوم محاسباتی در دانشکده محاسبات در دانشگاه ملی استرالیا است. (با احترام: Sitthixay Ditthavong/کانبرا تایمز)

از استفاده از ابررایانه‌ها برای استفاده از انواع جدید مواد گرفته تا آموزش مدل‌های یادگیری ماشینی برای مطالعه خواص پیچیده در مقیاس نانو، آماندا بارنارد، دانشمند محاسباتی استرالیایی در رابط محاسبات و علم داده کار می کند. یک استاد ارشد در دانشکده محاسبات در دانشگاه ملی استرالیابارنارد همچنین معاون مدیر و سرپرست علوم محاسباتی است. این روزها، او از انواع روش‌های محاسباتی برای حل مسائل در سراسر علوم فیزیکی استفاده می‌کند، اما بارنارد کار خود را به عنوان فیزیکدان آغاز کرد و دکترای خود را در سال 2003 در رشته فیزیک ماده متراکم نظری دریافت کرد.

پس از گذراندن چند سال آینده به عنوان دکتری در مرکز مواد نانومقیاس در آزمایشگاه ملی آرگون در ایالات متحده، او شروع به گسترش علایق تحقیقاتی خود کرد تا بسیاری از جنبه های علوم محاسباتی، از جمله استفاده از یادگیری ماشین در فناوری نانو، علم مواد، شیمی و پزشکی را در بر بگیرد.

همکار هر دو موسسه فیزیک استرالیا و انجمن سلطنتی شیمی، در سال 2022 بارنارد منصوب شد عضو نظم استرالیا. او همچنین برنده جوایز متعددی از جمله جایزه فاینمن 2014 در فناوری نانو (نظریه) و مدال 2019 از انجمن مدلسازان مولکولی استرالیا. او با هامیش جانستون در مورد علاقه‌اش به استفاده از یادگیری ماشینی برای طیف وسیعی از مشکلات، و در مورد چالش‌ها و پاداش‌های انجام مدیریت دانشگاه صحبت می‌کند.

می توانید کمی در مورد کاری که به عنوان یک دانشمند محاسباتی انجام می دهید به ما بگویید؟

علم محاسبات شامل طراحی و استفاده از مدل‌های ریاضی برای تحلیل مسائل محاسباتی در بسیاری از زمینه‌های علوم و مهندسی است. این شامل پیشرفت‌هایی در زیرساخت‌های محاسباتی و الگوریتم‌هایی است که محققان را در این حوزه‌های مختلف قادر می‌سازد تا آزمایش‌های محاسباتی در مقیاس بزرگ را انجام دهند. به نوعی، علم محاسبات شامل تحقیق در مورد محاسبات با کارایی بالا است و نه فقط تحقیق با استفاده از یک کامپیوتر با کارایی بالا.

ما بیشتر وقت خود را صرف الگوریتم‌ها می‌کنیم و سعی می‌کنیم نحوه پیاده‌سازی آن‌ها را به گونه‌ای که بهترین استفاده را از سخت‌افزار پیشرفته داشته باشیم، بیابیم. و این سخت افزار همیشه در حال تغییر است. این شامل شبیه‌سازی‌های مرسوم مبتنی بر مدل‌های ریاضی است که به‌طور خاص در حوزه‌های علمی مختلف، اعم از فیزیک، شیمی یا فراتر از آن، توسعه یافته‌اند. ما همچنین زمان زیادی را با استفاده از روش هایی از فراگیری ماشین (ML) و هوش مصنوعی (AI)، که بیشتر آن توسط دانشمندان کامپیوتر توسعه داده شده است، و آن را به تحقیقات بین رشته ای تبدیل می کند. این امکان استفاده از یک دسته کامل از رویکردهای جدید را در همه این حوزه های علمی مختلف فراهم می کند.

یادگیری ماشینی ما را قادر می‌سازد تا بسیاری از پیچیدگی‌هایی را که با استخراج آن تئوری‌های زیبا از دست داده‌ایم بازیابی کنیم.

شبیه‌سازی از جنبه‌های نظری هر حوزه علمی متولد شد که با سطوح مناسبی از انتزاع، ما را قادر به حل معادلات کرد. اما زمانی که ما آن نظریه ها را توسعه دادیم، آنها تقریباً ساده سازی بیش از حد مسئله بودند که یا به دنبال ظرافت ریاضی و یا صرفاً برای عملی بودن انجام می شد. ML ما را قادر می‌سازد تا بسیاری از پیچیدگی‌هایی را که با استخراج آن نظریه‌های زیبا از دست داده‌ایم، دوباره به دست آوریم. اما متأسفانه، همه ML به خوبی با علم کار نمی کنند، و بنابراین دانشمندان محاسباتی زمان زیادی را صرف تلاش برای کشف نحوه به کارگیری این الگوریتم هایی می کنند که هرگز قرار نبود برای این نوع مجموعه داده ها استفاده شوند تا بر برخی از مشکلات غلبه کنند. با تجربه در رابط و این یکی از زمینه های هیجان انگیزی است که من آن را دوست دارم.

شما کار خود را به عنوان یک فیزیکدان آغاز کردید. چه شد که به سمت علوم محاسباتی رفتید؟

فیزیک یک نقطه شروع عالی برای تقریبا هر چیزی است. اما من همیشه در مسیر علم محاسبات بودم بدون اینکه متوجه باشم. در طول اولین پروژه تحقیقاتی خود به عنوان دانشجو، از روش های محاسباتی استفاده کردم و فوراً درگیر شدم. من عاشق کدنویسی بودم، از نوشتن کد تا نتایج نهایی، و بنابراین فوراً فهمیدم که قرار است ابررایانه‌ها ابزار علمی من باشند. بسیار هیجان انگیز بود که به این فکر کنیم که یک دانشمند مواد چه کاری می تواند انجام دهد اگر بتواند هر بار نمونه های عالی بسازد. یا اگر یک شیمیدان بتواند همه آلودگی ها را از بین ببرد و واکنش های عالی داشته باشد، چه کاری می تواند انجام دهد. اگر بتوانیم محیط های خشن یا خطرناک را بدون خطر آسیب رساندن به کسی کشف کنیم، چه کاری می توانیم انجام دهیم؟ و مهمتر از آن، اگر می‌توانستیم همه این کارها را به طور همزمان، هر بار که تلاش می‌کردیم، انجام دهیم، چه می‌شد؟

زیبایی ابررایانه ها این است که آنها تنها ابزاری هستند که ما را قادر می سازند تا به این کمال نزدیک برسیم. چیزی که بیش از همه مرا مجذوب خود می‌کند این است که من نه تنها می‌توانم کارهایی را که همکارانم می‌توانند در آزمایشگاه انجام دهند، بازتولید کنم، بلکه می‌توانم هر کاری را که نمی‌توانند در آزمایشگاه انجام دهند، انجام دهم. بنابراین از همان روزهای اولیه، فیزیک محاسباتی من روی کامپیوتر بود. شیمی محاسباتی من سپس به مواد، انفورماتیک مواد و اکنون تقریباً منحصراً ML تکامل یافت. اما من همیشه روی روش‌ها در هر یک از این زمینه‌ها تمرکز کرده‌ام، و فکر می‌کنم پایه‌ای در فیزیک به من این امکان را می‌دهد که بسیار خلاقانه در مورد اینکه چگونه از نظر محاسباتی به همه این حوزه‌های دیگر برخورد می‌کنم فکر کنم.

یادگیری ماشین چه تفاوتی با شبیه سازی های کامپیوتری کلاسیک دارد؟

اکثر تحقیقات من در حال حاضر ML است، احتمالاً 80٪ آن. با این حال، من هنوز برخی شبیه‌سازی‌های معمولی را انجام می‌دهم، زیرا آنها چیز بسیار متفاوتی به من می‌دهند. شبیه سازی ها اساسا یک رویکرد از پایین به بالا هستند. ما با درک کمی از یک سیستم یا یک مشکل شروع می‌کنیم، یک شبیه‌سازی را اجرا می‌کنیم و سپس در پایان مقداری داده به دست می‌آوریم. در مقابل، ML یک رویکرد از بالا به پایین است. ما با داده ها شروع می کنیم، یک مدل را اجرا می کنیم و سپس به درک بهتری از سیستم یا مشکل می پردازیم. شبیه سازی بر اساس قوانین تعیین شده توسط نظریه های علمی تثبیت شده ما است، در حالی که ML بر اساس تجربیات و تاریخ است. شبیه سازی ها اغلب تا حد زیادی قطعی هستند، اگرچه نمونه هایی از روش های تصادفی مانند مونت کارلو وجود دارد. ML تا حد زیادی تصادفی است، اگرچه نمونه هایی وجود دارد که قطعی هستند.

با شبیه سازی، می توانم برون یابی بسیار خوبی انجام دهم. بسیاری از تئوری‌هایی که زیربنای شبیه‌سازی‌ها هستند، ما را قادر می‌سازند تا مناطقی از یک «فضای پیکربندی» (مختصاتی که همه حالت‌های ممکن یک سیستم را تعیین می‌کنند) یا مناطقی از یک مشکل را که هیچ داده یا اطلاعاتی برای آن‌ها نداریم، کشف کنیم. از طرف دیگر، ML واقعاً در درون یابی و پر کردن تمام شکاف ها خوب است و برای استنتاج بسیار خوب است.

مفهوم جریان داده

در واقع، این دو روش مبتنی بر انواع مختلف منطق هستند. شبیه سازی بر اساس منطق "اگر-پس-دیگر" است، به این معنی که اگر من یک مشکل خاص یا مجموعه ای از شرایط خاص داشته باشم، سپس یک پاسخ قطعی دریافت خواهم کرد یا در غیر این صورت، از نظر محاسباتی، احتمالاً اگر شما دریافت کنید، خراب می شود. اشتباه. ML، در مقابل، بر اساس منطق "تخمین، بهبود، تکرار" است، به این معنی که همیشه پاسخ خواهد داد. این پاسخ همیشه قابل بهبود است، اما ممکن است همیشه درست نباشد، بنابراین این یک تفاوت دیگر است.

شبیه سازی ها درون رشته ای هستند: آنها رابطه بسیار نزدیکی با دانش حوزه دارند و بر هوش انسانی تکیه دارند. از سوی دیگر، ML بین رشته‌ای است: با استفاده از مدل‌هایی که خارج از حوزه اصلی توسعه یافته‌اند، نسبت به دانش حوزه ناشناس است و به شدت بر هوش مصنوعی متکی است. به همین دلیل است که من دوست دارم این دو رویکرد را با هم ترکیب کنم.

آیا می توانید کمی بیشتر در مورد نحوه استفاده از یادگیری ماشینی در تحقیقات خود به ما بگویید؟

قبل از ظهور ML، دانشمندان باید تا حد زیادی روابط بین ورودی ها و خروجی ها را درک می کردند. قبل از اینکه بتوانیم آن را حل کنیم، باید ساختار مدل را از پیش تعیین می‌کردیم. این بدان معنی بود که قبل از اینکه بتوانیم به دنبال پاسخ باشیم باید ایده ای از پاسخ داشته باشیم.

می توانیم ساختار یک عبارت یا معادله را توسعه دهیم و همزمان آن را حل کنیم. این روش علمی را تسریع می کند و دلیل دیگری است که من دوست دارم از یادگیری ماشینی استفاده کنم

وقتی از ML استفاده می کنید، ماشین ها از تکنیک های آماری و اطلاعات تاریخی برای برنامه ریزی خود استفاده می کنند. یعنی می توانیم ساختار یک عبارت یا معادله را توسعه دهیم و همزمان آن را حل کنیم. این روش علمی را تسریع می کند و دلیل دیگری است که من دوست دارم از آن استفاده کنم.

تکنیک های ML که من استفاده می کنم متنوع هستند. طعم‌ها و انواع مختلفی از ML وجود دارد، درست مانند انواع مختلفی از فیزیک محاسباتی یا روش‌های فیزیک تجربی. من از یادگیری بدون نظارت استفاده می‌کنم که کاملاً مبتنی بر متغیرهای ورودی است و به دنبال توسعه «الگوهای پنهان» یا تلاش برای یافتن داده‌های معرف است. این برای مواد در علم نانو مفید است، زمانی که آزمایش‌هایی را برای اندازه‌گیری یک خاصیت انجام نداده‌ایم، اما در مورد شرایط ورودی که برای توسعه مواد قرار می‌دهیم تا حدودی می‌دانیم.

یادگیری بدون نظارت می‌تواند در یافتن گروه‌هایی از ساختارها، که به آنها خوشه‌ها گفته می‌شود، که شباهت‌هایی در فضای با ابعاد بالا دارند، یا ساختارهای خالص و معرف (کهن الگوها یا نمونه‌های اولیه) که مجموعه داده‌ها را به عنوان یک کل توصیف می‌کنند، مفید باشد. همچنین می‌توانیم داده‌ها را تبدیل کنیم تا آنها را به فضایی با ابعاد پایین‌تر ترسیم کنیم و شباهت‌های بیشتری را که قبلاً آشکار نبودند، آشکار کنیم، به روشی مشابه که ممکن است در فیزیک به فضای متقابل تغییر دهیم.

من همچنین از ML نظارت شده برای یافتن روابط و روندها، مانند روابط ساختار-ویژگی، که در مواد و علم نانو مهم هستند، استفاده می کنم. این شامل طبقه بندی می شود، جایی که ما یک برچسب مجزا داریم. فرض کنید ما در حال حاضر دسته‌های مختلفی از نانوذرات داریم و بر اساس ویژگی‌های آن‌ها، می‌خواهیم به طور خودکار آنها را به یک دسته یا دسته دیگر اختصاص دهیم و مطمئن شویم که به راحتی می‌توانیم این کلاس‌ها را تنها بر اساس داده‌های ورودی جدا کنیم.

من از یادگیری آماری و یادگیری نیمه نظارتی نیز استفاده می کنم. یادگیری آماری، به ویژه، در علم مفید است، اگرچه هنوز به طور گسترده مورد استفاده قرار نگرفته است. ما آن را به عنوان یک استنتاج علّی می‌دانیم که در تشخیص‌های پزشکی زیاد استفاده می‌شود، و می‌توان آن را برای تشخیص مؤثر چگونگی ایجاد یک ماده، به جای اینکه چرایی ایجاد کرد، به کار برد.

گروه تحقیقاتی شما شامل افرادی با طیف وسیعی از علایق علمی است. آیا می توانید طعم برخی از چیزهایی را که آنها در حال مطالعه هستند به ما بدهید؟

وقتی در فیزیک شروع کردم، هرگز فکر نمی کردم که توسط چنین گروه شگفت انگیزی از افراد باهوش از حوزه های علمی مختلف احاطه شوم. خوشه علوم محاسباتی در دانشگاه ملی استرالیا شامل دانشمندان محیط زیست، دانشمندان زمین، زیست شناسان محاسباتی و بیوانفورماتیکان است. همچنین محققانی در حال مطالعه ژنومیک، علوم اعصاب محاسباتی، شیمی کوانتومی، علم مواد، فیزیک پلاسما، اخترفیزیک، نجوم، مهندسی و نانوتکنولوژی هستند. بنابراین ما یک دسته متنوع هستیم.

گروه ما شامل جوزپه بارسا، که در حال توسعه الگوریتم هایی است که زیربنای بسته های نرم افزاری شیمی کوانتومی است که در سراسر جهان استفاده می شود. تحقیقات او بر این تمرکز دارد که چگونه می‌توانیم از پردازنده‌های جدید مانند شتاب‌دهنده‌ها استفاده کنیم و چگونه می‌توانیم درباره نحوه تقسیم‌بندی و تکه تکه شدن مولکول‌های بزرگ تجدیدنظر کنیم تا بتوانیم گردش‌های کاری موازی را به طور استراتژیک ترکیب کنیم. او همچنین به ما کمک می‌کند تا از ابررایانه‌ها به طور کارآمدتر استفاده کنیم که باعث صرفه‌جویی در مصرف انرژی می‌شود. و در دو سال گذشته، او رکورد جهانی را در بهترین الگوریتم شیمی کوانتومی مقیاس‌بندی کرده است.

همچنین در مقیاس کوچک - از نظر علمی - است مین بوئی، که یک بیوانفورماتیک است که بر روی توسعه مدل های آماری جدید در زمینه سیستم های فیلوژنومیک [یک زمینه چند رشته ای که تحقیقات تکاملی را با زیست شناسی سیستم ها و بوم شناسی با استفاده از روش های علم شبکه ترکیب می کند] کار می کند. اینها شامل مدل‌های پارتیشن‌بندی، مدل‌های آگاه به ایزومورفیسم و ​​مدل‌های درخت توزیع می‌شوند. کاربردهای این شامل مناطقی در آنزیم‌های فتوسنتزی یا داده‌های رونویسی فیلوژنی عمیق حشرات است، و او در مورد جلبک‌ها و همچنین باکتری‌ها و ویروس‌هایی مانند HIV و SARS-CoV-2 (که باعث COVID-19 می‌شود) کار کرده است.

مین بوئی

در انتهای بزرگتر مقیاس، ریاضیدان قرار دارد کوانلینگ دنگکه تحقیقات آن بر مدل‌سازی و شبیه‌سازی ریاضی برای رسانه‌های در مقیاس بزرگ، مانند اقیانوس‌ها و دینامیک جو، و همچنین شناورهای یخی قطب جنوب متمرکز است.

بهترین بخش زمانی است که متوجه می‌شویم مشکلی از یک دامنه در واقع قبلاً در دامنه دیگر حل شده است، و حتی بهتر از آن زمانی است که یک مورد تجربه در چندین حوزه را کشف کنیم تا بتوانیم به صورت فوق خطی مقیاس‌بندی کنیم. وقتی یک راه حل دارای چندین حوزه تاثیرگذار باشد، عالی است. و هر چند وقت یکبار یک عصب شناس محاسباتی را پیدا می کنید که در کنار یک فیزیکدان پلاسما کار می کند؟ به طور معمول این اتفاق نمی افتد.

شما علاوه بر همکاری با گروه تحقیقاتی خود، معاون دانشکده محاسبات دانشگاه ملی استرالیا نیز هستید. کمی در مورد آن نقش توضیح می دهید؟

این تا حد زیادی یک نقش اداری است. بنابراین، علاوه بر کار با گروهی شگفت‌انگیز از دانشمندان کامپیوتر در علوم داده، زمینه‌های اساسی در زبان‌ها، توسعه نرم‌افزار، امنیت سایبری، بینایی کامپیوتر، روباتیک و غیره، من همچنین می‌توانم فرصت‌هایی را برای افراد جدید ایجاد کنم تا به مدرسه بپیوندند و در مدرسه حضور پیدا کنند. بهترین نسخه از خودشان بسیاری از کارهای من در نقش رهبری مربوط به مردم است. و این شامل استخدام، مراقبت از برنامه شغلی و برنامه توسعه حرفه ای ما نیز می شود. من همچنین این فرصت را داشته ام که برنامه های جدیدی را برای مناطقی که فکر می کردم نیاز به توجه دارند شروع کنم.

یکی از این نمونه ها در طول همه گیری جهانی کووید بود. بسیاری از ما تعطیل شده بودیم و نمی توانستیم به آزمایشگاه های خود دسترسی پیدا کنیم، که ما را متعجب کرد که چه کاری می توانیم انجام دهیم. من از این فرصت استفاده کردم و برنامه ای به نام the را توسعه دادم یاران مشترک جوبیلی، که از محققانی که در رابط بین علوم کامپیوتر و حوزه دیگری کار می کنند، پشتیبانی می کند، جایی که آنها در حال حل چالش های بزرگ در حوزه خود هستند، اما همچنین از دانش آن حوزه برای اطلاع رسانی به انواع جدیدی از علوم رایانه استفاده می کنند. این برنامه در سال 2021 از پنج محقق از این دست در مناطق مختلف حمایت کرد.

من هم رئیس مجلس هستم برنامه زنان پیشگام، که دارای بورسیه تحصیلی، سخنرانی و کمک هزینه تحصیلی برای حمایت از زنانی است که وارد محاسبات می شوند و تضمین می کند که آنها در طول حرفه خود با ما موفق هستند.

و البته، یکی از نقش های دیگر من به عنوان معاون مدیر این است که از امکانات محاسباتی مدرسه خود مراقبت کنم. من به روش‌هایی نگاه می‌کنم که می‌توانیم خط لوله منابع خود را برای عبور از زمان‌های سخت، مانند دوران کووید، که نمی‌توانستیم تجهیزات جدیدی سفارش دهیم، متنوع کنیم. من همچنین بررسی می‌کنم که چگونه می‌توانیم در مصرف انرژی کارآمدتر باشیم، زیرا محاسبات انرژی زیادی مصرف می‌کند.

برای افرادی که در ML تحقیق می کنند باید زمان بسیار هیجان انگیزی باشد، زیرا این فناوری کاربردهای بسیار متفاوتی پیدا می کند. در تحقیقات خود بیشتر منتظر چه کاربردهای جدیدی از ML هستید؟

خوب، احتمالاً برخی از مواردی که قبلاً در مورد آنها شنیده اید، یعنی هوش مصنوعی. در حالی که خطرات مرتبط با هوش مصنوعی وجود دارد، فرصت‌های بسیار زیادی نیز وجود دارد، و من فکر می‌کنم که هوش مصنوعی مولد در سال‌های آینده برای علم اهمیت ویژه‌ای خواهد داشت – به شرطی که بتوانیم بر برخی از مسائل مربوط به «توهم» آن غلبه کنیم [هنگامی که یک سیستم هوش مصنوعی ، مانند یک مدل زبان بزرگ، اطلاعات نادرست تولید می کند، بر اساس مجموعه داده های آموزشی یا منطق زمینه ای یا ترکیبی از هر دو].

مهم نیست که در چه حوزه ای از علم هستیم، زمان، پول، منابع و تجهیزاتی که به آنها دسترسی داریم محدود شده ایم. این بدان معناست که ما به جای تمرکز بر غلبه بر آنها، علم خود را به خطر می اندازیم تا با این محدودیت ها مطابقت داشته باشیم

اما مهم نیست که در چه حوزه ای از علم هستیم، چه محاسباتی یا تجربی، همه ما تحت محدودیت های متعددی در رنج هستیم. ما از نظر زمان، پول، منابع و تجهیزاتی که به آنها دسترسی داریم محدود شده ایم. این بدان معناست که ما به جای تمرکز بر غلبه بر آنها، علم خود را به خطر می اندازیم تا با این محدودیت ها مطابقت داشته باشیم. من واقعاً معتقدم که زیرساخت ها نباید به ما دیکته کنند که چه کار کنیم، بلکه باید برعکس باشد.

فکر می‌کنم هوش مصنوعی مولد در زمان مناسبی آمده است تا ما را قادر سازد تا در نهایت بر برخی از این مشکلات غلبه کنیم، زیرا پتانسیل زیادی برای پر کردن شکاف‌ها دارد و به ما ایده می‌دهد که اگر همه چیز را داشتیم، چه علمی می‌توانستیم انجام دهیم. منابع لازم

در واقع، هوش مصنوعی می‌تواند به ما کمک کند تا با انجام کارهای کمتر، بیشتر به دست آوریم و از برخی از دام‌ها مانند سوگیری انتخاب اجتناب کنیم. این یک مشکل واقعا بزرگ در هنگام استفاده از ML در مجموعه داده های علمی است. ما باید کار بسیار بیشتری انجام دهیم تا مطمئن شویم که روش‌های مولد علم معنادار تولید می‌کنند، نه توهم. اگر بخواهند پایه و اساس مدل های بزرگ از پیش آموزش دیده را تشکیل دهند، این امر به ویژه مهم است. اما من فکر می‌کنم که این دوران واقعاً هیجان‌انگیزی از علم خواهد بود که در آن ما با هوش مصنوعی کار می‌کنیم، نه اینکه فقط یک وظیفه را برای ما انجام دهد.

تمبر زمان:

بیشتر از دنیای فیزیک