Знизу вгору до верху вниз: вчений-обчислювач Аманда Барнард про красу моделювання, машинне навчання та те, як вони перетинаються – Physics World

Знизу вгору до верху вниз: вчений-обчислювач Аманда Барнард про красу моделювання, машинне навчання та те, як вони перетинаються – Physics World

Аманда Барнард
Спеціаліст з інтерфейсу Аманда Барнард є заступником директора та керівником відділу обчислювальної техніки в Школі комп’ютерів Австралійського національного університету. (З дозволу: Sitthixay Ditthavong/Канберра Таймс)

Від використання суперкомп’ютерів для опрацювання нових видів матеріалів до навчання моделей машинного навчання для вивчення складних властивостей у нанорозмірі, Австралійський вчений-обчислювач Аманда Барнард працює на інтерфейсі обчислювальної техніки та науки про дані. Старший професор в Школа обчислювальної техніки при Австралійському національному університеті, Барнард також є заступником директора та керівником відділу обчислювальної науки. Сьогодні вона використовує різноманітні обчислювальні методи для вирішення проблем із фізичних наук, але Барнард розпочала свою кар’єру як фізик, отримавши ступінь доктора філософії з теоретичної фізики конденсованих систем у 2003 році.

Провівши наступні кілька років як постдоктор в Центр нанорозмірних матеріалів Аргонської національної лабораторії у США вона почала розширювати свої дослідницькі інтереси, щоб охопити багато аспектів обчислювальної науки, включаючи використання машинного навчання в нанотехнологіях, матеріалознавстві, хімії та медицині.

Стипендіат обох Австралійський інститут фізики і Королівське хімічне товариство, у 2022 році Барнарда призначили а Член ордена Австралії. Вона також отримала низку нагород, зокрема Премія Фейнмана в галузі нанотехнологій 2014 року (Теорія) і 2019 медаль від Асоціації молекулярних моделей Австралії. Вона розмовляє з Хемішем Джонстоном про свою зацікавленість у застосуванні машинного навчання для вирішення низки проблем, а також про труднощі та переваги роботи в університетському адмініструванні.

Чи можете ви розповісти нам трохи про те, чим ви займаєтеся як вчений-обчислювальник?

Обчислювальна техніка передбачає розробку та використання математичних моделей для аналізу складних обчислювальних проблем у багатьох галузях науки та техніки. Це включає в себе досягнення в обчислювальній інфраструктурі та алгоритмах, які дозволяють дослідникам у цих різних областях проводити великомасштабні обчислювальні експерименти. У певному сенсі обчислювальна наука передбачає дослідження високопродуктивних обчислень, а не лише дослідження з використанням високопродуктивного комп’ютера.

Ми витрачаємо більшу частину свого часу на алгоритми та намагаємося з’ясувати, як їх реалізувати таким чином, щоб найкраще використовувати сучасне апаратне забезпечення; і це обладнання постійно змінюється. Це включає звичайне моделювання на основі математичних моделей, розроблених спеціально для різних наукових областей, будь то фізика, хімія чи інші. Ми також витрачаємо багато часу на використання методів від навчання за допомогою машини (ML) і штучний інтелект (ШІ), більшість з яких розроблено комп’ютерними вченими, що робить його дуже міждисциплінарним дослідженням. Це дає змогу використовувати цілий ряд нових підходів у всіх цих різних наукових сферах.

Машинне навчання дозволяє нам відновити багато складності, яку ми втратили, коли виводили ці чудові теорії

Симуляція народилася з теоретичних аспектів кожної наукової галузі, які з деякими зручними рівнями абстракції дозволили нам розв’язати рівняння. Але коли ми розробляли ці теорії, вони були майже надмірним спрощенням проблеми, яке робилося або в гонитві за математичною елегантністю, або просто заради практичності. ML дозволяє нам відновити багато складності, яку ми втратили, коли виводили ці чудові теорії. Але, на жаль, не всі ML добре поєднуються з наукою, тому вчені-обчислювачі витрачають багато часу, намагаючись з’ясувати, як застосувати ці алгоритми, які ніколи не були призначені для використання в таких наборах даних, щоб подолати деякі проблеми, які досвід роботи на інтерфейсі. І це одна із захоплюючих сфер, яка мені подобається.

Ви починали свою кар’єру як фізик. Що змусило вас перейти до обчислювальної науки?

Фізика є чудовою відправною точкою для будь-чого. Але я завжди був на шляху до обчислювальної науки, не усвідомлюючи цього. Під час свого першого дослідницького проекту як студента я використовував обчислювальні методи і миттєво захопився. Мені подобалося кодування, від написання коду до кінцевих результатів, і тому я миттєво зрозумів, що суперкомп’ютерам призначено стати моїм науковим інструментом. Було захоплююче думати про те, що міг би зробити вчений-матеріалознавець, якби кожен раз міг робити ідеальні зразки. Або що міг би зробити хімік, якби він міг видалити всі забруднення та мати ідеальні реакції. Що ми могли б зробити, якби досліджували суворе чи небезпечне середовище, не ризикуючи нікого поранити? І що ще важливіше, що, якби ми могли робити всі ці речі одночасно, на вимогу, щоразу, коли ми намагаємось?

Краса суперкомп’ютерів полягає в тому, що вони є єдиним інструментом, який дозволяє нам досягти цієї майже досконалості. Найбільше мене захоплює те, що я можу не лише відтворити те, що мої колеги можуть зробити в лабораторії, але й зробити все те, що вони не можуть зробити в лабораторії. Тому з самого початку моя обчислювальна фізика була на комп’ютері. Потім моя обчислювальна хімія розвинулася до матеріалів, інформатики матеріалів, а тепер майже виключно до машинного навчання. Але я завжди зосереджувався на методах у кожній із цих областей, і я вважаю, що основи фізики дають мені можливість дуже творчо думати про те, як я підходжу до всіх цих інших областей з точки зору обчислень.

Чим машинне навчання відрізняється від класичного комп’ютерного моделювання?

Зараз більшість моїх досліджень — це ML, мабуть, 80%. Однак я все ще роблю деякі звичайні симуляції, оскільки вони дають мені щось зовсім інше. Симуляції в основному є підходом "знизу вгору". Ми починаємо з певного розуміння системи чи проблеми, запускаємо симуляцію, а потім отримуємо деякі дані в кінці. ML, навпаки, є підходом зверху вниз. Ми починаємо з даних, запускаємо модель, а потім закінчуємо кращим розумінням системи чи проблеми. Симуляція базується на правилах, визначених нашими усталеними науковими теоріями, тоді як ML базується на досвіді та історії. Симуляції часто в основному детерміновані, хоча є деякі приклади стохастичних методів, таких як Монте-Карло. ML є значною мірою стохастичним, хоча є деякі приклади, які також є детермінованими.

За допомогою симуляції я можу зробити дуже хорошу екстраполяцію. Багато теорій, які лежать в основі моделювання, дозволяють нам досліджувати області «конфігураційного простору» (координати, які визначають усі можливі стани системи) або області проблеми, для яких у нас немає даних чи інформації. З іншого боку, ML дійсно добре інтерполює та заповнює всі прогалини, а також дуже добре для висновків.

Концепція потоку даних

Дійсно, два методи базуються на дуже різних типах логіки. Симуляція базується на логіці «якщо-тоді-інше», що означає, що якщо у мене є певна проблема або певний набір умов, я отримаю детерміновану відповідь, інакше обчислювальна програма, ймовірно, завершиться збоєм, якщо ви отримаєте це неправильно. ML, навпаки, базується на логіці «оцінити-поліпшити-повторити», що означає, що він завжди дасть відповідь. Цю відповідь завжди можна покращити, але вона не завжди може бути правильною, тож це ще одна відмінність.

Симуляції є внутрішньодисциплінарними: вони дуже тісно пов’язані зі знаннями предметної області та покладаються на людський інтелект. З іншого боку, машинне навчання є міждисциплінарним: використовуючи моделі, розроблені за межами початкової області, воно не залежить від знань про предметну область і значною мірою покладається на штучний інтелект. Ось чому я люблю поєднувати два підходи.

Чи можете ви розповісти нам трохи більше про те, як ви використовуєте машинне навчання у своїх дослідженнях?

До появи ML вченим доводилося добре розуміти зв’язки між входами та виходами. Нам потрібно було заздалегідь визначити структуру моделі, перш ніж ми змогли її вирішити. Це означало, що ми повинні мати уявлення про відповідь, перш ніж шукати її.

Ми можемо розробити структуру виразу або рівняння і одночасно розв’язати їх. Це прискорює науковий метод, і це ще одна причина, чому я люблю використовувати машинне навчання

Коли ви використовуєте ML, машини використовують статистичні методи та історичну інформацію, щоб програмувати себе. Це означає, що ми можемо розробити структуру виразу або рівняння і одночасно розв’язати його. Це прискорює науковий метод, і це ще одна причина, чому я люблю його використовувати.

Техніки ML, які я використовую, різноманітні. Існує багато різних різновидів і типів ML, так само як існує багато різних типів обчислювальної фізики або методів експериментальної фізики. Я використовую неконтрольоване навчання, яке повністю базується на вхідних змінних і спрямоване на розробку «прихованих шаблонів» або спробу знайти репрезентативні дані. Це корисно для матеріалів у нанонауці, коли ми не проводили експерименти, щоб, можливо, виміряти властивість, але знаємо досить багато про вхідні умови, які ми використовуємо для розробки матеріалу.

Неконтрольоване навчання може бути корисним для пошуку груп структур, які називаються кластерами, які мають подібність у просторі високої розмірності, або чистих і репрезентативних структур (архетипів або прототипів), які описують набір даних у цілому. Ми також можемо трансформувати дані, щоб відобразити їх у низьковимірному просторі та виявити більше подібностей, які раніше не були очевидними, подібно до того, як ми могли б змінити зворотний простір у фізиці.

Я також використовую контрольоване машинне навчання, щоб знаходити зв’язки та тенденції, такі як зв’язки між структурою та властивостями, які важливі в матеріалах і нанонауках. Це включає класифікацію, де ми маємо окрему мітку. Скажімо, у нас уже є різні категорії наночастинок і, виходячи з їхніх характеристик, ми хочемо автоматично віднести їх до тієї чи іншої категорії та переконатися, що ми можемо легко розділити ці класи лише на основі вхідних даних.

Я також використовую статистичне навчання та напівконтрольоване навчання. Статистичне навчання, зокрема, корисне в науці, хоча воно ще не широко використовується. Ми вважаємо це причинно-наслідковим висновком, який часто використовується в медичній діагностиці, і його можна застосувати для ефективної діагностики, наприклад, як може бути створений матеріал, а не просто для того, чому він створений.

У вашу дослідницьку групу входять люди з широким колом наукових інтересів. Чи можете ви дати нам уявлення про деякі речі, які вони вивчають?

Коли я починав вивчати фізику, я ніколи не думав, що буду оточений такою дивовижною групою розумних людей з різних галузей науки. Кластер обчислювальної науки в Австралійському національному університеті включає вчених-екологів, науковців про Землю, обчислювальних біологів і біоінформатиків. Є також дослідники, які вивчають геноміку, обчислювальну нейронауку, квантову хімію, матеріалознавство, фізику плазми, астрофізику, астрономію, інженерію та – я – нанотехнології. Отже, ми різноманітна група.

До нашої групи входять Джузеппе Барка, який розробляє алгоритми, які лежать в основі програмних пакетів квантової хімії, які використовуються в усьому світі. Його дослідження зосереджено на тому, як ми можемо використовувати нові процесори, такі як прискорювачі, і як ми можемо переосмислити, як великі молекули можна розділяти та фрагментувати, щоб ми могли стратегічно поєднувати масивні паралельні робочі процеси. Він також допомагає нам ефективніше використовувати суперкомп’ютери, що економить енергію. І протягом останніх двох років він тримав світовий рекорд у найкращому квантово-хімічному алгоритмі масштабування.

Також у малому масштабі – з точки зору науки – є Мінь Буй, який є біоінформатиком і працює над розробкою нових статистичних моделей у сфері філогеномічних систем [міждисциплінарної сфери, яка поєднує еволюційні дослідження із системною біологією та екологією, використовуючи методи мережевої науки]. До них відносяться моделі розбиття, моделі з урахуванням ізоморфізму та моделі дерева розподілу. Застосування цього включає в себе області фотосинтетичних ферментів або глибокі дані транскрипції філогенії комах, і він провів роботу, вивчаючи водорості, а також бактерії та віруси, такі як ВІЛ і SARS-CoV-2 (який викликає COVID-19).

Мінь Буй

На більшій частині шкали знаходиться математик Куаньлінг Ден, чиї дослідження зосереджені на математичному моделюванні для великомасштабних середовищ, таких як океани та динаміка атмосфери, а також антарктичні крижини.

Найкраще, коли ми виявляємо, що проблему з одного домену насправді вже вирішено в іншому, а ще краще, коли ми виявляємо проблему в кількох доменах, щоб ми могли масштабувати надлінійно. Чудово, коли одне рішення має кілька сфер впливу. І як часто ви бачите обчислювального нейробіолога, який працює разом із фізиком плазми? Зазвичай це не буває.

Крім того, що ви працюєте з вашою дослідницькою групою, ви також є заступником директора Школи обчислювальної техніки Австралійського національного університету. Чи можете ви розповісти нам трохи про цю роль?

Це здебільшого адміністративна роль. Крім того, що я працював із дивовижною групою комп’ютерників у галузі науки про дані, основ мов, розробки програмного забезпечення, кібербезпеки, комп’ютерного зору, робототехніки тощо, я створював можливості для нових людей приєднатися до школи та бути найкраща версія себе. Велика частина моєї керівної роботи стосується людей. І це включає підбір персоналу, догляд за нашою програмою перебування на посаді та програмою професійного розвитку. Я також мав нагоду розпочати кілька нових програм для тих сфер, які, на мою думку, потребували уваги.

Один із таких прикладів був під час глобальної пандемії COVID. Багато хто з нас були закриті та не мали доступу до наших лабораторій, що змусило нас думати, що ми можемо зробити. Я скористався можливістю розробити програму під назвою the Ювілейна спільна стипендія, який підтримує дослідників, які працюють на поєднанні між інформатикою та іншою сферою, де вони вирішують грандіозні завдання у своїх галузях, а також використовують знання цієї галузі для інформування нових типів інформатики. У 2021 році програма підтримала п’ятьох таких дослідників у різних областях.

Я також є головою Піонерська жіноча програма, яка надає стипендії, лекції та стипендії, щоб підтримати жінок, які починають займатися комп’ютерною технікою, і забезпечити їм успіх протягом усієї кар’єри в нас.

І, звісно, ​​одна з моїх інших ролей як заступника директора — доглядати за комп’ютерним обладнанням нашої школи. Я розглядаю способи, за допомогою яких ми можемо диверсифікувати наш арсенал ресурсів, щоб пережити важкі часи, як-от під час COVID, коли ми не могли замовити нове обладнання. Я також шукаю, як ми можемо бути енергоефективнішими, оскільки обчислення споживають величезну кількість енергії.

Мабуть, це дуже захоплюючий час для людей, які досліджують ML, оскільки ця технологія знаходить так багато різних застосувань. Яких нових застосувань ML ви найбільше очікуєте у своїх дослідженнях?

Що ж, мабуть, про деякі з тих, про які ви вже чули, а саме ШІ. Хоча існують ризики, пов’язані з ШІ, є також величезні можливості, і я думаю, що генеративний ШІ буде особливо важливим у найближчі роки для науки – за умови, що ми зможемо подолати деякі проблеми з його «галюцинаціями» [коли система ШІ , як-от велика мовна модель, генерує неправдиву інформацію на основі або навчального набору даних, або контекстної логіки, або їх комбінації].

Незалежно від того, в якій галузі науки ми працюємо, ми обмежені часом, грошима, ресурсами та обладнанням, до якого ми маємо доступ. Це означає, що ми йдемо на компроміс із нашою наукою, щоб відповідати цим обмеженням, а не зосереджуємось на їх подоланні

Але незалежно від того, в якій галузі науки ми працюємо, обчислювальної чи експериментальної, ми всі страждаємо від ряду обмежень. Ми обмежені часом, грошима, ресурсами та обладнанням, до якого ми маємо доступ. Це означає, що ми йдемо на компроміс із нашою наукою, щоб відповідати цим обмеженням, а не зосереджуємось на їх подоланні. Я справді вірю, що інфраструктура не повинна диктувати нам те, що ми робимо, все має бути навпаки.

Я думаю, що генеративний штучний інтелект прийшов у слушний час, щоб дати нам змогу нарешті подолати деякі з цих проблем, оскільки він має великий потенціал, щоб заповнити прогалини та дати нам уявлення про те, яку науку ми могли б зробити, якби мали все необхідні ресурси.

Дійсно, штучний інтелект може дозволити нам отримати більше, роблячи менше, і уникнути деяких пасток, як-от упередженість відбору. Це дійсно велика проблема при застосуванні ML до наборів наукових даних. Нам потрібно зробити набагато більше, щоб гарантувати, що генеративні методи створюють значущу науку, а не галюцинації. Це особливо важливо, якщо вони збираються стати основою для великих попередньо навчених моделей. Але я думаю, що це буде справді захоплююча ера науки, коли ми співпрацюватимемо з ШІ, а не просто виконуватимемо за нас завдання.

Часова мітка:

Більше від Світ фізики