Alhaalta ylös ylhäältä alas: laskentatieteilijä Amanda Barnard simulaatioiden kauneudesta, koneoppimisesta ja näiden kahden leikkaamisesta – Physics World

Alhaalta ylös ylhäältä alas: laskentatieteilijä Amanda Barnard simulaatioiden kauneudesta, koneoppimisesta ja näiden kahden leikkaamisesta – Physics World

Amanda Barnard
Käyttöliittymän asiantuntija Amanda Barnard on apulaisjohtaja ja laskennallisen tieteen johtaja School of Computingissa Australian kansallisessa yliopistossa. (Kohtelias: Sitthixay Ditthavong/Canberra Times)

Supertietokoneiden käyttämisestä uudenlaisten materiaalien hyödyntämiseen koneoppimismallien kouluttamiseen monimutkaisten ominaisuuksien tutkimiseen nanomittakaavassa, Australialainen laskennallinen tiedemies Amanda Barnard toimii tietojenkäsittelyn ja datatieteen rajapinnassa. Vanhempi professori Australian kansallisen yliopiston tietojenkäsittelykoulu, Barnard on myös apulaisjohtaja ja laskennallisen tieteen johtaja. Nykyään hän käyttää erilaisia ​​laskennallisia menetelmiä fysiikan ongelmien ratkaisemiseen, mutta Barnard aloitti uransa fyysikkona ja sai tohtorintutkintonsa teoreettisesta tiivistettyjen aineiden fysiikasta vuonna 2003.

Vietettyään seuraavat muutamat vuodet postdocina Nanomittakaavan materiaalien keskus Argonnen kansallisessa laboratoriossa Yhdysvalloissa hän alkoi laajentaa tutkimusintressiään kattamaan monia laskennallisen tieteen näkökohtia, mukaan lukien koneoppimisen käyttö nanoteknologiassa, materiaalitieteessä, kemiassa ja lääketieteessä.

Kummankin kaveri Australian Institute of Physics ja Royal Society of Chemistry, vuonna 2022 Barnard nimitettiin a Australian ritarikunnan jäsen. Hän on myös voittanut useita palkintoja, mukaan lukien 2014 Feynman-palkinto nanoteknologiassa (teoria) ja 2019 mitali Australaasia molekyylimallintajien yhdistykseltä. Hän puhuu Hamish Johnstonille kiinnostuksestaan ​​soveltaa koneoppimista useisiin ongelmiin sekä yliopistohallinnon haasteista ja palkkioista.

Voitko kertoa meille vähän siitä, mitä teet laskennallisena tutkijana?

Laskennalliseen tieteeseen kuuluu matemaattisten mallien suunnittelu ja käyttö laskennallisesti vaativien ongelmien analysoimiseksi monilla tieteen ja tekniikan aloilla. Tämä sisältää edistysaskeleita laskennallisessa infrastruktuurissa ja algoritmeissa, jotka antavat näiden eri alojen tutkijoille mahdollisuuden suorittaa laajamittaisia ​​laskennallisia kokeita. Tavallaan laskennalliseen tieteeseen sisältyy korkean suorituskyvyn laskennan tutkimusta, ei vain tutkimusta korkean suorituskyvyn tietokoneella.

Käytämme suurimman osan ajastamme algoritmeihin ja yritämme selvittää, kuinka toteuttaa ne tavalla, joka hyödyntää kehittynyttä laitteistoa parhaalla mahdollisella tavalla. ja laitteisto muuttuu koko ajan. Tämä sisältää tavanomaiset simulaatiot, jotka perustuvat matemaattisiin malleihin, jotka on kehitetty erityisesti eri tieteenaloilla, olipa kyse fysiikasta, kemiasta tai muualta. Vietämme myös paljon aikaa käyttämällä menetelmiä alkaen koneoppiminen (ML) ja tekoäly (AI), joista useimmat ovat tietojenkäsittelytieteilijöiden kehittämiä, mikä tekee siitä erittäin monitieteistä tutkimusta. Tämä mahdollistaa joukon uusia lähestymistapoja kaikilla näillä eri tieteenaloilla.

Koneoppimisen avulla voimme vangita uudelleen paljon monimutkaisuutta, jonka olemme menettäneet, kun johdamme noita kauniita teorioita

Simulaatio syntyi kunkin tieteenalan teoreettisista näkökohdista, jotka auttoivat meitä ratkaisemaan yhtälöt joillakin sopivilla abstraktiotasoilla. Mutta kun kehitimme nuo teoriat, ne olivat melkein ongelman liiallista yksinkertaistamista, mikä tehtiin joko matemaattisen eleganssin saavuttamiseksi tai vain käytännöllisyyden vuoksi. ML antaa meille mahdollisuuden saada takaisin paljon monimutkaisuutta, jonka olemme menettäneet, kun johdamme noita kauniita teorioita. Mutta valitettavasti kaikki ML eivät toimi hyvin tieteen kanssa, joten laskennalliset tutkijat viettävät paljon aikaa yrittääkseen selvittää, kuinka soveltaa näitä algoritmeja, joita ei koskaan ollut tarkoitettu käytettäväksi tämäntyyppisissä tietosarjoissa joidenkin ongelmien ratkaisemiseksi. kokemusta käyttöliittymästä. Ja se on yksi jännittävistä alueista, joista pidän.

Aloitit urasi fyysikkona. Mikä sai sinut siirtymään laskennalliseen tieteeseen?

Fysiikka on loistava lähtökohta lähes kaikkeen. Mutta olin aina tiellä laskennalliseen tieteeseen tietämättäni. Ensimmäisen opiskelutyöni aikana käytin laskennallisia menetelmiä ja jäin heti koukkuun. Rakastin koodausta aina koodin kirjoittamisesta lopputulokseen, joten tiesin heti, että supertietokoneet oli tarkoitettu tieteelliseksi instrumentiksi. Oli jännittävää pohtia, mitä materiaalitieteilijä voisi tehdä, jos hän voisi tehdä täydellisiä näytteitä joka kerta. Tai mitä kemisti voisi tehdä, jos he voisivat poistaa kaikki kontaminaatiot ja saada täydelliset reaktiot. Mitä voisimme tehdä, jos voisimme tutkia ankaria tai vaarallisia ympäristöjä ilman vaaraa vahingoittaa ketään? Ja mikä vielä tärkeämpää, entä jos voisimme tehdä kaikki nämä asiat samanaikaisesti, pyynnöstä, joka kerta kun yritämme?

Supertietokoneiden kauneus on, että ne ovat ainoa väline, jonka avulla voimme saavuttaa tämän lähes täydellisyyden. Minua kiehtoo eniten se, että en pysty ainoastaan ​​toistamaan sitä, mitä kollegani voivat tehdä laboratoriossa, vaan myös tehdä kaikkea, mitä he eivät voi tehdä laboratoriossa. Joten aivan varhaisista ajoista lähtien laskennallinen fysiikkani oli tietokoneella. Laskennallinen kemiani kehittyi sitten materiaaleihin, materiaaliinformatiikkaan ja nyt melkein yksinomaan ML: hen. Mutta olen aina keskittynyt menetelmiin kaikilla näillä aloilla, ja mielestäni fysiikan perusta antaa minulle mahdollisuuden ajatella erittäin luovasti, kuinka lähestyn kaikkia näitä muita alueita laskennallisesti.

Miten koneoppiminen eroaa klassisista tietokonesimulaatioista?

Suurin osa tutkimuksestani on nyt ML, luultavasti 80% siitä. Teen kuitenkin edelleen joitain tavanomaisia ​​simulaatioita, koska ne antavat minulle jotain hyvin erilaista. Simulaatiot ovat pohjimmiltaan alhaalta ylös -lähestymistapaa. Aloitamme ymmärtämällä jonkin järjestelmän tai ongelman, suoritamme simulaation ja lopuksi saamme tietoja. ML sitä vastoin on ylhäältä alas -lähestymistapa. Aloitamme tiedoista, suoritamme mallin ja päädymme ymmärtämään paremmin järjestelmää tai ongelmaa. Simulointi perustuu vakiintuneiden tieteellisten teoriojemme määrittämiin sääntöihin, kun taas ML perustuu kokemuksiin ja historiaan. Simulaatiot ovat usein suurelta osin deterministisiä, vaikkakin on joitain esimerkkejä stokastisista menetelmistä, kuten Monte Carlo. ML on suurelta osin stokastinen, vaikka on joitakin esimerkkejä, jotka ovat myös deterministisiä.

Simulaatioiden avulla pystyn tekemään erittäin hyvän ekstrapoloinnin. Monet simulaatioiden taustalla olevista teorioista antavat meille mahdollisuuden tutkia "konfiguraatioavaruuden" alueita (koordinaatit, jotka määrittävät järjestelmän kaikki mahdolliset tilat) tai ongelman alueita, joista meillä ei ole tietoa tai tietoa. Toisaalta ML on todella hyvä interpoloimaan ja täyttämään kaikki aukot ja se on erittäin hyvä päättelyyn.

Tietovirran käsite

Itse asiassa nämä kaksi menetelmää perustuvat hyvin erilaiseen logiikkaan. Simulointi perustuu "jos-niin-muu" -logiikkaan, mikä tarkoittaa, että jos minulla on tietty ongelma tai tietyt olosuhteet, niin saan deterministisen vastauksen tai muuten laskennallisesti se todennäköisesti kaatuu, jos saat se väärin. ML sen sijaan perustuu "arvioi-paranna-toista" -logiikkaan, mikä tarkoittaa, että se antaa aina vastauksen. Tämä vastaus on aina parannettavissa, mutta se ei välttämättä aina ole oikea, joten se on toinen ero.

Simulaatiot ovat tieteidenvälisiä: niillä on hyvin läheinen suhde alan tietoon ja ne perustuvat ihmisen älykkyyteen. Toisaalta ML on monitieteinen: alkuperäisen toimialueen ulkopuolella kehitettyjä malleja käyttäen se on agnostikko domain-tietoa kohtaan ja luottaa vahvasti tekoälyyn. Tästä syystä pidän näiden kahden lähestymistavan yhdistämisestä.

Voitko kertoa meille hieman enemmän siitä, kuinka käytät koneoppimista tutkimuksessasi?

Ennen ML:n tuloa tutkijoiden piti melko paljon ymmärtää tulojen ja tulosten väliset suhteet. Meillä oli oltava mallin rakenne ennalta määrättynä ennen kuin pystyimme ratkaisemaan sen. Se tarkoitti, että meillä oli oltava käsitys vastauksesta, ennen kuin voimme etsiä sitä.

Voimme kehittää lausekkeen tai yhtälön rakennetta ja ratkaista sen samanaikaisesti. Se nopeuttaa tieteellistä menetelmää, ja se on toinen syy, miksi haluan käyttää koneoppimista

Kun käytät ML:ää, koneet käyttävät tilastotekniikoita ja historiallisia tietoja periaatteessa ohjelmoidakseen itsensä. Se tarkoittaa, että voimme kehittää lausekkeen tai yhtälön rakenteen ja ratkaista sen samanaikaisesti. Se nopeuttaa tieteellistä menetelmää, ja se on toinen syy, miksi haluan käyttää sitä.

Käyttämäni ML-tekniikat ovat erilaisia. ML:ää on monia erilaisia ​​makuja ja tyyppejä, aivan kuten on olemassa monia erilaisia ​​laskennallisen fysiikan tai kokeellisen fysiikan menetelmiä. Käytän ohjaamatonta oppimista, joka perustuu kokonaan syöttömuuttujiin ja jossa tarkastellaan "piilotetun mallin" kehittämistä tai edustavaa dataa. Siitä on hyötyä nanotieteen materiaaleille, kun emme ole tehneet kokeita jonkin ominaisuuden mittaamiseksi, mutta tiedämme melko vähän syöttöehdoista, joita asetamme materiaalin kehittämiseen.

Ohjaamaton oppiminen voi olla hyödyllistä löydettäessä rakenneryhmiä, joita kutsutaan klustereiksi ja joilla on yhtäläisyyksiä korkean ulottuvuuden tilassa, tai puhtaita ja edustavia rakenteita (arkkityyppejä tai prototyyppejä), jotka kuvaavat tietojoukkoa kokonaisuutena. Voimme myös muuntaa dataa kartoittaaksemme ne alemman ulottuvuuden tilaan ja paljastaa enemmän yhtäläisyyksiä, jotka eivät aiemmin olleet ilmeisiä, samalla tavalla kuin voisimme muuttaa fysiikan käänteisavaruuteen.

Käytän myös ohjattua ML:ää löytääkseni materiaali- ja nanotieteessä tärkeitä suhteita ja trendejä, kuten rakenne-ominaisuussuhteita. Tämä sisältää luokituksen, jossa meillä on erillinen etiketti. Oletetaan, että meillä on jo erilaisia ​​nanohiukkasten luokkia ja haluamme niiden ominaisuuksien perusteella määrittää ne automaattisesti joko johonkin luokkaan ja varmistaa, että voimme helposti erottaa nämä luokat pelkän syöttötiedon perusteella.

Käytän myös tilastollista oppimista ja puoliohjattua oppimista. Erityisesti tilastollinen oppiminen on hyödyllistä tieteessä, vaikka sitä ei vielä laajalti käytetä. Ajattelemme sitä kausaalisena päätelmänä, jota käytetään paljon lääketieteellisessä diagnostiikassa, ja sitä voidaan soveltaa tehokkaaseen diagnosoimiseen esimerkiksi siitä, miten materiaali voidaan luoda, eikä vain miksi se on luotu.

Tutkimusryhmässäsi on ihmisiä, joilla on monenlaisia ​​tieteellisiä kiinnostuksen kohteita. Voitko antaa meille esimakua joistakin asioista, joita he opiskelevat?

Kun aloin opiskella fysiikkaa, en koskaan uskonut, että ympärilläni olisi niin hämmästyttävä joukko älykkäitä ihmisiä eri tieteenaloilta. Australian National Universityn laskennallisen tieteen klusteriin kuuluu ympäristötieteilijöitä, maatieteilijöitä, laskennallisia biologeja ja bioinformaatikkoja. Siellä on myös tutkijoita, jotka opiskelevat genomiikkaa, laskennallista neurotieteitä, kvanttikemiaa, materiaalitieteitä, plasmafysiikkaa, astrofysiikkaa, tähtitiedettä, tekniikkaa ja – minä – nanoteknologiaa. Olemme siis monipuolista porukkaa.

Ryhmäämme kuuluu Giuseppe Barca, joka kehittää algoritmeja, jotka tukevat kvanttikemian ohjelmistopaketteja, joita käytetään kaikkialla maailmassa. Hänen tutkimuksensa keskittyy siihen, miten voimme hyödyntää uusia prosessoreita, kuten kiihdyttimiä, ja miten voimme ajatella uudelleen, kuinka suuria molekyylejä voidaan osioida ja pirstalla, jotta voimme strategisesti yhdistää massiivisesti rinnakkaisia ​​työnkulkuja. Hän myös auttaa meitä käyttämään supertietokoneita tehokkaammin, mikä säästää energiaa. Ja viimeisen kahden vuoden ajan hänellä on ollut maailmanennätys parhaassa skaalauskvanttikemian algoritmissa.

Myös pienessä mittakaavassa – tieteen kannalta – on Minh Bui, joka on bioinformaatikko, joka kehittää uusia tilastollisia malleja filogenomiikkajärjestelmien alalla [monitieteellinen ala, joka yhdistää evoluutiotutkimuksen systeemibiologiaan ja ekologiaan verkkotieteen menetelmiä käyttäen]. Näitä ovat osiointimallit, isomorfismitietoiset mallit ja jakelupuumallit. Tämän sovelluksia ovat muun muassa fotosynteettisten entsyymien tai syvän hyönteisfylogian transkriptiodatan alueet, ja hän on tutkinut leviä sekä bakteereja ja viruksia, kuten HIV ja SARS-CoV-2 (joka aiheuttaa COVID-19:ää).

Minh Bui

Asteikon suuremmassa päässä on matemaatikko Quanling Deng, jonka tutkimus keskittyy matemaattiseen mallintamiseen ja simulointiin laajamittaisille medioille, kuten valtamerien ja ilmakehän dynamiikkaan sekä Etelämantereen jäälautoihin.

Parasta on, kun huomaamme, että ongelma yhdeltä toimialueelta on jo ratkaistu toisella, ja vielä parempi, kun löydämme sellaisen, joka on kokenut useilla aloilla, jotta voimme skaalata superlineaarisesti. On hienoa, kun yhdellä ratkaisulla on useita vaikutusalueita. Ja kuinka usein löydät laskennallisen neurotieteilijän työskentelevän plasmafyysikon rinnalla? Se ei vain tapahdu normaalisti.

Sen lisäksi, että työskentelet tutkimusryhmäsi kanssa, olet myös Australian National Universityn tietojenkäsittelylaitoksen apulaisjohtaja. Voitko kertoa meille hieman tästä roolista?

Se on pitkälti hallinnollinen rooli. Sen lisäksi, että saan työskennellä hämmästyttävän tietojenkäsittelytieteilijöiden kanssa datatieteen, kielten perusaloilla, ohjelmistokehityksessä, kyberturvallisuudessa, tietokonenäössä, robotiikassa ja niin edelleen, saan myös luoda mahdollisuuksia uusille ihmisille liittyä kouluun ja olla paras versio itsestään. Suuri osa työstäni johtotehtävissä liittyy ihmisiin. Ja tähän sisältyy rekrytointi, hallintaohjelmamme hoitaminen ja myös ammatillinen kehitysohjelmamme. Minulla on myös ollut mahdollisuus aloittaa uusia ohjelmia aloilla, jotka mielestäni vaativat huomiota.

Yksi tällainen esimerkki oli globaalin COVID-pandemian aikana. Monet meistä suljettiin eivätkä päässeet laboratorioihimme, mikä sai meidät miettimään, mitä voimme tehdä. Käytin tilaisuutta hyväkseni kehittääkseni ohjelman nimeltä Juhlavuoden yhteinen apuraha, joka tukee tutkijoita, jotka työskentelevät tietojenkäsittelytieteen ja toisen alan rajapinnassa, jossa he ratkaisevat suuria haasteita omilla aloillaan, mutta myös hyödyntävät tätä aluetietoa uudentyyppisten tietojenkäsittelytieteen tiedottamiseen. Ohjelma tuki viittä tällaista tutkijaa eri aloilta vuonna 2021.

Olen myös hallituksen puheenjohtaja Pioneerinaiset -ohjelma, jolla on stipendejä, luentokursseja ja apurahoja naisten tukemiseksi tietojenkäsittelyn aloittamisessa ja heidän menestyksensä takaamiseksi koko uransa ajan.

Ja tietysti yksi muista tehtävistäni apulaisjohtajana on huolehtia koulumme laskentatiloista. Tarkastelen tapoja, joilla voimme monipuolistaa resurssivalikoimaamme selviytyäksemme vaikeista ajoista, kuten COVID-tilanteessa, jolloin emme voineet tilata uusia laitteita. Tutkin myös, kuinka voimme olla energiatehokkaampia, koska tietojenkäsittely kuluttaa valtavasti energiaa.

Se on varmasti erittäin jännittävää aikaa ihmisille, jotka tekevät tutkimusta ML:ssä, koska teknologia löytää niin monia erilaisia ​​käyttötarkoituksia. Mitä uusia ML:n sovelluksia odotat eniten tutkimuksessasi?

No, luultavasti jotkut niistä, joista olet jo kuullut, nimittäin tekoäly. Vaikka tekoälyyn liittyy riskejä, siinä on myös valtavia mahdollisuuksia, ja uskon, että generatiivinen tekoäly tulee olemaan erityisen tärkeä tulevina vuosina tieteelle – edellyttäen, että voimme voittaa jotkin ongelmista sen "hallusinoivalla" [kun tekoälyjärjestelmä , kuten suuri kielimalli, tuottaa vääriä tietoja joko harjoitustietojoukon tai kontekstuaalisen logiikan tai näiden molempien yhdistelmän perusteella].

Riippumatta siitä, millä tieteenalalla olemme, meitä rajoittaa käytettävissä oleva aika, rahat, resurssit ja laitteet. Se tarkoittaa, että vaarannamme tieteemme sopeutuaksemme näihin rajoituksiin sen sijaan, että keskittyisimme niiden ylittämiseen

Mutta riippumatta siitä, millä tieteenalalla olemme, olipa kyseessä laskennallinen tai kokeellinen, me kaikki kärsimme useista rajoituksista. Meitä rajoittaa käytettävissämme oleva aika, rahat, resurssit ja laitteet. Se tarkoittaa, että vaarannamme tieteemme sopeutuaksemme näihin rajoituksiin sen sijaan, että keskittyisimme niiden ylittämiseen. Uskon todella, että infrastruktuurin ei pitäisi sanella mitä teemme, sen pitäisi olla päinvastoin.

Luulen, että generatiivinen tekoäly on tullut oikeaan aikaan, jotta voimme vihdoin voittaa jotkut näistä ongelmista, koska sillä on paljon mahdollisuuksia täyttää aukot ja antaa meille käsityksen siitä, mitä tiedettä olisimme voineet tehdä, jos meillä olisi kaikki. tarvittavat resurssit.

Tekoäly voisi todellakin antaa meille mahdollisuuden saada enemmän tekemällä vähemmän ja välttää jotkin sudenkuopat, kuten valintaharha. Se on todella suuri ongelma, kun ML:ää sovelletaan tiedetietosarjoihin. Meidän on tehtävä paljon enemmän työtä varmistaaksemme, että generatiiviset menetelmät tuottavat mielekästä tiedettä, eivät hallusinaatioita. Tämä on erityisen tärkeää, jos ne muodostavat perustan suurille esikoulutetuille malleille. Mutta uskon, että tästä tulee todella jännittävä tieteen aikakausi, jossa teemme yhteistyötä tekoälyn kanssa sen sijaan, että se vain suorittaisi tehtävän meille.

Aikaleima:

Lisää aiheesta Fysiikan maailma