De jos în sus în sus în jos: om de știință în calcul Amanda Barnard despre frumusețea simulărilor, a învățării automate și a modului în care cele două se intersectează - Physics World

De jos în sus în sus în jos: om de știință în calcul Amanda Barnard despre frumusețea simulărilor, a învățării automate și a modului în care cele două se intersectează - Physics World

Amanda Barnard
Specialist în interfață Amanda Barnard este director adjunct și lider în domeniul științei computaționale la Școala de Calcul de la Universitatea Națională Australiană. (Cu amabilitatea: Sitthixay Ditthavong/Canberra Times)

De la utilizarea supercalculatoarelor pentru a folosi noi tipuri de materiale până la formarea modelelor de învățare automată pentru a studia proprietăți complexe la scară nanometrică, Omul de știință australian Amanda Barnard lucrează la interfața dintre informatică și știința datelor. Un profesor senior în Școala de calcul de la Universitatea Națională Australiană, Barnard este, de asemenea, director adjunct și lider în domeniul științei computaționale. În zilele noastre, ea folosește o varietate de metode de calcul pentru a rezolva probleme din științele fizice, dar Barnard și-a început cariera ca fizician, obținându-și doctoratul în fizica teoretică a materiei condensate în 2003.

După ce și-a petrecut următorii câțiva ani ca postdoctorat la Centrul pentru materiale la scară nanometrică de la Laboratorul Național Argonne în SUA, ea a început să-și extindă interesele de cercetare pentru a include multe aspecte ale științei computaționale, inclusiv utilizarea învățării automate în nanotehnologie, știința materialelor, chimie și medicină.

Un tip din ambele Institutul Australian de Fizică si Societatea Regală de Chimie, în 2022 Barnard a fost numit a Membru al Ordinului Australiei. Ea a câștigat, de asemenea, o serie de premii, inclusiv Premiul Feynman pentru nanotehnologie 2014 (Teoria) și Medalie 2019 de la Asociația Modelatorilor Moleculari din Australasia. Ea vorbește cu Hamish Johnston despre interesul ei pentru aplicarea învățării automate la o serie de probleme și despre provocările și recompensele de a face administrarea universitară.

Ne poți spune puțin despre ceea ce faci ca om de știință în calcul?

Știința computațională implică proiectarea și utilizarea modelelor matematice pentru a analiza probleme care necesită calcul în multe domenii ale științei și ingineriei. Aceasta include progrese în infrastructura de calcul și algoritmi care permit cercetătorilor din aceste domenii diferite să efectueze experimente de calcul la scară largă. Într-un fel, știința computațională implică cercetarea în calculul de înaltă performanță și nu doar cercetarea folosind un computer de înaltă performanță.

Ne petrecem cea mai mare parte a timpului pe algoritmi și încercând să ne dăm seama cum să-i implementăm într-un mod care să folosească cel mai bine hardware-ul avansat; și acel hardware se schimbă tot timpul. Aceasta include simulări convenționale bazate pe modele matematice dezvoltate special în diferite domenii științifice, fie că este vorba de fizică, chimie sau nu numai. De asemenea, petrecem mult timp folosind metode de la masina de învățare (ML) și inteligență artificială (AI), dintre care majoritatea au fost dezvoltate de informaticieni, ceea ce face o cercetare foarte interdisciplinară. Acest lucru permite folosirea unui număr întreg de noi abordări în toate aceste domenii științifice diferite.

Învățarea automată ne permite să recuperăm o mare parte din complexitatea pe care am pierdut-o atunci când derivăm acele teorii frumoase

Simularea a luat naștere din aspectele teoretice ale fiecărei arii științifice care, cu niște niveluri convenabile de abstractizare, ne-au permis să rezolvăm ecuațiile. Dar când am dezvoltat acele teorii, ele au fost aproape o simplificare excesivă a problemei, care a fost făcută fie în căutarea eleganței matematice, fie doar de dragul caracterului practic. ML ne permite să recuperăm o mare parte din complexitatea pe care am pierdut-o atunci când derivăm acele teorii frumoase. Dar, din păcate, nu toate ML funcționează bine cu știința, așa că oamenii de știință computaționali petrec mult timp încercând să descopere cum să aplice acești algoritmi care nu au fost niciodată intenționați să fie utilizați pentru aceste tipuri de seturi de date pentru a depăși unele dintre problemele care sunt experimentat la interfață. Și acesta este unul dintre domeniile interesante care îmi plac.

Ți-ai început cariera ca fizician. Ce te-a determinat să treci la știința computațională?

Fizica este un punct de plecare excelent pentru aproape orice. Dar am fost mereu pe calea științei computaționale fără să-mi dau seama. În timpul primului meu proiect de cercetare ca student, am folosit metode computaționale și am fost imediat captivat. Mi-a plăcut codificarea, de la scrierea codului până la rezultatele finale, așa că am știut imediat că supercalculatoarele erau destinate să fie instrumentul meu științific. A fost interesant să mă gândesc la ce ar putea face un om de știință în materiale dacă ar putea face mostre perfecte de fiecare dată. Sau ce ar putea face un chimist dacă ar putea elimina toate contaminările și ar avea reacții perfecte. Ce am putea face dacă am putea explora medii dure sau periculoase fără riscul de a răni pe cineva? Și, mai important, dacă am putea face toate aceste lucruri simultan, la cerere, de fiecare dată când am încercat?

Frumusețea supercomputerelor este că sunt singurul instrument care ne permite să atingem această perfecțiune aproape. Ceea ce mă captivează cel mai mult este că pot nu doar să reproduc ceea ce pot face colegii mei în laborator, ci și să fac tot ce nu pot face ei în laborator. Deci, din primele zile, fizica mea computațională a fost pe un computer. Chimia mea computațională a evoluat apoi la materiale, informatica materialelor și acum aproape exclusiv ML. Dar m-am concentrat întotdeauna pe metodele din fiecare dintre aceste domenii și cred că o bază în fizică îmi permite să mă gândesc foarte creativ la modul în care abordez toate aceste alte domenii din punct de vedere computațional.

Cum diferă învățarea automată de simulările clasice pe computer?

Majoritatea cercetărilor mele sunt acum ML, probabil 80% din ea. Totuși, mai fac niște simulări convenționale, deoarece îmi dau ceva foarte diferit. Simulările sunt în principiu o abordare de jos în sus. Începem cu o anumită înțelegere a unui sistem sau a unei probleme, rulăm o simulare și apoi obținem câteva date la sfârșit. ML, în schimb, este o abordare de sus în jos. Începem cu datele, rulăm un model și apoi ajungem la o mai bună înțelegere a sistemului sau a problemei. Simularea se bazează pe reguli determinate de teoriile noastre științifice consacrate, în timp ce ML se bazează pe experiențe și istorie. Simulările sunt adesea în mare măsură deterministe, deși există câteva exemple de metode stocastice, cum ar fi Monte Carlo. ML este în mare parte stocastică, deși există câteva exemple care sunt și ele deterministe.

Cu simulări, sunt capabil să fac o extrapolare foarte bună. Multe dintre teoriile care stau la baza simulărilor ne permit să explorăm zone ale unui „spațiu de configurare” (coordonatele care determină toate stările posibile ale unui sistem) sau zone ale unei probleme pentru care nu avem date sau informații. Pe de altă parte, ML este foarte bun la interpolarea și completarea tuturor golurilor și este foarte bun pentru inferență.

Conceptul de flux de date

Într-adevăr, cele două metode se bazează pe tipuri foarte diferite de logică. Simularea se bazează pe o logică „dacă-atunci-altfel”, ceea ce înseamnă că dacă am o anumită problemă sau un anumit set de condiții, atunci voi obține un răspuns determinist sau, altfel, din punct de vedere computațional, probabil că se va prăbuși dacă obții este greșit. ML, în schimb, se bazează pe o logică „estimare-îmbunătățire-repetare”, ceea ce înseamnă că va oferi întotdeauna un răspuns. Răspunsul este întotdeauna îmbunătățibil, dar s-ar putea să nu fie întotdeauna corect, așa că aceasta este o altă diferență.

Simulările sunt intradisciplinare: au o relație foarte strânsă cu cunoașterea domeniului și se bazează pe inteligența umană. Pe de altă parte, ML este interdisciplinară: folosind modele dezvoltate în afara domeniului inițial, este agnostic față de cunoștințele de domeniu și se bazează în mare măsură pe inteligența artificială. De aceea îmi place să combin cele două abordări.

Ne puteți spune puțin mai multe despre cum utilizați învățarea automată în cercetarea dvs.?

Înainte de apariția ML, oamenii de știință trebuiau să înțeleagă destul de mult relațiile dintre intrări și ieșiri. Trebuia să avem structura modelului predeterminată înainte de a putea să-l rezolvăm. Însemna că trebuia să avem o idee despre răspuns înainte de a putea căuta unul.

Putem dezvolta structura unei expresii sau a unei ecuații și o rezolvăm în același timp. Asta accelerează metoda științifică și este un alt motiv pentru care îmi place să folosesc învățarea automată

Când utilizați ML, mașinile folosesc tehnici statistice și informații istorice pentru a se programa, practic. Înseamnă că putem dezvolta structura unei expresii sau a unei ecuații și o putem rezolva în același timp. Asta accelerează metoda științifică și este un alt motiv pentru care îmi place să o folosesc.

Tehnicile ML pe care le folosesc sunt diverse. Există o mulțime de arome și tipuri diferite de ML, la fel cum există o mulțime de tipuri diferite de fizică computațională sau metode de fizică experimentală. Folosesc învățarea nesupravegheată, care se bazează în întregime pe variabile de intrare și se uită la dezvoltarea „modelelor ascunse” sau la încercarea de a găsi date reprezentative. Acest lucru este util pentru materiale în nanoștiință, când nu am făcut experimentele pentru a măsura probabil o proprietate, dar știm destul de multe despre condițiile de intrare pe care le-am pus pentru a dezvolta materialul.

Învățarea nesupravegheată poate fi utilă în găsirea unor grupuri de structuri, denumite clustere, care au asemănări în spațiul de dimensiuni mari sau structuri pure și reprezentative (arhetipuri sau prototipuri) care descriu setul de date ca întreg. De asemenea, putem transforma datele pentru a le mapa într-un spațiu de dimensiuni inferioare și a dezvălui mai multe asemănări care nu erau evidente anterior, într-un mod similar în care am putea trece la spațiu reciproc în fizică.

De asemenea, folosesc ML supravegheat pentru a găsi relații și tendințe, cum ar fi relațiile structură-proprietate, care sunt importante în materiale și nanoștiință. Aceasta include clasificarea, unde avem o etichetă discretă. Să presupunem că avem deja diferite categorii de nanoparticule și, pe baza caracteristicilor lor, dorim să le atribuim automat fie unei categorii sau alteia și să ne asigurăm că putem separa cu ușurință aceste clase doar pe baza datelor de intrare.

Folosesc și învățarea statistică și învățarea semi-supravegheată. Învățarea statistică, în special, este utilă în știință, deși nu este încă utilizată pe scară largă. Ne gândim la asta ca la o inferență cauzală care este folosită mult în diagnosticarea medicală și aceasta poate fi aplicată pentru a diagnostica eficient cum ar putea fi creat un material, de exemplu, și nu doar motivul pentru care este creat.

Grupul dvs. de cercetare include oameni cu o gamă largă de interese științifice. Ne puteți oferi o aromă a unora dintre lucrurile pe care le studiază?

Când am început în fizică, nu m-am gândit niciodată că voi fi înconjurat de un grup atât de uimitor de oameni inteligenți din diferite domenii științifice. Grupul de științe computaționale de la Universitatea Națională Australiană include oameni de știință în mediu, oameni de știință ai pământului, biologi computaționali și bioinformaticieni. Există, de asemenea, cercetători care studiază genomica, neuroștiința computațională, chimia cuantică, știința materialelor, fizica plasmei, astrofizică, astronomie, inginerie și – eu – nanotehnologie. Deci suntem un grup divers.

Grupul nostru include Giuseppe Barca, care dezvoltă algoritmi care stau la baza pachetelor software de chimie cuantică care sunt utilizate în întreaga lume. Cercetările sale se concentrează asupra modului în care putem folosi noi procesoare, cum ar fi acceleratoarele, și cum putem regândi modul în care moleculele mari pot fi împărțite și fragmentate, astfel încât să putem combina strategic fluxuri de lucru paralele masive. De asemenea, ne ajută să folosim supercalculatoarele mai eficient, ceea ce economisește energie. Și în ultimii doi ani, el a deținut recordul mondial în cel mai bun algoritm de scalare de chimie cuantică.

Tot la scară mică – din punct de vedere al științei – este Minh Bui, care este un bioinformatician care lucrează la dezvoltarea de noi modele statistice în domeniul sistemelor filogenomice [un domeniu multidisciplinar care combină cercetarea evolutivă cu biologia și ecologia sistemelor, folosind metode din știința rețelelor]. Acestea includ modele de partiționare, modele de izomorfism și modele de arbore de distribuție. Aplicațiile acestui lucru includ zone în enzimele fotosintetice sau datele de transcripție a filogeniei profunde ale insectelor și a lucrat în cercetarea algelor, precum și a bacteriilor și virușilor precum HIV și SARS-CoV-2 (care cauzează COVID-19).

Minh Bui

La capătul cel mai mare al scalei se află matematicianul Quanling Deng, ale cărui cercetări se concentrează pe modelarea și simularea matematică pentru medii la scară largă, cum ar fi oceanele și dinamica atmosferei, precum și sloturile de gheață din Antarctica.

Cea mai bună parte este atunci când descoperim că o problemă dintr-un domeniu a fost deja rezolvată într-un altul și chiar mai bine când descoperim una cu experiență în mai multe domenii, astfel încât să putem scala super-liniar. Este grozav când o soluție are mai multe zone de impact. Și cât de des ați găsi un neuroștiință computațional care lucrează alături de un fizician al plasmei? Pur și simplu nu se întâmplă în mod normal.

Pe lângă faptul că lucrezi cu grupul tău de cercetare, ești și director adjunct al Școlii de Calcul a Universității Naționale din Australia. Ne poți spune puțin despre acest rol?

Este în mare parte un rol administrativ. Așadar, pe lângă faptul că lucrez cu un grup uimitor de informaticieni din domeniul științei datelor, domenii fundamentale în limbi străine, dezvoltare software, securitate cibernetică, viziune computerizată, robotică și așa mai departe, pot crea oportunități pentru ca noi oameni să se alăture școlii și să fie cea mai bună versiune a lor. O mare parte din munca mea în rolul de conducere este despre oameni. Și aceasta include recrutarea, îngrijirea programului nostru de permanență și, de asemenea, programul nostru de dezvoltare profesională. De asemenea, am avut ocazia să încep niște programe noi pentru domenii care am considerat că au nevoie de atenție.

Un astfel de exemplu a fost în timpul pandemiei globale de COVID. Mulți dintre noi au fost închisi și nu am putut accesa laboratoarele noastre, ceea ce ne-a lăsat să ne întrebăm ce putem face. Am profitat de ocazie pentru a dezvolta un program numit Jubilee Joint Fellowship, care sprijină cercetătorii care lucrează la interfața dintre informatica și un alt domeniu, unde rezolvă marile provocări din domeniile lor, dar folosesc și cunoștințele din domeniu pentru a informa noi tipuri de informatică. Programul a sprijinit cinci astfel de cercetători din diferite domenii în 2021.

Sunt și președintele Programul Femei Pionier, care are burse, burse de prelegere și burse pentru a sprijini femeile care intră în informatică și pentru a se asigura că au succes pe parcursul carierei lor la noi.

Și, desigur, unul dintre celelalte roluri ale mele ca director adjunct este să am grijă de facilitățile de calcul ale școlii noastre. Mă uit la modalități prin care ne putem diversifica resursele pentru a trece prin perioade grele, cum ar fi în perioada COVID, când nu am putut comanda niciun echipament nou. Mă uit, de asemenea, la modul în care putem fi mai eficienți din punct de vedere energetic, deoarece calculul utilizează o cantitate enormă de energie.

Trebuie să fie un moment foarte interesant pentru oamenii care fac cercetări în ML, deoarece tehnologia găsește atât de multe utilizări diferite. Ce aplicații noi ale ML așteptați cel mai mult în cercetarea dvs.?

Ei bine, probabil unele dintre cele despre care auziți deja, și anume AI. Deși există riscuri asociate cu IA, există, de asemenea, o oportunitate enormă și cred că IA generativă va fi deosebit de importantă în următorii ani pentru știință – cu condiția să putem depăși unele dintre problemele cu „halucinarea” [când un sistem AI , cum ar fi un model de limbaj mare, generează informații false, bazate fie pe un set de date de antrenament, fie pe logica contextuală, fie pe o combinație a ambelor].

Indiferent în ce domeniu al științei ne aflăm, suntem restricționați de timpul pe care îl avem, banii, resursele și echipamentele la care avem acces. Înseamnă că ne compromitem știința pentru a se potrivi acestor limitări, mai degrabă decât să ne concentrăm pe depășirea lor

Dar indiferent în ce domeniu al științei ne aflăm, fie el computațional sau experimental, toți suferim de o serie de restricții. Suntem restricționați de timpul de care dispunem, banii, resursele și echipamentele la care avem acces. Înseamnă că ne compromitem știința pentru a se potrivi acestor limitări, mai degrabă decât să ne concentrăm pe depășirea lor. Cred cu adevărat că infrastructura nu ar trebui să ne dicteze ce facem, ar trebui să fie invers.

Cred că inteligența artificială generativă a venit la momentul potrivit pentru a ne permite să depășim în sfârșit unele dintre aceste probleme, deoarece are un potențial mare de a umple golurile și de a ne oferi o idee despre ce știință am fi putut face, dacă le-am fi avut pe toate. resursele necesare.

Într-adevăr, AI ne-ar putea permite să obținem mai mult făcând mai puțin și evitând unele dintre capcane, cum ar fi părtinirea selecției. Aceasta este o problemă foarte mare atunci când se aplică ML la seturile de date științifice. Trebuie să muncim mult mai mult pentru a ne asigura că metodele generative produc știință semnificativă, nu halucinații. Acest lucru este deosebit de important dacă urmează să formeze baza pentru modele mari pre-antrenate. Dar cred că aceasta va fi o eră a științei cu adevărat incitantă, în care lucrăm în colaborare cu AI, mai degrabă decât să îndeplinească doar o sarcină pentru noi.

Timestamp-ul:

Mai mult de la Lumea fizicii