Aşağıdan yukarıya: simülasyonların güzelliği, makine öğrenimi ve ikisinin nasıl kesiştiği üzerine hesaplama bilimcisi Amanda Barnard - Fizik Dünyası

Aşağıdan yukarıya: simülasyonların güzelliği, makine öğrenimi ve ikisinin nasıl kesiştiği üzerine hesaplama bilimcisi Amanda Barnard - Fizik Dünyası

Amanda Barnard
Arayüz uzmanı Amanda Barnard, Avustralya Ulusal Üniversitesi Bilgisayar Okulu'nda müdür yardımcısı ve hesaplamalı bilim lideridir. (Nezaket: Sitthixay Ditthavong/Kanberra Times)

Yeni malzeme türlerinden yararlanmak için süper bilgisayarların kullanılmasından, nano ölçekte karmaşık özellikleri incelemek için makine öğrenimi modellerinin eğitilmesine kadar, Avustralyalı hesaplamalı bilim adamı Amanda Barnard bilgi işlem ve veri biliminin arayüzünde çalışır. Kıdemli bir profesör Avustralya Ulusal Üniversitesi'nde Bilgisayar OkuluBarnard aynı zamanda müdür yardımcısı ve hesaplamalı bilim lideridir. Bugünlerde fizik bilimlerindeki problemleri çözmek için çeşitli hesaplamalı yöntemler kullanıyor ancak Barnard kariyerine fizikçi olarak başladı ve 2003 yılında teorik yoğun madde fiziği alanında doktorasını aldı.

Önümüzdeki birkaç yılı doktora sonrası olarak geçirdikten sonra Argonne Ulusal Laboratuvarı'ndaki Nano Ölçekli Malzemeler Merkezi ABD'de araştırma ilgi alanlarını, nanoteknoloji, malzeme bilimi, kimya ve tıpta makine öğreniminin kullanımı da dahil olmak üzere hesaplamalı bilimin birçok yönünü kapsayacak şekilde genişletmeye başladı.

İkisinin de arkadaşı Avustralya Fizik Enstitüsü ve Kraliyet Kimya Topluluğu2022'de Barnard atandı Avustralya Nişanı Üyesi. Ayrıca birçok ödül kazandı; bunlar arasında 2014 Feynman Nanoteknoloji Ödülü (Teori) ve Avustralasya Moleküler Modelleyiciler Birliği'nden 2019 madalyası. Hamish Johnston ile makine öğrenimini çeşitli sorunlara uygulama konusundaki ilgisini ve üniversite yöneticiliği yapmanın zorluklarını ve ödüllerini anlatıyor.

Bir hesaplamalı bilim insanı olarak neler yaptığınızı bize biraz anlatabilir misiniz?

Hesaplamalı bilim, bilim ve mühendisliğin birçok alanındaki hesaplama gerektiren sorunları analiz etmek için matematiksel modeller tasarlamayı ve kullanmayı içerir. Buna, bu farklı alanlardaki araştırmacıların büyük ölçekli hesaplamalı deneyler yapmalarını sağlayan hesaplama altyapısı ve algoritmalardaki gelişmeler de dahildir. Bir bakıma hesaplamalı bilim, yalnızca yüksek performanslı bir bilgisayar kullanarak yapılan araştırmayı değil, yüksek performanslı hesaplamaya yönelik araştırmaları da içerir.

Zamanımızın çoğunu algoritmalara harcıyoruz ve bunları gelişmiş donanımdan en iyi şekilde yararlanacak şekilde nasıl uygulayacağımızı bulmaya çalışıyoruz; ve bu donanım sürekli değişiyor. Buna fizik, kimya veya ötesi gibi farklı bilimsel alanlarda özel olarak geliştirilen matematiksel modellere dayalı geleneksel simülasyonlar da dahildir. Ayrıca aşağıdaki yöntemleri kullanarak çok fazla zaman harcıyoruz: makine öğrenme (ML) ve yapay zeka (AI), çoğu bilgisayar bilimcileri tarafından geliştirildi ve bu da onu çok disiplinlerarası bir araştırma haline getirdi. Bu, tüm bu farklı bilimsel alanlarda bir sürü yeni yaklaşımın kullanılmasına olanak tanır.

Makine öğrenimi, bu güzel teorileri türetirken kaybettiğimiz karmaşıklığın çoğunu yeniden yakalamamızı sağlıyor

Simülasyon, her bilimsel alanın bazı uygun soyutlama düzeyleriyle denklemleri çözmemizi sağlayan teorik yönlerinden doğmuştur. Ancak bu teorileri geliştirdiğimizde, bunlar neredeyse problemin aşırı basitleştirilmesiydi; bu da ya matematiksel zarafet arayışı içinde ya da sadece pratiklik adına yapıldı. ML, bu güzel teorileri türettiğimizde kaybettiğimiz karmaşıklığın çoğunu yeniden yakalamamızı sağlıyor. Ancak ne yazık ki tüm makine öğrenimi bilimle iyi çalışmaz ve bu nedenle hesaplamalı bilim insanları, bu tür veri kümeleri için kullanılması asla amaçlanmayan bu algoritmaların, bazı sorunların üstesinden gelmek için nasıl uygulanacağını bulmaya çalışırken çok zaman harcıyorlar. Arayüz konusunda deneyimli. Bu da sevdiğim heyecan verici alanlardan biri.

Kariyerinize fizikçi olarak başladınız. Hesaplamalı bilime yönelmenize ne sebep oldu?

Fizik hemen hemen her şey için harika bir başlangıç ​​noktasıdır. Ama farkında olmadan her zaman hesaplamalı bilime giden yoldaydım. Öğrenci olarak ilk araştırma projem sırasında hesaplamalı yöntemler kullandım ve anında bağımlısı oldum. Kodun yazılmasından nihai sonuçlara kadar kodlamayı çok sevdim ve böylece süper bilgisayarların benim bilimsel aracım olacağını anında anladım. Bir malzeme bilimcisinin her seferinde mükemmel örnekler üretebilmesi durumunda neler yapabileceğini düşünmek heyecan vericiydi. Veya bir kimyager tüm kirlilikleri giderip mükemmel reaksiyonlara sahip olsaydı neler yapabilirdi? Kimseye zarar verme riski olmadan zorlu veya tehlikeli ortamları keşfedebilseydik ne yapabilirdik? Ve daha da önemlisi, ya tüm bunları aynı anda, talep üzerine, her denediğimizde yapabilseydik?

Süper bilgisayarların güzelliği, bu mükemmelliğe ulaşmamızı sağlayan tek araç olmalarıdır. Beni en çok cezbeden şey, meslektaşlarımın laboratuvarda yapabildiklerini yeniden üretebilmem değil, aynı zamanda onların laboratuvarda yapamadıkları her şeyi de yapabilmem. Yani ilk günlerden itibaren hesaplamalı fiziğim bilgisayardaydı. Hesaplamalı kimyam daha sonra malzemelere, malzeme bilişimine ve şimdi de neredeyse tamamen makine öğrenimine doğru evrildi. Ancak ben her zaman bu alanların her birindeki yöntemlere odaklandım ve bence fizikteki bir temel, diğer tüm alanlara hesaplamalı olarak nasıl yaklaşacağım konusunda çok yaratıcı düşünmemi sağlıyor.

Makine öğreniminin klasik bilgisayar simülasyonlarından farkı nedir?

Araştırmalarımın çoğu artık makine öğrenimi üzerine, muhtemelen %80'i. Ancak hala bazı geleneksel simülasyonlar yapıyorum çünkü bana çok farklı bir şey veriyorlar. Simülasyonlar temelde aşağıdan yukarıya bir yaklaşımdır. Bir sistemi veya problemi biraz anlayarak başlıyoruz, bir simülasyon yürütüyoruz ve sonunda bazı veriler elde ediyoruz. ML ise aksine yukarıdan aşağıya bir yaklaşımdır. Verilerle başlıyoruz, bir model çalıştırıyoruz ve ardından sistemi veya sorunu daha iyi anlıyoruz. Simülasyon yerleşik bilimsel teorilerimizin belirlediği kurallara dayanırken, ML deneyimlere ve tarihe dayanmaktadır. Monte Carlo gibi stokastik yöntemlerin bazı örnekleri olmasına rağmen simülasyonlar genellikle büyük ölçüde deterministiktir. ML büyük ölçüde stokastiktir, ancak deterministik olan bazı örnekler de vardır.

Simülasyonlarla çok iyi tahminler yapabiliyorum. Simülasyonları destekleyen teorilerin çoğu, bir "konfigürasyon uzayının" (bir sistemin tüm olası durumlarını belirleyen koordinatlar) alanlarını veya hakkında hiçbir veri veya bilgiye sahip olmadığımız bir problemin alanlarını keşfetmemizi sağlar. Öte yandan, ML enterpolasyon yapma ve tüm boşlukları doldurma konusunda gerçekten çok iyi ve çıkarım yapmak için de çok iyi.

Veri akışı konsepti

Aslında iki yöntem çok farklı mantık türlerine dayanmaktadır. Simülasyon "eğer-o halde-else" mantığına dayanır; bu, belirli bir sorunum veya belirli bir dizi koşulum varsa, o zaman deterministik bir yanıt alacağım veya hesaplama açısından, şunu alırsanız muhtemelen çökeceği anlamına gelir: yanlış. ML ise bunun aksine "tahmin et-iyileştir-tekrarla" mantığına dayanır, bu da her zaman bir cevap vereceği anlamına gelir. Bu cevap her zaman geliştirilebilir ancak her zaman doğru olmayabilir, bu da başka bir farktır.

Simülasyonlar disiplinler arasıdır: Alan bilgisi ile çok yakın bir ilişkileri vardır ve insan zekasına dayanırlar. Öte yandan, makine öğrenimi disiplinlerarasıdır: orijinal alanın dışında geliştirilen modelleri kullanır, alan bilgisinden bağımsızdır ve büyük ölçüde yapay zekaya dayanır. Bu yüzden iki yaklaşımı birleştirmeyi seviyorum.

Araştırmanızda makine öğrenimini nasıl kullandığınız hakkında bize biraz daha bilgi verebilir misiniz?

Makine öğreniminin ortaya çıkışından önce, bilim adamlarının girdiler ve çıktılar arasındaki ilişkileri hemen hemen anlamaları gerekiyordu. Modelin yapısını çözebilmemiz için önceden belirlenmiş olmamız gerekiyordu. Bu, bir cevap aramadan önce bir cevap hakkında fikir sahibi olmamız gerektiği anlamına geliyordu.

Bir ifadenin veya denklemin yapısını geliştirip aynı anda çözebiliriz. Bu, bilimsel yöntemi hızlandırır ve makine öğrenimini kullanmayı sevmemin bir başka nedeni de budur

ML'yi kullandığınızda, makineler temel olarak kendilerini programlamak için istatistiksel teknikleri ve geçmiş bilgileri kullanır. Bu, bir ifadenin veya denklemin yapısını geliştirip aynı anda çözebileceğimiz anlamına gelir. Bu, bilimsel yöntemi hızlandırır ve onu kullanmayı sevmemin bir başka nedeni de budur.

Kullandığım makine öğrenimi teknikleri çeşitlidir. Tıpkı hesaplamalı fizik veya deneysel fizik yöntemlerinin birçok farklı türü olduğu gibi, makine öğreniminin de pek çok farklı çeşidi ve türü vardır. Tamamen girdi değişkenlerine dayanan denetimsiz öğrenmeyi kullanıyorum ve "gizli modeller" geliştirmeye veya temsili veriler bulmaya çalışıyor. Bu, belki bir özelliği ölçmek için deneyler yapmadığımız, ancak malzemeyi geliştirmek için koyduğumuz girdi koşulları hakkında oldukça fazla bilgi sahibi olduğumuz nanobilimdeki malzemeler için faydalıdır.

Denetimsiz öğrenme, yüksek boyutlu uzayda benzerliklere sahip, kümeler olarak adlandırılan yapı gruplarının veya veri kümesini bir bütün olarak tanımlayan saf ve temsili yapıların (arketipler veya prototipler) bulunmasında yararlı olabilir. Verileri daha düşük boyutlu bir uzaya haritalayacak şekilde dönüştürebilir ve fizikte karşılıklı uzaya geçiş yapabileceğimiz gibi, daha önce belirgin olmayan daha fazla benzerliği ortaya çıkarabiliriz.

Ayrıca malzeme ve nanobilimde önemli olan yapı-özellik ilişkileri gibi ilişkileri ve eğilimleri bulmak için denetimli makine öğrenimini kullanıyorum. Bu, ayrı bir etikete sahip olduğumuz sınıflandırmayı da içerir. Halihazırda farklı nanopartikül kategorilerimiz olduğunu ve özelliklerine göre bunları otomatik olarak bir kategoriye veya diğerine atamak istediğimizi ve bu sınıfları yalnızca girdi verilerine dayanarak kolayca ayırabildiğimizden emin olmak istediğimizi varsayalım.

İstatistiksel öğrenmeyi ve yarı denetimli öğrenmeyi de kullanıyorum. Özellikle istatistiksel öğrenme, henüz yaygın olarak kullanılmasa da bilimde faydalıdır. Bunu, tıbbi teşhislerde çokça kullanılan nedensel bir çıkarım olarak düşünüyoruz ve bu, örneğin bir materyalin yalnızca neden oluşturulduğundan ziyade, nasıl oluşturulabileceğini etkili bir şekilde teşhis etmek için uygulanabilir.

Araştırma grubunuz çok çeşitli bilimsel ilgi alanlarına sahip insanlardan oluşuyor. Bize çalıştıkları şeylerden bazılarını anlatabilir misiniz?

Fiziğe başladığımda, etrafımın farklı bilim alanlarından bu kadar muhteşem bir grup akıllı insan tarafından çevreleneceğini hiç düşünmemiştim. Avustralya Ulusal Üniversitesi'ndeki hesaplamalı bilim kümesi, çevre bilimcileri, yer bilimcileri, hesaplamalı biyologları ve biyoinformatikçileri içerir. Ayrıca genom bilimi, hesaplamalı sinir bilimi, kuantum kimyası, malzeme bilimi, plazma fiziği, astrofizik, astronomi, mühendislik ve - ben - nanoteknoloji üzerine çalışan araştırmacılar da var. Yani biz çok çeşitli bir grubuz.

Grubumuz şunları içerir: Giuseppe BarçaTüm dünyada kullanılan kuantum kimyası yazılım paketlerinin temelini oluşturan algoritmalar geliştiren Dr. Araştırması, hızlandırıcılar gibi yeni işlemcilerden nasıl yararlanabileceğimize ve devasa paralel iş akışlarını stratejik olarak birleştirebilmemiz için büyük moleküllerin nasıl bölümlendirilip parçalanabileceğine nasıl yeniden düşünebileceğimize odaklanıyor. Ayrıca süper bilgisayarları daha verimli kullanmamıza da yardımcı oluyor, bu da enerji tasarrufu sağlıyor. Ve son iki yıldır en iyi ölçeklendirme kuantum kimyası algoritmasında dünya rekorunu elinde tutuyor.

Ayrıca küçük ölçekte -bilimsel açıdan- Minh BuiFilogenomik sistemler (ağ biliminin yöntemlerini kullanarak evrimsel araştırmayı sistem biyolojisi ve ekoloji ile birleştiren multidisipliner bir alan) alanında yeni istatistiksel modeller geliştirmeye çalışan bir biyoinformatikçidir. Bunlar bölümleme modellerini, izomorfizme duyarlı modelleri ve dağıtım ağacı modellerini içerir. Bunun uygulamaları fotosentetik enzimlerdeki alanları veya derin böcek filogenisi transkripsiyon verilerini içerir ve kendisi alglerin yanı sıra HIV ve SARS-CoV-2 (COVID-19'a neden olan) gibi bakteri ve virüsleri inceleyen çalışmalar yapmıştır.

Minh Bui

Ölçeğin büyük ucunda matematikçi var Quanling DengAraştırmaları okyanuslar ve atmosfer dinamikleri ile Antarktika buz kütleleri gibi büyük ölçekli ortamlar için matematiksel modelleme ve simülasyona odaklanıyor.

En iyi yanı, bir alandaki bir sorunun aslında başka bir alanda çözülmüş olduğunu keşfetmemizdir ve daha da iyisi, süper doğrusal olarak ölçeklenebilmek için birden fazla alanda deneyimlenen bir sorunu keşfetmemizdir. Bir çözümün birden fazla etki alanına sahip olması harikadır. Ve bir plazma fizikçisinin yanında çalışan bir hesaplamalı sinir bilimciyi ne sıklıkta bulursunuz? Normalde olmaz.

Araştırma grubunuzla birlikte çalışmanın yanı sıra, aynı zamanda Avustralya Ulusal Üniversitesi Bilgisayar Okulu'nun müdür yardımcısısınız. Bize bu rolden biraz bahseder misiniz?

Bu büyük ölçüde idari bir rol. Veri bilimi, dillerdeki temel alanlar, yazılım geliştirme, siber güvenlik, bilgisayarla görme, robot bilimi vb. konularda muhteşem bir bilgisayar bilimci grubuyla çalışmanın yanı sıra, aynı zamanda yeni insanların okula katılması ve başarılı olması için fırsatlar yaratıyorum. kendilerinin en iyi versiyonu. Liderlik rolündeki çalışmalarımın çoğu insanlarla ilgilidir. Buna işe alım, görev süresi programımız ve mesleki gelişim programımız da dahildir. Ayrıca dikkat edilmesi gerektiğini düşündüğüm alanlar için yeni programlar başlatma fırsatım da oldu.

Böyle bir örnek, küresel COVID salgını sırasında yaşandı. Birçoğumuz kapatıldı ve laboratuvarlarımıza erişemedik, bu da ne yapabileceğimizi merak etmemize neden oldu. adlı bir program geliştirme fırsatını yakaladım. Jübile Ortak Bursu, bilgisayar bilimi ile başka bir alan arasındaki arayüzde çalışan, kendi alanlarındaki büyük zorlukları çözen ve aynı zamanda bu alan bilgisini yeni bilgisayar bilimi türlerini bilgilendirmek için kullanan araştırmacıları destekler. Program, 2021'de farklı alanlardaki bu türden beş araştırmacıyı destekledi.

aynı zamanda başkanlığını yapıyorum Öncü Kadınlar ProgramıKadınların bilgisayar sektörüne girmesini desteklemek ve bizimle kariyerleri boyunca başarılı olmalarını sağlamak için burslar, konferanslar ve arkadaşlıklar sunan .

Ve tabii ki müdür yardımcısı olarak diğer görevlerimden biri de okulumuzun bilgi işlem tesisleriyle ilgilenmek. Yeni ekipman sipariş edemediğimiz COVID sırasında olduğu gibi zor zamanları atlatmak için kaynak boru hattımızı çeşitlendirebileceğimiz yollara bakıyorum. Ayrıca enerji açısından nasıl daha verimli olabileceğimizi de araştırıyorum çünkü bilgi işlem çok büyük miktarda enerji tüketiyor.

Teknoloji pek çok farklı kullanım alanı bulduğundan, makine öğrenimi konusunda araştırma yapan insanlar için çok heyecan verici bir zaman olmalı. Araştırmanızda en çok hangi yeni makine öğrenimi uygulamalarını sabırsızlıkla bekliyorsunuz?

Muhtemelen zaten duyduklarınızdan bazıları, yani yapay zeka. Yapay zekayla ilgili riskler olsa da muazzam bir fırsat da var ve üretken yapay zekanın önümüzdeki yıllarda bilim için özellikle önemli olacağını düşünüyorum; bunun "halüsinasyon görmesi" (bir yapay zeka sistemi olduğunda) ile ilgili bazı sorunların üstesinden gelebilmemiz şartıyla. Büyük bir dil modeli gibi, bir eğitim veri kümesine veya bağlamsal mantığa veya her ikisinin bir kombinasyonuna dayalı olarak yanlış bilgi üretir.

Bilimin hangi alanında olursak olalım, sahip olduğumuz zaman, para, kaynaklar ve erişebildiğimiz ekipmanla sınırlıyız. Bu, bu sınırlamaların üstesinden gelmeye odaklanmak yerine bilimimizden bu sınırlamalara uymak için ödün verdiğimiz anlamına gelir

Ancak bilimin hangi alanında olursak olalım, ister hesaplamalı ister deneysel olsun, hepimiz bir takım kısıtlamalar altında sıkıntı çekiyoruz. Sahip olduğumuz zaman, para, kaynaklar ve erişebildiğimiz ekipmanlarla sınırlıyız. Bu, bu sınırlamaların üstesinden gelmeye odaklanmak yerine bilimimizden bu sınırlamalara uymak için ödün verdiğimiz anlamına geliyor. Altyapının ne yapacağımızı belirlememesi gerektiğine gerçekten inanıyorum; tam tersi olması gerekiyor.

Üretken yapay zekanın nihayet bu sorunlardan bazılarının üstesinden gelmemizi sağlamak için doğru zamanda geldiğini düşünüyorum çünkü boşlukları doldurma ve bize, eğer hepsine sahip olsaydık, hangi bilimi yapabileceğimize dair bir fikir verme konusunda çok fazla potansiyele sahip. gerekli kaynaklar.

Aslında yapay zeka, daha az yaparak daha fazlasını elde etmemizi ve seçim yanlılığı gibi bazı tuzaklardan kaçınmamızı sağlayabilir. Makine öğrenimini bilim veri kümelerine uygularken bu gerçekten büyük bir sorundur. Üretken yöntemlerin halüsinasyonlar değil, anlamlı bilim ürettiğinden emin olmak için çok daha fazla çalışma yapmamız gerekiyor. Bu, önceden eğitilmiş büyük modellerin temelini oluşturacaksa özellikle önemlidir. Ancak bence bu, yapay zekanın sadece bizim için bir görevi yerine getirmesinden ziyade, onunla işbirliği içinde çalışacağımız gerçekten heyecan verici bir bilim çağı olacak.

Zaman Damgası:

Den fazla Fizik dünyası