Dari bawah ke atas ke atas ke bawah: ilmuwan komputasi Amanda Barnard tentang keindahan simulasi, pembelajaran mesin, dan bagaimana keduanya berpotongan – Physics World

Dari bawah ke atas ke atas ke bawah: ilmuwan komputasi Amanda Barnard tentang keindahan simulasi, pembelajaran mesin, dan bagaimana keduanya berpotongan – Physics World

Amanda Barnard
Spesialis antarmuka Amanda Barnard adalah wakil direktur dan pimpinan ilmu komputasi di School of Computing di Australian National University. (Sumber: Sitthixay Ditthavong/Waktu Canberra)

Dari penggunaan superkomputer untuk memanfaatkan jenis material baru hingga melatih model pembelajaran mesin untuk mempelajari properti kompleks pada skala nano, Ilmuwan komputasi Australia Amanda Barnard bekerja di antarmuka komputasi dan ilmu data. Seorang profesor senior di Sekolah Komputasi di Universitas Nasional Australia, Barnard juga merupakan wakil direktur dan pimpinan ilmu komputasi. Saat ini, ia menggunakan berbagai metode komputasi untuk memecahkan masalah di bidang ilmu fisika, namun Barnard memulai karirnya sebagai fisikawan, menerima gelar PhD dalam bidang fisika benda terkondensasi teoretis pada tahun 2003.

Setelah menghabiskan beberapa tahun berikutnya sebagai postdoc di Pusat Bahan Skala Nano di Laboratorium Nasional Argonne di AS, ia mulai memperluas minat penelitiannya hingga mencakup banyak aspek ilmu komputasi, termasuk penggunaan pembelajaran mesin dalam nanoteknologi, ilmu material, kimia, dan kedokteran.

Seorang rekan dari keduanya Institut Fisika Australia dan Perhimpunan Kimia Kerajaan, pada tahun 2022 Barnard diangkat a Anggota Ordo Australia. Dia juga telah memenangkan sejumlah penghargaan, termasuk Penghargaan Feynman 2014 dalam Nanoteknologi (Teori) dan Medali 2019 dari Association of Molecular Modellers of Australasia. Dia berbicara dengan Hamish Johnston tentang minatnya dalam menerapkan pembelajaran mesin pada berbagai masalah, dan tentang tantangan serta manfaat dalam menjalankan administrasi universitas.

Bisakah Anda ceritakan sedikit tentang apa yang Anda lakukan sebagai ilmuwan komputasi?

Ilmu komputasi melibatkan perancangan dan penggunaan model matematika untuk menganalisis masalah yang menuntut komputasi di banyak bidang sains dan teknik. Hal ini mencakup kemajuan dalam infrastruktur komputasi dan algoritme yang memungkinkan peneliti di berbagai domain untuk melakukan eksperimen komputasi skala besar. Di satu sisi, ilmu komputasi melibatkan penelitian komputasi berkinerja tinggi, dan bukan hanya penelitian menggunakan komputer berkinerja tinggi.

Kami menghabiskan sebagian besar waktu kami pada algoritme dan mencoba mencari cara untuk mengimplementasikannya dengan cara yang memanfaatkan perangkat keras canggih sebaik-baiknya; dan perangkat keras itu berubah setiap saat. Ini mencakup simulasi konvensional berdasarkan model matematika yang dikembangkan secara khusus dalam domain ilmiah berbeda, baik fisika, kimia, atau lainnya. Kami juga menghabiskan banyak waktu menggunakan metode dari Mesin belajar (ML) dan kecerdasan buatan (AI), yang sebagian besar dikembangkan oleh ilmuwan komputer, menjadikannya penelitian yang sangat interdisipliner. Hal ini memungkinkan sejumlah pendekatan baru untuk digunakan di semua bidang ilmiah yang berbeda.

Pembelajaran mesin memungkinkan kita menangkap kembali banyak kompleksitas yang telah hilang saat kita mendapatkan teori-teori indah tersebut

Simulasi lahir dari aspek teoretis dari setiap bidang ilmiah yang, dengan beberapa tingkat abstraksi yang sesuai, memungkinkan kita memecahkan persamaan. Namun ketika kami mengembangkan teori-teori tersebut, teori-teori tersebut hampir merupakan penyederhanaan masalah yang berlebihan, yang dilakukan demi mengejar keanggunan matematis atau hanya demi kepraktisan. ML memungkinkan kita menangkap kembali banyak kompleksitas yang telah hilang saat kita mendapatkan teori-teori indah tersebut. Namun sayangnya, tidak semua ML bekerja dengan baik dengan sains, sehingga para ilmuwan komputasi menghabiskan banyak waktu untuk mencoba mencari cara untuk menerapkan algoritme yang tidak pernah dimaksudkan untuk digunakan pada kumpulan data semacam ini guna mengatasi beberapa masalah yang ada. berpengalaman di antarmuka. Dan itulah salah satu bidang menarik yang saya sukai.

Anda memulai karir Anda sebagai fisikawan. Apa yang membuat Anda beralih ke ilmu komputasi?

Fisika adalah titik awal yang bagus untuk hampir semua hal. Tapi saya selalu berada di jalur ilmu komputasi tanpa menyadarinya. Selama proyek penelitian pertama saya sebagai mahasiswa, saya menggunakan metode komputasi dan langsung ketagihan. Saya menyukai coding, mulai dari penulisan kode hingga hasil akhir, sehingga saya langsung tahu bahwa superkomputer ditakdirkan untuk menjadi instrumen ilmiah saya. Sangat menarik untuk memikirkan apa yang dapat dilakukan oleh ilmuwan material jika mereka dapat membuat sampel yang sempurna setiap saat. Atau apa yang dapat dilakukan seorang ahli kimia jika mereka dapat menghilangkan semua kontaminasi dan menghasilkan reaksi yang sempurna. Apa yang bisa kita lakukan jika kita bisa menjelajahi lingkungan yang keras atau berbahaya tanpa risiko melukai siapa pun? Dan yang lebih penting, bagaimana jika kita bisa melakukan semua hal ini secara bersamaan, sesuai permintaan, setiap kali kita mencobanya?

Keunggulan superkomputer adalah bahwa superkomputer adalah satu-satunya instrumen yang memungkinkan kita mencapai kesempurnaan ini. Yang paling membuat saya terpesona adalah saya tidak hanya bisa mereproduksi apa yang rekan-rekan saya bisa lakukan di lab, tapi juga melakukan semua yang tidak bisa mereka lakukan di lab. Jadi sejak awal, fisika komputasi saya ada di komputer. Kimia komputasi saya kemudian berkembang ke materi, informatika materi, dan sekarang secara eksklusif ML. Namun saya selalu fokus pada metode di masing-masing bidang ini, dan menurut saya landasan dalam fisika memungkinkan saya berpikir sangat kreatif tentang bagaimana saya mendekati semua bidang lainnya secara komputasi.

Apa perbedaan pembelajaran mesin dengan simulasi komputer klasik?

Sebagian besar penelitian saya sekarang adalah ML, mungkin 80%-nya. Saya masih melakukan beberapa simulasi konvensional, karena simulasi tersebut memberi saya sesuatu yang sangat berbeda. Simulasi pada dasarnya adalah pendekatan bottom-up. Kita mulai dengan pemahaman tentang suatu sistem atau masalah, kita menjalankan simulasi, dan pada akhirnya kita mendapatkan beberapa data. Sebaliknya, ML adalah pendekatan top-down. Kita mulai dengan data, menjalankan model, dan kemudian kita mendapatkan pemahaman yang lebih baik tentang sistem atau masalah. Simulasi didasarkan pada aturan yang ditentukan oleh teori ilmiah kami, sedangkan ML didasarkan pada pengalaman dan sejarah. Simulasi seringkali bersifat deterministik, meskipun ada beberapa contoh metode stokastik seperti Monte Carlo. ML sebagian besar bersifat stokastik, meskipun ada beberapa contoh yang juga bersifat deterministik.

Dengan simulasi, saya dapat melakukan ekstrapolasi dengan sangat baik. Banyak teori yang mendasari simulasi memungkinkan kita menjelajahi area “ruang konfigurasi” (koordinat yang menentukan semua kemungkinan keadaan suatu sistem) atau area masalah yang data atau informasinya tidak kita miliki. Di sisi lain, ML sangat bagus dalam melakukan interpolasi dan mengisi semua celah dan sangat bagus untuk inferensi.

Konsep aliran data

Memang benar, kedua metode ini didasarkan pada logika yang sangat berbeda. Simulasi didasarkan pada logika “jika-maka-lain”, yang berarti jika saya mempunyai masalah tertentu atau serangkaian kondisi tertentu, maka saya akan mendapatkan jawaban deterministik atau, secara komputasi, mungkin akan crash jika Anda mendapatkan itu salah. Sebaliknya, ML didasarkan pada logika “estimasi-perbaiki-ulangi”, yang artinya akan selalu memberikan jawaban. Jawabannya selalu bisa diperbaiki, tapi mungkin tidak selalu benar, jadi itulah perbedaannya.

Simulasi bersifat intradisipliner: simulasi memiliki hubungan yang sangat erat dengan domain pengetahuan dan bergantung pada kecerdasan manusia. Di sisi lain, ML bersifat interdisipliner: menggunakan model yang dikembangkan di luar domain asli, ML tidak bergantung pada pengetahuan domain dan sangat bergantung pada kecerdasan buatan. Inilah mengapa saya suka menggabungkan kedua pendekatan tersebut.

Bisakah Anda memberi tahu kami lebih banyak tentang cara Anda menggunakan pembelajaran mesin dalam penelitian Anda?

Sebelum munculnya ML, para ilmuwan harus memahami hubungan antara masukan dan keluaran. Kami harus menentukan struktur model terlebih dahulu sebelum kami dapat menyelesaikannya. Artinya, kita harus mempunyai gagasan tentang jawabannya sebelum kita dapat mencarinya.

Kita dapat mengembangkan struktur ekspresi atau persamaan dan menyelesaikannya pada saat yang bersamaan. Hal ini mempercepat metode ilmiah, dan itulah alasan lain mengapa saya suka menggunakan pembelajaran mesin

Saat Anda menggunakan ML, mesin menggunakan teknik statistik dan informasi historis untuk memprogram dirinya sendiri. Artinya kita dapat mengembangkan struktur ekspresi atau persamaan dan menyelesaikannya pada saat yang bersamaan. Hal ini mempercepat metode ilmiah, dan itulah alasan lain mengapa saya suka menggunakannya.

Teknik ML yang saya gunakan beragam. Ada banyak jenis dan jenis ML yang berbeda, sama seperti ada banyak jenis fisika komputasi atau metode fisika eksperimental. Saya menggunakan pembelajaran tanpa pengawasan, yang sepenuhnya didasarkan pada variabel masukan, dan berupaya mengembangkan “pola tersembunyi” atau mencoba menemukan data yang representatif. Hal ini berguna untuk material dalam nanosains, ketika kita belum melakukan eksperimen untuk mengukur suatu properti, namun kita mengetahui cukup banyak tentang kondisi input yang kita masukkan untuk mengembangkan material tersebut.

Pembelajaran tanpa pengawasan dapat berguna dalam menemukan kelompok struktur, yang disebut cluster, yang memiliki kesamaan dalam ruang berdimensi tinggi, atau struktur murni dan representatif (arketipe atau prototipe) yang menggambarkan kumpulan data secara keseluruhan. Kita juga dapat mentransformasikan data untuk memetakannya ke ruang berdimensi lebih rendah dan mengungkap lebih banyak kesamaan yang sebelumnya tidak terlihat, dengan cara serupa kita dapat mengubahnya ke ruang timbal balik dalam fisika.

Saya juga menggunakan ML yang diawasi untuk menemukan hubungan dan tren, seperti hubungan struktur-properti, yang penting dalam material dan nanosains. Ini termasuk klasifikasi, dimana kita mempunyai label tersendiri. Katakanlah kita sudah mempunyai berbagai kategori nanopartikel dan, berdasarkan karakteristiknya, kita ingin secara otomatis menetapkannya ke dalam satu kategori atau lainnya, dan memastikan bahwa kita dapat dengan mudah memisahkan kelas-kelas ini berdasarkan data masukan saja.

Saya juga menggunakan pembelajaran statistik dan pembelajaran semi-supervisi. Pembelajaran statistik, khususnya, berguna dalam sains, meskipun belum banyak digunakan. Kami menganggapnya sebagai kesimpulan kausal yang sering digunakan dalam diagnostik medis, dan ini dapat diterapkan untuk mendiagnosis secara efektif bagaimana suatu bahan, misalnya, dapat dibuat, dan bukan hanya sekedar alasan bahan tersebut dibuat.

Kelompok riset Anda mencakup orang-orang dengan beragam minat ilmiah. Bisakah Anda memberi kami gambaran tentang beberapa hal yang mereka pelajari?

Ketika saya mulai belajar fisika, saya tidak pernah berpikir bahwa saya akan dikelilingi oleh sekelompok orang pintar yang luar biasa dari berbagai bidang ilmiah. Kelompok ilmu komputasi di Australian National University mencakup ilmuwan lingkungan, ilmuwan bumi, ahli biologi komputasi, dan ahli bioinformatika. Ada juga peneliti yang mempelajari genomik, ilmu saraf komputasi, kimia kuantum, ilmu material, fisika plasma, astrofisika, astronomi, teknik, dan – saya – nanoteknologi. Jadi kami adalah kelompok yang beragam.

Kelompok kami termasuk Giuseppe Barca, yang mengembangkan algoritma yang mendukung paket perangkat lunak kimia kuantum yang digunakan di seluruh dunia. Penelitiannya terfokus pada bagaimana kita dapat memanfaatkan prosesor baru, seperti akselerator, dan bagaimana kita dapat memikirkan kembali bagaimana molekul besar dapat dipartisi dan difragmentasi sehingga kita dapat menggabungkan alur kerja paralel secara besar-besaran secara strategis. Dia juga membantu kita menggunakan superkomputer dengan lebih efisien, sehingga menghemat energi. Dan selama dua tahun terakhir, dia memegang rekor dunia dalam penskalaan algoritma kimia kuantum terbaik.

Juga dalam skala kecil – dalam hal ilmu pengetahuan – adalah Minh Bui, yang merupakan ahli bioinformatika yang bekerja mengembangkan model statistik baru di bidang sistem filogenomik [bidang multidisiplin yang menggabungkan penelitian evolusi dengan biologi sistem dan ekologi, menggunakan metode dari ilmu jaringan]. Ini termasuk model partisi, model sadar isomorfisme, dan model pohon distribusi. Penerapannya mencakup area dalam enzim fotosintetik atau data transkripsi filogeni serangga dalam, dan dia telah melakukan penelitian terhadap alga, serta bakteri dan virus seperti HIV dan SARS-CoV-2 (yang menyebabkan COVID-19).

Minh Bui

Yang paling besar adalah ahli matematika Quanling Deng, yang penelitiannya berfokus pada pemodelan dan simulasi matematika untuk media berskala besar, seperti dinamika lautan dan atmosfer, serta es yang terapung di Antartika.

Bagian terbaiknya adalah ketika kita menemukan bahwa masalah dari satu domain sebenarnya telah diselesaikan di domain lain, dan bahkan lebih baik lagi ketika kita menemukan masalah yang dialami di beberapa domain sehingga kita dapat melakukan penskalaan secara super linier. Sangat bagus bila satu solusi mempunyai dampak yang beragam. Dan seberapa sering Anda menemukan ahli saraf komputasi bekerja bersama ahli fisika plasma? Biasanya hal ini tidak terjadi.

Selain bekerja dengan kelompok riset, Anda juga menjabat sebagai wakil direktur Fakultas Komputasi Universitas Nasional Australia. Bisakah Anda ceritakan sedikit tentang peran itu?

Ini sebagian besar merupakan peran administratif. Jadi, selain bekerja dengan sekelompok ilmuwan komputer yang luar biasa di bidang ilmu data, bidang dasar bahasa, pengembangan perangkat lunak, keamanan siber, visi komputer, robotika, dan sebagainya, saya juga dapat menciptakan peluang bagi orang-orang baru untuk bergabung di sekolah ini dan menjadi versi terbaik dari diri mereka sendiri. Banyak pekerjaan saya dalam peran kepemimpinan adalah tentang orang-orang. Hal ini termasuk perekrutan, pemeliharaan program jalur kepemilikan, dan juga program pengembangan profesional. Saya juga mendapat kesempatan untuk memulai beberapa program baru di bidang-bidang yang menurut saya memerlukan perhatian.

Salah satu contohnya adalah selama pandemi global COVID. Banyak dari kami yang tutup dan tidak dapat mengakses laboratorium, sehingga membuat kami bertanya-tanya apa yang dapat kami lakukan. Saya mengambil kesempatan untuk mengembangkan program yang disebut Persekutuan Bersama Jubilee, yang mendukung peneliti yang bekerja pada antarmuka antara ilmu komputer dan domain lain, tempat mereka memecahkan tantangan besar di bidangnya, namun juga menggunakan pengetahuan domain tersebut untuk menginformasikan jenis ilmu komputer baru. Program ini mendukung lima peneliti serupa di berbagai bidang pada tahun 2021.

Saya juga ketuanya Program Perintis Perempuan, yang memiliki beasiswa, kuliah, dan fellowship untuk mendukung perempuan memasuki bidang komputasi dan memastikan mereka sukses sepanjang karier mereka bersama kami.

Dan tentu saja, salah satu peran saya yang lain sebagai wakil direktur adalah menjaga fasilitas komputasi di sekolah kami. Saya mencari cara agar kita dapat mendiversifikasi sumber daya kita untuk melewati masa-masa sulit, seperti selama COVID, ketika kita tidak dapat memesan peralatan baru. Saya juga mencari tahu bagaimana kita bisa lebih hemat energi, karena komputasi menggunakan energi yang sangat besar.

Ini pasti menjadi saat yang sangat menyenangkan bagi orang-orang yang melakukan penelitian di ML, karena teknologi ini menemukan banyak kegunaan berbeda. Aplikasi baru ML apa yang paling Anda nantikan dalam penelitian Anda?

Nah, mungkin salah satu yang pernah Anda dengar, yaitu AI. Meskipun terdapat risiko yang terkait dengan AI, terdapat juga peluang yang sangat besar, dan menurut saya AI generatif akan menjadi sangat penting di tahun-tahun mendatang bagi ilmu pengetahuan – asalkan kita dapat mengatasi beberapa masalah yang terkait dengan “halusinasi” [saat sistem AI , seperti model bahasa besar, menghasilkan informasi palsu, berdasarkan kumpulan data pelatihan atau logika kontekstual, atau kombinasi keduanya].

Apa pun bidang sains yang kita geluti, kita dibatasi oleh waktu, uang, sumber daya, dan peralatan yang bisa kita akses. Hal ini berarti kita mengkompromikan ilmu pengetahuan kita agar sesuai dengan keterbatasan tersebut dibandingkan berfokus untuk mengatasinya

Namun apa pun bidang sains yang kita geluti, baik komputasional maupun eksperimental, kita semua mengalami sejumlah keterbatasan. Kita dibatasi oleh waktu yang kita miliki, uang, sumber daya, dan peralatan yang dapat kita akses. Hal ini berarti kita mengkompromikan ilmu pengetahuan kita agar sesuai dengan keterbatasan tersebut dibandingkan berfokus untuk mengatasinya. Saya benar-benar percaya bahwa infrastruktur tidak seharusnya mendikte apa yang kita lakukan, namun justru sebaliknya.

Saya pikir AI generatif telah hadir pada saat yang tepat untuk memungkinkan kita mengatasi beberapa masalah ini karena AI generatif memiliki banyak potensi untuk mengisi kesenjangan dan memberi kita gambaran tentang ilmu pengetahuan apa yang bisa kita lakukan, jika kita memiliki semua hal tersebut. sumber daya yang diperlukan.

Memang benar, AI dapat memungkinkan kita memperoleh hasil lebih banyak dengan berbuat lebih sedikit dan menghindari beberapa kendala seperti bias seleksi. Ini adalah masalah yang sangat besar ketika menerapkan ML pada kumpulan data sains. Kita perlu melakukan lebih banyak upaya untuk memastikan bahwa metode generatif menghasilkan ilmu pengetahuan yang bermakna, bukan halusinasi. Hal ini sangat penting jika mereka ingin menjadi landasan bagi model besar yang telah dilatih sebelumnya. Namun menurut saya ini akan menjadi era sains yang sangat menarik di mana kita bekerja secara kolaboratif dengan AI, bukan sekadar melakukan tugas untuk kita.

Stempel Waktu:

Lebih dari Dunia Fisika