상향식에서 하향식으로: 계산 과학자 Amanda Barnard가 시뮬레이션의 아름다움, 기계 학습 및 이 둘이 교차하는 방식에 대해 설명합니다.

상향식에서 하향식으로: 계산 과학자 Amanda Barnard가 시뮬레이션의 아름다움, 기계 학습 및 이 둘이 교차하는 방식에 대해 설명합니다.

아만다 버나드
인터페이스 전문가 Amanda Barnard는 호주국립대학교 전산대학 부국장 겸 전산과학 책임자입니다. (제공: Sitthixay Ditthavong/캔버라 타임즈)

슈퍼컴퓨터를 사용하여 새로운 종류의 재료를 활용하는 것부터 기계 학습 모델을 교육하여 나노 규모의 복잡한 속성을 연구하는 것까지, 오스트레일리아의 계산 과학자 Amanda Barnard 컴퓨팅 및 데이터 과학의 인터페이스에서 작동합니다. 의 수석 교수 호주 국립 대학교 컴퓨터 학부, Barnard는 부국장이자 전산 과학 책임자이기도 합니다. 요즘 그녀는 다양한 계산 방법을 사용하여 물리 과학 전반에 걸쳐 문제를 해결하지만 Barnard는 물리학자로 경력을 시작하여 2003년 이론 응집 물질 물리학 박사 학위를 받았습니다.

박사후 연구원으로 몇 년을 보낸 후 아르곤국립연구소 나노소재연구단 미국에서 그녀는 나노기술, 재료 과학, 화학 및 의학에서의 기계 학습 사용을 포함하여 전산 과학의 여러 측면을 포괄하도록 연구 관심을 넓히기 시작했습니다.

두 사람의 동료 호주 물리학 연구소 그리고 왕립 화학 학회, 2022년 Barnard는 호주 훈장의 회원. 그녀는 또한 다음을 포함하여 많은 상을 수상했습니다. 2014 파인만 나노기술상 (이론)과 오스트랄라시아 분자 모델러 협회의 2019 메달. 그녀는 기계 학습을 다양한 문제에 적용하는 것에 대한 그녀의 관심과 대학 행정 업무의 어려움과 보상에 대해 Hamish Johnston과 이야기합니다.

전산 과학자로서 하는 일에 대해 조금 말씀해 주시겠습니까?

전산 과학은 과학 및 공학의 많은 영역에서 계산적으로 까다로운 문제를 분석하기 위해 수학적 모델을 설계하고 사용하는 것을 포함합니다. 여기에는 다양한 영역의 연구원들이 대규모 계산 실험을 수행할 수 있도록 하는 계산 인프라 및 알고리즘의 발전이 포함됩니다. 어떻게 보면 계산과학은 고성능 컴퓨터를 이용한 연구만이 아니라 고성능 컴퓨팅에 대한 연구를 포함합니다.

우리는 알고리즘에 대부분의 시간을 할애하고 고급 하드웨어를 최대한 활용하는 방식으로 알고리즘을 구현하는 방법을 알아내려고 노력합니다. 그리고 그 하드웨어는 항상 변화하고 있습니다. 여기에는 물리학, 화학 또는 그 이상의 다양한 과학적 영역에서 특별히 개발된 수학적 모델을 기반으로 하는 기존 시뮬레이션이 포함됩니다. 우리는 또한 다음의 방법을 사용하여 많은 시간을 보냅니다. 기계 학습 (ML)과 인공 지능 (AI), 대부분은 컴퓨터 과학자들이 개발했기 때문에 매우 학제간 연구입니다. 이를 통해 다양한 과학 분야에서 완전히 새로운 접근 방식을 사용할 수 있습니다.

기계 학습을 통해 아름다운 이론을 도출할 때 잃어버렸던 많은 복잡성을 되찾을 수 있습니다.

시뮬레이션은 편리한 추상화 수준을 통해 방정식을 풀 수 있는 각 과학 영역의 이론적 측면에서 탄생했습니다. 그러나 우리가 그 이론을 발전시켰을 때, 그것들은 수학적 우아함을 추구하거나 단지 실용성을 위해 행해진 문제를 거의 지나치게 단순화한 것이었습니다. ML을 사용하면 아름다운 이론을 도출할 때 잃어버렸던 많은 복잡성을 되찾을 수 있습니다. 그러나 불행히도 모든 ML이 과학과 잘 작동하는 것은 아니므로 컴퓨터 과학자는 이러한 종류의 데이터 세트에 사용하도록 의도되지 않은 이러한 알고리즘을 적용하는 방법을 알아내려고 많은 시간을 할애하여 다음과 같은 일부 문제를 극복합니다. 인터페이스에서 경험했습니다. 그리고 그것은 제가 좋아하는 흥미로운 분야 중 하나입니다.

당신은 물리학자로 경력을 시작했습니다. 컴퓨터공학과로 진학하게 된 계기는 무엇인가요?

물리학은 사실상 모든 것을 위한 훌륭한 출발점입니다. 그러나 나는 그것을 깨닫지 못한 채 항상 계산 과학의 길에 있었습니다. 학생으로서의 첫 번째 연구 프로젝트에서 전산 방법을 사용했고 즉시 매료되었습니다. 코드 작성부터 최종 결과에 이르기까지 모든 과정에서 코딩을 좋아했기 때문에 슈퍼컴퓨터가 나의 과학 도구가 될 운명이라는 것을 즉시 알았습니다. 매번 완벽한 샘플을 만들 수 있다면 재료 과학자가 무엇을 할 수 있을지 생각하는 것은 흥미로웠습니다. 또는 화학자가 모든 오염을 제거하고 완벽한 반응을 할 수 있다면 무엇을 할 수 있습니까? 누군가를 다칠 위험 없이 가혹하거나 위험한 환경을 탐험할 수 있다면 우리는 무엇을 할 수 있을까요? 그리고 더 중요한 것은 우리가 시도할 때마다 필요에 따라 이러한 모든 작업을 동시에 수행할 수 있다면 어떨까요?

슈퍼컴퓨터의 아름다움은 우리가 거의 완벽에 이를 수 있게 해주는 유일한 도구라는 것입니다. 나를 가장 사로잡는 것은 동료들이 실험실에서 할 수 있는 일을 내가 재현할 수 있을 뿐만 아니라 그들이 실험실에서 할 수 없는 모든 일을 할 수 있다는 점이다. 그래서 초창기부터 제 계산물리학은 컴퓨터에 있었습니다. 그 후 제 컴퓨터 화학은 재료, 재료 정보학, 그리고 지금은 거의 독점적으로 ML로 발전했습니다. 하지만 저는 항상 이러한 각 영역의 방법에 집중해 왔으며 물리학의 기초를 통해 다른 모든 영역에 계산적으로 접근하는 방법에 대해 매우 창의적으로 생각할 수 있다고 생각합니다.

기계 학습은 기존 컴퓨터 시뮬레이션과 어떻게 다른가요?

내 연구의 대부분은 이제 ML이며 아마도 80%일 것입니다. 그러나 여전히 기존 시뮬레이션을 수행합니다. 매우 다른 것을 제공하기 때문입니다. 시뮬레이션은 기본적으로 상향식 접근 방식입니다. 시스템이나 문제에 대한 이해로 시작하여 시뮬레이션을 실행한 다음 마지막에 데이터를 얻습니다. 반대로 ML은 하향식 접근 방식입니다. 데이터로 시작하여 모델을 실행한 다음 시스템이나 문제를 더 잘 이해하게 됩니다. 시뮬레이션은 확립된 과학 이론에 의해 결정된 규칙을 기반으로 하는 반면 ML은 경험과 역사를 기반으로 합니다. 몬테카를로(Monte Carlo)와 같은 확률론적 방법의 몇 가지 예가 있지만 시뮬레이션은 대체로 결정론적입니다. ML은 대체로 확률적이지만 결정론적인 몇 가지 예도 있습니다.

시뮬레이션을 통해 아주 좋은 추론을 할 수 있습니다. 시뮬레이션을 뒷받침하는 많은 이론을 통해 "구성 공간"(시스템의 모든 가능한 상태를 결정하는 좌표) 영역 또는 데이터나 정보가 없는 문제 영역을 탐색할 수 있습니다. 반면에 ML은 모든 간격을 보간하고 채우는 데 정말 능숙하며 추론에 매우 좋습니다.

데이터 흐름 개념

실제로 두 가지 방법은 매우 다른 종류의 논리를 기반으로 합니다. 시뮬레이션은 "if-then-else" 논리를 기반으로 합니다. 즉, 특정 문제 또는 특정 조건 집합이 있는 경우 결정론적 답변을 얻거나 계산적으로 다음과 같은 경우 충돌이 발생할 수 있습니다. 틀렸어. 반대로 ML은 "추정-개선-반복" 논리를 기반으로 합니다. 즉, 항상 답을 제공합니다. 그 대답은 항상 개선 가능하지만 항상 옳지는 않을 수 있으므로 또 다른 차이점입니다.

시뮬레이션은 학제적입니다. 시뮬레이션은 도메인 지식과 매우 밀접한 관계가 있으며 인간 지능에 의존합니다. 반면에 ML은 학제적입니다. 원래 도메인 외부에서 개발된 모델을 사용하여 도메인 지식에 구애받지 않고 인공 지능에 크게 의존합니다. 이것이 제가 두 가지 접근 방식을 결합하는 것을 좋아하는 이유입니다.

연구에서 기계 학습을 어떻게 사용하는지에 대해 조금 더 말씀해 주시겠습니까?

ML이 등장하기 전에 과학자들은 입력과 출력 간의 관계를 거의 이해해야 했습니다. 문제를 풀기 전에 모델의 구조를 미리 결정해야 했습니다. 그것은 우리가 답을 찾기 전에 답에 대한 아이디어를 가져야 한다는 것을 의미했습니다.

우리는 식이나 방정식의 구조를 개발하고 동시에 풀 수 있습니다. 그것은 과학적 방법을 가속화하고 제가 기계 학습을 사용하는 것을 좋아하는 또 다른 이유입니다.

ML을 사용할 때 기계는 기본적으로 자체적으로 프로그래밍하기 위해 통계적 기술과 과거 정보를 사용합니다. 그것은 우리가 식이나 방정식의 구조를 개발하고 동시에 풀 수 있다는 것을 의미합니다. 그것은 과학적 방법을 가속화하고 제가 그것을 사용하는 것을 좋아하는 또 다른 이유입니다.

제가 사용하는 ML 기술은 다양합니다. 다양한 유형의 전산 물리학 또는 실험 물리학 방법이 있는 것처럼 ML에도 다양한 풍미와 유형이 있습니다. 저는 전적으로 입력 변수를 기반으로 하는 비지도 학습을 사용하며 "숨겨진 패턴"을 개발하거나 대표 데이터를 찾으려고 합니다. 그것은 나노과학의 재료에 유용합니다. 특성을 측정하기 위한 실험을 수행하지 않았지만 재료를 개발하기 위해 넣은 입력 조건에 대해 꽤 많이 알고 있습니다.

비지도 학습은 고차원 공간에서 유사성을 갖는 클러스터라고 하는 구조 그룹 또는 데이터 세트를 전체적으로 설명하는 순수하고 대표적인 구조(원형 또는 프로토타입)를 찾는 데 유용할 수 있습니다. 또한 데이터를 변환하여 저차원 공간에 매핑하고 이전에는 분명하지 않았던 더 많은 유사성을 드러낼 수 있습니다. 이는 물리학에서 상호 공간으로 변경할 수 있는 것과 유사한 방식입니다.

또한 감독된 ML을 사용하여 재료 및 나노과학에서 중요한 구조-특성 관계와 같은 관계 및 추세를 찾습니다. 여기에는 개별 레이블이 있는 분류가 포함됩니다. 이미 서로 다른 범주의 나노입자가 있고 특성에 따라 나노입자를 하나의 범주에 자동으로 할당하고 입력 데이터만으로 이러한 범주를 쉽게 구분할 수 있는지 확인하려고 합니다.

통계적 학습과 준지도 학습도 사용합니다. 특히 통계 학습은 아직 널리 사용되지는 않지만 과학에서 유용합니다. 우리는 그것을 의료 진단에서 많이 사용되는 인과적 추론이라고 생각하며, 이는 예를 들어 재료가 왜 생성되었는지가 아니라 어떻게 생성되었는지 효과적으로 진단하는 데 적용될 수 있습니다.

귀하의 연구 그룹에는 광범위한 과학적 관심을 가진 사람들이 포함됩니다. 그들이 연구하고 있는 것들 중 일부에 대한 맛보기를 제공할 수 있습니까?

내가 물리학을 시작했을 때, 나는 다른 과학 분야에서 온 놀라운 똑똑한 사람들로 둘러싸인 그룹에 둘러싸여 있을 것이라고는 생각하지 못했습니다. 호주 국립 대학교의 컴퓨터 과학 클러스터에는 환경 과학자, 지구 과학자, 컴퓨터 생물학자 및 생물정보학자가 포함됩니다. 또한 유전체학, 컴퓨터 신경과학, 양자 화학, 재료 과학, 플라스마 물리학, 천체 물리학, 천문학, 공학 및 나노기술을 연구하는 연구원도 있습니다. 그래서 우리는 다양한 무리입니다.

우리 그룹에는 다음이 포함됩니다. 주세페 바르카, 전 세계에서 사용되는 양자 화학 소프트웨어 패키지를 뒷받침하는 알고리즘을 개발하고 있습니다. 그의 연구는 가속기와 같은 새로운 프로세서를 활용하는 방법과 대규모 병렬 워크플로를 전략적으로 결합할 수 있도록 큰 분자를 분할하고 단편화하는 방법을 재고하는 방법에 중점을 둡니다. 그는 또한 슈퍼컴퓨터를 보다 효율적으로 사용하여 에너지를 절약하도록 돕고 있습니다. 그리고 지난 XNUMX년 동안 그는 최고의 스케일링 양자 화학 알고리즘에서 세계 기록을 세웠습니다.

또한 과학의 관점에서 볼 때 소규모에서는 민부이, 그는 계통유전체학 시스템[네트워크 과학의 ​​방법을 사용하여 진화 연구와 시스템 생물학 및 생태학을 결합하는 종합 분야] 분야에서 새로운 통계 모델을 개발하는 생물정보학자입니다. 여기에는 파티셔닝 모델, 동형사상 인식 모델 및 분포 트리 모델이 포함됩니다. 이것의 적용에는 광합성 효소 또는 심층 곤충 계통 발생 전사 데이터 영역이 포함되며, 그는 조류뿐만 아니라 HIV 및 SARS-CoV-2(COVID-19 유발)와 같은 박테리아 및 바이러스를 조사하는 작업을 수행했습니다.

민부이

척도의 더 큰 끝에는 수학자 덩 콴링그의 연구는 해양 및 대기 역학과 남극 유빙과 같은 대규모 매체에 대한 수학적 모델링 및 시뮬레이션에 중점을 둡니다.

가장 좋은 점은 한 도메인의 문제가 실제로 다른 도메인에서 이미 해결되었음을 발견할 때이며, 여러 도메인에서 경험이 있는 문제를 발견하여 매우 선형적으로 확장할 수 있다는 점입니다. 하나의 솔루션이 여러 영역에 영향을 미칠 때 유용합니다. 플라즈마 물리학자와 함께 작업하는 전산 신경과학자를 얼마나 자주 찾을 수 있습니까? 일반적으로 발생하지 않습니다.

당신의 연구 그룹과 함께 일할 뿐만 아니라 당신은 호주 국립 대학교 컴퓨팅 스쿨의 부국장이기도 합니다. 그 역할에 대해 조금 말씀해 주시겠습니까?

주로 관리 역할입니다. 그래서 저는 데이터 과학, 언어, 소프트웨어 개발, 사이버 보안, 컴퓨터 비전, 로봇 공학 등의 기초 영역에 걸쳐 놀라운 컴퓨터 과학자 그룹과 함께 일할 뿐만 아니라 새로운 사람들이 학교에 합류하고 그들 자신의 최고의 버전. 리더십 역할에서 제가 하는 일 중 많은 부분이 사람에 관한 것입니다. 여기에는 채용, 임기 프로그램 및 전문성 개발 프로그램 관리가 포함됩니다. 나는 또한 관심이 필요하다고 생각한 분야에 대한 몇 가지 새로운 프로그램을 시작할 기회를 가졌습니다.

그러한 예 중 하나는 전 세계적으로 COVID 전염병이 발생했을 때였습니다. 우리 중 많은 사람들이 문을 닫았고 실험실에 액세스할 수 없었기 때문에 우리가 무엇을 할 수 있는지 궁금했습니다. 라는 프로그램을 개발할 기회를 얻었습니다. 주빌리 합동 친교, 컴퓨터 과학과 다른 영역 사이의 인터페이스에서 작업하는 연구원을 지원하여 해당 영역에서 큰 문제를 해결하고 해당 영역 지식을 사용하여 새로운 유형의 컴퓨터 과학을 알립니다. 이 프로그램은 2021년에 다양한 분야의 XNUMX명의 연구원을 지원했습니다.

나도 의장이다. 선구적인 여성 프로그램, 컴퓨터에 입문하는 여성을 지원하고 그들이 우리와 함께하는 동안 성공적인 경력을 쌓을 수 있도록 장학금, 강의 및 펠로우십을 제공합니다.

그리고 물론 부국장으로서의 다른 역할 중 하나는 우리 학교의 컴퓨터 시설을 관리하는 것입니다. 새로운 장비를 주문할 수 없었던 COVID 기간과 같은 어려운 시기를 헤쳐나가기 위해 리소스 파이프라인을 다양화할 수 있는 방법을 살펴봅니다. 컴퓨팅은 막대한 양의 에너지를 사용하기 때문에 에너지 효율성을 높일 수 있는 방법도 살펴봅니다.

기술이 매우 다양한 용도를 찾고 있기 때문에 ML에서 연구를 수행하는 사람들에게는 매우 흥미로운 시간이 될 것입니다. 연구에서 가장 기대되는 ML의 새로운 애플리케이션은 무엇입니까?

음, 아마도 여러분이 이미 듣고 있는 것 중 일부, 즉 AI일 것입니다. AI와 관련된 위험이 있지만 엄청난 기회도 있습니다. 생성적 AI는 앞으로 몇 년 동안 과학에 특히 중요할 것이라고 생각합니다. 대형 언어 모델과 같은 는 교육 데이터 세트 또는 컨텍스트 논리 또는 이들 모두의 조합을 기반으로 잘못된 정보를 생성합니다].

우리가 속해 있는 과학 분야가 무엇이든 우리는 시간, 돈, 자원, 접근할 수 있는 장비의 제약을 받습니다. 그것은 우리가 이러한 한계를 극복하는 데 초점을 맞추기보다는 이러한 한계에 맞추기 위해 우리의 과학을 타협하고 있음을 의미합니다.

그러나 우리가 속해 있는 과학 분야가 계산이든 실험이든 상관없이 우리 모두는 여러 가지 제한 사항에 시달립니다. 우리는 우리가 가진 시간, 돈, 자원, 접근할 수 있는 장비의 제약을 받습니다. 그것은 우리가 이러한 한계를 극복하는 데 초점을 맞추기보다는 이러한 한계에 맞추기 위해 과학을 타협하고 있음을 의미합니다. 저는 인프라가 우리가 하는 일을 좌우해서는 안 되며 그 반대여야 한다고 진심으로 믿습니다.

제너레이티브 AI는 격차를 메우고 우리가 모든 것을 가졌다면 어떤 과학을 할 수 있었는지에 대한 아이디어를 제공할 수 있는 많은 잠재력을 가지고 있기 때문에 우리가 이러한 문제 중 일부를 마침내 극복할 수 있도록 적시에 왔다고 생각합니다. 필요한 자원.

실제로 AI는 우리가 덜 함으로써 더 많은 것을 얻을 수 있게 하고 선택 편향과 같은 함정을 피할 수 있습니다. 이는 ML을 과학 데이터 세트에 적용할 때 정말 큰 문제입니다. 우리는 생성 방법이 환각이 아닌 의미 있는 과학을 생성하도록 훨씬 더 많은 작업을 수행해야 합니다. 이는 사전 훈련된 대규모 모델의 기반을 형성하려는 경우에 특히 중요합니다. 하지만 AI가 우리를 위해 과업을 수행하는 것이 아니라 AI와 협력하는 과학의 정말 흥미로운 시대가 될 것이라고 생각합니다.

타임 스탬프 :

더보기 물리 세계