새로운 '물리학에서 영감을 받은' 생성 AI가 기대치를 초과 | 콴타 매거진

새로운 '물리학에서 영감을 받은' 생성 AI가 기대치를 초과 | 콴타 매거진

새로운 '물리학에서 영감을 받은' 생성 AI가 기대치를 초과 | Quanta Magazine PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.

개요

인공지능 도구, 특히 신경망은 물리학자들에게 좋은 도구였습니다. 수년 동안 이 기술은 연구자들이 가속기 실험에서 입자 궤적을 재구성하고, 새로운 입자의 증거를 검색하고, 중력파와 외계 행성을 감지하는 데 도움이 되었습니다. AI 도구는 확실히 물리학자들에게 많은 일을 할 수 있지만, MIT의 물리학자인 Max Tegmark에 따르면 이제 질문은 "우리가 무엇이든 돌려줄 수 있는가?"입니다.

Tegmark는 동료 물리학자들이 AI 과학에 상당한 기여를 할 수 있다고 믿으며 이를 최우선 연구 과제로 삼았습니다. 그는 물리학자들이 AI 기술 발전에 도움을 줄 수 있는 한 가지 방법은 작동 방식이 대체로 이해하기 어려운 신경망의 "블랙박스" 알고리즘을 잘 이해된 물리적 프로세스 방정식으로 대체하는 것이라고 말했습니다.

아이디어는 아주 새로운 것이 아닙니다. 생성적 AI 모델 확산을 기반으로 예를 들어 커피 한잔에 우유를 부으면 균일하게 퍼지는 과정은 2015년에 처음 등장했으며 그 이후로 생성되는 이미지의 품질이 크게 향상되었습니다. 이 기술은 DALL·E 2 및 Midjourney와 같은 인기 있는 이미지 생성 소프트웨어를 구동합니다. 이제 Tegmark와 그의 동료들은 물리학에서 영감을 받은 다른 생성 모델이 확산 기반 모델만큼 작동할 수 있는지, 아니면 더 나은 성능을 발휘할 수 있는지 알아보고 있습니다.

작년 말, Tegmark 팀은 이미지를 생성하는 유망한 새로운 방법을 도입했습니다. 포아송 흐름 생성 모델 (PFGM). 그 안에서 데이터는 전하 입자로 표현되며, 이 입자들은 결합하여 특정 순간의 전하 분포에 따라 특성이 달라지는 전기장을 생성합니다. 전하의 이동이 두 전하 사이의 정전기력이 두 전하 사이의 거리의 제곱에 반비례한다는 원리(뉴턴 중력의 공식화와 유사)에서 파생된 포아송 방정식에 의해 지배되기 때문에 포아송 흐름 모델이라고 합니다. .

이러한 물리적 프로세스가 PFGM의 핵심입니다. "우리 모델은 우주의 모든 지점에서 전기장의 강도와 방향으로 거의 완벽하게 특성화될 수 있습니다."라고 말했습니다. 쉬이룬, MIT 대학원생이자 논문의 공동 저자입니다. "신경망이 훈련 과정에서 배우는 것은 전기장을 추정하는 방법입니다." 그리고 그렇게 함으로써 이 모델의 이미지는 전기장에 의해 간결하게 설명될 수 있기 때문에 이미지를 생성하는 방법을 배울 수 있습니다.

개요

PFGM은 확산 기반 접근 방식으로 생성된 것과 동일한 품질의 이미지를 생성할 수 있으며 10~20배 더 빠르게 수행할 수 있습니다. "이것은 우리가 이전에 본 적이 없는 방식으로 물리적 구조인 전기장을 활용합니다."라고 말했습니다. 하나넬 하잔, Tufts University의 컴퓨터 과학자입니다. "이는 우리의 신경망을 개선하기 위해 다른 물리적 현상을 활용할 가능성의 문을 열어줍니다."

확산 및 포아송 흐름 모델은 물리학에서 가져온 방정식을 기반으로 한다는 점 외에도 공통점이 많습니다. 학습 중에 이미지 생성을 위해 설계된 확산 모델은 일반적으로 그림(예: 개)으로 시작한 다음 시각적 노이즈를 추가하여 해당 특징이 완전히 가려질 때까지(완전히 제거되지는 않지만) 각 픽셀을 무작위 방식으로 변경합니다. 그런 다음 모델은 프로세스를 역전시켜 원본에 가까운 개를 생성하려고 시도합니다. 일단 훈련되면 모델은 겉보기에 비어 있는 캔버스에서 시작하여 개와 기타 이미지를 성공적으로 만들 수 있습니다.

포아송 흐름 모델은 거의 동일한 방식으로 작동합니다. 학습 중에는 한때 선명했던 이미지에 점진적으로 노이즈를 추가하는 순방향 프로세스와 초기 버전이 대부분 복구될 때까지 모델이 해당 노이즈를 단계적으로 제거하려고 시도하는 역방향 프로세스가 있습니다. 확산 기반 생성과 마찬가지로 시스템은 결국 훈련에서 볼 수 없었던 이미지를 만드는 방법을 학습합니다.

그러나 포아송 모델의 기본 물리학은 완전히 다릅니다. 확산은 열역학적 힘에 의해 구동되는 반면 포아송 흐름은 정전기력에 의해 구동됩니다. 후자는 매우 복잡한 전기장을 생성할 수 있는 전하의 배열을 이용하여 상세한 이미지를 표현한다. 그러나 그 필드는 시간이 지남에 따라 전하가 더 고르게 퍼지게 합니다. 마치 우유가 커피 한 잔에 자연적으로 퍼지는 것과 같습니다. 그 결과 필드 자체가 더욱 단순해지고 균일해집니다. 그러나 이 소음으로 가득 찬 균일한 필드는 완전한 백지 상태가 아닙니다. 그것은 여전히 ​​이미지를 쉽게 조합할 수 있는 정보의 씨앗을 담고 있습니다.

2023년 초에 팀은 포아송 모델을 업그레이드했습니다. 연장하다 전체 모델 제품군을 포괄합니다. 증강 버전인 PFGM++에는 새로운 매개변수가 포함되어 있습니다. D이를 통해 연구자는 시스템의 차원을 조정할 수 있습니다. 이것은 큰 차이를 만들 수 있습니다. 친숙한 XNUMX차원 공간에서 전하에 의해 생성된 전기장의 강도는 해당 전하로부터의 거리의 제곱과 반비례합니다. 그러나 XNUMX차원에서 전계 강도는 역세제곱 법칙을 따릅니다. 그리고 공간의 모든 차원과 모든 가치에 대해 D, 그 관계는 다소 다릅니다.

개요

이러한 단일 혁신은 포아송 흐름 모델에 훨씬 더 큰 가변성을 제공했으며 극단적인 경우는 다양한 이점을 제공했습니다. 언제 D 예를 들어, 모델이 더 견고합니다. 즉, 전기장을 추정할 때 발생하는 오류에 더 잘 견딥니다. “모델은 전기장을 완벽하게 예측할 수 없습니다.”라고 말했습니다. 리우 지밍, MIT의 또 다른 대학원생이자 두 논문의 공동 저자입니다. “항상 약간의 편차가 있습니다. 그러나 견고성은 추정 오류가 높더라도 여전히 좋은 이미지를 생성할 수 있음을 의미합니다.” 그래서 당신은 꿈에 그리던 개로 끝나지 않을 수도 있지만, 여전히 개와 비슷한 개로 끝나게 될 것입니다.

다른 극단에서는, D 높을수록 신경망은 훈련하기가 더 쉬워지고 예술적 기술을 익히는 데 필요한 데이터가 줄어듭니다. 정확한 이유는 설명하기 쉽지 않지만, 차원이 많을수록 모델이 추적해야 할 전기장이 적어서 동화할 데이터가 적기 때문입니다.

향상된 모델인 PFGM++는 "두 극단 사이를 보간할 수 있는 유연성을 제공합니다"라고 말했습니다. 로즈 유, 캘리포니아 대학교 샌디에고 캠퍼스의 컴퓨터 과학자입니다.

그리고 이 범위 내의 어딘가에 이상적인 값이 있습니다. D Xu는 견고성과 훈련 용이성 사이의 적절한 균형을 유지한다고 말했습니다. “향후 작업의 한 가지 목표는 최적의 지점을 찾는 체계적인 방법을 찾아내어 가능한 최상의 솔루션을 선택할 수 있도록 하는 것입니다. D 시행착오 없이 주어진 상황에 맞춰

MIT 연구원들의 또 다른 목표는 새로운 생성 모델 계열의 기초를 제공할 수 있는 더 많은 물리적 프로세스를 찾는 것입니다. 이라는 프로젝트를 통해 GenPhys, 팀은 이미 약한 핵력과 관련된 유카와 잠재력이라는 하나의 유망한 후보를 확인했습니다. Liu는 “이것은 입자 수가 항상 보존되는 포아송 흐름 및 확산 모델과 다릅니다.”라고 말했습니다. “유카와 전위를 사용하면 입자를 소멸하거나 입자를 둘로 나눌 수 있습니다. 예를 들어, 그러한 모델은 세포 수가 동일하게 유지될 필요가 없는 생물학적 시스템을 시뮬레이션할 수 있습니다.”

이는 유익한 조사가 될 수 있다고 Yu는 말했습니다. "이미지 생성을 넘어 잠재적인 응용 프로그램을 확장하는 새로운 알고리즘과 새로운 생성 모델로 이어질 수 있습니다."

그리고 PFGM++만으로도 이미 발명가의 원래 기대치를 초과했습니다. 그들은 처음에 그것을 깨닫지 못했습니다. D 무한대로 설정되면 증폭된 포아송 흐름 모델은 확산 모델과 구별할 수 없게 됩니다. Liu는 올해 초에 수행한 계산에서 이 사실을 발견했습니다.

머트 필란시스탠포드 대학의 컴퓨터 과학자인 는 이러한 '통합'을 MIT 그룹의 작업에서 비롯된 가장 중요한 결과로 간주합니다. 그는 "PFGM++ 논문은 이 두 모델이 모두 더 넓은 클래스의 일부임을 밝혀 흥미로운 질문을 제기합니다. 발견을 기다리는 생성 AI에 대한 다른 물리적 모델이 있을 수 있으며 더 큰 통합을 암시할 수 있습니까?"라고 말했습니다. ”

타임 스탬프 :

더보기 콴타마진