DeepMind AI는 PlatoBlockchain 데이터 인텔리전스 컴퓨팅에 중요한 계산에서 수학자들을 한 단계 끌어올립니다. 수직 검색. 일체 포함.

DeepMind AI One-Ups 수학자, 컴퓨팅에 중요한 계산

DeepMind가 다시 해냈습니다.

생물학의 근본적인 문제를 해결한 후—단백질 구조 예측-과 매듭 이론의 수학 풀기, 수천 개의 일상적인 응용 프로그램 내부에 내장된 기본 컴퓨팅 프로세스를 목표로 합니다. 이미지 파싱부터 모델링 날씨 또는 인공 신경망의 내부 작동을 조사하는 AI는 이론적으로 다양한 분야에서 계산 속도를 높여 에너지 사용과 비용을 줄이면서 효율성을 높일 수 있습니다.

하지만 더 인상적인 것은 방법 그들은 그것을했다. AlphaTensor라고 불리는 기록적인 알고리즘은 알파 제로, 체스와 바둑에서 인간 플레이어를 압도한 것으로 유명합니다.

"알고리즘은 수천 년 동안 기본 작업을 수행하기 위해 전 세계 문명에서 사용되었습니다." 공동 저자 Drs. DeepMind의 Matej Balog와 Alhussein Fawzi. "그러나 알고리즘을 발견하는 것은 매우 어려운 일입니다."

AlphaTensor는 AI가 인간이 설계한 모든 것을 능가하는 프로그램을 설계하는 동시에 자체 기계 "두뇌"를 개선하는 새로운 세계로 가는 길을 개척합니다.

"이 작업은 사람들이 수십 년 동안 작업해 온 최적화 문제에 AI를 사용하여 미지의 영역으로 밀어붙입니다. 발견한 솔루션은 계산 실행 시간을 개선하기 위해 즉시 개발될 수 있습니다."라고 수석 편집자 Dr. Federico Levi가 말했습니다. 자연, 그 출판 연구.

행렬 곱셈을 입력하십시오

AlphaTensor가 직면한 문제는 행렬 곱셈입니다. 갑자기 화면 아래로 스크롤되는 녹색 숫자의 행과 열을 상상한다면 혼자가 아닙니다. 대략적으로 말하면 매트릭스는 그와 비슷합니다. 선택한 데이터를 디지털 방식으로 나타내는 숫자 그리드입니다. 이미지의 픽셀, 사운드 클립의 주파수 또는 비디오 게임 캐릭터의 모양과 동작이 될 수 있습니다.

행렬 곱셈은 두 개의 숫자 그리드를 사용하여 서로 곱합니다. 고등학교에서 자주 가르치는 계산이지만 컴퓨팅 시스템에도 중요합니다. 여기에서 한 행렬의 숫자 행은 다른 행렬의 열과 곱해집니다. 결과는 비디오 게임 장면을 확대하거나 기울이는 명령과 같은 결과를 생성합니다. 이러한 계산은 내부적으로 작동하지만 전화나 컴퓨터를 사용하는 사람은 매일 결과에 의존합니다.

문제가 어떻게 극도로 어려워지고 극도로 빨라지는지 알 수 있습니다. 큰 행렬을 곱하는 것은 엄청나게 에너지와 시간이 많이 드는 작업입니다. 새 행렬을 구성하려면 각 숫자 쌍을 개별적으로 곱해야 합니다. 행렬이 커짐에 따라 최고의 체스나 바둑 수를 예측하는 것보다 훨씬 더 문제를 빠르게 해결할 수 없게 됩니다. 일부 전문가들은 있다고 추정합니다. 더 많은 방법 우주의 원자 수보다 행렬 곱셈을 풀기 위해.

1969년에 독일 수학자 Volker Strassen은 XNUMXxXNUMX 행렬 곱셈의 한 라운드를 줄임으로써 코너를 잘라내는 방법이 있음을 보여주었습니다. 총 여덟에서 일곱. 인상적이지 않을 수도 있지만 Strassen의 방법은 행렬 곱셈에 대해 오랫동안 유지된 작업 표준, 즉 알고리즘을 능가할 수 있음을 보여주었습니다. 그의 접근 방식인 Strassen 알고리즘은 50년 이상 가장 효율적인 접근 방식으로 군림했습니다.

하지만 더 효율적인 방법이 있다면 어떨까요? "그것을 푸는 최고의 알고리즘은 아무도 모른다"고 작업에 참여하지 않은 일본 나고야 대학의 프랑수아 르 갈 박사는 이야기 MIT 기술 검토. "컴퓨터 과학에서 가장 큰 공개 문제 중 하나입니다."

AI 추적 알고리즘

인간의 직관이 흔들리고 있다면 기계적인 마음을 활용하는 것은 어떨까요?

새로운 연구에서 DeepMind 팀은 행렬 곱셈을 게임으로 바꿨습니다. 이전 AlphaZero와 유사하게 AlphaTensor는 생물학적 뇌가 학습하는 방식에서 영감을 받은 기계 학습 방법인 심층 강화 학습을 사용합니다. 여기에서 AI 에이전트(종종 인공 신경망)는 환경과 상호 작용하여 다단계 문제를 해결합니다. 성공하면 "보상"을 얻습니다. 즉, AI의 네트워크 매개변수가 업데이트되어 나중에 다시 성공할 가능성이 높아집니다.

팬케이크 뒤집는 법을 배우는 것과 같습니다. 처음에는 많은 것이 바닥에 떨어지지만 결국에는 신경망이 완벽한 뒤집기를 위해 팔과 손의 움직임을 학습하게 됩니다.

AlphaTensor의 훈련장은 일종의 3D 보드 게임입니다. 기본적으로 스도쿠와 거의 비슷한 XNUMX인용 퍼즐입니다. AI는 가능한 가장 적은 단계로 숫자 그리드를 곱해야 하며, 허용되는 무수히 많은 이동 중에서 선택해야 합니다.

이러한 허용 가능한 움직임은 AlphaTensor에 세심하게 설계되었습니다. 언론 브리핑에서 공동 저자인 Hussain Fawzi 박사는 다음과 같이 설명했습니다.

다시 말해, 엄청나게 다양한 옵션에 직면했을 때 건초더미에서 바늘을 찾을 가능성을 높이기 위해 어떻게 범위를 좁힐 수 있을까요? 건초더미 전체를 파헤치지 않고 바늘에 도달하기 위한 최선의 전략은 무엇입니까?

팀이 AlphaTensor에 통합한 한 가지 트릭은 트리 검색이라는 방법입니다. 은유적으로 말해서 무작위로 건초더미를 파는 대신 여기서 AI는 더 나은 결과로 이어질 수 있는 "도로"를 조사합니다. 그런 다음 중간 학습은 AI가 성공 가능성을 높이기 위한 다음 조치를 계획하는 데 도움이 됩니다. 팀은 또한 어린이에게 체스의 시작 동작을 가르치는 것과 같은 성공적인 게임의 알고리즘 샘플을 보여주었습니다. 마지막으로, AI가 가치 있는 움직임을 발견하면 팀은 더 나은 결과를 찾기 위해 더 맞춤화된 학습을 위해 이러한 작업을 재정렬할 수 있도록 허용했습니다.

새로운 지평을 열다

AlphaTensor가 잘 작동했습니다. 일련의 테스트에서 팀은 최대 XNUMXxXNUMX 행렬, 즉 행이나 열에 각각 XNUMX개의 숫자가 있는 행렬에 대해 가장 효과적인 솔루션을 찾기 위해 AI에 도전했습니다.

이 알고리즘은 Strassen의 원래 해킹을 빠르게 재발견했지만 이전에 인간이 고안한 모든 솔루션을 능가했습니다. 다양한 크기의 매트릭스로 AI를 테스트한 AlphaTensor는 70개 이상의 더 효율적인 솔루션을 찾았습니다. "사실 AlphaTensor는 일반적으로 각 매트릭스 크기에 대해 수천 개의 알고리즘을 발견합니다."라고 팀은 말했습니다. "정신이 번쩍 듭니다."

어떤 경우에는 80x76 행렬과 919x896 행렬을 곱하여 AI가 이전 기록인 XNUMX개의 개별 곱셈을 XNUMX개로 줄였습니다. XNUMX에서 XNUMX까지의 XNUMXxXNUMX 행렬.

개념 증명을 손에 넣은 팀은 실용화에 돌입했습니다. 컴퓨터 칩은 종종 다양한 계산을 최적화하도록 설계됩니다. 예를 들어 그래픽용 GPU 또는 기계 학습을 위한 AI 칩—알고리즘을 가장 적합한 하드웨어와 일치시키면 효율성이 높아집니다.

여기에서 팀은 AlphaTensor를 사용하여 기계 학습에서 인기 있는 두 칩인 NVIDIA V100 GPU와 Google TPU에 대한 알고리즘을 찾았습니다. 전체적으로 AI가 개발한 알고리즘은 계산 속도를 최대 20%까지 향상시켰습니다.

AI가 스마트폰, 노트북 또는 기타 일상 장치의 속도를 높일 수 있는지 여부는 말하기 어렵습니다. 그러나 "실제로 사용할 수 있다면 이 개발은 매우 흥미진진할 것"이라고 MIT의 버지니아 윌리엄스 박사는 말했다. "성능이 향상되면 많은 응용 프로그램이 향상될 것입니다."

AI의 마음

AlphaTensor가 행렬 곱셈에 대한 최신 인간 기록을 경신했음에도 불구하고 DeepMind 팀은 아직 그 이유를 설명할 수 없습니다.

DeepMind 과학자이자 공동 저자인 Pushmeet Kohli 박사는 언론 브리핑에서 "이 게임을 통해 놀라운 직관력을 갖게 되었습니다."라고 말했습니다.

진화하는 알고리즘은 사람 대 기계일 필요도 없습니다.

AlphaTensor는 더 빠른 알고리즘을 향한 디딤돌이지만 더 빠른 알고리즘도 존재할 수 있습니다. "특정 형식의 알고리즘으로 검색을 제한해야 하기 때문에 더 효율적일 수 있는 다른 유형의 알고리즘을 놓칠 수 있습니다."라고 Balog와 Fawzi는 썼습니다.

아마도 훨씬 더 흥미로운 경로는 인간과 기계의 직관을 결합할 것입니다. "이 새로운 방법이 실제로 이전의 모든 방법을 포함하는지 또는 이들을 결합하여 더 나은 것을 얻을 수 있는지 알아내는 것이 좋을 것입니다." 말했다 윌리엄스. 다른 전문가들도 동의합니다. 풍부한 알고리즘을 마음대로 사용할 수 있으므로 과학자들은 AlphaTensor의 솔루션이 작동하게 만든 원인에 대한 단서를 찾기 위해 분석을 시작하여 다음 혁신을 위한 길을 닦을 수 있습니다.

이미지 크레디트 : DeepMind

타임 스탬프 :

더보기 특이점 허브