이 강력한 두뇌 칩은 매우 효율적이어서 스마트폰 PlatoBlockchain 데이터 인텔리전스에 고급 AI를 가져올 수 있습니다. 수직 검색. 일체 포함.

이 강력한 두뇌 칩은 휴대전화에 고급 AI를 가져올 수 있는 매우 효율적입니다.

영상

AI와 재래식 컴퓨터는 지옥에서 만들어진 짝이다.

주된 이유는 현재 하드웨어 칩이 설정되어 있는 방식입니다. 전통적인 Von Neumann 아키텍처를 기반으로 하는 이 칩은 메인 프로세서에서 메모리 스토리지를 분리합니다. 각 계산은 악몽 같은 월요일 아침 통근이며 칩이 각 구획에서 끊임없이 데이터를 왕복하며 악명 높은 "메모리 월. "

교통 체증에 갇힌 적이 있다면 좌절감을 알 것입니다. 시간과 에너지 낭비가 필요합니다. AI 알고리즘이 점점 더 복잡해짐에 따라 문제는 점점 더 악화됩니다.

그렇다면 심층 신경망과 완벽하게 일치하는 뇌를 기반으로 한 칩을 설계하지 않는 이유는 무엇입니까?

메모리 컴퓨팅(CIM) 칩을 입력합니다. 이름에 충실한 이 칩은 동일한 사이트에서 메모리를 계산하고 저장합니다. 통근을 잊어 버리십시오. 칩은 데이터 트래픽 병목 현상 문제를 해결하고 더 높은 효율성과 더 낮은 에너지 소비를 약속하는 매우 효율적인 재택 근무 대안입니다.

또는 이론도 마찬가지입니다. AI 알고리즘을 실행하는 대부분의 CIM 칩은 완전한 하드웨어에서 작업을 실행하는 대신 칩 시뮬레이션을 사용하여 기능을 보여주는 칩 설계에만 집중했습니다. 이 칩은 또한 이미지 인식, 음성 인식 등 다양한 AI 작업에 적응하는 데 어려움을 겪으며 스마트폰이나 기타 일상적인 장치에 대한 통합을 제한합니다.

이번 달 연구 in 자연 CIM을 처음부터 업그레이드했습니다. 스탠포드의 뉴로모픽 하드웨어 전문가인 Dr. HS Philip Wong과 UC San Diego의 Gert Cauwenberghs 박사가 이끄는 국제 팀은 칩 디자인에만 초점을 맞추는 대신 기술에서 아키텍처, 하드웨어를 보정하는 알고리즘에 이르기까지 전체 설정을 최적화했습니다. .

결과로 나온 NeuRRAM 칩은 48개의 병렬 코어와 3백만 개의 메모리 셀을 갖춘 강력한 뉴로모픽 컴퓨팅 거물입니다. 매우 다재다능한 이 칩은 손으로 쓴 숫자 읽기, 이미지에서 자동차 및 기타 물체 식별, 음성 녹음 디코딩과 같은 여러 AI 표준 작업을 84% 이상의 정확도로 처리했습니다.

성공률이 평범해 보일 수 있지만 기존 디지털 칩과 경쟁하지만 에너지를 크게 절약할 수 있습니다. 저자에게 이는 계산을 위해 데이터를 클라우드로 이동시킬 필요 없이 AI를 우리 장치에 직접 가져오는 데 한 걸음 더 다가간 것입니다.

"클라우드에서 정보를 주고받는 대신 칩에서 이러한 계산을 수행하면 미래에 더 빠르고, 더 안전하고, 더 저렴하고, 확장 가능한 AI가 가능해지고 더 많은 사람들이 AI의 힘에 액세스할 수 있습니다." 말했다

신경 영감

AI 전용 칩 지금은 놀라운 XNUMX센트입니다. Google의 Tensor Processing Unit(TPU) 및 Tesla의 Dojo 슈퍼컴퓨터 아키텍처에서 Baidu 및 Amazon에 이르기까지 기술 대기업들은 점점 더 정교해지는 딥 러닝 알고리즘을 지원하는 프로세서를 구축하기 위해 AI 칩 골드 러시에 수백만 달러를 투자하고 있습니다. 일부는 심지어 기계 학습을 활용하여 칩 아키텍처 설계 AI 소프트웨어에 맞게 조정되어 경주 전체를 가져옵니다.

특히 흥미로운 개념 중 하나는 뇌에서 바로 나옵니다. 데이터가 뉴런을 통과할 때 시냅스라고 하는 물리적 "도크"를 통해 네트워크에 "연결"됩니다. 작은 버섯과 같은 신경 가지 위에 있는 이러한 구조는 다중 작업을 수행합니다. 단백질 구성의 변화를 통해 데이터를 계산하고 저장합니다.

다시 말해, 뉴런은 기존 컴퓨터와 달리 메모리에서 CPU로 데이터를 이동할 필요가 없습니다. 이것은 뇌에 디지털 장치에 비해 이점을 제공합니다. 에너지 효율이 높고 동시에 여러 계산을 수행하며, 모두 두개골 내부에 채워진 XNUMX파운드짜리 젤리로 포장되어 있습니다.

뇌의 측면을 재현하지 않는 이유는 무엇입니까?

엔터 버튼 뉴 로모 픽 컴퓨팅. 한 가지 해킹은 RRAM 또는 저항성 랜덤 액세스 메모리 장치('멤리스터'라고도 함)를 사용하는 것이었습니다. RRAM은 하드웨어의 저항을 변경하여 전원이 차단된 경우에도 메모리를 저장합니다. 시냅스와 유사하게 이러한 구성 요소는 작은 영역의 조밀한 배열로 포장되어 대량 없이 매우 복잡한 계산이 가능한 회로를 생성할 수 있습니다. 현재의 마이크로프로세서 및 칩에 회로를 구축하기 위한 제조 공정인 ​​CMOS와 결합될 때, 듀오는 더욱 강력해진다 딥 러닝 알고리즘을 실행하기 위한 것입니다.

그러나 대가가 따릅니다. "RRAM-CIM 아키텍처 내의 고도로 병렬화된 아날로그 계산은 탁월한 효율성을 제공하지만 디지털 회로에서와 동일한 수준의 기능적 유연성과 계산 정확도를 실현하는 것을 어렵게 만듭니다."라고 저자는 말했습니다.

최적화 지니

새로운 연구는 RRAM-CIM 칩의 모든 부분을 파고들어 실제 사용을 위해 재설계했습니다.

기술에서 시작됩니다. NeuRRAM은 병렬로 계산하는 48개의 코어를 자랑하며 RRAM 장치는 CMOS 회로에 물리적으로 짜여져 있습니다. 뉴런과 마찬가지로 각 코어는 사용하지 않을 때 개별적으로 꺼질 수 있어 메모리가 RRAM에 저장되는 동안 에너지를 보존합니다.

이 RRAM 셀(XNUMX만 개 모두)은 데이터가 양방향으로 전송될 수 있도록 연결되어 있습니다. 칩이 여러 유형의 AI 알고리즘에 유연하게 적응할 수 있도록 하는 중요한 설계라고 저자는 설명했습니다. 예를 들어, 심층 신경망의 한 유형인 CNN(컨볼루션 신경망)은 특히 컴퓨터 비전에 뛰어나지만 데이터가 한 방향으로 흐르도록 해야 합니다. 대조적으로, 오디오 인식에 자주 사용되는 심층 신경망의 한 유형인 LSTM은 신호를 시간과 일치시키기 위해 데이터를 반복적으로 처리합니다. 시냅스와 마찬가지로 칩은 하나의 RRAM "뉴런"이 다른 RRAM에 얼마나 강하게 연결되는지 인코딩합니다.

이 아키텍처를 통해 데이터 흐름을 미세 조정하여 교통 체증을 최소화할 수 있었습니다. 단일 레인 트래픽을 다중 레인으로 확장하는 것처럼 이 칩은 가장 계산 집약적인 문제에서 네트워크의 현재 "메모리"를 복제하여 여러 코어가 동시에 문제를 분석할 수 있습니다.

이전 CIM 칩에 대한 최종 수정은 두뇌와 같은 계산(종종 아날로그)과 디지털 처리 사이의 더 강력한 다리였습니다. 여기에서 칩은 아날로그 계산을 디지털 신호로 쉽게 변환할 수 있는 뉴런 회로를 사용합니다. 저자들은 이전의 "전력이 부족하고 지역이 부족한" 설정에서 한 단계 더 발전했다고 설명했습니다.

최적화가 이루어졌습니다. 그들의 이론을 테스트하기 위해 팀은 NeuRRAM 칩을 제조하고 다른 게임을 실행하는 Play Station 5와 같은 다양한 알고리즘에 맞게 하드웨어를 프로그래밍하는 알고리즘을 개발했습니다.

수많은 벤치마크 테스트에서 칩은 챔피언처럼 작동했습니다. 칩에서 XNUMX층 CNN을 실행하는 NeuRRAM은 인기 있는 MNIST 데이터베이스를 사용하여 손으로 쓴 숫자를 인식하는 데 XNUMX% 미만의 오류율을 보였습니다.

또한 더 어려운 작업에서도 탁월했습니다. 또 다른 인기 있는 심층 신경망인 LSTM을 로드한 이 칩은 Google 음성 명령 인식을 시도했을 때 대략 85% 정확했습니다. 또 다른 AI 아키텍처에서 실행되는 이 칩은 단 70개의 코어를 사용하여 노이즈가 많은 이미지를 복구할 수 있었고 오류를 약 XNUMX% 줄였습니다.

그래서 뭐야?

한 단어: 에너지.

대부분의 AI 알고리즘은 총 에너지 돼지입니다. NeuRRAM은 이전 최첨단 RRAM-CIM 칩의 절반 에너지 비용으로 작동하여 뉴로모픽 컴퓨팅을 통한 에너지 절약의 약속을 현실로 구현합니다.

그러나 이 연구의 두드러진 점은 전략입니다. 칩을 설계할 때 과학자들은 여러 작업에 대한 효율성, 다양성 및 정확성의 균형을 맞춰야 하는 경우가 너무 많습니다. 모든 컴퓨팅이 하드웨어에서 직접 수행될 때 문제는 더욱 심각해집니다. NeuRRAM은 한 번에 모든 짐승과 싸울 수 있음을 보여주었습니다.

여기에 사용된 전략은 다음과 같은 다른 뉴로모픽 컴퓨팅 장치를 최적화하는 데 사용할 수 있습니다. 상변화 메모리 기술s, 저자는 말했다.

현재 NeuRRAM은 시뮬레이션이 아닌 물리적 칩이 의도한 대로 작동함을 보여주는 개념 증명입니다. 그러나 RRAM을 추가로 확장하고 크기를 언젠가는 휴대폰에 맞도록 축소하는 등 개선의 여지가 있습니다.

"오늘은 키워드 발견이나 사람 감지와 같은 간단한 AI 작업을 수행하는 데 사용되지만 내일은 완전히 다른 사용자 경험을 가능하게 할 수 있습니다. 작은 장치 내에서 음성 인식과 결합된 실시간 비디오 분석을 상상해 보십시오.” 말했다 연구 저자 Dr. Weier Wan. "연구원이자 엔지니어로서 저의 야망은 실험실의 연구 혁신을 실용화하는 것입니다."

이미지 신용 : David Bailot/캘리포니아대학교 샌디에이고

타임 스탬프 :

더보기 특이점 허브