메타, AI 이미지 분할 모델 SAM 공개

메타, AI 이미지 분할 모델 SAM 공개

Meta, AI 이미지 분할 모델인 SAM PlatoBlockchain Data Intelligence 공개 수직 검색. 일체 포함.

알파벳 Inc 구글 AI 모델을 교육하는 데 사용하는 슈퍼컴퓨터에 대한 정보를 공유하면서 슈퍼컴퓨터가 전력 효율적이고 더 빠르다고 주장했습니다. 엔비디아 A100 칩. Google은 XNUMX세대 Tensor Processing Unit(TPU)이라는 맞춤형 칩을 생산했습니다.

기술 대기업에 따르면 회사는 회사의 AI 교육 작업의 90% 이상에 칩을 사용하고 있습니다. Google은 모델을 통해 데이터를 공급하는 칩을 추가하여 인간과 같은 텍스트와 같은 작업에서 실용적으로 만들거나 이미지를 생성합니다.

이상적으로, TPU는 이미지 인식, 음성 인식, 자연어 처리 등과 같은 많은 기계 학습 응용 프로그램에 사용되는 심층 신경망(DNN)의 추론 단계를 가속화합니다. TPU는 DNN 교육에도 사용됩니다.

또한 읽기 : 독일이 벌금형을 위협함에 따라 법적 뜨거운 물에 트위터

화요일 구글 과학 논문을 발표했다 4개 이상의 칩을 연결한 방법을 설명합니다. 이 회사에 따르면 개별 기계를 한 곳에 모으기 위해 맞춤형으로 개발된 광 스위치를 사용했습니다.

과학 논문에서 Google은 비슷한 크기의 시스템에서 자사 칩이 1.7세대 TPU와 동시에 시장에 출시된 Nvidia의 A1.9 칩 기반 시스템보다 최대 100배 빠르고 전력 효율은 XNUMX배 높다고 밝혔습니다.

추가 개선 필요

분석가들은 데이터 추론 칩 시장이 기업들이 투자함에 따라 빠르게 성장할 것이라고 보고 있습니다. 인공 지능 기술 그들의 제품에. 그러나 Google과 같은 회사는 그렇게 하면 추가되는 추가 비용과 비용 중 하나인 전기 비용을 제한하는 방법을 이미 연구하고 있습니다.

다음과 같은 제품을 구동하는 대규모 언어 모델 Google의 Bard 또는 OpenAI의 ChatGPT 규모가 엄청나게 커졌습니다. 사실 그들은 단일 칩에 저장하기에는 너무 큽니다.

이처럼 이러한 연결을 개선하는 것이 AI 슈퍼컴퓨터를 구축하는 기업 간의 경쟁의 핵심 포인트가 되었습니다.

또한 이러한 모델은 수천 개의 칩으로 분할되어 몇 주 이상 함께 작동하여 모델을 교육합니다.

지금까지 공개된 Google의 가장 중요한 언어 모델인 PaLM은 4일 동안 000개의 칩 슈퍼컴퓨터 중 두 대에 분할하여 학습했습니다.

이 회사에 따르면 슈퍼컴퓨터를 사용하면 칩 간의 연결을 즉석에서 쉽게 구성할 수 있습니다.

Google Fellow Norm Jouppi와 Google Distinguished Engineer인 David Patterson은 시스템에 대한 블로그 게시물에서 "회로 전환을 통해 고장난 구성 요소 주변을 쉽게 라우팅할 수 있습니다.

"이러한 유연성 덕분에 슈퍼컴퓨터 상호 연결의 토폴로지를 변경하여 ML(머신 러닝) 모델의 성능을 가속화할 수도 있습니다."

Google에 따르면 비교가 되지 않습니다.

Nvidia는 엄청난 양의 데이터로 AI 모델을 훈련시키는 시장을 지배하고 있습니다. 그러나 이러한 모델이 훈련된 후에는 프롬프트에 대한 텍스트 응답 생성 및 이미지에 고양이가 포함되어 있는지 여부를 결정하는 것과 같은 작업을 수행하여 "추론"이라고 하는 작업에 더 광범위하게 사용됩니다.

주요 소프트웨어 스튜디오는 현재 Nvidia의 A100 프로세서를 사용하고 있습니다. A100 칩은 개발 스튜디오에서 AI 기계 학습 워크로드에 사용하는 가장 일반적으로 사용되는 칩입니다.

XNUMXD덴탈의 A100이 적합합니다. ChatGPT와 같은 도구를 지원하는 기계 학습 모델, 빙 AI, 또는 안정적인 확산. 신경망 모델을 교육하고 사용하는 데 중요한 여러 간단한 계산을 동시에 수행할 수 있습니다.

Nvidia는 댓글 요청을 거절했지만 로이터, Google은 100세대를 Nvidia의 현재 주력 제품인 HXNUMX 칩과 비교하지 않았다고 말했습니다.

구글은 또한 회사가 "미래 팁의 건전한 파이프라인"을 가지고 있다고 말했지만 자세한 내용은 밝히지 않았지만 Nvidia H100과 경쟁할 새로운 TPU에서 작업할 수 있음을 암시했습니다.

구글은 현재 슈퍼컴퓨터에 대한 세부 정보만 공개하고 있지만 2020년부터 오클라호마주 메이스 카운티의 데이터 센터에서 회사 내부에서 온라인 상태를 유지하고 있습니다.

Google은 스타트업 Midjourney가 이 시스템을 사용하여 몇 단어의 텍스트를 입력한 후 새로운 이미지를 생성하는 모델을 훈련했다고 말했습니다.

타임 스탬프 :

더보기 메타뉴스