Databricks는 오픈 소스 LLM이 GPT-3.5를 능가한다고 주장합니다.

Databricks는 오픈 소스 LLM이 GPT-3.5를 능가한다고 주장합니다.

Databricks는 오픈 소스 LLM이 GPT-3.5 PlatoBlockchain Data Intelligence를 능가한다고 주장합니다. 수직 검색. 일체 포함.

분석 플랫폼인 Databricks는 기업이 자사의 도구를 사용하여 LLM 대세에 동참하기를 희망하면서 오픈 소스 기반의 대규모 언어 모델을 출시했습니다.

Apache Spark를 중심으로 설립된 이 사업은 DBRX라고 불리는 범용 LLM이 언어 이해, 프로그래밍 및 수학 분야에서 오픈 소스 경쟁사를 능가한다고 주장하는 수많은 벤치마크를 발표했습니다. 개발자는 또한 동일한 측정에서 OpenAI의 독점 GPT-3.5를 능가한다고 주장했습니다.

DBRX는 모자이크 AI(Mosaic AI)가 개발했다. Databricks 인수 1.3억 달러에 달하는 비용을 지불하고 Nvidia DGX Cloud에서 교육을 받았습니다. Databricks는 여러 전문가 네트워크 또는 학습자가 문제를 나누는 MoE(혼합 전문가) 아키텍처를 통해 효율성을 위해 DBRX를 최적화했다고 주장합니다.

Databricks는 이 모델이 132억 개의 매개변수를 보유하고 있지만 하나의 입력에서 활성화되는 매개변수는 36억 개에 불과하다고 설명했습니다.

Databricks의 마케팅 부사장인 Joel Minnick은 다음과 같이 말했습니다. 등록: “이것이 모델이 지금처럼 효율적으로 실행될 수 있으면서도 놀라울 정도로 빠르게 실행되는 큰 이유입니다. 실제로 현재 시중에 나와 있는 주요 챗봇을 사용한다면 답변이 생성되는 것을 기다리고 지켜보는 데 익숙할 것입니다. DBRX를 사용하면 거의 즉각적으로 이루어집니다.”

하지만 모델 자체의 성능은 Databricks의 핵심이 아닙니다. 결국 이 사업은 DBRX를 다음 용도로 사용할 수 있도록 만드는 것입니다. GitHub에서 무료포옹하는 얼굴.

Databricks는 고객이 이 모델을 자체 LLM의 기초로 사용하기를 바라고 있습니다. 그런 일이 발생하면 고객 챗봇이나 내부 질문 응답이 향상되는 동시에 Databricks의 독점 도구를 사용하여 DBRX가 어떻게 구축되었는지 보여줄 수도 있습니다.

Databricks는 데이터 처리를 위한 Apache Spark 및 Databricks 노트북, 데이터 관리 및 거버넌스를 위한 Unity Catalog, 실험 추적을 위한 MLflow를 사용하여 DBRX가 개발된 데이터세트를 통합했습니다.

Minnick은 제3자 소유권 및 거버넌스에 대한 두려움으로 인해 LLM에 대한 기업 투자가 지연되었다고 밝혔습니다. “데이터를 제3자에게 옮겨야 하고, 모델 가중치에 대한 소유권이 없고, 데이터의 엔드 투 엔드 거버넌스를 완전히 제어할 수 없기 때문에 속도가 느려집니다.”라고 그는 설명했습니다.

"우리가 구축하기로 한 것은 기업이 특정 사용 사례에 맞게 자체 애플리케이션을 가져오는 데 사용할 수 있는 매우 효율적인 모델이었습니다."

Amalgam Insights의 CEO이자 수석 분석가인 박현은 Databricks가 다른 기업이 따르고 미세 조정할 수 있는 프로세스로서 모델이 어떻게 구축되었는지 단계별로 보여줄 수 있다는 점에서 DBRX의 중요성을 관찰했습니다.

"종단 간 모델 튜닝, 테스트 및 운영화에서 계보, 가시성, 반복성 및 모델 소유권의 조합이 중요합니다."

Park은 Databricks가 이미 고객을 위해 50,000개가 넘는 맞춤형 모델을 구축했다는 사실을 알고 있다고 말했습니다. "모델 구축 경험과 최고의 프라이빗 및 오픈 소스 노력과 동등한 고성능 모델을 통해 대규모로 이를 수행할 수 있는 능력의 조합이 이번 발표를 기업 IT 관점에서 주목할 만하게 만듭니다."

DBRX 뉴스는 Databricks의 변화하는 경쟁 환경에 맞춰 진행됩니다. 이 회사는 Microsoft와 장기적인 전략적 파트너십을 맺어 Azure Databricks를 탄생시켰습니다. 여기서 사용자는 Redmond 거대 기업의 클라우드 플랫폼과 긴밀하게 연결된 통합 데이터 서비스를 약속받습니다.

그러나 2017년에 제안이 시작된 이후 Microsoft는 사용자에게 하나의 환경에서 데이터 웨어하우징과 데이터 레이크를 제공하는 Databricks의 레이크하우스 시장으로 진출했으며 사용자에게 다음과 같은 엔터프라이즈급 LLM을 약속했습니다. 10억 달러야 OpenAI 파트너십. Fabric 환경에서는 Microsoft도 제공할 수 있습니다. 트랜잭션 데이터베이스 시스템인 Azure Cosmos DB 및 Azure SQL DB에서 "미러링"하여 데이터를 이동하지 않고도 분석 서비스에 대한 액세스를 제공합니다.

Databricks와 Microsoft의 전략에 걸려 있는 공개 질문은 LLM 기술에 대한 예상 투자가 언제 홍수처럼 쏟아질 것인지입니다. 1월에는 가트너 예측 기술에 대한 기업의 지출은 올해에는 이루어지지 않을 것이며 다른 IT 투자에 거의 영향을 미치지 않을 것입니다. ®

타임 스탬프 :

더보기 등록