Databricks, açık kaynak LLM'nin GPT-3.5'i geride bıraktığını iddia ediyor

Databricks, açık kaynak LLM'nin GPT-3.5'i geride bıraktığını iddia ediyor

Databricks, açık kaynak LLM'nin GPT-3.5 PlatoBlockchain Veri Zekasını geride bıraktığını iddia ediyor. Dikey Arama. Ai.

Analitik platformu Databricks, işletmelerin LLM çoğunluğuna katılmak için araçlarını kullanmayı tercih edeceğini umarak, açık kaynaklı, temel bir büyük dil modeli başlattı.

Apache Spark etrafında kurulan şirket, DBRX olarak adlandırılan genel amaçlı LLM'nin dil anlama, programlama ve matematik konularında açık kaynaklı rakiplerini geride bıraktığını iddia eden bir dizi kıyaslama yayınladı. Geliştirici ayrıca aynı ölçümlerde OpenAI'nin tescilli GPT-3.5'ini geride bıraktığını da iddia etti.

DBRX, Mosaic AI tarafından geliştirildi. Databricks satın alındı 1.3 milyar dolara ve Nvidia DGX Cloud üzerinde eğitim aldı. Databricks, birden fazla uzman ağın veya öğrencinin bir sorunu bölüştüğü uzmanlar karışımı (MoE) mimarisi olarak adlandırdığı mimariyle DBRX'i verimlilik için optimize ettiğini iddia ediyor.

Databricks, modelin 132 milyar parametreye sahip olduğunu ancak herhangi bir girişte yalnızca 36 milyarının aktif olduğunu açıkladı.

Databricks pazarlama başkan yardımcısı Joel Minnick şunları söyledi: Kayıt: “Bu, modelin hem bu kadar verimli hem de inanılmaz derecede hızlı çalışmasının büyük bir nedeni. Pratik anlamda, bugün piyasada bulunan herhangi bir büyük sohbet robotunu kullanıyorsanız, muhtemelen beklemeye ve yanıtın oluşturulmasını izlemeye alışkınsınızdır. DBRX ile bu neredeyse anında oluyor.”

Ancak modelin performansı Databricks için önemli değil. Sonuçta biz DBRX'i kullanılabilir hale getiriyoruz GitHub'da ücretsiz ve Sarılma Yüz.

Databricks, müşterilerin modeli kendi yüksek lisans eğitimlerinin temeli olarak kullanmasını umuyor. Böyle bir durumda müşteri sohbet robotları veya dahili soru yanıtlama geliştirilebilir ve aynı zamanda DBRX'in Databricks'in özel araçları kullanılarak nasıl oluşturulduğu da gösterilebilir.

Databricks, veri işleme için Apache Spark ve Databricks not defterleri, veri yönetimi ve yönetişim için Unity Catalog ve deney izleme için MLflow kullanılarak DBRX'in geliştirildiği veri kümesini bir araya getirdi.

Minnick, LLM'lere yapılan kurumsal yatırımın, üçüncü taraf mülkiyeti ve yönetimine ilişkin korkular nedeniyle geciktiğini açıkladı. "Verileri üçüncü taraflara taşımak zorunda olmak, model ağırlıkları üzerinde sahiplik sahibi olmamak, veri yönetimini uçtan uca tam olarak kontrol edememek; bunlar onları yavaşlatan şeylerdir" diye açıkladı.

"Oluşturmak için yola çıktığımız şey, kuruluşların kendi özel kullanım durumları için kendi uygulamalarını getirmek için kullanabilecekleri son derece verimli bir modeldi."

Amalgam Insights'ın CEO'su ve baş analisti Hyoun Park, DBRX'in öneminin, Databricks'in modelin nasıl oluşturulduğunu diğer kuruluşların takip edeceği ve ince ayar yapacağı bir süreç olarak adım adım gösterebilmesi olduğunu gözlemledi.

"Uçtan uca model ayarlama, test etme ve operasyonelleştirmede köken, görünürlük, tekrarlanabilirlik ve model sahipliğinin birleşimi önemlidir."

Park, Databricks'in halihazırda müşteriler için 50,000'den fazla özel model oluşturduğunu anladığını belirtti. "Bu duyuruyu benim için kurumsal BT perspektifinden kayda değer kılan şey, model oluşturma deneyimi ile bunu en iyi özel ve açık kaynak çabalarıyla eşit düzeyde yüksek performanslı bir modelle geniş ölçekte yapabilme yeteneğinin birleşimidir."

DBRX haberleri Databricks için değişen rekabet ortamında ortaya çıkıyor. Sektörün Microsoft ile uzun vadeli bir stratejik ortaklığı var ve bunun sonucunda Azure Databricks ortaya çıktı; burada kullanıcılara Redmond devinin bulut platformuna yakından bağlı entegre veri hizmetleri sözü verildi.

Ancak teklifin 2017'de başlatılmasından bu yana Microsoft, kullanıcılara veri ambarı ve veri göllerinin tek bir ortamda sunulduğu Databricks'in göl evi pazarına geçti ve kullanıcılara kurumsal düzeyde LLM'ler vaat ediyor. 10 milyar dolar OpenAI ortaklığı. Fabric ortamında, Microsoft da sunabilir Azure Cosmos DB ve Azure SQL DB işlemsel veritabanı sistemlerinden "yansıtma" yaparak verileri taşımadan analiz hizmetlerine erişim sunar.

Hem Databricks'in hem de Microsoft'un stratejileri üzerinde asılı duran açık bir soru, LLM teknolojilerine beklenen yatırım akışının ne zaman geleceğidir. Ocak ayında, Gartner tahmin etti teknolojiye yönelik kurumsal harcamalar bu yıl gerçekleşmeyecek ve diğer BT yatırımları üzerinde çok az etkisi olacak. ®

Zaman Damgası:

Den fazla Kayıt