A Databricks azt állítja, hogy nyílt forráskódú LLM-je túljár a GPT-3.5 eszén

A Databricks azt állítja, hogy nyílt forráskódú LLM-je túljár a GPT-3.5 eszén

Databricks claims its open source LLM outsmarts GPT-3.5 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A Databricks analitikai platform elindított egy nyílt forráskódú, alapozó, nagy nyelvi modellt, abban a reményben, hogy a vállalatok úgy döntenek, hogy eszközeiket használják az LLM sávjának ugrására.

Az Apache Spark köré alapított biznisz egy csomó benchmarkot tett közzé, amely azt állította, hogy általános célú LLM-je – DBRX néven – legyőzte a nyílt forráskódú riválisait a nyelvértés, a programozás és a matematika terén. A fejlesztő azt is állította, hogy ugyanezekkel a mértékekkel legyőzte az OpenAI szabadalmaztatott GPT-3.5-öt.

A DBRX-et a Mosaic AI fejlesztette ki, amely Databrick beszerzett 1.3 milliárd dollárért, és az Nvidia DGX Cloudon képezték ki. A Databricks azt állítja, hogy optimalizálta a DBRX-et a hatékonyság érdekében az úgynevezett mix-of-expert (MoE) architektúrával – ahol több szakértői hálózat vagy tanuló felosztja a problémát.

Databricks elmagyarázta, hogy a modell 132 milliárd paraméterrel rendelkezik, de egyetlen bemeneten csak 36 milliárd aktív.

Joel Minnick, a Databricks marketing alelnöke elmondta A regisztráció: „Ez egy nagy oka annak, hogy a modell olyan hatékonyan tud működni, mint amilyen, ugyanakkor rendkívül gyorsan fut. Gyakorlatilag, ha bármilyen nagy csevegőbotot használ, amely ma elérhető, valószínűleg megszokta, hogy várjon, és figyelje a válasz generálását. A DBRX-szel ez szinte azonnali.”

De magának a modellnek a teljesítménye nem a lényeg a Databricks számára. A biz végül is elérhetővé teszi a DBRX-et ingyenes a GitHubon és a Átölelő arc.

A Databricks azt reméli, hogy az ügyfelek ezt a modellt használják saját LLM-eik alapjául. Ha ez megtörténik, az javíthatja az ügyfelek chatbotjait vagy a belső kérdések megválaszolását, miközben megmutatja, hogyan épült fel a DBRX a Databricks szabadalmaztatott eszközeivel.

A Databricks összeállította azt az adatkészletet, amelyből a DBRX-et fejlesztették, az adatfeldolgozáshoz Apache Spark és Databricks notebookokat, az adatkezeléshez és -irányításhoz a Unity Catalog, a kísérletek követéséhez pedig az MLflow-t használva.

Minnick felfedte, hogy a vállalati befektetéseket az LLM-ekbe késleltették a harmadik felek tulajdonjoga és irányítása miatti félelmek. „Az, hogy az adatokat harmadik félnek kell átadni, nem birtokolni a modell súlyait, nem lehet teljes mértékben ellenőrizni az adatok végpontok közötti irányítását – ezek lassítják őket” – magyarázta.

„Amit elhatároztunk, egy rendkívül hatékony… modellt terveztünk, amelyet a vállalatok használhatnak saját alkalmazásaikhoz saját speciális felhasználási eseteikhez.”

Hyoun Park, az Amalgam Insights vezérigazgatója és vezető elemzője megfigyelte, hogy a DBRX jelentősége abban rejlik, hogy a Databricks lépésről lépésre meg tudja mutatni, hogyan épült fel a modell, amely folyamatot követhet és finomhangolhat más vállalatok számára.

„A származás, a láthatóság, az ismételhetőség és a modell tulajdonjogának ez a kombinációja a teljes modellhangolásban, tesztelésben és operacionalizálásban fontos.”

Park megjegyezte, hogy megértette, hogy a Databricks már több mint 50,000 XNUMX egyedi modellt épített az ügyfelek számára. „A modellépítési tapasztalat és a nagy teljesítményű, a legjobb magán- és nyílt forráskódú erőfeszítésekkel egyenrangú modellek kombinációja teszi ezt a bejelentést számomra figyelemre méltóvá vállalati informatikai szempontból.”

A DBRX-hírek a Databricks változó verseny hátterében játszódnak. A biznisznek hosszú távú stratégiai partnersége van a Microsofttal, amelynek eredménye az Azure Databricks, amelyben a felhasználóknak a redmondi óriás felhőplatformjához szorosan kapcsolódó integrált adatszolgáltatásokat ígérnek.

Az ajánlat 2017-es bevezetése óta azonban a Microsoft beköltözött a Databricks lakehouse piacára – ahol a felhasználóknak adattárházat és adatlakokat kínálnak egy környezetben –, és vállalati szintű LLM-eket ígér a felhasználóknak. 10 milliárd dollárja OpenAI partnerség. Fabric környezetben, A Microsoft is tud ajánlani „tükrözés” az Azure Cosmos DB és Azure SQL DB tranzakciós adatbázisrendszereiből, hozzáférést biztosítva az analitikai szolgáltatásokhoz adatok áthelyezése nélkül.

Mind a Databricks, mind a Microsoft stratégiája fölött nyitott kérdés, hogy mikor érkezik meg az LLM-technológiákba való várható beruházások özöne. Januárban, Gartner jósolta A technológiára fordított vállalati kiadások nem jönnek idén, és csekély hatása lenne az egyéb informatikai beruházásokra. ®

Időbélyeg:

Még több A regisztráció