A Databricks analitikai platform elindított egy nyílt forráskódú, alapozó, nagy nyelvi modellt, abban a reményben, hogy a vállalatok úgy döntenek, hogy eszközeiket használják az LLM sávjának ugrására.
Az Apache Spark köré alapított biznisz egy csomó benchmarkot tett közzé, amely azt állította, hogy általános célú LLM-je – DBRX néven – legyőzte a nyílt forráskódú riválisait a nyelvértés, a programozás és a matematika terén. A fejlesztő azt is állította, hogy ugyanezekkel a mértékekkel legyőzte az OpenAI szabadalmaztatott GPT-3.5-öt.
A DBRX-et a Mosaic AI fejlesztette ki, amely Databrick beszerzett 1.3 milliárd dollárért, és az Nvidia DGX Cloudon képezték ki. A Databricks azt állítja, hogy optimalizálta a DBRX-et a hatékonyság érdekében az úgynevezett mix-of-expert (MoE) architektúrával – ahol több szakértői hálózat vagy tanuló felosztja a problémát.
Databricks elmagyarázta, hogy a modell 132 milliárd paraméterrel rendelkezik, de egyetlen bemeneten csak 36 milliárd aktív.
Joel Minnick, a Databricks marketing alelnöke elmondta A regisztráció: „Ez egy nagy oka annak, hogy a modell olyan hatékonyan tud működni, mint amilyen, ugyanakkor rendkívül gyorsan fut. Gyakorlatilag, ha bármilyen nagy csevegőbotot használ, amely ma elérhető, valószínűleg megszokta, hogy várjon, és figyelje a válasz generálását. A DBRX-szel ez szinte azonnali.”
De magának a modellnek a teljesítménye nem a lényeg a Databricks számára. A biz végül is elérhetővé teszi a DBRX-et ingyenes a GitHubon és a Átölelő arc.
A Databricks azt reméli, hogy az ügyfelek ezt a modellt használják saját LLM-eik alapjául. Ha ez megtörténik, az javíthatja az ügyfelek chatbotjait vagy a belső kérdések megválaszolását, miközben megmutatja, hogyan épült fel a DBRX a Databricks szabadalmaztatott eszközeivel.
A Databricks összeállította azt az adatkészletet, amelyből a DBRX-et fejlesztették, az adatfeldolgozáshoz Apache Spark és Databricks notebookokat, az adatkezeléshez és -irányításhoz a Unity Catalog, a kísérletek követéséhez pedig az MLflow-t használva.
Minnick felfedte, hogy a vállalati befektetéseket az LLM-ekbe késleltették a harmadik felek tulajdonjoga és irányítása miatti félelmek. „Az, hogy az adatokat harmadik félnek kell átadni, nem birtokolni a modell súlyait, nem lehet teljes mértékben ellenőrizni az adatok végpontok közötti irányítását – ezek lassítják őket” – magyarázta.
„Amit elhatároztunk, egy rendkívül hatékony… modellt terveztünk, amelyet a vállalatok használhatnak saját alkalmazásaikhoz saját speciális felhasználási eseteikhez.”
Hyoun Park, az Amalgam Insights vezérigazgatója és vezető elemzője megfigyelte, hogy a DBRX jelentősége abban rejlik, hogy a Databricks lépésről lépésre meg tudja mutatni, hogyan épült fel a modell, amely folyamatot követhet és finomhangolhat más vállalatok számára.
„A származás, a láthatóság, az ismételhetőség és a modell tulajdonjogának ez a kombinációja a teljes modellhangolásban, tesztelésben és operacionalizálásban fontos.”
Park megjegyezte, hogy megértette, hogy a Databricks már több mint 50,000 XNUMX egyedi modellt épített az ügyfelek számára. „A modellépítési tapasztalat és a nagy teljesítményű, a legjobb magán- és nyílt forráskódú erőfeszítésekkel egyenrangú modellek kombinációja teszi ezt a bejelentést számomra figyelemre méltóvá vállalati informatikai szempontból.”
A DBRX-hírek a Databricks változó verseny hátterében játszódnak. A biznisznek hosszú távú stratégiai partnersége van a Microsofttal, amelynek eredménye az Azure Databricks, amelyben a felhasználóknak a redmondi óriás felhőplatformjához szorosan kapcsolódó integrált adatszolgáltatásokat ígérnek.
Az ajánlat 2017-es bevezetése óta azonban a Microsoft beköltözött a Databricks lakehouse piacára – ahol a felhasználóknak adattárházat és adatlakokat kínálnak egy környezetben –, és vállalati szintű LLM-eket ígér a felhasználóknak. 10 milliárd dollárja OpenAI partnerség. Fabric környezetben, A Microsoft is tud ajánlani „tükrözés” az Azure Cosmos DB és Azure SQL DB tranzakciós adatbázisrendszereiből, hozzáférést biztosítva az analitikai szolgáltatásokhoz adatok áthelyezése nélkül.
Mind a Databricks, mind a Microsoft stratégiája fölött nyitott kérdés, hogy mikor érkezik meg az LLM-technológiákba való várható beruházások özöne. Januárban, Gartner jósolta A technológiára fordított vállalati kiadások nem jönnek idén, és csekély hatása lenne az egyéb informatikai beruházásokra. ®
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/
- :van
- :is
- :nem
- :ahol
- $ UP
- 000
- 2017
- 36
- 50
- 7
- a
- képesség
- Képes
- hozzáférés
- át
- aktív
- Után
- ellen
- AI
- Minden termék
- már
- Is
- an
- elemző
- analitika
- és a
- Közlemény
- válasz
- üzenetrögzítő
- bármilyen
- Apache
- alkalmazások
- építészet
- VANNAK
- körül
- AS
- At
- elérhető
- Égszínkék
- háttér
- alap
- BE
- üt
- hogy
- referenciaértékek
- BEST
- Nagy
- Billió
- biz
- mindkét
- hoz
- épít
- Épület
- épült
- de
- by
- kéri
- TUD
- esetek
- katalógus
- vezérigazgató
- változó
- chatbots
- fő
- azt állította,
- követelő
- követelések
- ügyfél részére
- szorosan
- felhő
- Felhő platform
- CO
- kombináció
- érkező
- versenyképes
- ellenőrzés
- Világegyetem
- szokás
- vevő
- Ügyfelek
- dátum
- adatkezelés
- adatfeldolgozás
- adatbázis
- Késik
- fejlett
- Fejlesztő
- osszuk
- do
- nem
- le-
- szinkronizált
- hatékonyság
- hatékony
- eredményesen
- erőfeszítések
- végtől végig
- Vállalkozás
- vállalati szintű
- Vállalatok
- Környezet
- várható
- tapasztalat
- kísérlet
- szakértő
- magyarázható
- rendkívüli módon
- szövet
- GYORS
- félelmek
- végén
- árvíz
- következik
- A
- alapítványi
- Alapított
- ból ből
- teljesen
- Általános rendeltetésű
- generált
- kap
- óriás
- Go
- megy
- kormányzás
- kellett
- megtörténik
- Legyen
- tekintettel
- he
- Magas
- remélve
- Hogyan
- HTTPS
- if
- Hatás
- fontos
- javul
- in
- bemenet
- meglátások
- integrált
- belső
- bele
- beruházás
- IT
- ITS
- maga
- január
- jpg
- ugrás
- Kedves
- tavak
- nyelv
- nagy
- indított
- tanulók
- leszármazás
- kis
- LLM
- hosszú lejáratú
- fontos
- KÉSZÍT
- Gyártás
- vezetés
- piacára
- Marketing
- matematikai
- me
- intézkedések
- microsoft
- esetleg
- tükrözés
- modell
- modellek
- mozog
- áthelyezve
- mozgó
- többszörös
- Közel
- hálózatok
- hír
- figyelemre méltó
- neves
- Nvidia
- of
- ajánlat
- felajánlott
- felajánlás
- on
- ONE
- csak
- nyitva
- nyílt forráskódú
- OpenAI
- dönt
- optimalizált
- or
- Más
- ki
- felett
- saját
- tulajdon
- paraméterek
- Park
- fél
- Létrehozása
- teljesítmény
- előadó
- perspektíva
- emelvény
- Plató
- Platón adatintelligencia
- PlatoData
- játszik
- pont
- rendelkezik
- Gyakorlati
- elnök
- magán
- valószínűleg
- Probléma
- folyamat
- feldolgozás
- Programozás
- igért
- ígér
- szabadalmazott
- közzétett
- tesz
- kérdés
- RE
- ok
- Revealed
- rivális
- futás
- fut
- s
- azonos
- Skála
- Szolgáltatások
- készlet
- előadás
- mutató
- jelentőség
- óta
- lassú
- forrás
- Szikra
- különleges
- Költési
- Stratégiai
- Stratégiai partnerség
- stratégiák
- Systems
- Technologies
- Technológia
- feltételek
- Tesztelés
- hogy
- A
- azok
- Őket
- Ott.
- Ezek
- dolgok
- Harmadik
- harmadik felek
- harmadik fél
- ezt
- idén
- Bekötött
- nak nek
- Ma
- együtt
- mondta
- szerszámok
- Csomagkövetés
- kiképzett
- ügyleti
- dallam
- hangolás
- megértés
- megértett
- egység
- használ
- használt
- Felhasználók
- segítségével
- vice
- Alelnök
- láthatóság
- Várakozás
- volt
- őrzés
- we
- Mit
- amikor
- ami
- míg
- miért
- lesz
- val vel
- nélkül
- Nyerte
- lenne
- év
- te
- zephyrnet