Platforma analityczna Databricks uruchomiła podstawowy model dużego języka o otwartym kodzie źródłowym, mając nadzieję, że przedsiębiorstwa zdecydują się na korzystanie z jej narzędzi, aby wskoczyć na modę LLM.
Firma założona wokół Apache Spark opublikowała mnóstwo testów porównawczych, twierdząc, że jej uniwersalny LLM – nazwany DBRX – pokonuje rywali z otwartym kodem źródłowym w zakresie rozumienia języka, programowania i matematyki. Deweloper twierdził również, że w tych samych środkach pokonał zastrzeżony GPT-3.5 OpenAI.
DBRX został opracowany przez Mosaic AI, który Zdobyto kostki danych za 1.3 miliarda dolarów i trenował w chmurze Nvidia DGX. Firma Databricks twierdzi, że zoptymalizowała DBRX pod kątem wydajności dzięki tak zwanej architekturze mieszanki ekspertów (MoE), w której wiele sieci ekspertów lub uczniów dzieli problem.
Databricks wyjaśnił, że model posiada 132 miliardy parametrów, ale tylko 36 miliardów jest aktywnych na jednym wejściu.
– powiedział Joel Minnick, wiceprezes ds. marketingu Databricks Rejestr: „To główny powód, dla którego ten model może działać równie wydajnie, jak dotychczas, ale jednocześnie działa niesamowicie szybko. W praktyce, jeśli korzystasz z dowolnego rodzaju popularnych chatbotów, które są obecnie dostępne, prawdopodobnie jesteś przyzwyczajony do czekania i obserwowania, jak generowana jest odpowiedź. Dzięki DBRX jest to niemal natychmiastowe.”
Ale wydajność samego modelu nie jest celem Databricks. W końcu zadaniem jest udostępnienie DBRX za darmo na GitHubie i Przytulanie Twarzy.
Databricks ma nadzieję, że klienci wykorzystają ten model jako podstawę własnych LLM. Jeśli tak się stanie, może to ulepszyć chatboty klientów lub odpowiadanie na pytania wewnętrzne, jednocześnie pokazując, w jaki sposób DBRX został zbudowany przy użyciu zastrzeżonych narzędzi Databricks.
W firmie Databricks zebrano zbiór danych, na podstawie którego opracowano DBRX, korzystając z notatników Apache Spark i Databricks do przetwarzania danych, Unity Catalog do zarządzania danymi i zarządzania nimi oraz MLflow do śledzenia eksperymentów.
Minnick ujawnił, że inwestycje przedsiębiorstw w LLM zostały opóźnione ze względu na obawy dotyczące własności i zarządzania przez osoby trzecie. „Konieczność przekazywania danych stronom trzecim, brak własności wag modeli i brak możliwości pełnej kontroli nad całościowym zarządzaniem danymi – to wszystko spowalnia te procesy” – wyjaśnił.
„Postanowiliśmy zbudować niezwykle wydajny… model, z którego przedsiębiorstwa mogą korzystać, aby korzystać z własnych aplikacji w konkretnych przypadkach użycia”.
Hyoun Park, dyrektor generalny i główny analityk w Amalgam Insights, zauważył, że znaczenie DBRX polega na tym, że Databricks może pokazać, jak model został zbudowany, krok po kroku, jako proces, który inne przedsiębiorstwa mogą śledzić i dostrajać.
„To połączenie pochodzenia, widoczności, powtarzalności i własności modelu w kompleksowym dostrajaniu, testowaniu i operacjonalizacji modelu jest ważne”.
Park zauważył, że rozumie, że firma Databricks zbudowała już dla klientów ponad 50,000 XNUMX niestandardowych modeli. „To połączenie doświadczenia w budowaniu modeli i możliwości wykonywania tego na dużą skalę z modelem o wysokiej wydajności na poziomie najlepszych wysiłków prywatnych i open source sprawia, że to ogłoszenie jest dla mnie godne uwagi z punktu widzenia IT przedsiębiorstwa”.
Wiadomości DBRX dotyczą zmieniającego się otoczenia konkurencyjnego dla Databricks. Firma współpracuje długoterminowo, strategicznie z firmą Microsoft, co zaowocowało usługą Azure Databricks, w ramach której użytkownikom obiecuje się zintegrowane usługi danych ściśle powiązane z platformą chmurową giganta z Redmond.
Jednak od czasu wprowadzenia oferty w 2017 r. firma Microsoft wkroczyła na rynek Lakehouse firmy Databricks — gdzie użytkownikom oferuje się hurtownie danych i jeziora danych w jednym środowisku — i obiecuje użytkownikom LLM klasy korporacyjnej z to 10 miliardów dolarów Partnerstwo OpenAI. W środowisku Fabric, Microsoft może również zaoferować „mirroring” z transakcyjnych systemów baz danych Azure Cosmos DB i Azure SQL DB, oferując dostęp do usług analitycznych bez przenoszenia danych.
Otwartym pytaniem wiszącym nad strategiami zarówno Databricks, jak i Microsoftu jest to, kiedy nadejdzie powódź oczekiwanych inwestycji w technologie LLM. W styczniu, Gartner przewidział wydatki przedsiębiorstw na tę technologię nie zostaną poniesione w tym roku i będą miały niewielki wpływ na inne inwestycje w IT. ®
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/
- :ma
- :Jest
- :nie
- :Gdzie
- $W GÓRĘ
- 000
- 2017
- 36
- 50
- 7
- a
- zdolność
- Zdolny
- dostęp
- w poprzek
- aktywny
- Po
- przed
- AI
- Wszystkie kategorie
- już
- również
- an
- analityk
- analityka
- i
- Zapowiedź
- odpowiedź
- sekretarka
- każdy
- Apache
- aplikacje
- architektura
- SĄ
- na około
- AS
- At
- dostępny
- Lazur
- zasłona
- podstawa
- BE
- bić
- jest
- Benchmarki
- BEST
- Duży
- Miliard
- biz
- obie
- przynieść
- budować
- Budowanie
- wybudowany
- ale
- by
- Połączenia
- CAN
- Etui
- katalog
- ceo
- wymiana pieniędzy
- nasze chatboty
- szef
- twierdził,
- twierdząc,
- roszczenia
- klientów
- dokładnie
- Chmura
- Platforma chmurowa
- CO
- połączenie
- przyjście
- konkurencyjny
- kontrola
- kosmos
- zwyczaj
- klient
- Klientów
- dane
- zarządzanie danymi
- analiza danych
- Baza danych
- opóźniony
- rozwinięty
- Deweloper
- podzielić
- do
- robi
- na dół
- dubbingowane
- efektywność
- wydajny
- skutecznie
- starania
- koniec końców
- Enterprise
- klasy korporacyjnej
- przedsiębiorstwa
- Środowisko
- spodziewany
- doświadczenie
- eksperyment
- ekspert
- wyjaśnione
- niezwykle
- tkanina
- FAST
- Obawy
- w porządku
- powódź
- obserwuj
- W razie zamówieenia projektu
- podstawowy
- Założony
- od
- w pełni
- ogólny cel
- wygenerowane
- otrzymać
- gigant
- Go
- będzie
- zarządzanie
- miał
- dzieje
- Have
- mający
- he
- Wysoki
- nadzieję
- W jaki sposób
- HTTPS
- if
- Rezultat
- ważny
- podnieść
- in
- wkład
- spostrzeżenia
- zintegrowany
- wewnętrzny
- najnowszych
- inwestycja
- IT
- JEGO
- samo
- styczeń
- jpg
- skok
- Uprzejmy
- jezior
- język
- duży
- uruchomiona
- uczniowie
- rodowód
- mało
- LLM
- długoterminowy
- poważny
- WYKONUJE
- Dokonywanie
- i konserwacjami
- rynek
- Marketing
- matematyka
- me
- środków
- Microsoft
- może
- mirroring
- model
- modele
- ruch
- przeniósł
- przeniesienie
- wielokrotność
- Blisko
- sieci
- aktualności
- dostojnik
- zauważyć
- Nvidia
- of
- oferta
- oferowany
- oferuje
- on
- ONE
- tylko
- koncepcja
- open source
- OpenAI
- optować
- zoptymalizowane
- or
- Inne
- na zewnątrz
- koniec
- własny
- własność
- parametry
- Park
- strony
- Współpraca
- jest gwarancją najlepszej jakości, które mogą dostarczyć Ci Twoje monitory,
- wykonywania
- perspektywa
- Platforma
- plato
- Analiza danych Platona
- PlatoDane
- odgrywa
- punkt
- posiada
- Praktyczny
- prezydent
- prywatny
- prawdopodobnie
- Problem
- wygląda tak
- przetwarzanie
- Programowanie
- obiecał
- obiecuje
- własność
- opublikowany
- położyć
- pytanie
- RE
- powód
- Ujawnił
- rywale
- run
- działa
- s
- taki sam
- Skala
- Usługi
- zestaw
- pokazać
- seans
- znaczenie
- ponieważ
- powolny
- Źródło
- Iskra
- specyficzny
- Spędzanie
- Strategiczny
- Partnerstwo strategiczne
- strategie
- systemy
- Technologies
- Technologia
- REGULAMIN
- Testowanie
- że
- Połączenia
- ich
- Im
- Tam.
- Te
- rzeczy
- Trzeci
- osoby trzecie
- innych firm
- to
- w tym roku
- Związany
- do
- już dziś
- razem
- powiedział
- narzędzia
- Śledzenie
- przeszkolony
- transakcyjny
- melodia
- strojenie
- zrozumienie
- zrozumiany
- Jedność
- posługiwać się
- używany
- Użytkownicy
- za pomocą
- wice
- Wiceprezes
- widoczność
- Czekanie
- była
- oglądania
- we
- Co
- jeśli chodzi o komunikację i motywację
- który
- Podczas
- dlaczego
- będzie
- w
- bez
- Wygrał
- by
- rok
- You
- zefirnet