Платформа аналітики Databricks запустила основну модель великої мови з відкритим вихідним кодом, сподіваючись, що підприємства вирішать використовувати її інструменти, щоб підхопити перемогу в LLM.
Підприємство, засноване навколо Apache Spark, опублікувало низку тестів, в яких стверджувалося, що його LLM загального призначення – під назвою DBRX – переміг конкурентів з відкритим кодом у розумінні мови, програмуванні та математиці. Розробник також стверджував, що він переміг власний OpenAI GPT-3.5 за тими ж показниками.
DBRX був розроблений Mosaic AI, який Databricks придбано за 1.3 мільярда доларів США та навчався на Nvidia DGX Cloud. Databricks стверджує, що оптимізувала DBRX для підвищення ефективності за допомогою так званої архітектури змішаних експертів (MoE), де кілька експертних мереж або учнів ділять проблему.
Databricks пояснив, що модель має 132 мільярди параметрів, але лише 36 мільярдів активні на кожному вході.
Про це заявив віце-президент Databricks з маркетингу Джоел Міннік Реєстр: «Це вагома причина, чому модель може працювати так само ефективно, як і вона, але при цьому працює неймовірно швидко. З практичної точки зору, якщо ви користуєтеся будь-якими основними чат-ботами, які існують сьогодні, ви, ймовірно, звикли чекати та спостерігати, як генерується відповідь. З DBRX це майже миттєво».
Але для Databricks головне не продуктивність самої моделі. Зрештою, бізнес полягає в тому, щоб зробити DBRX доступним для безкоштовно на GitHub та Обіймати обличчя.
Databricks сподівається, що клієнти використовуватимуть модель як основу для своїх власних LLM. Якщо це станеться, це може покращити роботу чат-ботів клієнтів або відповіді на внутрішні питання, а також показати, як DBRX було створено з використанням фірмових інструментів Databricks.
Databricks об’єднав набір даних, на основі якого було розроблено DBRX, використовуючи ноутбуки Apache Spark і Databricks для обробки даних, каталог Unity для керування даними та керування ними та MLflow для відстеження експериментів.
Міннік розповів, що інвестиції підприємств у LLM були відкладені через побоювання щодо володіння та управління третіми особами. «Необхідність передавати дані третім сторонам, відсутність права власності на вагові коефіцієнти моделі, нездатність повністю контролювати управління даними від кінця до кінця – це речі, які сповільнюють їх», – пояснив він.
«Те, що ми збиралися побудувати, було надзвичайно ефективною… моделлю, яку підприємства можуть використовувати, щоб перейти та застосувати власні програми для власних конкретних випадків використання».
Хьон Пак, генеральний директор і головний аналітик Amalgam Insights, зауважив, що значення DBRX полягає в тому, що Databricks може показати, як покроково будувалася модель як процес, який інші підприємства можуть слідувати та налаштовувати.
«Таке поєднання походження, видимості, повторюваності та володіння моделлю в наскрізному налаштуванні моделі, тестуванні та введенні в дію є важливим».
Парк зазначив, що, як йому відомо, компанія Databricks вже створила понад 50,000 XNUMX індивідуальних моделей для клієнтів. «Це поєднання досвіду створення моделей і здатності робити це в масштабі з високопродуктивною моделлю нарівні з найкращими зусиллями приватного та відкритого коду робить це оголошення помітним для мене з точки зору корпоративних ІТ».
Новини DBRX розгортаються на мінливому конкурентному тлі для Databricks. Підприємство має довгострокове стратегічне партнерство з Microsoft, результатом якого є Azure Databricks, де користувачам обіцяють інтегровані служби даних, тісно пов’язані з хмарною платформою гіганта з Редмонда.
Але після того, як ця пропозиція була запущена в 2017 році, Microsoft перейшла на ринок Lakehouse Databricks, де користувачам пропонуються сховища даних і озера даних в одному середовищі, і обіцяє користувачам LLM корпоративного рівня з це 10 мільярдів доларів Партнерство OpenAI. У своєму середовищі Fabric, Microsoft також може запропонувати «дзеркалювання» зі своїх систем транзакційних баз даних Azure Cosmos DB і Azure SQL DB, пропонуючи доступ до аналітичних служб без переміщення даних.
Над стратегіями Databricks і Microsoft залишається відкритим питання про те, коли прибуде потік очікуваних інвестицій у технології LLM. В січні, Гартнер передбачив Витрати підприємств на цю технологію не будуть цього року, і це мало вплине на інші інвестиції в ІТ. ®
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/
- : має
- :є
- : ні
- :де
- $UP
- 000
- 2017
- 36
- 50
- 7
- a
- здатність
- Здатний
- доступ
- через
- активний
- після
- проти
- AI
- ВСІ
- вже
- Також
- an
- аналітик
- аналітика
- та
- Оголошення
- відповідь
- відповідь
- будь-який
- Apache
- застосування
- архітектура
- ЕСТЬ
- навколо
- AS
- At
- доступний
- Лазурний
- задник
- основа
- BE
- бити
- буття
- тести
- КРАЩЕ
- Великий
- Мільярд
- бізнес
- обидва
- приносити
- будувати
- Створюємо
- побудований
- але
- by
- Виклики
- CAN
- випадків
- каталог
- Генеральний директор
- заміна
- chatbots
- головний
- стверджував,
- стверджуючи,
- претензій
- клієнтів
- тісно
- хмара
- Хмарна платформа
- CO
- поєднання
- майбутній
- конкурентоспроможний
- контроль
- Космос
- виготовлений на замовлення
- клієнт
- Клієнти
- дані
- управління даними
- обробка даних
- Database
- Затримується
- розвиненою
- Розробник
- ділити
- do
- робить
- вниз
- охрестили
- ефективність
- ефективний
- продуктивно
- зусилля
- кінець в кінець
- підприємство
- підприємства
- підприємств
- Навколишнє середовище
- очікуваний
- досвід
- експеримент
- експерт
- пояснені
- надзвичайно
- тканину
- ШВИДКО
- страх
- кінець
- повінь
- стежити
- для
- фундаментальні
- Заснований
- від
- повністю
- Головна мета
- генерується
- отримати
- гігант
- Go
- буде
- управління
- було
- відбувається
- Мати
- має
- he
- Високий
- сподіваючись
- Як
- HTTPS
- if
- Impact
- важливо
- удосконалювати
- in
- вхід
- розуміння
- інтегрований
- внутрішній
- в
- інвестиції
- IT
- ЙОГО
- сам
- січня
- JPG
- стрибати
- Дитина
- озера
- мова
- великий
- запущений
- учнів
- родовід
- трохи
- LLM
- довгостроковий
- основний
- РОБОТИ
- Робить
- управління
- ринок
- Маркетинг
- математики
- me
- заходи
- Microsoft
- може бути
- відображає
- модель
- Моделі
- рухатися
- переїхав
- переміщення
- множинний
- Близько
- мереж
- новини
- Помітний
- зазначив,
- Nvidia
- of
- пропонувати
- запропонований
- пропонує
- on
- ONE
- тільки
- відкрити
- з відкритим вихідним кодом
- OpenAI
- вибирати
- оптимізований
- or
- Інше
- з
- над
- власний
- власність
- параметри
- Парк
- Сторони
- Партнерство
- продуктивність
- виконанні
- перспектива
- платформа
- plato
- Інформація про дані Платона
- PlatoData
- відіграє
- точка
- володіє
- Практичний
- президент
- приватний
- ймовірно
- Проблема
- процес
- обробка
- Програмування
- пообіцяв
- обіцяє
- власником
- опублікований
- put
- питання
- RE
- причина
- Показали
- суперників
- прогін
- пробіжки
- s
- то ж
- шкала
- Послуги
- комплект
- Показувати
- показ
- значення
- з
- сповільнювати
- Source
- Іскритися
- конкретний
- Витрати
- Стратегічний
- Стратегічне партнерство
- стратегії
- Systems
- Технології
- Технологія
- terms
- Тестування
- Що
- Команда
- їх
- Їх
- Там.
- Ці
- речі
- третій
- треті сторони
- третя сторона
- це
- У цьому році
- Зв'язаний
- до
- сьогодні
- разом
- сказав
- інструменти
- Відстеження
- навчений
- транзакційний
- мелодія
- настройка
- розуміння
- зрозуміла
- єдність
- використання
- використовуваний
- користувачі
- використання
- віце
- Віцепрезидент
- видимість
- Очікування
- було
- спостереження
- we
- Що
- коли
- який
- в той час як
- чому
- волі
- з
- без
- Виграв
- б
- рік
- Ти
- зефірнет