Аналитическая платформа Databricks запустила базовую модель большого языка с открытым исходным кодом в надежде, что предприятия предпочтут использовать ее инструменты, чтобы присоединиться к моде LLM.
Компания, основанная на Apache Spark, опубликовала множество тестов, в которых утверждается, что ее LLM общего назначения, получивший название DBRX, превосходит конкурентов с открытым исходным кодом в понимании языка, программировании и математике. Разработчик также заявил, что по тем же показателям он превзошел фирменную версию OpenAI GPT-3.5.
DBRX был разработан компанией Mosaic AI, которая Блоки данных приобретены за 1.3 миллиарда долларов и прошел обучение на Nvidia DGX Cloud. Databricks утверждает, что оптимизировала DBRX для повышения эффективности с помощью так называемой архитектуры смешанных экспертов (MoE), когда несколько экспертных сетей или учащихся разделяют проблему.
В Databricks пояснили, что модель имеет 132 миллиарда параметров, но только 36 миллиардов активных на каждом входе.
Джоэл Минник, вице-президент по маркетингу Databricks, рассказал: Регистр: «Это важная причина, почему модель может работать так же эффективно, но при этом работает невероятно быстро. С практической точки зрения, если вы используете какие-либо крупные чат-боты, существующие сегодня, вы, вероятно, привыкли ждать и наблюдать за тем, как генерируется ответ. С DBRX это происходит практически мгновенно».
Но производительность самой модели не имеет значения для Databricks. В конце концов, бизнес делает DBRX доступным для бесплатно на GitHub и Обнимая лицо.
Databricks надеется, что клиенты будут использовать эту модель в качестве основы для своих собственных программ LLM. Если это произойдет, это может улучшить чат-боты для клиентов или ответы на внутренние вопросы, а также показать, как DBRX был создан с использованием собственных инструментов Databricks.
Компания Databricks собрала набор данных, на основе которого был разработан DBRX, с использованием блокнотов Apache Spark и Databricks для обработки данных, каталога Unity для управления данными и управления ими, а также MLflow для отслеживания экспериментов.
Минник сообщил, что инвестиции предприятий в LLM задерживались из-за опасений по поводу владения и управления третьими лицами. «Необходимость передавать данные третьим лицам, отсутствие права собственности на веса модели, невозможность полностью контролировать сквозное управление данными — это вещи, которые их замедляют», — объяснил он.
«То, что мы намеревались создать, было чрезвычайно эффективной… моделью, которую предприятия могли бы использовать для внедрения в свои приложения для своих конкретных случаев использования».
Хён Пак, генеральный директор и главный аналитик Amalgam Insights, заметил, что значение DBRX заключается в том, что Databricks может показать, как была построена модель, шаг за шагом, как процесс, которому другие предприятия могут следовать и точно настраивать.
«Такое сочетание происхождения, прозрачности, повторяемости и владения моделью при сквозной настройке, тестировании и вводе в эксплуатацию очень важно».
Пак отметил, что, насколько он понимает, Databricks уже построила для клиентов более 50,000 XNUMX индивидуальных моделей. «Именно сочетание опыта построения моделей и способности делать это в масштабе с помощью высокопроизводительной модели, наравне с лучшими частными разработками и разработками с открытым исходным кодом, делает это объявление примечательным для меня с точки зрения корпоративных ИТ».
Новости DBRX развиваются на фоне меняющейся конкурентной среды для Databricks. У компании есть долгосрочное стратегическое партнерство с Microsoft, результатом которого стала Azure Databricks, в которой пользователям обещаны интегрированные службы обработки данных, тесно связанные с облачной платформой редмондского гиганта.
Но с тех пор, как это предложение было запущено в 2017 году, Microsoft вышла на рынок озер Databricks, где пользователям предлагаются хранилища данных и озера данных в одной среде, и обещает пользователям LLM корпоративного уровня с это 10 миллиардов долларов Партнерство OpenAI. В среде Fabric Microsoft также может предложить «зеркалирование» своих транзакционных систем баз данных Azure Cosmos DB и Azure SQL DB, предлагая доступ к аналитическим службам без перемещения данных.
Открытый вопрос, висящий над стратегиями Databricks и Microsoft, заключается в том, когда придет поток ожидаемых инвестиций в технологии LLM. В январе, Гартнер предсказал Корпоративные расходы на эту технологию в этом году не пойдут, и они окажут незначительное влияние на другие инвестиции в ИТ. ®
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/
- :имеет
- :является
- :нет
- :куда
- $UP
- 000
- 2017
- 36
- 50
- 7
- a
- способность
- в состоянии
- доступ
- через
- активный
- После
- против
- AI
- Все
- уже
- причислены
- an
- аналитик
- аналитика
- и
- Объявление
- ответ
- ответ
- любой
- апаш
- Приложения
- архитектура
- МЫ
- около
- AS
- At
- доступен
- Лазурный
- задник
- основа
- BE
- бить
- не являетесь
- тесты
- ЛУЧШЕЕ
- большой
- миллиард
- biz
- изоферменты печени
- приносить
- строить
- Строительство
- построенный
- но
- by
- Объявления
- CAN
- случаев
- каталог
- Генеральный директор
- изменения
- chatbots
- главный
- заявил
- заявив,
- требования
- клиентов
- тесно
- облако
- Облачная платформа
- CO
- сочетание
- приход
- конкурентоспособный
- контроль
- Космос
- изготовленный на заказ
- клиент
- Клиенты
- данным
- управление данными
- обработка данных
- База данных
- Задерживается
- развитый
- Застройщик
- делить
- do
- приносит
- вниз
- дублированный
- затрат
- эффективный
- эффективно
- усилия
- впритык
- Предприятие
- корпоративного класса
- предприятий
- Окружающая среда
- ожидаемый
- опыт
- эксперимент
- эксперту
- объяснены
- чрезвычайно
- ткань
- БЫСТРО
- страх
- конец
- наводнение
- следовать
- Что касается
- основополагающий
- Основана
- от
- полностью
- общее назначение
- генерируется
- получить
- гигант
- Go
- будет
- управление
- было
- происходит
- Есть
- имеющий
- he
- High
- надеясь
- Как
- HTTPS
- if
- Влияние
- важную
- улучшать
- in
- вход
- размышления
- интегрированный
- в нашей внутренней среде,
- в
- инвестиций
- IT
- ЕГО
- саму трезвость
- январь
- JPG
- Прыгать
- Вид
- озера
- язык
- большой
- запустили
- учащихся
- происхождение
- мало
- LLM
- долгосрочный
- основной
- ДЕЛАЕТ
- Создание
- управление
- рынок
- Маркетинг
- математике
- me
- меры
- Microsoft
- может быть
- зеркальное отображение
- модель
- Модели
- двигаться
- переехал
- перемещение
- с разными
- Возле
- сетей
- Новости
- примечательный
- отметил,
- Nvidia
- of
- предлагают
- предложенный
- предлагающий
- on
- ONE
- только
- открытый
- с открытым исходным кодом
- OpenAI
- выбирать
- оптимизированный
- or
- Другое
- внешний
- за
- собственный
- собственность
- параметры
- Парк
- Стороны
- Партнерство
- производительность
- выполнения
- перспектива
- Платформа
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- играет
- Точка
- обладает
- практическое
- президент
- частная
- вероятно
- Проблема
- процесс
- обработка
- Программирование
- обещанный
- Обещает
- ( изучите наши патенты),
- опубликованный
- положил
- вопрос
- RE
- причина
- Показали
- соперников
- Run
- работает
- s
- то же
- Шкала
- Услуги
- набор
- показывать
- показ
- значение
- с
- медленной
- Источник
- Искриться
- конкретный
- Расходы
- Стратегический
- Стратегическое партнерство
- стратегий
- системы
- технологии
- Технологии
- terms
- Тестирование
- который
- Ассоциация
- их
- Их
- Там.
- Эти
- вещи
- В третьих
- третье лицо
- сторонние
- этой
- В этом году
- Связанный
- в
- сегодня
- вместе
- заявил
- инструменты
- Отслеживание
- специалистов
- транзакционный
- мелодия
- настройка
- понимание
- понимать
- единство
- использование
- используемый
- пользователей
- через
- вице
- вице-президент
- видимость
- Ожидание
- законопроект
- наблюдение
- we
- Что
- когда
- который
- в то время как
- зачем
- будете
- без
- Выиграл
- бы
- год
- Ты
- зефирнет