Databricks утверждает, что ее LLM с открытым исходным кодом превосходит GPT-3.5

Databricks утверждает, что ее LLM с открытым исходным кодом превосходит GPT-3.5

Databricks утверждает, что ее LLM с открытым исходным кодом превосходит GPT-3.5 PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Аналитическая платформа Databricks запустила базовую модель большого языка с открытым исходным кодом в надежде, что предприятия предпочтут использовать ее инструменты, чтобы присоединиться к моде LLM.

Компания, основанная на Apache Spark, опубликовала множество тестов, в которых утверждается, что ее LLM общего назначения, получивший название DBRX, превосходит конкурентов с открытым исходным кодом в понимании языка, программировании и математике. Разработчик также заявил, что по тем же показателям он превзошел фирменную версию OpenAI GPT-3.5.

DBRX был разработан компанией Mosaic AI, которая Блоки данных приобретены за 1.3 миллиарда долларов и прошел обучение на Nvidia DGX Cloud. Databricks утверждает, что оптимизировала DBRX для повышения эффективности с помощью так называемой архитектуры смешанных экспертов (MoE), когда несколько экспертных сетей или учащихся разделяют проблему.

В Databricks пояснили, что модель имеет 132 миллиарда параметров, но только 36 миллиардов активных на каждом входе.

Джоэл Минник, вице-президент по маркетингу Databricks, рассказал: Регистр: «Это важная причина, почему модель может работать так же эффективно, но при этом работает невероятно быстро. С практической точки зрения, если вы используете какие-либо крупные чат-боты, существующие сегодня, вы, вероятно, привыкли ждать и наблюдать за тем, как генерируется ответ. С DBRX это происходит практически мгновенно».

Но производительность самой модели не имеет значения для Databricks. В конце концов, бизнес делает DBRX доступным для бесплатно на GitHub и Обнимая лицо.

Databricks надеется, что клиенты будут использовать эту модель в качестве основы для своих собственных программ LLM. Если это произойдет, это может улучшить чат-боты для клиентов или ответы на внутренние вопросы, а также показать, как DBRX был создан с использованием собственных инструментов Databricks.

Компания Databricks собрала набор данных, на основе которого был разработан DBRX, с использованием блокнотов Apache Spark и Databricks для обработки данных, каталога Unity для управления данными и управления ими, а также MLflow для отслеживания экспериментов.

Минник сообщил, что инвестиции предприятий в LLM задерживались из-за опасений по поводу владения и управления третьими лицами. «Необходимость передавать данные третьим лицам, отсутствие права собственности на веса модели, невозможность полностью контролировать сквозное управление данными — это вещи, которые их замедляют», — объяснил он.

«То, что мы намеревались создать, было чрезвычайно эффективной… моделью, которую предприятия могли бы использовать для внедрения в свои приложения для своих конкретных случаев использования».

Хён Пак, генеральный директор и главный аналитик Amalgam Insights, заметил, что значение DBRX заключается в том, что Databricks может показать, как была построена модель, шаг за шагом, как процесс, которому другие предприятия могут следовать и точно настраивать.

«Такое сочетание происхождения, прозрачности, повторяемости и владения моделью при сквозной настройке, тестировании и вводе в эксплуатацию очень важно».

Пак отметил, что, насколько он понимает, Databricks уже построила для клиентов более 50,000 XNUMX индивидуальных моделей. «Именно сочетание опыта построения моделей и способности делать это в масштабе с помощью высокопроизводительной модели, наравне с лучшими частными разработками и разработками с открытым исходным кодом, делает это объявление примечательным для меня с точки зрения корпоративных ИТ».

Новости DBRX развиваются на фоне меняющейся конкурентной среды для Databricks. У компании есть долгосрочное стратегическое партнерство с Microsoft, результатом которого стала Azure Databricks, в которой пользователям обещаны интегрированные службы обработки данных, тесно связанные с облачной платформой редмондского гиганта.

Но с тех пор, как это предложение было запущено в 2017 году, Microsoft вышла на рынок озер Databricks, где пользователям предлагаются хранилища данных и озера данных в одной среде, и обещает пользователям LLM корпоративного уровня с это 10 миллиардов долларов Партнерство OpenAI. В среде Fabric Microsoft также может предложить «зеркалирование» своих транзакционных систем баз данных Azure Cosmos DB и Azure SQL DB, предлагая доступ к аналитическим службам без перемещения данных.

Открытый вопрос, висящий над стратегиями Databricks и Microsoft, заключается в том, когда придет поток ожидаемых инвестиций в технологии LLM. В январе, Гартнер предсказал Корпоративные расходы на эту технологию в этом году не пойдут, и они окажут незначительное влияние на другие инвестиции в ИТ. ®

Отметка времени:

Больше от Регистр