分析平台Databricks推出了开源基础大型语言模型,希望企业选择使用其工具来赶上LLM潮流。
该公司以 Apache Spark 为核心,发布了一系列基准测试,声称其通用 LLM(称为 DBRX)在语言理解、编程和数学方面击败了开源竞争对手。该开发商还声称,它在相同的指标上击败了 OpenAI 专有的 GPT-3.5。
DBRX由Mosaic AI开发, 收购 Databricks 花费 1.3 亿美元,并在 Nvidia DGX Cloud 上进行训练。 Databricks 声称它通过所谓的专家混合 (MoE) 架构优化了 DBRX 的效率,在该架构中,多个专家网络或学习者划分一个问题。
Databricks 解释说,该模型拥有 132 亿个参数,但只有 36 亿个参数在任一输入上处于活动状态。
Databricks 营销副总裁 Joel Minnick 表示 注册:“这是该模型能够高效运行且运行速度极快的一个重要原因。实际上,如果您使用当今任何类型的主要聊天机器人,您可能习惯于等待并观看答案的生成。有了 DBRX,这几乎是瞬时的。”
但模型本身的性能并不是 Databricks 的重点。毕竟,商业正在使 DBRX 可用于 在 GitHub 上免费 和 拥抱脸.
Databricks 希望客户使用该模型作为他们自己的法学硕士的基础。如果发生这种情况,它可能会改进客户聊天机器人或内部问答,同时还展示 DBRX 是如何使用 Databricks 的专有工具构建的。
Databricks 将开发 DBRX 的数据集放在一起,使用 Apache Spark 和 Databricks 笔记本进行数据处理,使用 Unity Catalog 进行数据管理和治理,并使用 MLflow 进行实验跟踪。
明尼克透露,企业对法学硕士的投资因对第三方所有权和治理的担忧而被推迟。 “必须将数据转移给第三方,没有模型权重的所有权,无法完全控制端到端的数据治理——这些都会减慢他们的速度,”他解释道。
“我们着手构建的是一个极其高效的……模型,企业可以使用该模型将其引入到自己的应用程序中,以满足自己的特定用例。”
Amalgam Insights 首席执行官兼首席分析师 Hyun Park 观察到 DBRX 的重要性在于,Databricks 可以展示模型是如何一步步构建的,作为其他企业可以遵循和微调的流程。
“在端到端模型调整、测试和操作化中,沿袭性、可见性、可重复性和模型所有权的结合非常重要。”
Park 指出,据他了解 Databricks 已经为客户构建了 50,000 多个定制模型。 “正是模型构建经验与大规模构建高性能模型的能力相结合,与最好的私有和开源工作相媲美,从企业 IT 的角度来看,这一公告对我来说非常引人注目。”
DBRX 消息是在 Databricks 不断变化的竞争背景下发布的。该公司与微软建立了长期战略合作伙伴关系,从而诞生了Azure Databricks——其中向用户承诺提供与微软这家微软巨头的云平台紧密相关的集成数据服务。
但自 2017 年推出该服务以来,微软已进入 Databricks 的 Lakehouse 市场——在该市场中,用户可以在一个环境中获得数据仓库和数据湖——并向用户承诺企业级法学硕士 10亿美元 OpenAI 合作伙伴关系。在其 Fabric 环境中, 微软还可以提供 从其事务数据库系统 Azure Cosmos DB 和 Azure SQL DB 进行“镜像”,无需移动数据即可访问分析服务。
Databricks 和 Microsoft 战略上悬而未决的一个问题是,LLM 技术的预期投资何时会到来。在一月, Gartner预测 企业在该技术上的支出今年不会出现,并且对其他 IT 投资影响不大。 ®
- :具有
- :是
- :不是
- :在哪里
- $UP
- 000
- 2017
- 36
- 50
- 7
- a
- 对,能力--
- Able
- ACCESS
- 横过
- 要积极。
- 后
- 驳
- AI
- 所有类型
- 已经
- 还
- an
- 分析人士
- 分析
- 和
- 公告
- 回答
- 回答
- 任何
- 阿帕奇
- 应用领域
- 架构
- 保健
- 围绕
- AS
- At
- 可使用
- Azure
- 背景
- 基础
- BE
- 打
- 作为
- 基准
- 最佳
- 大
- 亿
- 商业
- 都
- 带来
- 建立
- 建筑物
- 建
- 但是
- by
- 呼叫
- CAN
- 例
- 检索目录
- CEO
- 改变
- 聊天机器人
- 首席
- 声称
- 自称
- 索赔
- 客户
- 密切
- 云端技术
- 云计算平台
- CO
- 组合
- 未来
- 竞争的
- 控制
- 宇宙
- 习俗
- 顾客
- 合作伙伴
- data
- 数据管理
- 数据处理
- 数据库
- 延迟
- 发达
- 开发商
- 分
- do
- 不
- 向下
- 配音
- 效率
- 高效
- 有效
- 工作的影响。
- 端至端
- 企业
- 企业级
- 企业
- 环境
- 预期
- 体验
- 实验
- 技术专家
- 解释
- 非常
- 布
- 高效率
- 恐惧
- 结束
- 洪水
- 遵循
- 针对
- 基础
- 公司成立
- 止
- 充分
- 一般用途
- 产生
- 得到
- 巨人
- Go
- 去
- 治理
- 民政事务总署
- 发生
- 有
- 有
- he
- 高
- 希望
- 创新中心
- HTTPS
- if
- 影响力故事
- 重要
- 改善
- in
- 输入
- 可行的洞见
- 集成
- 内部
- 成
- 投资
- IT
- 它的
- 本身
- 一月
- JPG
- 跳
- 类
- 湖泊
- 语言
- 大
- 推出
- 学习者
- 血统
- 小
- LLM
- 长期
- 主要
- 制作
- 制作
- 颠覆性技术
- 市场
- 营销
- 数学
- me
- 措施
- 微软
- 可能
- 镜像
- 模型
- 模型
- 移动
- 移动
- 移动
- 多
- 近
- 网络
- 消息
- 显着
- 注意到
- Nvidia公司
- of
- 提供
- 最多线路
- 提供
- on
- 一
- 仅由
- 打开
- 开放源码
- OpenAI
- 选择
- 优化
- or
- 其他名称
- 输出
- 超过
- 己
- 所有权
- 参数
- 地形公园
- 各方
- 合作伙伴
- 性能
- 执行
- 透视
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 扮演
- 点
- 拥有
- 实用
- 总统
- 私立
- 大概
- 市场问题
- 过程
- 处理
- 代码编程
- 许诺
- 承诺
- 所有权
- 出版
- 放
- 题
- RE
- 原因
- 揭密
- 对手
- 运行
- 运行
- s
- 同
- 鳞片
- 特色服务
- 集
- 显示
- 显示
- 意义
- 自
- 放慢
- 来源
- 火花
- 具体的
- 花费
- 善用
- 战略伙伴关系
- 策略
- 产品
- 技术
- 专业技术
- 条款
- 测试
- 这
- 其
- 他们
- 那里。
- 博曼
- 事
- 第三
- 第三者
- 第三方
- Free Introduction
- 今年
- 绑
- 至
- 今晚
- 一起
- 告诉
- 工具
- 跟踪
- 熟练
- 交易
- 调
- 调音
- 理解
- 了解
- 统一
- 使用
- 用过的
- 用户
- 运用
- 副
- 副总裁
- 能见度
- 等候
- 是
- 观看
- we
- 什么是
- ,尤其是
- 这
- 而
- 为什么
- 将
- 也完全不需要
- 韩元
- 将
- 年
- 完全
- 和风网