Anthropic 推出了 Claude 2.1,这是其大型语言模型的最新版本。 我们被告知它可以处理更多文本并生成比以前的迭代更准确的响应,并且它可以与开发人员定义的 API 交互,从而使其能够与用户的技术堆栈集成。
周二,这家由 2019 年离开 OpenAI 的人组建的专注于 ML 安全性和可靠性的初创公司表示,Claude 2.1 模型的功能加倍,现在正在为其基于网络的应用程序提供支持。 人工智能聊天机器人应用,可供开发者和企业使用。 Claude 的工作方式类似于 OpenAI 的 ChatGPT 及其 API:你用自然语言向它发出提示和请求,与它进行对话,它会尝试给出答案。
“Claude 2.1 为企业提供了关键功能方面的进步,包括行业领先的 200K 代币上下文窗口、模型幻觉率的显着降低、系统提示以及我们的新测试版功能:工具使用,”该公司 说过 在其发行说明中。
令牌上下文窗口指示用户可以在其输入提示中包含的文本量。 与前身 Claude 2 相比,最新型号可以处理 翻番 代币的数量,这家新贵声称这是“行业第一”。 单词块被分割成标记,200K 标记上下文窗口相当于大约 150,000 个单词,或者超过 500 页的文本。
增加 token 上下文窗口意味着 Claude 2.1 可以完成更大的自然语言任务,例如摘要、问答,或者对更长、更复杂文档的翻译。 然而,处理这么多文本将需要聊天机器人几分钟的时间来响应。
另一个可能更有用的属性是模型能够生成更真实的响应。 Anthropic 声称,Claude 2.1 产生幻觉(编造东西)的速度比旧版本低 2 倍。 它也更有可能承认它不知道查询的正确答案,而不是像它可能提到的其他一些系统那样编造答案。
在实验中,当给出错误的事实时,例如:“玻利维亚人口第五多的城市是蒙特罗”,模型更有可能回答如下:“我不确定玻利维亚人口第五多的城市是哪个,“ 例如。
无论如何,其他机器人也可以做同样的事情:例如,Google Bard 可以根据搜索结果仔细检查其答案,并突出显示已确认的事实和有问题的断言。
“Claude 2.1 的错误答案减少了 30%,并且错误地得出支持特定主张的文档的比率降低了 3-4 倍,”Anthropic 团队说道。
这家旧金山公司最新的大型语言模型还可以与用户定义的 API 和工具交互,以执行简单的操作。 以下是它可以做的事情的列表,或者我们是这样被告知的:
- 使用计算器应用程序进行复杂的数字推理
- 将自然语言请求转换为结构化 API 调用
- 通过搜索数据库或使用网络搜索 API 回答问题
- 通过私有 API 在软件中执行简单的操作
- 连接到产品数据集以提出推荐并帮助用户完成购买
因此,用户可以提示 Claude 执行特定任务,例如从私有知识库检索信息或与 API 集成。
它还支持系统提示,这是聊天机器人的常见功能,允许开发人员在用户提示前加上特定的上下文,例如告诉模型采用特定的角色或以结构化且一致的方式生成响应。
例如,假设您想在网站中构建一个聊天机器人,以便它回答程序员有关您提供的某些数据库软件的查询。 将系统提示设置为类似以下内容是明智的:“您是一位友好、乐观,但不太非正式或亲密的机器人图书管理员,希望帮助开发人员查找有关我们销售的数据库的信息。 您应该回答以下查询并提供相关文档的链接。”
该系统提示与用户的请求连接,由模型处理,并将结果返回给用户。 定义系统提示符使您不必自己进行连接。 当你看到人们试图让法学硕士做坏事时,他们通常是在试图 覆盖 那个系统提示。
用户可以期望 付 [PDF] 输入提示中处理的每百万代币 8 美元,模型输出中生成的每百万代币 24 美元。
现在是 Anthropic 推出 Claude 2.1 的好时机,特别是因为它的竞争对手 OpenAI 不得不暂时 暂停 由于缺乏计算能力来支持更高的使用率,ChatGPT Plus 订阅的新注册者。 更不用说,在首席执行官萨姆·奥尔特曼(Sam Altman)被震惊解雇后,OpenAI目前还面临着内部危机。
OpenAI的未来是 不确定。 尽管微软提出要领导一个新的人工智能研究团队,但奥特曼似乎希望回到原来的工作,并且还在考虑创办一家新公司。 与此同时,其大多数员工 威胁 除非现任董事会退出并且奥特曼恢复领导职务,否则他将辞职。
科技公司现在正在利用这种情况,许多公司试图从 OpenAI 吸引人才和客户,并像今天的 Anthropic 一样,推广竞争系统。
Anthropic 的联合创始人包括首席执行官 Dario Amodei,他是 OpenAI 的前研究副总裁; Daniela Amodei,曾任 OpenAI 安全与政策副总裁; Tom Brown,OpenAI 的首席 GPT-3 工程师; 以及 OpenAI 前政策总监 Jack Clark(加上前彭博社和 注册.) 它获得了数十亿美元的资金和支持 谷歌, Amazon, 和别的。 ®
- :具有
- :是
- :不是
- $UP
- 000
- 1
- 150
- 2019
- 30
- 500
- 7
- a
- 对,能力--
- 关于
- 精准的
- 行动
- 承认
- 采用
- 进步
- 优点
- 驳
- AI
- AI聊天机器人
- 研究
- 允许
- 允许
- 还
- 其中
- 量
- an
- 和
- 回答
- 答案
- 人类的
- API
- APIs
- 应用
- 出现
- 保健
- AS
- At
- 尝试
- 可使用
- 远离
- 背部
- 坏
- BE
- 测试
- 十亿美元
- 商业
- 板
- 机器人
- 棕色
- 建立
- 但是
- by
- CAN
- 能力
- 携带
- CEO
- 聊天机器人
- 聊天机器人
- ChatGPT
- 城市
- 要求
- 索赔
- CO
- 联合创始人
- 相当常见
- 公司
- 公司
- 相比
- 竞争
- 完成
- 复杂
- 计算
- CONFIRMED
- 考虑
- 一贯
- 上下文
- 谈话
- 正确
- 可以
- 危机
- 的CrunchBase
- 电流
- 目前
- 合作伙伴
- 数据库
- 数据库
- 数据集
- 定义
- 提供
- 证明
- 尽管
- 开发商
- 开发
- 使然
- 副总经理
- do
- 文件
- 文件
- 文件
- 不会
- 美元
- 双打
- 两
- 员工
- 工程师
- 企业
- 特别
- 例子
- 期望
- 实验
- 制作中
- 面对
- 事实
- 正确
- 专栏
- 射击
- (名字)
- 专注焦点
- 以下
- 针对
- 形成
- 前
- 以前
- 旧金山
- 友好
- 止
- 资金
- 未来
- 生成
- 产生
- 给
- 特定
- 非常好
- 谷歌
- 民政事务总署
- 处理
- 有
- 有
- 帮助
- 相关信息
- 更高
- 近期亮点
- 他的
- 举行
- 但是
- HTTPS
- i
- in
- 包括
- 行业中的应用:
- 行业领先
- 非正式的
- 信息
- 输入
- 例
- 集成
- 相互作用
- 内部
- 亲密
- 成
- IT
- 迭代
- 它的
- 千斤顶
- 工作
- JPG
- 键
- 知道
- 知识
- 缺乏
- 语言
- 大
- 大
- 最新
- 发射
- 推出
- 启动
- 铅
- 领导者
- 左
- 让
- 喜欢
- 容易
- 友情链接
- 清单
- ll
- 不再
- 看
- 降低
- 多数
- 使
- 制作
- 许多
- 手段
- 与此同时
- 微软
- 百万
- 分钟
- ML
- 模型
- 更多
- 最先进的
- 许多
- 自然
- 全新
- 现在
- of
- 提供
- 老
- on
- 一旦
- OpenAI
- or
- 其他名称
- 其它
- 我们的
- 输出
- 产量
- 超过
- 网页
- 特别
- 员工
- 为
- 百分
- 演出
- 也许
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 加
- 政策
- 功率
- 供电
- 前任
- 以前
- 私立
- 过程
- 处理
- 处理
- 生产
- 产品
- 程序员
- 促进
- 财产
- 查询
- 题
- 有疑问吗?
- 退出
- 率
- 价格表
- 宁
- RE
- 建议
- 减少
- 释放
- 相应
- 可靠性
- 一个回复
- 请求
- 要求
- 研究
- 回应
- 回复
- 导致
- 成果
- 对手
- 机器人
- s
- 实现安全
- 说
- Sam
- 山姆·奥特曼
- 同
- 圣
- 旧金山
- 对工资盗窃
- 搜索
- 搜索
- 看到
- 出售
- 集
- 应该
- 显著
- 简易
- 自
- 情况
- So
- 软件
- 一些
- 东西
- 具体的
- 分裂
- 堆栈
- 开始
- 启动
- 结构化
- 订阅
- 这样
- SUPPORT
- 支持
- 肯定
- 系统
- 产品
- 采取
- 拍摄
- 服用
- 天赋
- 任务
- 任务
- 团队
- 科技
- 告诉
- 文本
- 比
- 这
- 其
- 他们
- 事
- 从而
- 次
- 至
- 今晚
- 象征
- 令牌
- 告诉
- 汤姆
- 也有
- 工具
- 工具
- 翻译
- 试图
- 周二
- 一般
- 乐观
- 暴发户
- 用法
- 使用
- 用户
- 用户
- 运用
- 版本
- 通过
- vp
- 想
- 方法..
- we
- 卷筒纸
- 基于网络的
- 您的网站
- 什么是
- ,尤其是
- 这
- WHO
- 将
- 窗口
- WISE
- 魆
- 话
- 合作
- 价值
- 将
- 完全
- 您一站式解决方案
- 你自己
- 和风网