Meta 的下一个人工智能策略? 传言 Llama 3 将于 2024 年初推出 - Decrypt

Meta 的下一个人工智能策略? 传言 Llama 3 将于 2024 年初推出 – 解密

在主导人工智能领域的竞赛中,人们对 Meta 的下一个重大举措的好奇心达到了白热化的程度。 凭借 2 月份发布的 Llama 3 生成文本模型,人工智能观察者正在急切地寻找 Llama XNUMX 的迹象。

如果业界的抱怨可信的话,这家科技巨头开源成功的续作可能会在 2024 年初推出。

Meta 尚未正式证实这些谣言,但马克·扎克伯格最近透露了 Meta 的 LLM(大型语言模型)的未来,首先承认 Llama 3 正在开发中。 但他表示,新的基础人工智能模型仍处于次要地位,而优先事项仍然是对 Llama 2 进行微调,使其对消费者更加友好。

“我的意思是,我们总是在训练另一种模型,”他在一次播客采访中说道,该采访的重点是 人工智能与虚拟宇宙的交集”,“我们训练了 Llama 2,并将其作为开源模型发布,目前的首要任务是将其构建到一系列消费产品中......

“但是,是的,我们也在研究未来的基础模型,我没有任何关于这方面的新消息或新闻,”他继续说道。 “我不知道具体什么时候能准备好。”

虽然 Meta 尚未正式证实这一传闻,但开发周期模式和巨额硬件投资暗示着即将推出。 Llama 1 和 Llama 2 的训练间隔为六个月,如果这种节奏保持下去,新的 Llama 3(据推测与 OpenAI 的 GPT-4 相当)可能会在 2024 年上半年推出。

Reddit 用户增加了猜测的深度 美洲驼希尔 对 Meta 的历史模型开发周期进行了全面分析。

用户提议,Llama 1 的训练从 2022 年 2023 月到 2 年 2023 月,Llama 3 紧随其后,直到 2023 年 2024 月,为 Llama 4 从 XNUMX 年 XNUMX 月到 XNUMX 年 XNUMX 月的训练设定一个合理的阶段。这些见解与元的叙述相吻合,即不懈追求 AI 卓越,渴望展示其可与 GPT-XNUMX 功能并驾齐驱的下一个进步。

与此同时,技术论坛和 社会化媒体 正在热闹地 讨论 关于这个新的迭代如何重新建立 Meta 的竞争优势。 科技界还从现有的信息碎片中拼凑出了一个可能的时间表。

除此之外,还有一点 Twitter 上的说法:据报道,在“Meta GenAI”社交活动中无意中听到的一段对话,后来由 OpenAI 研究员 Jason Wei 发布了推文。 据 Wei 称,“我们拥有训练 Llama 3 和 4 号的计算能力”,并确认它也将是开源的。

与此同时,该公司与戴尔的合作伙伴关系(为企业用户提供本地 Llama 2)强调了其对个人数据控制和安全的承诺,这一举措既具有战略意义,又具有时代意义。 随着 Meta 准备与 OpenAI 和 Google 等巨头正面交锋,这一承诺至关重要。

Meta 还将人工智能融入其许多产品中,因此该公司增加股份是有道理的,以免被抛在后面。 Llama 2 为 Meta AI 以及 Meta 的聊天机器人、Meta 生成服务和 Meta 的 AI 眼镜等其他服务提供支持。

在这股猜测旋风中,马克·扎克伯格 (Mark Zuckerberg) 对开源 Llama 3 的思考只会让人好奇和神秘。 扎克伯格在最近与计算机科学家莱克斯·弗里德曼 (Lex Fridman) 的播客中分享道:“我们需要一个流程来对此进行红队处理,并确保其安全。”

Llama 2 拥有多层架构,其版本提供 7 亿、13 亿和强大的 70 亿参数,每个参数都适合不同级别的复杂性和计算能力。 LLM 中的参数充当神经构建块,定义模型理解和生成语言的能力,参数的数量通常与模型的复杂性和潜在输出质量相关。

这家人工智能巨头接受过广泛的语料库培训 2万亿代币,支撑其在广泛的主题和上下文中导航和生成类人文本的能力。

图片由元提供

在此背景下,硬件基础也在奠定。 作为 报道 by 解码Meta 正在为一个数据中心配备 Nvidia H100,这是用于人工智能训练的最强大的硬件之一,这清楚地表明车轮正在运转良好。

然而,尽管有种种兴奋和猜测,真相仍然笼罩在公司机密之中。

Meta 在人工智能领域竞争的意图很大程度上取决于所需的培训时间、硬件投资和开源问题。 与此同时,人们对《Llama 2024》的期待也是显而易见的,因为《Llama 3》很可能会在 XNUMX 年发布。

编辑 小泽赖恩.

随时了解加密新闻,在您的收件箱中获取每日更新。

时间戳记:

更多来自 解码