阿联酋新型人工智能聊天机器人“Jais”迎合阿拉伯语使用者

阿联酋新型人工智能聊天机器人“Jais”迎合阿拉伯语使用者

据 CNN 报道,阿拉伯联合酋长国 (UAE) 的一个由学者、研究人员和工程师组成的团队推出了一款名为“Jais”的新型生成式人工智能聊天机器人,专门迎合世界各地讲阿拉伯语的人们的需求。

该团队认为阿拉伯语是第六种语言 最常说的 这种世界上约有 272 亿使用者的语言“在主流人工智能中的代表性不足”。 他们希望结束英语在训练称为大语言模型(LLM)的人工智能系统中的主导地位。

Jais AI 聊天机器人专注于中东

人工智能中的语言问题是全世界关注的问题。 日本最近放弃了英语,建立了自己的 ChatGPT 版本。 研究人员 说过 虽然 OpenAI 的聊天机器人在英语方面表现出色,但“由于字母系统的差异、有限的数据和其他因素”,它在日语方面往往表现不佳。

Jais 以阿联​​酋的一座山命名,CNN 报告 说,并且可以根据命令执行任务,例如写诗,就像 ChatGPT 或谷歌 诗人,但规模有限。 AI 接受了 13 亿个数据参数的训练,与 ChatGPT 3.5 的近 175 亿个参数相去甚远,后者衡量的是大型语言模型的大小,但不是其准确性。

阿布扎比穆罕默德·本·扎耶德人工智能大学 (MBZUAI) 自然语言处理教授 Timothy Baldwin 表示,计划将 Jais 的数据集扩展到 30 亿个参数,并使其能够读取图像和图表而不仅仅是文本。

该大学与硅谷的 Cerebras Systems 和阿联酋人工智能公司 G42 的子公司 Inception 合作创建了 Jais。 Baldwin 表示,虽然 Meta 的 LLaMA 和 OpenAI 的 GPT 等竞争对手的法学硕士可以理解阿拉伯语,但他们主要接受在线英语数据的培训。

对于 Jais 来说,培训结合了英语和阿拉伯语数据集,但特意关注来自中东的内容,因为阿拉伯语在中东被广泛使用和书写。

鲍德温表示,这样的关注使人工智能聊天机器人超越了“其他人在阿拉伯语方面所能取得的成就”。

根据 MBZUAI 的说法,Jais 独特的培训有助于聊天机器人“理解文化差异和方言”,使其对各种不同行业更加有用。 开发人员以开源方式向公众提供该模型,这意味着任何人都可以对其进行自定义。

阿联酋的新型人工智能聊天机器人“Jais”迎合阿拉伯语人士的需求 PlatoBlockchain 数据智能。垂直搜索。人工智能。

阿联酋的新型人工智能聊天机器人“Jais”迎合阿拉伯语人士的需求 PlatoBlockchain 数据智能。垂直搜索。人工智能。

在方言之间切换

鲍德温告诉 CNN,Jais 的多样化数据训练将使其能够在用于官方文件和正式写作的现代标准阿拉伯语方言和通常在博客或社交媒体上使用的当地方言之间进行切换。

他说:“这方面肯定还有改进的空间,但重点更多地放在能够理解模型是否有更多非正式输入方面的稳健性。”

与其他生成式 AI 聊天机器人一样,Jais 的设计初衷就是抵制那些会产生“有毒或有害” 鲍德温说,不会回答“导致自残或暗示成瘾”的问题。 同性恋等话题是禁区,符合穆斯林信仰。

也可以参考: ChatGPT 对“英语”的依赖迫使日本创建自己的人工智能聊天机器人

华盛顿特区中东研究所战略技术和网络安全项目主任穆罕默德·索利曼表示,英语等基于拉丁字母的语言 主宰 互联网,这意味着这些语言中的数据集是最大的。

他说:“让那些会说特定语言的人专有使用人工智能工具,可能会阻止社会中的弱势群体从人工智能中获益。”

据 CNN 报道,索利曼补充道:“[这些法学硕士]缺乏对其他文化的认识,这对不同背景的人的用户体验产生了不利影响。”

阿联酋在开发生成式人工智能系统方面取得了重大进展。 该酋长国是世界上第一个任命酋长国 人工智能部长 2017 年。据报道,它还拥有该地区最大的生成式人工智能模型 Falcon,该模型由阿布扎比先进技术研究委员会和技术创新研究所 (TII) 在 XNUMX 月份发布。

时间戳记:

更多来自 元新闻