大型语言模型 SauLM-7B 旨在法律应用

由柏拉图重新发布

关注： 0

机器学习研究人员和法律专家发布了 SauLM-7B，他们声称这是第一个专门针对法律工作和应用的文本生成开源大语言模型。

鉴于最近生成人工智能在提交的法庭文件中引用了不存在的案例的引人注目的错误—— 马塔 v 阿维安卡 和 朴诉金 ——这可能看起来不明智。人工智能模型产生幻觉的倾向及其不确定的数据来源似乎会成为一个利害攸关的行业的交易破坏者。

但 SauLM-7B 的创造者隶属于初创公司平等.ai法国巴黎萨克雷大学和索邦大学，以及葡萄牙里斯本大学和诺瓦法学院认为，人工智能在法律中占有一席之地。

Equall.ai 的一位发言人在一封电子邮件中表示：“法学硕士和更广泛的人工智能系统将对法律实践产生变革性影响，其中包括但不仅仅限于边际生产力。” 注册。 “我们的重点是创建由律师指导和控制的端到端法律人工智能系统。

我们相信，专门用于法律领域的系统将比通用系统表现得更好

“基于数据和经验，我们相信专门用于法律领域的系统将比通用系统表现得更好。这包括更精确和更有用的工具，帮助律师专注于他们最喜欢和最擅长的事情，即行使法律判断并为客户提供建议。”

其他组织对人工智能辅助的效用也同样持乐观态度。高盛去年估计 [PDF] “在美国，当前四分之一的工作任务可以通过人工智能实现自动化，其中在行政（46％）和法律（44％）职业中的风险尤其高……”而像这样的初创公司基准智商, 哈维.ai及安全标志技术在这种预测中看到市场机会。

Equall.ai 由 White & Case LLP 前合伙人 Jorge Mattamouros 创立，他认为几乎所有法律工作——研究、文件审查和分析、摘要以及文件中关键段落的识别——都可以从人工智能中受益。

“我们相信法学硕士开辟了更多的途径，其中一些我们今天已经看到，还有许多仍有待发现，”Equall.ai 的发言人继续说道。 “例如，我们相信法学硕士将彻底改变我们处理数据处理流程和数据生成的方式，这对于获取高质量数据昂贵且困难的法律应用至关重要。”

Equall.ai 的观点是，人工智能模型的不准确性是可以减轻的。

“法学硕士仍然是概率模型，”该公司告诉我们。 “幻觉通常是非经销法学硕士的症状。换句话说，当被提示生成与法学硕士接受培训的数据相似的主题和数据的文本时，法学硕士产生幻觉的几率明显低于被提示生成他们很少了解的内容时的幻觉。

“例如，在我们与实际律师一起对索尔进行评估的过程中，我们能够确认它在讨论特定法律概念时不太容易产生幻觉。简而言之，我们期望接受过法律数据专门培训的法学硕士比通才的同行更少对法律主题产生幻觉。”

尽管如此，这位新贵警告说，人工智能模型不应该像合法数据库一样被依赖，并且建议仔细检查法学硕士的输出。我们会说：检查是强制性的。

SauLM-7B 背后的研究人员 – Pierre Colombo、Telmo Pessoa Pires、Malik Boudiaf、Dominic Culver、Rui Melo、Caio Corro、Andre FT Martins、Fabrizio Esposito、Vera Lúcia Raposo、Sofia Morgado 和 Michael Desa – 描述了他们的工作一篇论文标题为“SaulLM-7B：开创性的大型法律语言模型”。

可在 AI 模型社区网站 HuggingFace 上找到，绍尔LM-7B 基于开源的 Mistral 7B 模型，两者都有 7 亿个参数。这比类似的模型要少得多美洲驼2，可以基于多达 70 亿个参数。但 SauLM-7B 的创建者指出，这只是第一个里程碑，并且正在针对不同的模型尺寸开展工作。

正如您对法学硕士的期望一样，SauLM-7B 的工作原理是用自然语言提出问题或给出提示，并尝试回答或回应它们；在这种情况下，它的重点是法律和法律问题。

英国合法人工智能初创公司 Safe Sign Technologies 的联合创始人兼首席科学家 Jonathan Schwarz 表示注册 SauLM-7B 的制造商采取了明智的方法来专门培养普通法学硕士。

“作为更多专有技术的开源替代品，这是一个很好的产品，”他说。 “但是，还有一些工作需要完成。”

作为更多专有技术的开源替代品，这是一个很好的产品

施瓦茨指出了红队模型的必要性，他说他的公司正在内部这样做。

我们获悉，Safe Sign Technologies 已经制定了法律法学硕士的原型，并计划在今年晚些时候或之后通过合作伙伴准备第二次迭代以供部署。

施瓦茨表示，该公司尚未准备好对其产品的开源或专有程度发表评论。但他声称，虽然 SaulLM-7B-Instruct（根据一般和法律指令进行微调的版本）在 LegalBench-Instruct 基准测试中的平均得分为 0.61，“我们正在接近 0.77”。该准确率与 GPT-4 类似，但我们强烈建议您对机器学习基准保持一定的了解。

Safe Sign Technologies 联合创始人兼首席执行官 Alexander (Sami) Kardos-Nyheim 在接受采访时表示：“我们的目标是创建一个人工智能解决方案，立即为每个人提供非常优质的法律建议。” 注册。 “并非来自 ChatGPT 或类似机构的不可靠法律建议。但你可以通过人工智能实际使用和依赖严肃的法律建议。”