美国科学促进会小组回顾：保持人工智能的丰富广度

由柏拉图重新发布

关注： 0

AAAS 2023 的最终 CCC 小组，“保持人工智能的丰富广度”，于 5 月 XNUMX 日（星期日）会议的最后一天举行。该小组由 David Danks（加州大学圣地亚哥分校）、Bo Li（伊利诺伊大学厄巴纳-香槟分校）和 Melanie Mitchell（圣达菲研究所）组成，由 Maria Gini（明尼苏达大学）主持。

Bo Li 博士首先讨论了进行可信赖的机器学习 (ML) 的重要性，以及我们可以确保 ML 安全、公平和包容的方式。李说，机器学习无处不在，如今已用于大量日常活动，例如导航上班、通过电子邮件发送“快速回复”，甚至使用面部识别打开手机。然而，许多依赖机器学习的技术容易受到攻击。这些技术也不是万无一失的，并且众所周知会犯错误，例如导致错误逮捕的面部识别。

李博士随后指出 PCMag 上的一篇文章，该文章预测，由于勒索软件攻击和对抗性人工智能程序的增加，2023 年将是一场安全噩梦。幸运的是，最近人们开始认识到人工智能程序的风险。白宫科技政策办公室 (OSTP) 发布了人工智能权利法案蓝图和停止进一步人工智能开发的请愿书，包括史蒂夫沃兹尼亚克和埃隆马斯克在内的许多行业领袖都签署了这份请愿书，阐明了快速和不受监管的 AI 开发的风险。 OSTP 的 AI 权利法案蓝图概述了对安全有效的强大 AI 系统的需求，以及对算法歧视保护的需求，以确保 AI 系统对所有人保持公平和公正。

然后，李博士深入研究了各种用于挫败人工智能系统的对抗性攻击。李指出她自己对物理攻击的研究，特别是在自动驾驶汽车的图像识别方面。在李博士合着的一篇论文中，她和她的同事展示了他们可以轻松地将感知系统混淆为使用各种物理攻击错误识别停车标志，如下图所示。

AAAS 小组回顾：保持人工智能的丰富广度 PlatoBlockchain 数据智能。垂直搜索。人工智能。

arXiv:1707.08945 [cs.CR]

李博士还指出了对 MRI 图像识别软件的攻击，这可能会误导软件错误地分割 MRI 图像，并误诊肿瘤，如下图所示。

AAAS 小组回顾：保持人工智能的丰富广度 PlatoBlockchain 数据智能。垂直搜索。人工智能。

李博士认为，提高人工智能的安全性和可信度至关重要。这在依赖时间序列数据的 AI 应用程序中可以清楚地看到，例如面部识别系统随着年龄的增长识别人脸的能力。训练传统机器学习模型时经常出现的一个问题是静态数据假设。静态数据集假设数据集的均值和方差随时间保持不变，以及两个数据点之间的协方差（例如，数据集第 9 天和第 10 天的数据之间的协方差等于第 99 天和第 100 天）。虽然这对于典型的固定数据集可能是正确的，但在使用真实世界数据时，这种假设通常并不成立。出现的问题是，当在现实世界的应用程序中部署基于固定数据训练的模型时，我们现在正在对现实世界的数据进行预测，而这些预测依赖于不再成立的假设。这可能导致 AI 应用程序做出不准确的预测或决策，从而导致毁灭性的后果。虽然我们可以尝试纠正测试数据的非平稳性，但可能很难确定在哪里以及通过什么方式进行这些纠正。

李博士说，训练数据和测试数据之间的鸿沟造成了她所谓的“可信度差距”，在这种情况下，人们可能会担心缺乏稳健性、隐私、泛化和公平性。这里的目标是通过增强系统的稳健性来缩小可信度差距，使它们能够拒绝攻击，准确地适应新情况，并保护其数据被 ML 应用程序使用的个人的隐私。

Melanie Mitchell 博士随后将我们的注意力从机器学习转移到甚至超越传统的深度学习来讨论生成式 AI。 Mitchell 博士举了一些流行的生成式 AI 程序的例子，例如可以对提示生成文本响应的 ChatGPT，以及可以使用生成的图像对提示进行响应的 DALL-E。媒体推测，诸如此类的生成式 AI 程序正在迅速接近与人类相当的智能水平。然而，米切尔对这一声明表示怀疑。

米切尔博士提到她的一个学生训练了一个神经网络来判断图像中是否包含动物。该模型具有很高的准确性，但是当米切尔的学生进行分析以了解该程序如何做出判断时，他意识到该程序根本没有查看图像中包含动物的部分，而是专注于的背景。该模型并没有学习区分图像的动物部分和非动物部分，而是实际上自学了大多数动物图像都有模糊的背景，因此它开始完全忽略图像的前景。

米切尔说，这个例子清楚地表明了人工智能的一个核心问题：让程序学习很容易，但让他们学习你想让他们学习的东西可能非常困难。人工智能不具备即使是蹒跚学步的幼儿也可能拥有的那种常识，因此很难纠正计算机可能做出的人类可能永远无法想象的假设。

大多数神经网络也可以通过将可清晰识别的项目放置在意想不到的位置或方向而轻易被愚弄。米切尔展示了一个由奥本大学的一组研究人员创建的示例。下图显示了各种方向的校车。在第一个方向中，校车的位置符合预期，神经网络可以轻松地 100% 确定地识别出物体。然而，当校车的方向旋转到一个意想不到的位置时，程序每次都无法识别物体，尽管它仍然能以很高的确定性进行识别。

奥尔康、迈克尔 A. 等人。 “摆出一个姿势：神经网络很容易被熟悉物体的奇怪姿势所愚弄。” arXiv 预印本 arXiv:1811.11553 (2018)。

当你在实验室工作时，AI 程序犯的这些错误可能非常愚蠢，但它们也会在现实世界中产生严重的后果，最显着的是自动驾驶汽车因为错误识别或未能识别物体而发生碰撞。人工智能也在努力确定何时应该或不应该识别一个对象。米切尔博士展示了两张图片（下图），第一张展示了一辆自动驾驶汽车的摄像头，将车上骑自行车的人识别为真正的骑车人，第二张展示了特斯拉每次经过带有图片的广告牌时都会猛踩刹车的停车标志。

https://www.theguardian.com/technology/2017/aug/30/self-driving-cars-hackers-security

AAAS 小组回顾：保持人工智能的丰富广度 PlatoBlockchain 数据智能。垂直搜索。人工智能。

Mitchell 博士随后将我们的注意力转向了 Moravec 的悖论，她在之前的演讲中已经提到了这一点。 Moravec 的悖论指出，“让计算机在智力测试或下跳棋中表现出成人水平的表现相对容易，但在感知和移动方面，很难或不可能让它们具备一岁儿童的技能”（Moravec，汉斯。 心灵孩子). 那么我们如何才能纠正人工智能缺乏感知和常识的问题呢？ Mitchell 博士随后讨论了一个领域，该领域已被提议根据已在人类和某些动物物种中确定的“核心知识”系统来评估人类和机器。先天“核心知识”的概念是由认知心理学家、哈佛大学发展研究实验室主任伊丽莎白·斯佩尔克提出的。 Spelke 博士的工作涉及识别人类独特认知能力的来源，以及这些能力如何从出生到成年发展。

如果无法衡量和比较人类智能与机器智能，我们就不能指望为机器提供改进其性能所需的反馈。米切尔博士希望通过创造方法来衡量和比较人类和人工智能的表现，我们将能够克服人工智能同时成为我们最聪明和最愚蠢的伴侣的障碍。

最后，大卫·丹克斯 (David Danks) 博士将我们的注意力从人工智能本身转移到了围绕如何开展和资助人工智能研究的讨论框架上。在他题为“让千种人工智能绽放”的演讲中，丹克斯博士讨论了两种关于科学努力本质的主流观点。第一种意识形态以托马斯·库恩 (Thomas Kuhn) 为例。库恩认为科学受当时主导范式的控制，这意味着大多数科学家都被相同的观点或思维方式所控制，例如人们普遍认为大爆炸理论创造了宇宙。 Danks 说，这种库恩式的思维方式会导致同质化思维，因为越来越少的科学家会跳出框框思考并挑战当今占主导地位的规范。

哲学家保罗费耶阿本德提出了一种截然不同的意识形态。他认为科学家应该从不同的角度来处理问题。为此，费耶阿本德主张“让千花开”。在他看来，科学家应该研究通灵板和占星术理论，因为你永远无法确定目前持有的范式是否正确，如果不质疑甚至最坚定的范式，科学就无法进步。随着在这种科学进步的愿景下提出和研究更多古怪的理论，这种哲学导致了更多的异质性思维。

丹克斯博士说，我们可以将库恩和费耶阿本德的科学愿景视为极端的两端。他解释说，完全同质化的思维会阻碍科学探究，但让一个想法的每一朵花都绽放也是过度的，所以我们可以取消一些研究领域，比如研究通灵板和占星术。丹克斯博士进一步认为，思考具有更多异质性和同质性思维模式的利弊可能是有用的。我们的思想越同质，我们在被广泛认为重要的公认领域和理论上取得的短期进展就越快。另一方面，更多样化的科学共同愿景会产生更多新颖的理论和想法，而这些理论和想法可能无法通过其他方式得到发展。这是以将更多资源浪费在没有成功的理论以及将更少的时间和资源投入到最有益于社会的研究领域为代价的。

Danks 博士指出，实际上，在同质社区中为研究分配资金要容易得多，因为每个人都有相似的观点。这种范式也可以转向对社会最有价值的研究机会，从而增加公众的兴趣和资金。

丹克斯提出，就我们如何进行科学研究的愿景而言，我们在这个连续统一体中的位置很重要。向极端的任何一端走得太远都会严重阻碍进步，不幸的是，Danks 博士说，我们开始在 AI 研究中陷入一个极端。

在下图中，Danks 将我们的注意力引向了 2014 年至今的数据。

科技创业

正如我们所见，仅 4 年时间，提到神经网络的论文比例就增加了近 XNUMX 倍。今天绝大多数人工智能研究都集中在深度学习上，神经网络研究正在排挤其他形式的人工智能。 Danks 说，我们对 AI 的研究变得过于同质化，我们正在忽视其他重要且有价值的 AI 形式。为此，丹克斯提出了两种解决方案。

首先，他建议我们可以通过确保为深度学习以外的人工智能形式提供适当的资金来解决供应方面的同质性问题。那些分配资金的人最好考虑正在资助的 AI 类型，并且可能会激励 AI 应用程序的多样性。

另一方面，我们也可以从需求端来面对这个问题。人工智能的大部分资金都集中在我们已经知道可以解决的问题上，但是我们之前从米切尔博士那里听到的那些挑战又如何呢？例如，将常识纳入人工智能系统的资金在哪里？丹克斯博士说，我们不应该像现在这样接受人工智能，我们需要努力让它变得更好。为此，他建议我们首先关注改进神经网络的技术，然后再资助网络本身的更多应用。

请继续关注小组的问答，明天将在 CCC 博客上发布。