为什么人工智能模型会在取代程序员之前很久就取代艺术家
也许我们从生成式人工智能中看到的最令人费解的含义是,与创造力将是人类创造力的最后堡垒的普遍观点相反,它实际上似乎是 容易得多 将相当困难的创造性任务自动化,而不是将相对简单的编程任务自动化。 为了理解这一点,我们比较了两个更流行的生成 AI 用例:代码生成和图像生成。 但我们相信这种说法更普遍,即使生成模型扩展到更复杂的应用程序也是如此。
争论的简短版本(我们在下面更详细地讨论)是,虽然像这样的产品 GitHub 副驾驶,以目前的形式,可以使编码更有效率,但它并没有消除对具有编程知识的有能力的软件开发人员的需求。 一个重要原因是,在构建程序时,正确性真的很重要。 如果 AI 生成一个程序,它仍然需要人来验证它是否正确——这种努力几乎与开始创建它的水平相同。
另一方面,任何会打字的人都可以使用像这样的模型 稳定扩散 在几分钟内生成高质量、独一无二的图像,成本要低很多个数量级。 创造性的工作产品通常没有严格的正确性约束,模型的输出非常完整。 很难不看到依赖创意视觉的行业发生全面的相变,因为对于许多用途而言,人工智能现在能够产生的视觉效果已经足够了,而我们仍处于该技术的早期阶段。
我们完全承认,按照该领域的发展速度,很难对任何预测充满信心。 不过现在,我们似乎更有可能看到完全由程序员创建的充满创意图像的应用程序,而不是完全由创作者构建的具有人工设计艺术的应用程序。
为什么炒作,为什么是现在?
在我们深入了解代码生成与图像生成的具体细节之前,了解一下目前 AI 整体和生成 AI 的流行程度是很有用的。
生成式 AI 正以前所未有的速度被开发人员采用。 在我们撰写本文时,Stable Diffusion 轻松遥遥领先于 GitHub 存储库的趋势图. 它的增长远远领先于基础设施或加密领域的任何最新技术(见上图)。 几乎每天都有使用该技术的初创公司的启动和融资公告,在线社交网络上充斥着由生成模型创建的内容。
过去十年对人工智能的总体投资水平也不容小觑。 自 2010 年代中期以来,我们已经看到仅出版物的数量就呈指数级增长(见下图)。 今天,arXiv 上发布的所有文章中约有 20% 是关于 AI、ML 和 NLP 的。 重要的是,理论成果已经跨越了一个临界阈值,它们变得易于使用,并引发了新技术、软件和初创公司的寒武纪大爆发。
上图中最近的峰值主要是由于生成人工智能。 在短短十年内,我们已经从可以对图像进行分类和创建词嵌入的专家专用 AI 模型发展为可以编写有效代码并使用自然语言提示创建非常准确图像的公开可用模型。 创新的步伐刚刚加快也就不足为奇了,当生成模型开始侵入曾经由人类主导的其他领域时也就不足为奇了。
生成式人工智能和编程
生成式人工智能的最早用途之一是作为程序员的辅助。 它的工作方式是在大量代码库(例如 GitHub 中的所有公共存储库)上训练模型,然后在程序员编码时向他们提出建议。 结果非常出色。 如此之多以至于这种方法将成为未来编程的代名词是合理的。
然而,相对于我们将在下面介绍的图像生成,生产率的提高并不大。 如上所述,部分原因是正确性在编程中至关重要(实际上是更广泛的工程问题,但我们在这篇文章中专注于编程)。 例如, 最近的一项研究发现 对于匹配高风险的场景 CWE(常见弱点列举), 40% 的 AI 生成代码包含漏洞.
因此,用户必须在生成足够的代码以提供有意义的生产力提升与仍然限制它以便检查正确性之间取得平衡。 结果,副驾驶有 帮助 提高开发人员的生产力——最近的研究(此处 和 此处) 将收益提高到 2 倍或更少——但达到与我们在开发人员语言和工具之前的进步中看到的水平相当的水平。 例如,根据一些估计,从汇编语言到 C 语言的跳跃将生产率提高了 2-5 倍。
对于更有经验的程序员来说,关注点可能会超出代码的正确性并扩展到整体代码质量。 作为 快杰里米霍华德 已经解释 关于最新版本的 OpenAI Codex 模型,“[I]t 编写冗长的代码,因为它正在生成 代码。 对我来说,将普通代码变成我喜欢并且我知道是正确的代码比从头开始编写要慢得多——至少在我熟悉的语言中是这样。”
因此,虽然很明显生成式编程是开发人员生产力的阶跃函数,但尚不清楚这种改进与我们之前看到的有很大不同。 生成式 AI 可以培养更好的程序员,但他们仍然必须进行编程。
生成式 AI 和视觉效果
另一方面,生成模型对图像生成等创造性工作输出的影响是极端的。 它在效率和成本方面带来了许多数量级的改进,并且很难不看到它迎来了整个行业的阶段转变。
生成式人工智能在这个领域的工作方式是从用户那里获取简单的文本输入,称为提示,然后模型生成视觉输出。 目前,有用于创建许多输出格式的模型,包括图像、视频、3D 模型和纹理。
特别有趣的是如何扩展这些模型以生成新的或特定领域的图像,而几乎没有创造性的干预。 例如,Guido(作者之一)采用了预训练图像模型,并在他自己的几十张照片上对其进行了重新训练。 从那里,他能够使用 在提示中。 以下是根据以下提示生成的照片:” 作为美国队长“” 在巴黎“” 在一幅画中“。
在商业环境中,图像生成与代码生成的巨大差异在于生成式 AI 在多大程度上改变了经济计算。 为了创建上述图片,Guido 在基础设施资源上花费了大约 50 美元的少量照片来训练模型. 一旦经过训练,生成图像的成本约为 0.001 美元 在计算资源中,可以在云中完成,或者 在最新一代笔记本电脑上. 此外,生成图像只需几秒钟。
如果没有生成式 AI,获得自定义图像的唯一方法是聘请艺术家或自己动手。 即使我们假设一个人可以在一小时内以 10 美元的价格创建完全自定义的逼真图像, 生成式人工智能方法很容易便宜四个数量级,速度快一个数量级。 更现实地说,任何定制艺术品或图形设计项目都可能需要数天或数周时间,并且将花费数百甚至数千美元。
与上面的编程辅助工具类似,生成式 AI 将是 作为工具采用 由艺术家创作,两者都需要一定程度的用户监督。 但是,很难夸大图像模型模仿完整艺术家输出的能力所产生的经济差异。 使用代码生成模型,即使编写执行标准计算任务的非常基本的功能程序也需要审查、编辑和添加许多代码片段的测试。 但对于基本图像,输入提示并从十几个建议中挑选图像可以在一分钟内完成。
以我们自己的漫画家(和投资伙伴)李洋子为例(@stuffyokodraws). 我们使用她之前的 70 张图像训练了一个模型,该模型能够生成具有令人毛骨悚然的模仿水平的图像。 每个艺术家都必须弄清楚下一步要创作什么,她甚至发现经过训练的模型可以呈现出比她想象的更多的选择——至少在给定时间段内被迫生产某些东西时是这样。 绘制同一对象的方法有数百种,但生成模型可以立即明确哪些路径值得探索。
所以当涉及到这样的任务时,我们并不是说计算机一定是 更好 比人类 1:1 的基础上。 但与许多其他任务一样,当计算机可以产生完整的工作输出时,它们只会杀死我们 规模.
试着猜猜下面哪些图是洋子直接画的,哪些是生成的。
经济的巨大进步、创造新风格和新概念的灵活性以及生成完整或接近完整作品的能力向我们表明,我们准备好看到所有以创意资产为核心的行业发生显着变化。业务的主要部分。 并且这不仅限于图像,而是适用于整个设计领域。 例如:
- 生成式 AI 可以创建 2D 艺术、纹理、3D 模型,并帮助进行游戏关卡设计。
- 在营销方面,它看起来有望取代库存艺术、产品摄影和插图。
- 我们已经在网页设计、室内设计和景观设计中看到了应用。
我们真的才刚刚开始。 如果用例需要创造性地生成内容,则很难理解为什么生成式 AI 不会破坏它或至少成为流程的一部分。
-
好的,那么这篇文章的重点是什么? 虽然它在某种程度上侧重于代码生成和图像生成,但我们确实怀疑结果适用范围更广。 特别是,在系统构建之前很久,人工智能可能会破坏全面的创造性努力——无论是视觉、文本还是音乐。
除了我们上面使用的正确性论证之外,也可能是组合和重新组合所有现有技术可能足以满足创意输出的实际范围。 例如,音乐和电影行业历来制作了无数流行专辑和电影的仿制品。 完全可以想象,随着时间的推移,生成模型可以帮助自动化这些功能。 然而,由 Stable Diffusion 和 DALL-E 2 生成的这么多图像的非凡之处在于 他们真的很好 和 真的很有趣. 不难想象人工智能模型会产生真正有趣的音乐风格融合,甚至“编写”长篇电影,这些电影在如何将概念和风格联系在一起方面很有趣。
相反,很难想象以前的系统会包含我们开发所有未来系统所需的所有工具。 或者即使是复杂的系统也可以像各种艺术或音乐风格一样轻松组合。 一个系统的价值,以及为什么它们如此难以构建,往往在于细节的长尾——所有的权衡、变通办法、给定设计空间的优化,以及它们包含的制度/潜在知识。 因此,我们必须继续建设。
我们会抵制预测的冲动 究竟 生成式人工智能将如何影响创意产业。 然而, 历史表明,新工具往往 扩大 而不是收缩艺术的定义,并让新型艺术家可以使用它. 在这种情况下,新艺术家是系统构建者。 所以, 对于技术创始人,我们认为生成式 AI 绝对是一种积极的工具 为了扩大软件的影响范围——游戏将更加精美,营销将更加引人注目,书面内容将更加引人入胜,电影将更加鼓舞人心。
谁知道呢:有一天,一份 2022 年末的互联网档案可能会被视为最后一个主要由人类生成的内容存储库之一。 至少,这篇文章的这段文字完全是由人类生成的。
***
此处表达的观点是引用的个人 AH Capital Management, LLC (“a16z”) 人员的观点,而不是 a16z 或其关联公司的观点。 此处包含的某些信息是从第三方来源获得的,包括来自 a16z 管理的基金的投资组合公司。 虽然取自被认为可靠的来源,但 a16z 并未独立验证此类信息,也不就该信息的当前或持久准确性或其在特定情况下的适用性做出任何陈述。 此外,该内容可能包含第三方广告; a16z 未审查此类广告,也不认可其中包含的任何广告内容。
此内容仅供参考,不应被视为法律、商业、投资或税务建议。 您应该就这些事项咨询您自己的顾问。 对任何证券或数字资产的引用仅用于说明目的,并不构成投资建议或提供投资咨询服务的要约。 此外,本内容并非针对也不打算供任何投资者或潜在投资者使用,并且在任何情况下都不得在决定投资于 a16z 管理的任何基金时作为依据。 (投资 a16z 基金的要约仅通过私募备忘录、认购协议和任何此类基金的其他相关文件提出,并应完整阅读。)任何提及、提及或提及的投资或投资组合公司所描述的并不代表对 a16z 管理的车辆的所有投资,并且不能保证这些投资将是有利可图的,或者将来进行的其他投资将具有类似的特征或结果。 由 Andreessen Horowitz 管理的基金进行的投资清单(不包括发行人未允许 a16z 公开披露的投资以及对公开交易的数字资产的未宣布投资)可在 https://a16z.com/investments 获得/。
其中提供的图表仅供参考,在做出任何投资决定时不应依赖。 过去的表现并不预示未来的结果。 内容仅在所示日期生效。 这些材料中表达的任何预测、估计、预测、目标、前景和/或意见如有更改,恕不另行通知,并且可能与他人表达的意见不同或相反。 有关其他重要信息,请参阅 https://a16z.com/disclosures。