人工智能艺术启示录

新闻 2023-03-20

4310 0

编者按：语音识别、图像识别等的准确率逐渐跟上甚至超越人类，国际象棋和围棋 AI 相继击败世界冠军……随着人工智能在一个又一个领域取得突破，艺术领域一度被认为是人类最后的堡垒。但最近随着 DALL-E、MidJourney、Disco Diffusion、Imagen 等模型的登场，仿佛绘画这个手艺也要被人工智能抢了饭碗。应该如何看待人工智能艺术？它对我们的影响如何？它算不算争议的艺术？本文进行了探讨。文章来自编译。

这幅画是 AI MidJourney 创作的。我只需要输入提示（“野火”）和纵横比，剩下的交给 AI 就行了。这个 AI 已经相当不错，但离最先进的水平还差得很远，像它这样的 AI ，在接下来的几年里，将以几美分的成本在几秒钟内制作出类似水准的艺术。而且它的应用不限于像上面这样的“艺术”，它适用于你在生活当中看到的几乎所有类型的图片。这里面的市场究竟有多大，我觉得很难估算。这篇文章主要是我的各种观点的梳理，但其实其中有些根本就不能算是观点。

经济

艺术家将会失业。这几乎已经不可避免，因为曾经需要几个小时才能完成的工作现在只需要几秒钟，如果说好作品很难生成的话，那可能就多需要几分钟。的确，需要强调的是，这项技术还处在起步阶段，目前存在的明显问题中的 95% 都可以用更大规模的模型、不同的方法或更好的 UI 来解决。如果你用过 Stable Diffusion 或 MidJourney 或 DALL-E 2，你就会知道要为个人创意生成好的结果是多么困难。我一直在关注这方面的论文，我相信这些问题将来会消失不见的。目前这些问题在这批非公开的模型当中已经不见了，在面向公众的模型中这些问题将来也会消失。特殊性是人类艺术家现在主张的关键点之一，但这一点不会继续下去。

这种变化造成的经济影响不会是都一样的。就实际工作和劳动力而言，受影响最大的是那些处于市场底部的人，在Fiverr上用很低廉的佣金接单，按规范做雇佣兵艺术品。如果你的生计是给《龙与地下城》的角色或者书籍封面等做设计的话，最好为减薪做好准备。如果你在艺术市场的高端，从事平面设计工作，我想你可能还有时间，尽管这方面的工作也会发生改变。我们将看到这些模型会被整合到工作流里面，被当作工具使用，但是能够用更少的劳动力做更多的事情意味着什么？付出去的钱免不了会变少。从某种程度来说，有些需求应该还是没法得到满足的，比如说赚钱的机会，但对于这一点我仍有些怀疑。我认为更有可能的情况会是这样，提示设计（prompt engineering）以及图像处理（image manipulation）会成为首选技能，拥有这些技能的艺术家会取代主要技能是绘画手艺的艺术家。

很多艺术家很可能会失业，很难挣到佣金，或者佣金率会被压低等等。这些艺术家需要接受再培训，但其实不太可能得到培训的机会。对于部分人来说，之前能挣钱的马上可能就没法挣钱了。这对他们很不利。

但话虽如此，经济影响是明摆着的事情，谈起来又很无趣。下面我想谈谈其他方面的影响。

大家还会创作艺术吗？

我是一名作者。如果写作得不到报酬的话，我还会写作吗？写。当然还会写。我开始写东西的时候根本就没有观众，我的写作完全免费，在线发布，而且至今大部分仍然是在线免费的，主要靠 Patreon 挣点打赏。

我发现有一个重要的观点是，一旦我们把经济的因素抛到一边，如果大家是为了创作艺术而创作艺术的话，今后他们仍然会继续创作艺术。对他们来说，其实一切都没有改变。有人会失去工作，但人工智能艺术不能阻止大家拿起铅笔在纸上涂鸦。更好的是，人们会利用 AI 艺术去创造新事物，我们的工具箱里面又多了一个工具（见下文）。

我看到过这样一个观点，就是现在人们仍然会养马，新技术会取代但不会扼杀旧技术，马并没有被汽车淘汰。我认为这个类比很有趣，虽说在很多方面都是错的。马匹可不是什么小事。在 1915 年左右的鼎盛时期，美国大约有 2500 万匹马。它们遍布城市的每一条街道，有一整个产业都是为了解决马匹所带来的种种问题的，也就是马粪的处理、喂马、照顾马、各种马具等。到了 1960 年，马匹数量已经下降到 250 万，而且在很多地方都不受欢迎，马匹已经完全被汽车、拖拉机等取代。它们从普通的日常品变成了人们几乎从未见过的东西。而且在人口增加的背景下，情况也许就更加严重了，因为人均拥有马匹数正在急剧下降。所以在那种情况下，说“汽车进马匹退”是对的，但是如果你对着一名画家说“嘿，你这辈子会看到绘画数量下降 90%，以后没人会教美术，这东西会从日常生活中消失”，我想就算绘画不会被彻底扼杀掉，这番话也会吓到他们，并引起一定程度的重视。

我认为总的来说，人总还是要创作艺术的，不过这个观点缺少了一点东西。

人为什么要创作艺术？

我们不妨看几个可能的答案。不过我认为随便找一位艺术家的话，对方给出的答案都会有所不同，而且大多数人就算能确定的话，给出的也会是部分答案的组合。

首先是钱。金钱可以换取商品和服务。有钱才能活下去！理由参见上文讨论到的经济影响。这一点我其实不想再多说了，但是，艺术确实是部分人的生计所在，害怕失去吃饭的家伙可以理解，尤其是如果他们没有学会其他技能的话。这是一个残酷打击，因为仅仅几年前，这项技术似乎还没有出现，然后仿佛突然之间就冒出来了。而且人工智能在这方面的进步似乎比在其他领域的进展来得更安全。

但就像我所说那样，我就算没有钱也会创作自己的艺术，而且我对来钱也没有任何期望。我为什么要这样做？

艺术的核心是要试着表达和唤起。难以用语言表达的东西可以用这种方式来讨论，没有自己形式逻辑的论点可以用这种方式提出，也可以用这种艺术的方式与他人建立联系、分享东西。有些人之所以要绘画或写作，是因为这是一种让自己解压的方式，一种摆脱心理创伤的方式，或者是用来感受某种情绪或思考某个想法。我读过很多小说，很显然作者是把一部分的自己放进小说里面了，我写的一些东西里面也有我的影子。

有人会说“就算人工智能可以创作艺术，但你还是可以做你的，人工智能不会阻拦你”，但这个说法对不对我不能完全确定。从严格的机械意义上来说，是，就算知道人工智能可以更快更好地创作出艺术，艺术家仍然可以继续自己的创作。尽管如此，艺术家与艺术的部分关系还是会受到影响，但这种影响乍看之下可能并不明显。

艺术的表达未必就得有观众，但如果你创作出来的东西别人感同身受的话，一定会有所帮助。如果我知道我写的东西永远不会被别人看见的话，我想我就不会写那么多东西摆在硬盘驱动器的某个角落积灰，直到被重新格式化或丢弃。在我看来，那种感觉就像对着虚空咆哮，就像西西弗斯把巨石推上山顶然后又掉下来。其实艺术有时候已经是这样了。你发表了点什么，告诉大家去看，你希望他们看看这个属于你的东西，结果等来的却是一片死寂，这是很常见的事情。

我认为这对于当代来说已经成为一个大问题，人工智能艺术会让这个问题变得更糟。有时候当我走进图书馆或书店，看到有多少这样的东西在展出时，也会有同样的感觉，那就是内容太多了，多到会湮没其中。这会让那种咆哮的感觉更加强烈，因为自己对文化的贡献变得微不足道。当我想到 AI 艺术，以及 AI 散文（可能即将到来，只是现在还没有真正出现）时，我曾经想过，如果有人说“噢耶，明年会有一百万倍的内容产生，在千分之一的时间内就能按要求完成，而且这一切都是在没有任何真正的人类参与的情况下完成的”，我会怎么想？这是一种存在主义危机的绝望，仿佛个人身份的基石已经坍塌，我与世界的关系已经被撕裂。

这个观点有点情绪化了。我想我必须指出这一点，因为当有人想过来讨论一下经济，或者想谈谈怎么解决问题时，你却说“这就是我的感受”。但关键不在于那些，关键在于那种存在但没有依靠，一种渺小和无足轻重的感觉，这种渺小和无足轻重，甚至超过了你作为数十亿人组成的社会的一员的那种渺小和无足轻重（编者注：人类本身的渺小和无足轻重）。

就表达而言，另一半是与其他人的联系。艺术是一种交流行为，是一次谈话。你看到一张照片，然后照片会让你产生某种感觉，是的，有时候你会独自感受那个艺术，但我之所以喜欢艺术，大部分是因为可以与别人一起讨论，在公共场合探讨艺术，想弄清楚艺术想表达什么，或者哪些是无心插柳柳成荫的事情。总的来说，我觉得作为作家或艺术家最好的地方就在这儿，这种你来我往是非常公开的，作为评论家的目标（陈列柜），有时候艺术必须捍卫自己，但我认为对于大多数艺术家来说这一条几乎已经消失了，即便这些艺术家仍继续创作艺术。而当创作者是人工智能时，批判的性质会发生变化。我认为这一点必须改变。

这里有一种很愚蠢的形式，“荣誉”（kudo），用点赞数或分享数与作品互动。我认为这种做法很蠢，因为它源自对一切事物都想有衡量标准，但又没法为大多数人真正关心的东西建立衡量标准，那些担心自己在 Instagram 获得的点赞数或者在 Twitter 上获得红心数减少的人，我对他们没有一点同情心。当然，我没见过有谁真的表达过这种担忧，但考虑到世界之大，这样的人也许会有的。真正让我感到担心的，我认为也是很多艺术家都会担心的，是即将失去的讨论、互动以及对话等。

那么，人类会不会再也不创作艺术了？不是所有人。但对于某些艺术家来说，创作艺术的理由至少会消失了一点。我认为，如果你创作出来的东西没人看，或者你的表达之前已经有人表达过了的话，是很令人灰心的。这里并不是说人工智能艺术对人类或社会有害，但至少这是很多艺术家的感受，而且我觉得他们有这种感觉是对的。

便宜、可得的艺术

不好的说了这么多，是时候讲讲人工智能艺术的一些好处了。首先，也是最大的一点，人工智能降低了艺术的门槛。姑且把艺术家放在一边，我确实认为人工智能艺术可以带来纯粹的好处。如果只是与计算机交流一下就能生成艺术的话，那么你将获得巨大收益。创作艺术的门槛会逐步下降，任何会用电脑的人都可以（或者只需支付几分钱的“佣金”，如果你愿意的话）创作出体面的艺术品。

就我从艺术当中感受到的东西而言，我认为这还是很棒的。作为一个以前没有艺术细胞的人，突然间我也可以创作艺术了，而且我可以把它添加到我正在创作的东西上，尤其是文字上，只要说一句“这种东西！”，或者“这里帮我做点视觉效果”，或者“我脑海里想到的这个东西是不是很棒？”我喜欢这一切。散文不同于绘画艺术作品，两者是相辅相成的关系。在我的理想世界里，所有作品都会有插图，每章都应该有一到两张引人注目的大图，好在特定时刻设置场景或带给人强烈的视觉冲击。人工智能艺术几乎准备好了。但这不是抢真正的艺术家的饭碗，因为我永远也请不起艺术家为我创作插画，也没有时间或技能自己画。

我现在正在写一份关于世界建筑的大型文档，大概有 70 个不同的地方，我计划要安排 70 张插图。如果按照传统请人画的话，费用大概要 7000 美元，但我没有给这个项目准备那么多的预算，因为如果幸运的话，这份文档可能也就一百多人能看到。最重要的是，一幅插图 100 美元已经是很低的价格，而且低价也意味着做出来的插图作品质量相对较低。但现在因为有了人工智能艺术，我们多了一种此前从不存在的艺术。所以我真的很感谢这种东西。我也认为这对社会和文化都有好处。艺术家的担忧确实需要考虑，但人工智能艺术的好处也需要得到承认。

人工智能作为工具

人工智能可以创作艺术。我看到有人对此提出异议，因为根据定义，人工智能创作的东西也许不算艺术，至少在某些定义下不算。但我认为那些定义很愚蠢，我会选择忽略它们。

“人工智能工具论”这种思路认为人工智能基本上就像一支笔，或者一个调色板，要不就是艺术家用来创作的任何其他工具。工具论有强化版和弱化版，我觉得在适用与否上存在一些混淆，这里我会试着解释一下。

论点一是说人工智能只是一种工具，其作用与多一种新型的画笔差不多，但我认为这种看法是非常错误的。最大的不同在于，人工智能所能做的事情远远超过了任何工具所能为，包括添加构图、内容、调色板、图片元素以及各种其他东西人工智能都可以做。如果把人工智能作为创作过程的一部分来使用的话，它能带来的东西比任何其他工具都要多。

论点二是人工智能将成为艺术家的跳板，我认为这个说法更有道理一些。许多艺术家会把人工智能直接植入到自己的工作流程之中，去代替参考照片、图库以及类似的东西。在开始一个项目之前艺术家会先找到灵感，而且用人工智能来产生这种灵感几乎不费吹灰之力，人工智能艺术将成为艺术创作过程的一部分，但对原先的过程其实也没多少改变。

不过，这项技术可以做的还有很多，而且我认为“人工智能将成为一种工具”的说法并没有完全领会到人工智能所能做到的工作广度。这种人工智能主要是利用文本生成图像的模型，也就是说输入文本提示就能输出图像，但是鉴于人工智能对图像的含义有部分“理解”能力，所以实际上人工智能最终可以做的选项范围是很广的，其中有些事情与文本的关系相对不大。人工智能可以对图像进行变换，让语义和组成元素保持一致，可以将两个图像的元素融合到一起，可以将一张图片的样式应用到另一张图片上，可以提取任何图像的样式并应用到任何其他图片上。人工智能还可以用插图作为内容的自动填充，提升注意力，可以在事后取消裁剪，更改构图，可以对图像进行放大，可以通过生成细节让图像成为焦点。这里提到的大部分已经是人工智能现在就可以做的事情，在一两年内它就可以仅凭借新的用户界面而不是全新的模型或技术来做到更多的事情。

所以我认为“人工智能作为工具”的立论也很贴切，因为现在的艺术家们用到的新工具就已经有十几二十种了。我还认为，在人工智能产生的影响当中，这只是相对较小的一部分，相对于人工智能能产出廉价、丰富的艺术而言。

文化

另一个主要问题是这会对“文化”产生什么影响。其实这个东西是很难说清楚的，但我认为我们至少可以列出其中的一些担心和反驳。

首先，就这个词的任何意义而言，人们担心人工智能毫无“创造性”。人工智能只是收集了大量艺术品之后再从中“学习”，它输出的默认就是你能想象得到的最通用的一些内容，尤其是在构图和主题方面。让你眼前一亮的 AI 很少见，而且大部分都是没有灵魂的，不是因为那是由没有灵魂的机器做出来的，而是因为那是安全的，且经过清洗的，跟以前出现过的一切很类似，不过是旧事物的重新排列组合，并没有增加什么新东西进去。

这种说法有一定道理。目前的模型用在以前已经见过一百万次的东西身上最合适。它们更擅长画荷马·辛普森（Homer Simpson）和达斯·维达（Darth Vader，黑武士），不擅长搞点独特的新创作。它们知道已经被无数次复制的标准姿势，除非搞砸，否则人工智能想不出新的姿势。它们会产生偏见，这是它自己的问题，已经超出了本文的讨论范围，但之所以造成这种偏见，原因之一是训练数据里面有流行的内容，其中也包括了一堆衍生的东西。

在这方面我就遇到过很多问题。其实我脑子里面已经有一幅想象的画面，我试图给出提示，但人工智能就是不想按提示做。到目前为止，我遇到的最大麻烦是想让酒馆用鸡腿穿越平原。我试过很多个提示以及几个不同的模型。弄清楚为什么人工智能不想这么做的原因应该很有趣：酒馆的样子它是见过的，而且知道酒馆应该在地面上。它知道鸡腿是什么，并且知道鸡腿不应该长在酒馆下面。将来的模型也许可以部分解决这个问题，但模型的衍生方式是其训练方式的一个关键特征。在创意上人工智能是受限的。

所以我知道，如果你是一名艺术家，或者只是一个关心“文化”的人，看到当前的模型及其局限性，你会怎么想，“这些人工智能生成的艺术，像潮水一样把所有的人类艺术都冲刷掉，这件事情难道不是很糟糕吗？当一切都是平庸之物的混搭时，文化会变成什么样子？”我认为这种担忧是合理的，但我确实不知道答案。

有一件事情需要考虑——一年后我们拥有的技术会与现在的技术不一样。目前的输出比较索然无味，千篇一律，如果将来提示设计或者向模型添加词汇的能力到位的话就可以克服，就算最终人工智能不能像我预期的那样，其实也还有一个好处: 艺术家将拥有一个小众市场，这个市场将可以创作出新鲜的事物，突破那些平庸之物。

显然，这一切最终会折腾出什么东西来我也不知道。我认为，谁要声称看到了未来可能都是胡说八道。但我的感觉是，至少就文化而言，模型反刍出东西的方式也许不会对艺术的整体健康构成主要障碍，事实上，模型的那些具体手段是通用的，让我们可以更好地理解风格和内容，鉴于同一个主题可以拥有几种不同风格，这样就可以看出艺术家或艺术运动与众不同的那些细节。