AI绘图正在逐渐取代中底层画师?

新闻 2023-03-15

4310 0

在过去的几年里，人工智能取得了极快的发展，其中包括基于机器学习和深度学习的「图像生成技术」。运用该技术，只需输入文本语句就可输出具有独特风格和想象力的图像。面对AI绘图这个势不可挡的趋势，设计从业者们，是否做好准备了呢？

在过去的几年里，人工智能（AI）取得了极快的发展。

ChatGPT和GPT-4对话上的智能程度在不断刷新常人的认知，给大众带来了惊人的体验与惊叹。

同期发展的AI技术，还有基于机器学习和深度学习的「图像生成技术」。

该技术能够让计算机在一定程度上模拟人类进行绘画，用户只需输入文本语句（prompt提示）就可输出具有独特风格和想象力的图像。

文本->图像，AI绘图，指的就是这个过程。

随着大众对于AI绘图关注度的升温，相关的争议不断，有人开始提出「AI取代画师」的观点。

面对AI绘图这个势不可挡的趋势，设计从业者们，是否做好了准备？

一、AI绘图，高效无情的出图机器

2022年8月，在美国科罗拉多州艺术博览会上一幅名为《太空歌剧院》的画作在数字艺术类别比赛中获得了第一。

由AI绘制的《太空歌剧院》

人们也很快得知，这个画作并非真人绘制，而是由游戏设计师使用一个叫Midjourney的AI工具生成而来。

随着这则新闻的传播，AI绘画也开始进入更多人的视野。

1. 国外知名的AI绘画工具

下面先介绍几个国外具有代表性的AI绘画工具：

1）DALL·E2

DALL·E2 是一个由 OpenAI 公司开发的模型，也是一个在线服务。它通过输入一个文本描述（prompt提示）生成多个精准匹配文本的图像。

DALL·E2 结合"CLIP 预训练模型"和"Diffusion扩散模型"来实现了文本->图像（text-to-image）的生成。

扩散模型运行时的成像过程，就是一个"Diffusion 扩散"的过程——

从有噪声开始->逐渐改善图像->直到完全没有噪声->图像越来越接近所提供的文本描述。

DALL·E2 还有一个的特别的功能是"AI编辑"，可以在生成的图片上涂抹某些部分再让 AI 直接修改。

DALL·E2 只使用了已获授权的图片集来进行训练。

2）Stable Diffusion

Stable Diffusion 模型，前身是谷歌开源的 Disco Diffusion 模型。

Stable Diffusion 模型也结合了CLIP技术（OpenAI发布的技术）和Diffusion扩散模型，同样是通过输入文本（prompt提示）来生成图像。

比较特别的是， Stable Diffusion 是一个开源的模型，很多开发者基于这个开源模型开发训练出了更多不同的生成模型。

Stable Diffusion 的母公司Stability AI 在2022年10月宣布获得1.01亿美元融资，投后估值达10亿美元。

3）Midjourney

Midjourney由同名实验室开发，和大部分市面上的AI绘画应用采用的是同一个模型，但是模型使用了大量图像数据来训练。

Midjourney在生成图片的一致性和连贯性上做了很多努力，它生成的图像风格十分独特。

Midjourney几乎所有的生成和交互都发生在Discord社区里，使用其Discord机器人来接收请求和发送生成结果。

3种绘图工具的对比：我们进行测试，对于同样一句文本（其他参数默认的情况下），这3种绘图工具的图片生成效果。

输入文本：

An old man rowing a boat on a lake.

AI生成的图片：

收费标准：

3种绘图工具的体验地址：

①Stable Diffusion

Dream Studio：https://beta.dreamstudio.ai/dream

Hugging Face(免费): https://huggingface.co/spaces/stabilityai/stable-diffusion

②DALL·E2

https://openai.com/dall-e-2/

CLIP：https://openai.com/blog/clip/

③Midjourney

https://www.midjourney.com/home/

（注：某些服务只对部分国家开放）

Midjourney的效果更具艺术感：

对比生成效果可以明显看出，Midjourney生成的图像不太像照片，似乎更像一幅艺术画作。

在Discord社区里运作的Midjourney社区，因为其具有艺术感且画面注重细节的生成效果，收获了全球近千万用户，在线用户也是百万等级。

在社区频道里，用户仅仅需要使用/唤起命令行操作，在/imagine命令下输入prompt文本发送即可。

以下是输入简单文本后，Midjourney生成的图像：

效果如此惊艳的生成图片，只需几十秒内就能得到。

2. 国内的AI绘画产品

国内也相继出现了类似的AI绘画产品，几乎都有免费尝试的额度，通常支持多种风格/艺术家/模型。

以下是国内提供AI绘画服务的一些产品：

随着技术的逐渐普及和越来越高的热度，AIGC似乎就不再是大众试水画图画着玩儿的一个小工具。

这个"高效无情的出图机器"，似乎已经开始在影响和撬动设计行业的变革。

二、设计行业 X AIGC

1. 游戏制作× AIGC

很多游戏项目，开始利用AIGC生产游戏相关素材。

1）国外游戏工作室 Lost Lore《Bearverse》游戏

国外游戏工作室 Lost Lore 出品的主打 NFT 集换概念的F2P游戏《Bearverse》包含了大量的角色设计。

游戏工作室直言：采用AI画图节省了80%美术成本！

①17名角色的调整：

开发成本：从5万美元压缩至1万美元；

工时耗费：从6个月大幅减少至1个月。

②创作一张场景概念图：

工时耗费：从1-2周压缩至1天以内。

设计总监最后也坦言：

95%的效果和概念图呈现仍是由团队真人创作。

2. 商业设计 ×AIGC

大厂团队已经不甘观望，开始了AIGC在商业设计工作流中的实践。

1）腾讯-ISUX团队

腾讯的ISUX团队2023年3月1日刚刚发表在其官网的文章《运用AIGC人工智能生产内容》

https://isux.tencent.com/articles/aigc-design.html

文中提到了腾讯的ISUX团队运用AIGC进行商业设计的好几个案例，并进行了结合使用AIGC后设计团队的全新工作流的方法总结。

2）百度-AIGC营销赋能业务

百度也在试图利用AIGC满足商业设计上的需求。

百度发布了AIGC方向的产品负责人岗位，负责比如"商业广告平台部的内容生产相关工具的规划和落地"。

3. 个人头像设计× AIGC

1）国外的AI美图软件Lensa「魔法头像」功能

「魔法头像」是Lensa基于Stable Diffusion技术开发的头像生成功能，用户上传10-20张自拍照，能生成50～200张不同风格的AI自画像/头像。

生成50/100/200张的价格分别是：3.99/5.99/7.99 美元。

因为这项新功能的加入，2022年12月的前5天，Lensa下载量达到400多万次，"日收入"也一度达到了300万美元。

2）美图秀秀「百变 AI 头像」功能

同样是美图软件的国内团队——美图秀秀，也随机发布了相似的功能。

从产品定位来看，也是输入真人头像就能批量地获得多种风格的头像。

和国外的AI美图软件Lensa相比，美图秀秀对于用户的输入门槛要求更低一些，只需要提供3张正脸无遮挡自拍照即可。

3）抖音「AI绘画」特效

继2021年的「漫画脸」特效（基于GAN技术）后，2022年抖音又上线了特效玩法「AI绘画」（基于Stable Diffusion技术）。

用户只要输入一张图片，AI就会根据图片生成一张动漫风格的图片。

抖音「AI绘画」功能的的峰值QPS（每秒请求量）一度达到1.4w。

4）QQ小世界AI画匠

腾讯QQ上线了"QQ小世界AI画匠"活动，主题为"异次元的我"。

用户上传1张个人照片，即可一键生成专属异次元形象。

4. 动画背景× AIGC

1）国产志怪类动画《神弦曲：猫儿与时光铃铛》

由十九号动漫出品的国产志怪类动画《神弦曲：猫儿与时光铃铛》将于明年上映。官方在2022年12月发布了预告片。

主创团队称，预告片三分之二的背景都是结合AI制作完成的。

制作预告片中的30多个背景，工时耗费从3个月降到2个月，效率上提升了至少30%。

主创在采访中提到："有了这样的一个技术，把我们的预算从一个标准动画电影预算直接减半，我们就快速地获得了一些投资机会。"

5. 视频制作× AIGC

除了绘画领域外，AIGC也在动态的视频生成上有了很多突破。

1）Runway 新功能：视频转风格生成器 GEN 1

Runway AI 是一家图片和视频AI编辑软件提供商，为设计师、艺术家和开发人员提供一系列工具的平台，帮助他们利用人工智能技术创建作品。

Runway 平台推出了新功能 —— 把视频转换成任意风格的生成器 GEN 1。

GEN 1 这个能力和图生图功能（image-to-image）类似，只是变成了从视频到视频（video-to-video）的生成。

https://research.runwayml.com/gen1

看起来， GEN 1 是一个支持用户可订制化的视频滤镜的能力。

而定制化的方式极为简单，只需一张具有风格的图片。

2）Wonder Studio：一键替换真人为CG角色

这款由一家人工智能初创公司Wonder Dynamics推出的AI工具Wonder Studio，声称可以实现「一键把视频中的真人替换为CG角色」，简化电影制作流程。

https://wonderdynamics.com/

整个工具的使用流程大概是：

真人先替代CG机器人进行表演

视频拍摄完成，导入进软件

选择想要的CG角色，安装在实拍的真人身上

目前官方网站上开放了内测申请。

三、AI绘图的争议

在设计行业中，很多人的对于AI绘图的态度，都是不怎么正面的，主要集中在几点：

从业者的担忧

版权

学习信心的打击

争议1：从业者的担忧

在AIGC生成绘画能力效率和质量皆可的前提下，中底层画师好像确实慢慢就不需要那么多了……

论出图速度：人赶不上机器的出图速度；

论出图创意：AI 可以生成出关键元素外的细节，似乎更为惊喜；

论风格效果：AI 能训练出不同的绘画模型，对应不同画风；

输入相同的一段prompt文本后，不同的模型可以生成出不同风格的图片，且速度极快，通常是几秒～20秒内不等：

除了想要的关键元素外，生成图片中还包含更多精彩的细节描绘。

结合AI批量生成的能力，很多绘画需求，似乎只靠AI就都被高效地满足了。

随着AI作画的部署成本逐渐降低，一些中小企业和初创团队，也开始有能力在通用大模型的基础上进行模型的调教、设计师岗位的精减。

令从业者最担心的事情就是：

当AI绘画工具具备了一定绘画能力，也就同时具备了"抢人类设计师饭碗"的能力。

争议2：版权

我们在AI绘画出的作品中能看到很多有明显风格的影子。

也可以直白地说，一些AI绘画模型的训练数据中，有着很多未经明确授权的画师作品。

AI绘画侵犯了画师的版权，也开始遭到画师们的集体抵制。

2022年8月29日，一个名叫mimic的AI绘画网站上线了测试版，主攻日系二次元画风头像，允许用户上传15-200张图像让AI学习并输出相同画风的AI画作。没想到刚发布便遭到大量日本画师的抵制，画师们集体发表了"禁止将我的作品用于AI作画"的声明。有的画师为了防范于未然，甚至删除了发在推特上的画作，怕有心之人盗用上传至平台使用。

2022年12月，全球知名CG视觉艺术网站 Art Station也被上千名画师发起了联合抵制，画师们认为，任由系统学习模仿自己的画作是在侵犯版权。网站画师纷纷上传一张名为"NO TO AI GENERATED IMAGES（拒绝AI绘画）"的图片表明态度，首页一度被此图片占领。

对于画师们来说：

自己的画风，是独属于自己的独特标志和可贵财产。

如果让AI简单地模仿自己画风来作画，那无疑是对独有艺术的糟蹋。

即便有的画师愿意提供自己的绘画作为模型的训练数据，但似乎他/她们也没有收到任何版权上的收益。

AIGC产出的画作的版权归属于谁，成了关注和争议的话题。

争议3：打击小白学绘画的信心

AI 绘画的强势碾压的能力，似乎也打击到了不少绘画小白从零开始学绘画的信心。

有的人会感叹：

既然AI几天就能学到做到那么好的效果了，自己再花费数年去学习，还有没有必要…

四、AI 绘图的短板

AI绘画当然不是全能的，也永远不会是。至今的AI绘画也还存在着众多短板。

短板1：AI 无法准确还原想象中的创意

AI绘画的确具有非常强大的创造力和想象力。但这样的创造力和想象力，其实是一种「快速随机」的结果。

效果既受限于算法、数据的质量和数量，也受限于用户对于prompt的运用。

人类的创造力和想象力仍然具有独特的价值，想要AI生成还原出来十分贴合人脑想象中的创意，是很有难度的。

不少尝试了MidJourney进行AI绘图的人表示：

AI生成的图片效果确实是不错，但都并不是我脑海中想象的那个样子。

甚至，AI会理解失误，生成"离谱图片"：

输入的文本是：一个小女孩，一手拿着冰淇淋，一手牵着气球，走在公园里。

AI生成出的却是——"冰淇淋气球"。

短板2：AI 绘图还不足够满足个性化需求

AI 绘图是很强，但是还不足以满足个性化需求。比如：

针对不同场景类型进行统一且又独具个性的设计；

稳定一个主体使之在每一次生成结果中都保持成套效果；

以上能力的欠缺，使得AI无法高效地完成"成系列的商业设计"。

五、AI绘画的未来

尽管很多设计从业者对于AI绘画表示焦虑，但作者判断：未来很长一段时间内，大部分行业可能只会把AI绘画当成一个「辅助工具」来用。

前期，大家在拼AI的效率；后期，则是拼人工优化AI的能力。

人工优化AI能力，可以从以下3个方向出发。

优化AI方向1：AI 模型的定制

想要模型更稳定地产出特定风格的绘画图片，可以定制出一个AI模型。

但AI模型的定制的门槛比较高，通常至少需要一个设计师搭配一个算法工程师来实现，而涉及到模型训练的过程，则需要工程部署能力、硬件显卡的支持。

模型训练出的效果也取决于多个因素，比如：训练素材、模型选型、参数设置、训练方法等。

优化AI方向2：会用 prompt "咒语"

我们可以把"prompt"理解为"送给AI模型的文本指令"。

输入高质量有效的prompt，可以大幅度提升AI绘图的稳定度，让成图更加接近我们的描述。

prompt输入的格式通常可以是以下内容的一个组合：

prompt文本输入=[形容词+主语 / 主语+状语]，[背景]，[画面类型]，[风格/艺术家]，[灯光/色调]，[视角/修饰词]，[细节]，[画面质量]

因为这一体验过于神奇，很多人不禁将prompt形容为"咒语"。

在市场上，还出现了买卖prompt词的平台：一家初创公司PromptBase，允许用户在该平台买卖提示词（Prompt），售价约为1.99美元～9.99美元不等。PromptBase将向卖家抽成20%。

平台上目前已上架不少提示词，适合不同模型、不同种类。

而在学术上，也有所谓"prompt engineering" 即" prompt 工程"的说法。

提示工程（prompt engineering）：如何同人工智能交流，并得到你要的结果。

https://learnprompting.org/docs/intro

优化AI方向3：灵活组合模型，优化工作流

因为AI绘画工具的介入，现有设计的工作流程将随之而改变，整合诞生了全新的工作流:

AI绘画先进行生成-> 再从AI生成的十几张结果中挑选用作局部素材->再利用PS或其他工具精修处理

随着AI绘画相关的新技术不断出现，其AI绘画的工作流也需要随着新的技术来优化，进化为更适合的工作流。

比如，当发现了「根据图片提取prompt」的新技术后，可结合这个新技术优化设计工作流。

结合了「提取prompt」的设计工作流，也许就变成了这样：

再比如，当发现了出现「ControlNet插件」的新技术后，可结合这个新技术再次优化设计工作流。

ControlNet插件：可以完成对人物骨骼走势、形态、动作、姿势的精确控制。

结合了「ControlNet插件」OpenPose模块的设计工作流，也许就变成了这样：

以上提到的"人工优化AI能力"，第1点"AI模型定制"门槛较高，需要一定技术和硬件。

但"prompt实践"、"设计流程优化"，都是现今设计从业者可以探索和实践的方式。

六、画师的命运：等着被取代，还是转型？

我们经常看到一些新的AI技术应用的效果出现后，很多人立马开始感叹：AI抢饭碗了、AI取代设计师、失业倒计时+1……

AI绘画的能力不容忽视，但它也不是万能的。

AI解决了生成效率，能在一定流程上减少一部分工作量。但又因为AI绘画引入了新的工作流，同时会创造新的工作量。

相应地，一些新的就业岗位也会增加，比如现在就有俗称为"AI调教师"的一种存在。

在某些绘画领域中，也已经有了"AI插图绘制师"、"AI绘图师"的人力需求：

以下，也许是"AI绘图师"可以贡献的能力：

绘制优质的训练素材供模型学习

高效地使用prompt，测试出稳定的生成效果

将"生成结果的质量好坏"准确地反馈给算法（人类反馈强化学习RLHF）

结合AI技术，优化设计工作流

AIGC势不可挡，那些率先学习如何用AI进行美术工作的人，将会发现自己处于行业的顶端。

毕竟，差异化竞争的关键，就是让自己掌握"差异化的优势"。

截图源自Aisocia.com平台的AI对话

结语

借用一段"腾讯ISUX团队"文章中的结语：

随着AI模型能力的飞速迭代升级，现有的短板能力也会不断补齐，因此我们可以相信在不远的将来，设计师利用AI模型来开脑洞并辅助出图是趋势所向，但并不是说我们需要完全依赖AI，因为设计本身是理性而浪漫的工作，仅靠随机性做设计是完全不可取且不靠谱的。更合适的思路应该是，设计师首先定义好规则与框架，从AI模型提供的成百上千个结果中寻找到最匹配我们诉求的结果，从而辅助我们更快更好的达成目标。另外面对日新月异的的智能工具，我们应该保持终生学习的心态，做好时刻接受新事物的挑战，才能在越来越激烈的竞争中立于不败之地。——《运用AIGC人工智能生产内容》

AI绘画，还仅仅是AI技术应用的其中一环。未来，AI将涉足3D模型生成、AI视频创作、AI作曲等领域。

更多AI能力也会发展，就像现在的AI绘画一样，影响和撬动相关行业的变革。

AI绘图会取代所有画师吗？不可能。

AI绘图会逐渐取代中底层画师吗？不无可能。

留给从业者的忠告，还是那句话：保持终生学习的心态，做好时刻接受新事物的挑战。

最后，送给所有打工人的心声：

参考文章：

https://www.marktechpost.com/2022/11/14/how-do-dall%C2%B7e-2-stable-diffusion-and-midjourney-work/ How Do DALL·E 2, Stable Diffusion, and Midjourney Work?

https://www.thepaper.cn/newsDetail_forward_21420325

https://finance.sina.com.cn/blockchain/2023-03-03/doc-imyiqhat7670720.shtml

https://baijiahao.baidu.com/s?id=1759154697131925527

https://mp.weixin.qq.com/s/pkzXaW_-77zXLKQqx2nlcA

作者：葛晓玲，一个互联网重度依赖者。微信公众号：产品零感（feelingPM）

本文由 @葛零零原创发布于人人都是产品经理。未经许可，禁止转载。

题图来自Unsplash，基于CC0协议

查看原文

MJ指南