AI绘图正在逐渐取代中底层画师?

在过去的几年里,人工智能取得了极快的发展,其中包括基于机器学习和深度学习的「图像生成技术」。运用该技术,只需输入文本语句就可输出具有独特风格和想象力的图像。面对 AI 绘图这个势不可挡的趋势,设计从业者们,是否做好准备了呢?

在过去的几年里,人工智能(AI)取得了极快的发展。

ChatGPT 和 GPT-4 对话上的智能程度在不断刷新常人的认知,给大众带来了惊人的体验与惊叹。

同期发展的 AI 技术,还有基于机器学习和深度学习的「图像生成技术」。

该技术能够让计算机在一定程度上模拟人类进行绘画,用户只需输入文本语句(prompt 提示)就可输出具有独特风格和想象力的图像。

文本 ->图像,AI 绘图,指的就是这个过程。

随着大众对于 AI 绘图关注度的升温,相关的争议不断,有人开始提出「AI 取代画师」的观点。

面对 AI 绘图这个势不可挡的趋势,设计从业者们,是否做好了准备?

一、AI 绘图,高效无情的出图机器

2022 年 8 月,在美国科罗拉多州艺术博览会上一幅名为《太空歌剧院》的画作在数字艺术类别比赛中获得了第一。

由 AI 绘制的《太空歌剧院》

人们也很快得知,这个画作并非真人绘制,而是由游戏设计师使用一个叫 Midjourney 的 AI 工具生成而来。

随着这则新闻的传播,AI 绘画也开始进入更多人的视野。

1. 国外知名的 AI 绘画工具

下面先介绍几个国外具有代表性的 AI 绘画工具:

1)DALL · E2

DALL · E2 是一个由 OpenAI 公司开发的模型,也是一个在线服务。它通过输入一个文本描述(prompt 提示)生成多个精准匹配文本的图像。

DALL · E2 结合 “CLIP 预训练模型 ” 和 “Diffusion 扩散模型 ” 来实现了文本 ->图像(text-to-image)的生成。

扩散模型运行时的成像过程,就是一个 “Diffusion 扩散 ” 的过程——

从有噪声开始 ->逐渐改善图像 ->直到完全没有噪声 ->图像越来越接近所提供的文本描述。

DALL · E2 还有一个的特别的功能是 “AI 编辑 “,可以在生成的图片上涂抹某些部分再让 AI 直接修改。

DALL · E2 只使用了已获授权的图片集来进行训练。

2)Stable Diffusion

Stable Diffusion 模型,前身是谷歌开源的 Disco Diffusion 模型。

Stable Diffusion 模型也结合了 CLIP 技术(OpenAI 发布的技术)和 Diffusion 扩散模型,同样是通过输入文本(prompt 提示)来生成图像。

比较特别的是, Stable Diffusion 是一个开源的模型,很多开发者基于这个开源模型开发训练出了更多不同的生成模型。

Stable Diffusion 的母公司 Stability AI 在 2022 年 10 月宣布获得 1.01 亿美元融资,投后估值达 10 亿美元。

3)Midjourney

Midjourney 由同名实验室开发,和大部分市面上的 AI 绘画应用采用的是同一个模型,但是模型使用了大量图像数据来训练。

Midjourney 在生成图片的一致性和连贯性上做了很多努力,它生成的图像风格十分独特。

Midjourney 几乎所有的生成和交互都发生在 Discord 社区里,使用其 Discord 机器人来接收请求和发送生成结果。

3 种绘图工具的对比:我们进行测试,对于同样一句文本(其他参数默认的情况下),这 3 种绘图工具的图片生成效果。

输入文本:

An old man rowing a boat on a lake.

AI 生成的图片:

收费标准:

3 种绘图工具的体验地址:

① Stable Diffusion

Dream Studio:https://beta.dreamstudio.ai/dream

Hugging Face ( 免费 ) : https://huggingface.co/spaces/stabilityai/stable-diffusion

② DALL · E2

https://openai.com/dall-e-2/

CLIP:https://openai.com/blog/clip/

③ Midjourney

https://www.midjourney.com/home/

(注:某些服务只对部分国家开放)

Midjourney 的效果更具艺术感:

对比生成效果可以明显看出,Midjourney 生成的图像不太像照片,似乎更像一幅艺术画作。

在 Discord 社区里运作的 Midjourney 社区 ,因为其具有艺术感且画面注重细节的生成效果,收获了全球近千万用户,在线用户也是百万等级。

在社区频道里,用户仅仅需要使用 / 唤起命令行操作,在 /imagine 命令下输入 prompt 文本发送即可。

以下是输入简单文本后,Midjourney 生成的图像:

效果如此惊艳的生成图片,只需几十秒内就能得到。

2. 国内的 AI 绘画产品

国内也相继出现了类似的 AI 绘画产品,几乎都有免费尝试的额度,通常支持多种风格 / 艺术家 / 模型。

以下是国内提供 AI 绘画服务的一些产品:

随着技术的逐渐普及和越来越高的热度,AIGC 似乎就不再是大众试水画图画着玩儿的一个小工具。

这个 ” 高效无情的出图机器 “,似乎已经开始在影响和撬动设计行业的变革。

二、设计行业 X AIGC

1. 游戏制作 × AIGC

很多游戏项目,开始利用 AIGC 生产游戏相关素材。

1)国外游戏工作室 Lost Lore《Bearverse》游戏

国外游戏工作室 Lost Lore 出品的主打 NFT 集换概念的 F2P 游戏《Bearverse》包含了大量的角色设计。

游戏工作室直言:采用 AI 画图节省了 80% 美术成本!

① 17 名角色的调整:

开发成本:从 5 万美元压缩至 1 万美元;

工时耗费:从 6 个月大幅减少至 1 个月。

②创作一张场景概念图:

工时耗费:从 1-2 周压缩至 1 天以内。

设计总监最后也坦言:

95% 的效果和概念图呈现仍是由团队真人创作。

2. 商业设计 × AIGC

大厂团队已经不甘观望,开始了 AIGC 在商业设计工作流中的实践。

1)腾讯 -ISUX 团队

腾讯的 ISUX 团队 2023 年 3 月 1 日刚刚发表在其官网的文章《运用 AIGC 人工智能生产内容》

https://isux.tencent.com/articles/aigc-design.html

文中提到了腾讯的 ISUX 团队运用 AIGC 进行商业设计的好几个案例,并进行了结合使用 AIGC 后设计团队的全新工作流的方法总结。

2)百度 -AIGC 营销赋能业务

百度也在试图利用 AIGC 满足商业设计上的需求。

百度发布了 AIGC 方向的产品负责人岗位,负责比如 ” 商业广告平台部的内容生产相关工具的规划和落地 “。

3. 个人头像设计 × AIGC

1)国外的 AI 美图软件 Lensa「魔法头像」功能

「魔法头像」是 Lensa 基于 Stable Diffusion 技术开发的头像生成功能,用户上传 10-20 张自拍照,能生成 50~200 张不同风格的 AI 自画像 / 头像。

生成 50/100/200 张的价格分别是:3.99/5.99/7.99 美元。

因为这项新功能的加入,2022 年 12 月的前 5 天,Lensa 下载量达到 400 多万次,” 日收入 ” 也一度达到了 300 万美元。

2)美图秀秀「百变 AI 头像 」功能

同样是美图软件的国内团队——美图秀秀,也随机发布了相似的功能。

从产品定位来看,也是输入真人头像就能批量地获得多种风格的头像。

和国外的 AI 美图软件 Lensa 相比,美图秀秀对于用户的输入门槛要求更低一些,只需要提供 3 张正脸无遮挡自拍照即可。

3)抖音「AI 绘画」特效

继 2021 年的「漫画脸」特效(基于 GAN 技术)后,2022 年抖音又上线了特效玩法「AI 绘画」(基于 Stable Diffusion 技术)。

用户只要输入一张图片,AI 就会根据图片生成一张动漫风格的图片。

抖音「AI 绘画」功能的的峰值 QPS(每秒请求量)一度达到 1.4w。

4)QQ 小世界 AI 画匠

腾讯 QQ 上线了 “QQ 小世界 AI 画匠 ” 活动,主题为 ” 异次元的我 “。

用户上传 1 张个人照片,即可一键生成专属异次元形象。

4. 动画背景 × AIGC

1)国产志怪类动画《神弦曲:猫儿与时光铃铛》

由十九号动漫出品的国产志怪类动画《神弦曲:猫儿与时光铃铛》将于明年上映。官方在 2022 年 12 月发布了预告片。

主创团队称,预告片三分之二的背景都是结合 AI 制作完成的。

制作预告片中的 30 多个背景,工时耗费从 3 个月降到 2 个月,效率上提升了至少 30%。

主创在采访中提到:” 有了这样的一个技术,把我们的预算从一个标准动画电影预算直接减半,我们就快速地获得了一些投资机会。”

5. 视频制作 × AIGC

除了绘画领域外,AIGC 也在动态的视频生成上有了很多突破。

1)Runway 新功能:视频转风格生成器 GEN 1

Runway AI 是一家图片和视频 AI 编辑软件提供商,为设计师、艺术家和开发人员提供一系列工具的平台,帮助他们利用人工智能技术创建作品。

Runway 平台推出了新功能 —— 把视频转换成任意风格的生成器 GEN 1。

GEN 1 这个能力和图生图功能(image-to-image)类似,只是变成了从视频到视频(video-to-video)的生成。

https://research.runwayml.com/gen1

看起来, GEN 1 是一个支持用户可订制化的视频滤镜的能力。

而定制化的方式极为简单,只需一张具有风格的图片。

2)Wonder Studio:一键替换真人为 CG 角色

这款由一家人工智能初创公司 Wonder Dynamics 推出的 AI 工具 Wonder Studio,声称可以实现「一键把视频中的真人替换为 CG 角色」,简化电影制作流程。

Home Page

整个工具的使用流程大概是:

真人先替代 CG 机器人进行表演

视频拍摄完成,导入进软件

选择想要的 CG 角色,安装在实拍的真人身上

目前官方网站上开放了内测申请。

三、AI 绘图的争议

在设计行业中,很多人的对于 AI 绘图的态度,都是不怎么正面的,主要集中在几点:

从业者的担忧

版权

学习信心的打击

争议 1:从业者的担忧

在 AIGC 生成绘画能力效率和质量皆可的前提下,中底层画师好像确实慢慢就不需要那么多了……

论出图速度:人赶不上机器的出图速度;

论出图创意:AI 可以生成出关键元素外的细节,似乎更为惊喜;

论风格效果:AI 能训练出不同的绘画模型,对应不同画风;

输入相同的一段 prompt 文本后,不同的模型可以生成出不同风格的图片,且速度极快,通常是几秒~20 秒内不等:

除了想要的关键元素外,生成图片中还包含更多精彩的细节描绘。

结合 AI 批量生成的能力,很多绘画需求,似乎只靠 AI 就都被高效地满足了。

随着 AI 作画的部署成本逐渐降低,一些中小企业和初创团队,也开始有能力在通用大模型的基础上进行模型的调教、设计师岗位的精减。

令从业者最担心的事情就是:

当 AI 绘画工具具备了一定绘画能力,也就同时具备了 ” 抢人类设计师饭碗 ” 的能力。

争议 2:版权

我们在 AI 绘画出的作品中能看到很多有明显风格的影子。

也可以直白地说,一些 AI 绘画模型的训练数据中,有着很多未经明确授权的画师作品。

AI 绘画侵犯了画师的版权,也开始遭到画师们的集体抵制。

2022 年 8 月 29 日,一个名叫 mimic 的 AI 绘画网站上线了测试版,主攻日系二次元画风头像,允许用户上传 15-200 张图像让 AI 学习并输出相同画风的 AI 画作。没想到刚发布便遭到大量日本画师的抵制,画师们集体发表了 ” 禁止将我的作品用于 AI 作画 ” 的声明。有的画师为了防范于未然,甚至删除了发在推特上的画作,怕有心之人盗用上传至平台使用。

2022 年 12 月,全球知名 CG 视觉艺术网站 Art Station 也被上千名画师发起了联合抵制,画师们认为,任由系统学习模仿自己的画作是在侵犯版权。网站画师纷纷上传一张名为 “NO TO AI GENERATED IMAGES(拒绝 AI 绘画)” 的图片表明态度,首页一度被此图片占领。

对于画师们来说:

自己的画风,是独属于自己的独特标志和可贵财产。

如果让 AI 简单地模仿自己画风来作画,那无疑是对独有艺术的糟蹋。

即便有的画师愿意提供自己的绘画作为模型的训练数据,但似乎他 / 她们也没有收到任何版权上的收益。

AIGC 产出的画作的版权归属于谁,成了关注和争议的话题。

争议 3:打击小白学绘画的信心

AI 绘画的强势碾压的能力,似乎也打击到了不少绘画小白从零开始学绘画的信心。

有的人会感叹:

既然 AI 几天就能学到做到那么好的效果了,自己再花费数年去学习,还有没有必要…

四、AI 绘图的短板

AI 绘画当然不是全能的,也永远不会是。至今的 AI 绘画也还存在着众多短板。

短板 1:AI 无法准确还原想象中的创意

AI 绘画的确具有非常强大的创造力和想象力。但这样的创造力和想象力,其实是一种「快速随机」的结果。

效果既受限于算法、数据的质量和数量,也受限于用户对于 prompt 的运用。

人类的创造力和想象力仍然具有独特的价值,想要 AI 生成还原出来十分贴合人脑想象中的创意,是很有难度的。

不少尝试了 MidJourney 进行 AI 绘图的人表示:

AI 生成的图片效果确实是不错,但都并不是我脑海中想象的那个样子。

甚至,AI 会理解失误,生成 ” 离谱图片 “:

输入的文本是:一个小女孩,一手拿着冰淇淋,一手牵着气球,走在公园里。

AI 生成出的却是—— ” 冰淇淋气球 “。

短板 2:AI 绘图还不足够满足个性化需求

AI 绘图是很强,但是还不足以满足个性化需求。比如:

针对不同场景类型进行统一且又独具个性的设计;

稳定一个主体使之在每一次生成结果中都保持成套效果;

以上能力的欠缺,使得 AI 无法高效地完成 ” 成系列的商业设计 “。

五、AI 绘画的未来

尽管很多设计从业者对于 AI 绘画表示焦虑,但作者判断:未来很长一段时间内,大部分行业可能只会把 AI 绘画当成一个「辅助工具」来用。

前期,大家在拼 AI 的效率;后期,则是拼人工优化 AI 的能力。

人工优化 AI 能力,可以从以下 3 个方向出发。

优化 AI 方向 1:AI 模型的定制

想要模型更稳定地产出特定风格的绘画图片,可以定制出一个 AI 模型。

但 AI 模型的定制的门槛比较高,通常至少需要一个设计师搭配一个算法工程师来实现,而涉及到模型训练的过程,则需要工程部署能力、硬件显卡的支持。

模型训练出的效果也取决于多个因素,比如:训练素材、模型选型、参数设置、训练方法等。

优化 AI 方向 2:会用 prompt ” 咒语 “

我们可以把 “prompt” 理解为 ” 送给 AI 模型的文本指令 “。

输入高质量有效的 prompt,可以大幅度提升 AI 绘图的稳定度,让成图更加接近我们的描述。

prompt 输入的格式通常可以是以下内容的一个组合:

prompt 文本输入= [ 形容词 + 主语 / 主语 + 状语 ] , [ 背景 ] , [ 画面类型 ] , [ 风格 / 艺术家 ] , [ 灯光 / 色调 ] , [ 视角 / 修饰词 ] , [ 细节 ] , [ 画面质量 ]

因为这一体验过于神奇,很多人不禁将 prompt 形容为 ” 咒语 “。

在市场上,还出现了买卖 prompt 词的平台:一家初创公司 PromptBase,允许用户在该平台买卖提示词(Prompt),售价约为 1.99 美元~9.99 美元不等。PromptBase 将向卖家抽成 20%。

平台上目前已上架不少提示词,适合不同模型、不同种类。

而在学术上,也有所谓 “prompt engineering” 即 ” prompt 工程 ” 的说法。

提示工程(prompt engineering):如何同人工智能交流,并得到你要的结果。

https://learnprompting.org/docs/intro

优化 AI 方向 3:灵活组合模型,优化工作流

因为 AI 绘画工具的介入,现有设计的工作流程将随之而改变,整合诞生了全新的工作流 :

AI 绘画先进行生成 -> 再从 AI 生成的十几张结果中挑选用作局部素材 ->再利用 PS 或其他工具精修处理

随着 AI 绘画相关的新技术不断出现,其 AI 绘画的工作流也需要随着新的技术来优化,进化为更适合的工作流。

比如,当发现了「根据图片提取 prompt」的新技术后,可结合这个新技术优化设计工作流。

结合了「提取 prompt」的设计工作流,也许就变成了这样:

再比如,当发现了出现「ControlNet 插件」的新技术后,可结合这个新技术再次优化设计工作流。

ControlNet 插件:可以完成对人物骨骼走势、形态、动作、姿势的精确控制。

结合了「ControlNet 插件」OpenPose 模块的设计工作流,也许就变成了这样:

以上提到的 ” 人工优化 AI 能力 “,第 1 点 “AI 模型定制 ” 门槛较高,需要一定技术和硬件。

但 “prompt 实践 “、” 设计流程优化 “,都是现今设计从业者可以探索和实践的方式。

六、画师的命运:等着被取代,还是转型?

我们经常看到一些新的 AI 技术应用的效果出现后,很多人立马开始感叹:AI 抢饭碗了、AI 取代设计师、失业倒计时 +1 ……

AI 绘画的能力不容忽视,但它也不是万能的。

AI 解决了生成效率,能在一定流程上减少一部分工作量。但又因为 AI 绘画引入了新的工作流,同时会创造新的工作量。

相应地,一些新的就业岗位也会增加,比如现在就有俗称为 “AI 调教师 ” 的一种存在。

在某些绘画领域中,也已经有了 “AI 插图绘制师 “、”AI 绘图师 ” 的人力需求:

以下,也许是 “AI 绘图师 ” 可以贡献的能力:

绘制优质的训练素材供模型学习

高效地使用 prompt,测试出稳定的生成效果

将 ” 生成结果的质量好坏 ” 准确地反馈给算法(人类反馈强化学习 RLHF)

结合 AI 技术,优化设计工作流

AIGC 势不可挡,那些率先学习如何用 AI 进行美术工作的人,将会发现自己处于行业的顶端。

毕竟,差异化竞争的关键,就是让自己掌握 ” 差异化的优势 “。

截图源自 Aisocia.com 平台的 AI 对话

结语

借用一段 ” 腾讯 ISUX 团队 ” 文章中的结语:

随着 AI 模型能力的飞速迭代升级,现有的短板能力也会不断补齐,因此我们可以相信在不远的将来,设计师利用 AI 模型来开脑洞并辅助出图是趋势所向,但并不是说我们需要完全依赖 AI,因为设计本身是理性而浪漫的工作,仅靠随机性做设计是完全不可取且不靠谱的。更合适的思路应该是,设计师首先定义好规则与框架,从 AI 模型提供的成百上千个结果中寻找到最匹配我们诉求的结果,从而辅助我们更快更好的达成目标。另外面对日新月异的的智能工具,我们应该保持终生学习的心态,做好时刻接受新事物的挑战,才能在越来越激烈的竞争中立于不败之地。——《运用 AIGC 人工智能生产内容》

AI 绘画,还仅仅是 AI 技术应用的其中一环。未来,AI 将涉足 3D 模型生成、AI 视频创作、AI 作曲等领域。

更多 AI 能力也会发展,就像现在的 AI 绘画一样,影响和撬动相关行业的变革。

AI 绘图会取代所有画师吗?不可能。

AI 绘图会逐渐取代中底层画师吗?不无可能。

留给从业者的忠告,还是那句话:保持终生学习的心态,做好时刻接受新事物的挑战。

最后,送给所有打工人的心声:

参考文章:

https://www.marktechpost.com/2022/11/14/how-do-dall%C2%B7e-2-stable-diffusion-and-midjourney-work/ How Do DALL · E 2, Stable Diffusion, and Midjourney Work?

https://www.thepaper.cn/newsDetail_forward_21420325

https://finance.sina.com.cn/blockchain/2023-03-03/doc-imyiqhat7670720.shtml

https://baijiahao.baidu.com/s?id=1759154697131925527

https://mp.weixin.qq.com/s/pkzXaW_-77zXLKQqx2nlcA

作者:葛晓玲,一个互联网重度依赖者。微信公众号:产品零感(feelingPM)

本文由 @葛零零 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

查看原文

    THE END
    喜欢就支持一下吧
    点赞13 分享
    评论 抢沙发
    头像
    欢迎您留下宝贵的见解!
    提交
    头像

    昵称

    取消
    昵称表情代码图片

      暂无评论内容