说明:本文写于2022年8月,其时AI绘画刚刚兴起,尚不为大众所知。AI进化的速度经常是一日千里,现在百度文心一格的绘画能力虽然仍有瑕疵,但已今非昔比。人们关于互联网的记忆经常发生错乱,此旧文就像是一个被有意无意间保存下来的时间切片,记录下AI绘画技术早期发展的一瞬,供日后回望检索。我想,这就是发布这篇体验文章的意义所在。
楔子
这个月初(2022年8月),抖音海外版TikTok上线了AI绿幕背景功能,在视频直播中输入几个关键词描述,就会自动把主播人像从现实场景中抠出来并替换成AI即时生成的背景。从下面的例子可以看出,生成的背景多是比较抽象、大幅扭曲的图案,从输入的关键词描述看有些相关性——比如下面左图关键词是“爆炸的星系、花 (exploding galaxy flowers)“,中图的关键词是“海洋中的宇航员”,右图的关键词是“恐龙打网球”——但反过来要从背景猜出原始关键词就强人所难了。不管怎样,这个新上线的功能吸引了不少博主竞相尝试,在外网上掀起了一波热潮。

上周又看到一个新闻,美国《大西洋月刊》的编辑在发布一篇报道(Where Does Alex Jones Go From Here?)时,一反常规的没有使用人类艺术家插画作为文章配图,而是使用了一款名为Midjourney的AI绘画工具生成的图片。生成这张插图使用的关键词描述是“一个男人坐在办公室的日光灯下”,男人表情略显痛苦,正贴合这篇文章的内容。这件事在以绘制插画为生的艺术家圈子里引起了轩然大波,很多人持批评意见,认为不应该让计算机抢艺术家的饭碗。后来这名编辑还特意撰文说明了此事,并表达了歉意(I Went Viral in the Bad Way)。

但自今年以来,AI绘图已经蔚为潮流,支持基于文字描述生成图像的应用和网站层出不穷,很多作品效果让人大为惊叹。我对此也颇有兴趣,刚巧最近百度文心大模型也推出了一个类似的网站,更方便的是支持中文关键词描述,我在周末兴致勃勃的玩了一下午。感觉怎么说呢?虽然还有很大缺陷,但正应了那句网络流行语:我看不懂,但我大受震撼!
AI绘画初体验——百度文心一格
操作说明
一格网站的操作很简单明了:
- 最上面输入关键词或一句话,多个要素可以用标点分隔;需要注意的是,有时会发生AI无法识别关键词的情况,这时就要尝试替换其他的描述(以下截图就是一个失败的样例,我估计是“美轮美奂”一词对AI构成了挑战);
- 选择创作方向,也可以选择“不限定”;
- 选择创作风格,可以多选,会针对每种选择的风格生成一张图;
- 选择尺寸,目前提供3种尺寸,只能单选;
- 最后点击“立即生成”,就可以等待AI出图了;速度不慢,一般2分钟即可完成输出;

我的尝试
我最先尝试了人物,并参考其他海外版AI工具的用法,塞了一堆描述词:“空中舞蹈,女神,唐代,神话,华丽,丝绸,飘带,水墨画,塔罗牌,红色背景,虚幻引擎”。嗯……这个结果……看起来不太行。
![]() |
![]() |
![]() |
然后我试着减少描述词,让内容聚焦一些:“一个正在哭泣的女孩”。嗯,效果还是很一般,看起来百度的文心大模型缺少对人物画的训练啊。
![]() |
![]() |
![]() |
接下来,我尝试了动物,首先是幻想题材的:“猫武士和老虎在草地上搏斗”。看来百度模型还没有完全认识猫和老虎。
![]() |
![]() |
![]() |
来点更日常的:“小狗,小猫,草地”。嗯,稍好一点。
![]() |
![]() |
![]() |
那就再开脑洞一点:“天空,巨大的太极图,神仙打架”,以及“奶油房屋,樱桃蛋糕,马里奥”。结果一言难尽。
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
最后还试了很多别的场景,从结果中挑了一些看的过去的:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
体验小结
从当前状态来看,百度文心大模型的AI绘画能力还有很大问题,完全不适合画人物,画动物也基本不行。对外提供的交互项也有缺失,比如很多关键词不支持,比如指定“宫崎骏”之类的画家风格大多不行;对于也不支持在生成的画作基础上进行再次微调。当然目前这个新事物也还是测试阶段,并没有对公众大规模开放。
总得来说,作为创意辅助工具,即便是当前不完备的状态也还是有价值的,可以帮助插画师们开脑洞,验证新想法。特别是用来创建幻想场景的话,多少能找到一些可用的素材。相比外网的同类工具,可以直接使用中文关键词和描述是也是很大的优势。
目前网上很火的AI绘画工具,还包括Disco Diffusion、Midjourney、Stable Diffusion等,在豆瓣、小红书等社区里能看到不少突破人类想象力,风格多样又浑然一体,精致甚至唯美的AI画作,让人惊叹不已。等我有时间,想必也会去尝试一下这些更成熟更优质的工具,沉浸在AI画家创作的瑰丽世界里。
AI会替代艺术家吗?
这是一个敏感的话题,就像开头所提到的新闻一样,而且这不仅仅会刺痛以插画为生的艺术家们,甚至对整个人类都是一种冒犯。一开始,新技术是以一种救星面目出现的,人们期盼着可以从日常繁琐劳作中解脱出来,可以拥有更多的闲暇,可以从事更高级的活动——比如,艺术创作。即便阿尔法狗在围棋上击败了人类顶级高手, “琴” 和 “画” 仍被视作人类独有的才华,是那些嗡嗡作响的电子设备无法觊觎的神圣领域。但,现在AI开始入侵了。
显然,艺术不会消失,最顶级的艺术家仍将受人追捧。但我确实认为,很多艺术工作者们将面临大的危机,或者被迫改行,或者忍受逐渐下滑的岗位和报酬,就像照相技术最终消灭了99%的肖像画家一样。一种应对方式是与AI共舞,把AI绘画当作辅助创意、减少前期风格尝试工作量的工具,人脑负责构思定调,电脑负责具体的绘画,就像中世纪的欧洲绘画名家和他们带的学徒一样。不可否认的是,绘画的门槛大大降低了,原来凭借数年如一日练就的技艺,与未经训练的普通人的巨大差别,被很大程度上抹平了。
艺术,一向有两种定义。一种是对美的事物的刻画,可以引发自然愉悦的心理感受;一种是上层社会所炫耀的消费、奢华,当普通民众开始疯狂模仿的时候,社会精英们会再去求索无法被模仿的东西。照相机的发明,曾经促成了文艺复兴以来追求逼真刻画人与自然的绘画趋势转向,转向更深奥难懂的现代抽象艺术;而如今AI绘画的出现及日臻成熟,又会让艺术潮流发生哪些巨变呢?
评论留言