先上视频(调高音量),你的品牌LOGO在不久的将来应该是这样的,视听立体体验
视频加载中...国外团队提出了一种新颖的方法,可以自动生成艺术字体。只需要输入样式要求的文字描述就可以输出字体的艺术样式,同时确保可读性。
由于缺乏标准答案以及数据,他们采用大型语言模型来实现文本和视觉图像之间建立连接,并构建了一个无监督生成模型,其主干是扩散模型。
具体技术细节,采用了扩散模型中的去噪生成器,并增加了一个基于CNN的鉴别器,以将输入样式应用于输入文本。鉴别器使用给定字母/单词字体的光栅化图像作为真实样本,并将去噪生成器的输出作为伪造样本。
模型被称为DS-Fusion,是鉴别和样式化扩散的缩写。

艺术字体
DS-Fusion的流程(可跳过)
模型的输入为一个样式提示和一个字形图像。样式图像是根据样式词和属性生成的。DS-Fusion首先利用隐式扩散过程来构建给定样式的隐空间,然后引入鉴别器将样式融合到字形形状中。如果模块右下角有一个锁的图标,则模块的参数是预先训练并冻结的。"+"模块表示扩散模型的迭代噪声注入过程。

流程
单字母样式生成

多字母样式生成

根据输入字体风格生成样式
下面的图片展示了在输入字母“R”的情况下,通过改变输入字体来产生结果,其风格为“龙”。保持字体的形状,包括笔画厚度、斜度和重音。

可调整样式属性
在输入提示中使用样式属性可以进一步微调样式化效果,如下图孔雀样式风格调整。

最近AIGC每日进展案例超级多,关注我将持续跟踪跟进行业进展。
评论留言