电商模型1元即可购买,人物背景可随意更换!国产AI工具降低成本99%

AIGC
后台-插件-广告管理-内容页头部广告(手机)

阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!

奥飞斯谢峰明敏

退出|公众号QbitAI

AI工具秒制作电商卡,一张仅需1块钱,成本下降99%!

上传一张随机照片,保持衣服不变但改变你的脸:

足不出户即可搭配各种背景,光影也能自然呈现:

小哥也有,还可以自动完成扩展,任意调整图片大小:

虽然不是真人的照片,只是一个人在台上的照片,但还是能展现出上半身的效果:

它甚至可以超越维度,将2维纸人的服装变成3D真实的款式。

 

这种效果乍一看很难看出是AI产生的。

这样一来,经销商就不用做大量的线下拍摄、换场景甚至出去拍照的步骤,在电脑前就能制作出丰富的产品图片了?

 

这是怎么回事,电商模式已经扛不住大米了?

1分钟制作一张AI模型图片

上面提到的AI工具叫做小K电商地图。

目前可提供4种电商卡生成功能:

将儒家模型添加到图表中

真人模型变脸

将真人模型添加到假发卡中

为产品卡生成新背景

各种效果只需3步即可完成,界面非常简单易懂,操作过程大约需要1分钟。

例如,如果您选择迪丽热巴的照片,您想要更改脸部和表情,并将背景替换为T台并调整图像的大小。

 

您必须先上传图片,系统会自动分割图片并选择您要保留的区域。

(如果服装上有头发,可以同时保留头发))

然后设置你想要改变的元素,包括模特的脸型、表情、背景等。

同时,还可以对衣服添加一些特殊处理。

这里我们把原来的肖像换成了露齿而笑的欧美模特,背景是T台,而且原图的尺寸也被放大了。

可以看到,在生成的结果中,衣服和发型保留得很好,但其他元素都做了相应的调整。

另外,头发、光线和阴影都经过了重新处理。背景也完全由AI重新生成,这与传统PS过场动画不同。

 

一代给出4张图片,方便选择。

生成的图像背景的细节也能处理得很好。例如,在雪地背景中,角色的鞋子上添加了雪花。

小K电商地图中,提供了多种类型的AI模型,覆盖不同地区、不同年龄段。

如果您对现有车型不满意,还可以自由定制专属车型。有两种定制模式:

如果用户没有模型,则输入一些具有一定稀缺性的非公开AI模型;用户已有模型,会根据模型本身的外观进行定制。

除了AI模型和真人之外,二维人物也可以定制。

 

另类人工智能背景也很丰富。

据报道,自定义背景功能和物品地图生成也将很快推出。

那么,小K电商卡是如何实现这些效果的呢?

结合自主研发的姿态算法

小K电商卡的底层技术可以简单地分为两部分:生成+控制。

生成能力来自开源的StableDiffusion。

在控制方面,引入了小K本人开发的一系列算法,其中姿态算法最为突出。

要知道,AI绘画长期以来并不能很好地画出人的手,在可控性上的表现也比较差,这是由于扩散模型本身的特点造成的。

 

后来,随着ControlNet的出现,通过向预训练的扩散模型添加额外的输入,可以控制稳定扩散生成的细节。

输入可以有不同类型,包括草图、边缘图像、语义分割图像、人体关键点特征、霍夫变换检测线、深度图、人体骨骼等。

因此,StableDiffusion加上人体姿态估计算法(Openpose)可以很好地控制角色动作的生成。

小K电商卡的技术逻辑也是如此,只不过他们采用了自研算法,性能更加稳定。

基于该算法,小K的另一款视频动作捕捉产品——小K直播姬通过普通的RGB摄像头,无需传感器,实现了3D动作捕捉。

 

而且在处理手指细节方面效果非常好。

因此,对于没有四肢的头像卡,可以立即识别出小K电商卡。头部的自动添加以及绘图能力的提升也得益于该算法。

解决了可控的姿势之后,还需要解决可控的人脸。对此,小K电商卡推出了LoRA。

LoRA原本是微软研究团队早在2021年提出的一种大语言模型微调技术,可以大幅提升微调训练的速度。

去年年底,韩国科学技术院KAIST研究员@cloneofsimo与HuggingFace合作,将该方法扩展到StableDiffusion。

 

不仅单颗11GB显存的RTX2080Ti实现了模型的完整微调,而且原始模型权重被冻结,新训练的权重可以保存为3MB大小的单个文件进行发布。

这项技术被AI绘画爱好者用来固定模型生成物体,目前流行的就是固定人物形象。在CivitAI社区中,每一个微调后的权重被称为一个lora,相当于一个角色模板,任何人都可以轻松下载使用。

最后,关于背景,为了满足电商场景的需求,小K也做出了更强的控制。

例如,在某些情况下,用户实际上只想替换模型的脸部,而不会改变其他任何内容。

 

所以在这种情况下,AI仍然会绘制一张新图像,但会保留95%的相似度。

如果用户想要更换背景,算法会在光影等细节上进行更多的添加,力求让图像自然、真实。

那么,小K电商名片是谁带来的呢?

从游戏到AI再到AIGC

小K电商卡的创造者叫云波科技,专注于AIGC虚拟内容的创作和制作。

该团队由游戏行业出身的梅松和陈敏于2017年创立。

其中,梅松是蓝港互动前高级副总裁,《王者之剑》系列手游制作人,拥有超过10年的游戏制作经验;陈敏是蓝港互动前CTO,核心团队拥有近20年的研发经验。

 

凭借对游戏动画市场的了解,他们从创业初期就选择专注于AI视频动作捕捉技术。

经过4年研发,基于云博自研算法的3D虚拟直播产品小K直播集将于2021年上线,免费提供给广大VTuber。

如今,小K直播集服务超过40万Anker用户,是哔哩哔哩、酷狗音乐等平台的官方虚拟直播工具。

成立6年来,云波科技与AI、虚拟内容、游戏动画等领域保持着高度的联系。

 

去年AI绘画火爆后,云波也迅速跟进。结合自身优势和市场调研,最终决定同时推进两条路线:一是AI扑克牌领域,二是AI电商卡领域。

两种方式的底层逻辑是相同的:降低成本、提高效率。

创始人兼CEO梅松介绍,电商行业传统的图片制作方式是线下实时拍摄,涉及模特、摄影师、外景等付费,平均每张图片价格在100元左右。但如果是AI生成的话,这个数字可以减少到1元。

为什么要先推进AI电商卡这条线?

梅松给出了两个判断:

一方面,从市场角度来看,电商行业每年可以有数以亿计的新产品,每个产品都必须有自己的产品卡。

 

这意味着电商市场每年需要数百亿的产品图片,市场需求巨大;

另一方面,从技术角度来看,电商行业对AI地图的需求更注重可控性,较少创造性,这使得技术发展更加可控。

这也是小K电商卡较早问世的原因。梅松也坦言,开发之初,模型生成的效果并不理想,研发团队反复做调试。今年年初,他们也想,姿态算法的引入能否让效果更加可控?

原来ControlNet刚刚出来,帮助我们验证了想法,省去了一些试错的环节。

目前,小K电商卡已正式发布,数十家电商行业用户已做内部测试,1.2版本即将上线。

 

梅松透露,之所以在此时发布产品,一方面是想抓住市场机会。目前业内同类产品还比较少见;另一方面,团队对自己的迭代速度有信心。

我们之前发布小K直播姬的时候也是遵循这个逻辑,后来实现了几乎每周的产品迭代,整个产品的功能也越来越丰富。

如今,研发团队也在加速2.0版本的开发。新一代产品希望实现AI模型姿势的灵活调整,瞬间将平淡的衣服变成上身效果。

与此同时,云波科技还获得了最新一轮融资。

作为一家初创公司,云波的融资节奏其实有点特别——第一轮天使轮融资是在公司成立三年后完成的。

 

原因是,云船成立后,首先要做的就是完成基础研发。

梅松很诚实地说,创始团队出身于游戏行业,一开始对AI了解不多,所以花了更多的耐心、时间和精力进行研发,终于在2020年有了一个令人满意的demo。

基础技术落地后,2020年至2021年,云波步伐明显加快,先后完成A轮和A+轮融资,金额数百万美元。2021年底,云波开始崭露头角的小K直播集也顺利上线。

对于此事,梅松本人也开玩笑说:

一家初创公司怎么可能需要4年时间才能做出一个产品?

 

投资了我们天使轮的BV百度创投当时也表示:抛开其他事情不说,你们的坚持还是很令人鼓舞的。

如今,随着AIGC浪潮的到来,人工智能为支持创作、提升工作效率开辟了进一步的空间,应用层的爆发已初具规模。

量子比特智库预测,到2030年,我国AIGC市场规模将达到万亿。

2025年预计成为行业第一个规模爆发点,年复合增长率将有质的提升。未来两年,行业将进入应用爆发期,大量应用层玩家进入。

所以回望当下,不仅大型模型公司值得关注,同时懂技术和应用内容的行业玩家也将成为AIGC应用指数级爆发背后的主力军,实现自身新一轮的成长。

 

-关于-

“AIGC+垂直领域社区”

招募!欢迎关注AIGC的伙伴加入AIGC+垂直领域社区,共同学习、探索、创新AIGC!

请注意您想要参与的垂直领域“教育”或“广告营销”。要加入AIGC人才社区,请注意:“人才”&“姓名-公司-职位”。

点击这里关注我,记得标记star哦~

一键连续三个“分享”“点赞”“观看”

科技前沿的进步天天见面~

免责声明:文章内容如涉及作品内容、版权图片或其它问题,请在30日内与本号作者联系,如反映情况属实我们将第一时间删除责任文章。文章只提供参考并不构成任何投资及应用建议。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。