近日,百度公开一项关于图像生成方法的发明专利,这件AIGC专利所披露的技术涉及跨模态生成和可控文生图技术领域,通过AI技术结合创作者的需求对图像进行二次编辑优化,使得画作更加精准的符合用户创意需求,创作优质画作。
从这件专利技术所展示的方案来看,用户通过涂抹等形式确定原画作中待编辑和加工的区域;接着调用人工智能AI编辑功能,获取整幅画作的编辑信息;最后对编辑区域的内容进行与原画风格一致的补全编辑,并对补全画作连接处进行平滑处理,高效解决了精准改图难题,最终生成满足用户需求和审美的理想画作。由于图像数据天然并不存真实用户涂抹二次创作的记录和理想结果作为训练数据,在优化涂抹编辑的过程中,需要精心设计训练数据的自动构建方式。在这项专利中,通过多种数据自动构建和增强方式,智能预测多种可能的用户涂抹区域位置、形状和尺寸,并自动识别涂抹区域的视觉语义,从而支持无条件涂抹或者有指定内容的有条件涂抹,能够对图像指定位置实施高成功率的增加、改动、删除操作,并保持良好的图像风格和内容一致性。
据悉,目前这项涂抹编辑功能已经在百度AI作画产品“文心一格”正式上线应用,文生图AIGC技术正凭借其强大的算法和出色的图像处理能力,为绘画创作带来了前所未有的变革。

除了涂抹编辑功能,文心一格还推出了首创性的图片风格叠加的玩法,图片叠加支持多张图片风格特征融合,快速实现画作风格迁移、主体与场景融合、多角色特点融合等创意。在体验图片叠加功能时,用户可从本地图库或者系统自带图库中上传期待叠加融合的参考图,上传图片后用户通过调整叠加参数对图片的影响程度进行调整,还可以通过输入具体的文本要求,根据文本信息再进行叠加融合,使得生成的图片融入更多用户的主观元素,增添可玩性的同时,进一步丰富了用户的创作参与感,打破用户作画过程中对于制图基础以及图像设计的能力壁垒。



文心一格在核心技术上,具备知识增强的混合专家扩散生成、基于知识的Prompt学习、图像生成与编辑融合的自然交互、全栈技术自主可控等四大亮点,解决了文生图通用性和可控性的难题,实现了全球领先的文本驱动的图像生成效果,提供了易用丰富的图像生成能力。依托百度飞桨的分布式训练能力以及扩散生成的算法上的突破,作画能力和效果得到质的发展,并得以不断迭代上线新功能。除了底层技术能力的“先天优势”,文心一格从用户需求出发更新迭代,也在不断强化产品的易用性与便捷性,不断拓展其在游戏、直播、电商、虚拟IP等场景的应用边界,创造全新价值。据透露,截至5月,参与文心一格测试的生态伙伴已经超过了900个,注册用户超600万,应用场景已经覆盖广告营销、内容制作、游戏原画、工业设计等多个领域。
伴随着人工智能技术的不断深化和扩展,AIGC在各行各业中的渗透和融合程度不断加深,为诸多行业带来了巨大的潜力和机遇。文心一格的诞生,正是人工智能技术和艺术创作应用领域融合发展落地的划时代产品,其丰富全面的功能为创作者们提供了更多的创作可能性,无论是从创意角度还是技术实现上,文心一格都展现出了百度在AIGC技术方面的领先地位。本次二次编辑新功能的上新,降低了图片编辑的门槛,让绘画制图小白轻松上手,进一步提高了技术应用的兼容性和实用性,为专业的绘画创作者提高了创作编辑效率,丰富了创作思路和灵感来源,让更多的人能够参与到艺术创作中。
未来,文心一格将成为创作者们不可或缺的AIGC工具,提高用户使用效率、降低使用门槛,让用户的创意和奇思插上腾飞的翅膀。
评论留言