视觉数据生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品制造方法及图纸

技术编号:44922257 阅读:25 留言:0更新日期:2025-04-08 19:02
本申请提供了一种视觉数据生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对角色数据进行特征提取,得到角色数据中的第一对象的角色特征;对布局数据进行特征提取,得到布局数据中的第二对象的参考特征;基于角色特征、参考特征及图像噪声进行多次扩散处理,得到每一次扩散处理后的生成内容特征;基于最后一次扩散处理后的生成内容特征,得到目标视觉数据;目标视觉数据包含第一对象的角色特征、第二对象的参考特征和布局数据的语义特征。通过本申请,能够增强生成视频或者生成图像中的角色一致性,提高图像生成质量。

【技术实现步骤摘要】

本申请涉及图像处理,尤其涉及一种视觉数据生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品


技术介绍

1、相关技术中,在给定一张包含人物的图片(称为布局图),用指定的角色人物图替换布局图中的人物时,为了保证生成图像中的人物与角色人物保持一致,通常使用的方法是采用布局图的人物的位置和姿势、指定的角色人物图的特征信息,来一同控制最终图像的生成。

2、由于相关技术中要综合考虑多个条件来控制输出,尤其在需要突出考虑人物的角色一致性的情况下,会难以突出布局图的语义的控制效果,因此影响最终的生成图像语义的精准程度,从而降低图像生成时的人物一致性,降低生成图像的质量。


技术实现思路

1、本申请实施例提供一种视觉数据生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够增强生成视频或者生成图像中的角色一致性,提高图像生成质量。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种视觉数据生成方法,所述方法包括:对角色数据进行特征提取,得到所述角色数据中本文档来自技高网...

【技术保护点】

1.一种视觉数据生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述角色特征、所述参考特征及图像噪声进行多次扩散处理,得到每一次扩散处理后的生成内容特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述对第N-1次扩散处理后的生成内容特征添加高斯噪声,得到加噪后的内容特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述角色特征、所述参考特征及图像噪声进行多次扩散处理,得到每一次扩散处理后的生成内容特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于最后一次扩散处理后的...

【技术特征摘要】

1.一种视觉数据生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述角色特征、所述参考特征及图像噪声进行多次扩散处理,得到每一次扩散处理后的生成内容特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述对第n-1次扩散处理后的生成内容特征添加高斯噪声,得到加噪后的内容特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述角色特征、所述参考特征及图像噪声进行多次扩散处理,得到每一次扩散处理后的生成内容特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于最后一次扩散处理后的生成内容特征,得到目标视觉数据,包括:

6.根据权利要求1至5任一项所述的方法,其特征在于,所述对角色数据进行特征提取,得到所述角色数据中的第一对象的角色特征,包括:

...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名
申请(专利权)人:北京生数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1