图像数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号：42621481 阅读：14 留言：0更新日期：2024-09-06 01:25

本申请实施例公开了一种图像数据处理方法、装置、设备及存储介质，应用于人工智能技术，该方法包括：通过图像生成模型，对样本编辑图像进行加噪处理，得到带噪编辑图像，根据图像分布文本对应的文本表征和带噪编辑图像对应的隐空间表征，生成预测对象图像；通过属性编辑网络，根据对象属性编辑文本对应的文本表征，对预测对象图像中的编辑对象进行对象属性编辑，得到编辑对象的预测编辑图像；根据预测编辑图像和带噪编辑图像，确定加噪处理针对样本编辑图像所添加的预测噪声数据，根据所添加的预测噪声数据，以及加噪处理针对样本编辑图像所添加的实际噪声数据，对属性编辑网络进行迭代训练。本申请能够提高对象属性编辑的效率和便捷性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能技术等领域，尤其涉及一种图像数据处理方法、装置、设备及存储介质。

技术介绍

1、随着基于扩散模型(stablediffusion)的图像生成模型的出现，图像可控生成领域取得显著进展。一些常见的应用如对对象(如物体、人物、动物)进行不常见的创意编辑让其呈现各种对象属性(如猫头上长角、人物长兔耳朵)。实践中发现，目前的对象属性编辑方案中，需要人工交互以标记编辑对象在图像的位置，然后将对象属性编辑过程拆分为多个阶段，且需要人工对每个阶段可能出现的错误进行监督修复，这样操作比较繁琐，导致对象属性编辑的效率比较低。

技术实现思路

1、本申请实施例提供一种图像数据处理方法、装置、设备及存储介质，提高对象属性编辑的效率和便捷性。

2、本申请实施例一方面提供一种图像数据处理方法，包括：

3、获取训练图文对；上述训练图文对包括编辑对象的样本编辑图像、图像分布文本和对象属性编辑文本，上述图像分布文本描述上述样本编辑图像中所包含的对象，上述样本编辑图像所包含的对象中包括...

【技术保护点】

1.一种图像数据处理方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述图像生成模型包括加噪网络和去噪网络；

3.如权利要求2所述的方法，其特征在于，所述通过属性编辑网络包括对象定位子网络、属性编辑子网络和属性调整子网络；所述对象属性编辑文本包对括编辑对象文本和编辑属性文本；

4.如权利要求3所述的方法，其特征在于，所述对象定位子网络包括对象定位层和对象掩膜层；

5.如权利要求4所述的方法，其特征在于，所述通过所述对象定位层，根据所述编辑对象文本对应的文本表征，对所述编辑对象在所述第i次迭代对应的预测对象图像中的图像区域进...

【技术特征摘要】

1.一种图像数据处理方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述图像生成模型包括加噪网络和去噪网络；

4.如权利要求3所述的方法，其特征在于，所述对象定位子网络包括对象定位层和对象掩膜层；

5.如权利要求4所述的方法，其特征在于，所述通过所述对象定位层，根据所述编辑对象文本对应的文本表征，对所述编辑对象在所述第i次迭代对应的预测对象图像中的图像区域进行激活处理，得到激活对象图像，包括：

6.如权利要求4所述的方法，其特征在于，所述根据所述第i次迭代对应的预测对象图像，对所述编辑对象在所述掩膜对象图像中的图像区域进行标记处理，得到标记对象图像，包括：

7.如权利要求3所述的方法，其特征在于，所述通过所述属性调整子网络，根据所述第i次迭代对应的预测对象图像，对所述编辑后的标记对象图像进行调整，得到所述第i次迭代对应的候选编辑图像，包括：

8.如权利要求1所述的方法，其特征在于，所述根据所添加的预测噪声数据，以...

【专利技术属性】
技术研发人员：郭卉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人