【技术实现步骤摘要】
本申请涉及人工智能技术等领域,尤其涉及一种图像数据处理方法、装置、设备及存储介质。
技术介绍
1、随着基于扩散模型(stablediffusion)的图像生成模型的出现,图像可控生成领域取得显著进展。一些常见的应用如对对象(如物体、人物、动物)进行不常见的创意编辑让其呈现各种对象属性(如猫头上长角、人物长兔耳朵)。实践中发现,目前的对象属性编辑方案中,需要人工交互以标记编辑对象在图像的位置,然后将对象属性编辑过程拆分为多个阶段,且需要人工对每个阶段可能出现的错误进行监督修复,这样操作比较繁琐,导致对象属性编辑的效率比较低。
技术实现思路
1、本申请实施例提供一种图像数据处理方法、装置、设备及存储介质,提高对象属性编辑的效率和便捷性。
2、本申请实施例一方面提供一种图像数据处理方法,包括:
3、获取训练图文对;上述训练图文对包括编辑对象的样本编辑图像、图像分布文本和对象属性编辑文本,上述图像分布文本描述上述样本编辑图像中所包含的对象,上述样本编辑图像所包含的对象中包括
...【技术保护点】
1.一种图像数据处理方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述图像生成模型包括加噪网络和去噪网络;
3.如权利要求2所述的方法,其特征在于,所述通过属性编辑网络包括对象定位子网络、属性编辑子网络和属性调整子网络;所述对象属性编辑文本包对括编辑对象文本和编辑属性文本;
4.如权利要求3所述的方法,其特征在于,所述对象定位子网络包括对象定位层和对象掩膜层;
5.如权利要求4所述的方法,其特征在于,所述通过所述对象定位层,根据所述编辑对象文本对应的文本表征,对所述编辑对象在所述第i次迭代对应的预测对
...【技术特征摘要】
1.一种图像数据处理方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述图像生成模型包括加噪网络和去噪网络;
3.如权利要求2所述的方法,其特征在于,所述通过属性编辑网络包括对象定位子网络、属性编辑子网络和属性调整子网络;所述对象属性编辑文本包对括编辑对象文本和编辑属性文本;
4.如权利要求3所述的方法,其特征在于,所述对象定位子网络包括对象定位层和对象掩膜层;
5.如权利要求4所述的方法,其特征在于,所述通过所述对象定位层,根据所述编辑对象文本对应的文本表征,对所述编辑对象在所述第i次迭代对应的预测对象图像中的图像区域进行激活处理,得到激活对象图像,包括:
6.如权利要求4所述的方法,其特征在于,所述根据所述第i次迭代对应的预测对象图像,对所述编辑对象在所述掩膜对象图像中的图像区域进行标记处理,得到标记对象图像,包括:
7.如权利要求3所述的方法,其特征在于,所述通过所述属性调整子网络,根据所述第i次迭代对应的预测对象图像,对所述编辑后的标记对象图像进行调整,得到所述第i次迭代对应的候选编辑图像,包括:
8.如权利要求1所述的方法,其特征在于,所述根据所添加的预测噪声数据,以...
【专利技术属性】
技术研发人员:郭卉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。