数据处理方法技术

技术编号:39521370 阅读:13 留言:0更新日期:2023-11-25 19:00
本公开提供了数据处理方法

【技术实现步骤摘要】
数据处理方法、装置、设备、计算机可读存储介质及产品


[0001]本公开涉及人工智能中的深度学习,尤其涉及一种数据处理方法

装置

设备

计算机可读存储介质及产品


技术介绍

[0002]拍摄产品宣传图是一项复杂且耗时的工作,为了快速地生成多张产品宣传图,现有技术中一般使用扩散模型进行产品宣传图的生成

但是在图像生成过程中,虽然可以通过文本描述控制生成的背景,但经常会出现对产品图自身边缘部分进行随意外扩补充,例如给商品进行延伸,给人多长出一只手等,导致产品主体遭到改变,无法有效进行宣传图生成


技术实现思路

[0003]本公开提供了一种用于解决扩散模型在生成目标图像时对输入图像边缘部分进行随意外扩补充的技术问题的数据处理方法

装置

设备

计算机可读存储介质及产品

[0004]根据本公开的第一方面,提供了一种数据处理方法,包括:
[0005]获取训练数据集,其中,所述训练数据集中包括多组训练数据,所述训练数据中包括预先进行像素处理的第一图像

包括随机噪声的第二图像以及预设的文本描述信息,所述第一图像中内容主体的边缘部分被配置为预设的第一像素值,所述第一图像中所述内容主体以外的区域被配置为预设的第二像素值,所述第一像素值大于所述第二像素值;
[0006]采用所述训练数据集对预设的待训练扩散模型进行训练操作,直至所述待训练扩散模型满足预设的收敛条件,获得训练后的目标扩展模型

[0007]根据本公开的第二方面,提供了一种数据处理方法,包括:
[0008]获取图像生成请求,其中,所述图像生成请求中包括目标物品对应的关联图像以及预设的背景描述信息;
[0009]根据所述图像生成请求,将所述关联图像中目标物品的边缘部分的像素值调整为预设的第一像素值,将所述关联图像中非目标物品区域的像素值调整为预设的第二像素值,获得控制图像;
[0010]将所述控制图像以及所述背景描述信息输入至预设的目标扩展模型中,获得所述目标扩展模型输出的与所述目标物品关联的至少一张扩展图像;
[0011]其中,所述目标扩展模型是基于第一方面所述的数据处理方法训练获得的

[0012]根据本公开的第三方面,提供了一种数据处理装置,包括:
[0013]获取模块,用于获取训练数据集,其中,所述训练数据集中包括多组训练数据,所述训练数据中包括预先进行像素处理的第一图像

包括随机噪声的第二图像以及预设的文本描述信息,所述第一图像中内容主体的边缘部分被配置为预设的第一像素值,所述第一图像中所述内容主体以外的区域被配置为预设的第二像素值,所述第一像素值大于所述第二像素值;
[0014]训练模块,用于采用所述训练数据集对预设的待训练扩散模型进行训练操作,直至所述待训练扩散模型满足预设的收敛条件,获得训练后的目标扩展模型

[0015]根据本公开的第四方面,提供了一种数据处理装置,包括:
[0016]请求获取模块,用于获取图像生成请求,其中,所述图像生成请求中包括目标物品对应的关联图像以及预设的背景描述信息;
[0017]像素调整模块,用于根据所述图像生成请求,将所述关联图像中目标物品的边缘部分的像素值调整为预设的第一像素值,将所述关联图像中非目标物品区域的像素值调整为预设的第二像素值,获得控制图像;
[0018]输入模块,用于将所述控制图像以及所述背景描述信息输入至预设的目标扩展模型中,获得所述目标扩展模型输出的与所述目标物品关联的至少一张扩展图像;
[0019]其中,所述目标扩展模型是基于第三方面所述的数据处理装置训练获得的

[0020]根据本公开的第五方面,提供了一种电子设备,包括:
[0021]至少一个处理器;以及
[0022]与所述至少一个处理器通信连接的存储器;其中,
[0023]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面或第二方面所述的方法

[0024]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面或第二方面任一项所述的方法

[0025]根据本公开的第七方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面或第二方面所述的方法

[0026]根据本公开的技术解决了提高了扩散模型输出的目标图像的精准度,避免扩散模型在生成目标图像时对输入图像边缘部分进行随意外扩补充

[0027]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围

本公开的其它特征将通过以下的说明书而变得容易理解

附图说明
[0028]附图用于更好地理解本方案,不构成对本公开的限定

其中:
[0029]图1为本公开所基于的系统架构图;
[0030]图2为本公开实施例提供的数据处理方法的流程示意图;
[0031]图3为本公开又一实施例提供的数据处理方法的流程示意图;
[0032]图4为本公开实施例提供的模型训练场景示意图;
[0033]图5为本公开又一实施例提供的数据处理方法的流程示意图;
[0034]图6为本公开又一实施例提供的数据处理方法的流程示意图;
[0035]图7为本公开实施例提供的数据处理装置的结构示意图;
[0036]图8为本公开实施例提供的数据处理装置的结构示意图;
[0037]图9为本公开实施例提供的电子设备的结构示意图

具体实施方式
[0038]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的

因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神

同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述

[0039]本公开提供一种数据处理方法

装置

设备

计算机可读存储介质及产品,应用于人工智能领域中的深度学习,以达到提高扩散模型输出的目标图像的精准度的技术效果

[0040]本公开提供的数据处理方法

装本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种数据处理方法,包括:获取训练数据集,其中,所述训练数据集中包括多组训练数据,所述训练数据中包括预先进行像素处理的第一图像

包括随机噪声的第二图像以及预设的文本描述信息,所述第一图像中内容主体的边缘部分被配置为预设的第一像素值,所述第一图像中所述内容主体以外的区域被配置为预设的第二像素值,所述第一像素值大于所述第二像素值;采用所述训练数据集对预设的待训练扩散模型进行训练操作,直至所述待训练扩散模型满足预设的收敛条件,获得训练后的目标扩展模型
。2.
根据权利要求1所述的方法,所述获取训练数据集,包括:获取预设的图像数据集,其中,所述图像数据集中包括多张待处理图像以及各待处理图像对应的文本描述信息,所述待处理图像中包括内容主体区域;针对各待处理图像,识别所述待处理图像中内容主体的显示位置;基于所述内容主体的显示位置对所述内容主体的边缘部分以及所述待处理图像中所述内容主体以外的区域进行像素调整操作,获得所述第一图像;在所述待处理图像中添加随机噪声,获得所述第二图像;将所述待处理图像对应的第一图像

第二图像以及所述文本描述信息确定为所述待处理图像对应的训练数据;基于各待处理图像对应的训练数据构建所述训练数据集
。3.
根据权利要求2所述的方法,所述基于所述内容主体的显示位置对所述内容主体的边缘部分以及所述待处理图像中所述内容主体以外的区域进行像素调整操作,获得所述第一图像,包括:基于所述内容主体的显示位置确定所述待处理图像中除所述内容主体以外的非主体区域;将所述非主体区域的像素设置为预设的第二像素值;将所述内容主体的显示区域与所述非主体区域之间的交界处确定为所述内容主体的边缘部分;将所述边缘部分的像素设置为预设的第一像素值
。4.
根据权利要求3所述的方法,所述将所述非主体区域的像素设置为预设的第二像素值,包括:对所述待处理图像进行图像取反操作,获得第一反转图像;将所述第一反转图像中所述非主体区域的像素设置为预设的第二像素值
。5.
根据权利要求2所述的方法,所述待处理图像中包括预设的标注信息,所述标注信息用于标注所述内容主体的显示区域;所述识别所述待处理图像中内容主体的显示位置,包括:基于所述待处理图像对应的标注信息确定待处理图像中内容主体的显示位置;或者,所述识别所述待处理图像中内容主体的显示位置,包括:根据预设的主体识别模型识别所述待处理图像中内容主体的显示位置
。6.
根据权利要求1‑5任一项所述的方法,所述第一像素值为最大像素值,所述第二像素值为预设的负值像素
。7.
根据权利要求1‑5任一项所述的方法,所述采用所述训练数据集对预设的待训练扩
散模型进行训练操作,直至所述待训练扩散模型满足预设的收敛条件,获得训练后的目标扩展模型,包括:将所述训练数据集中的训练数据输入至所述待训练扩散模型中,获得所述待训练扩散模型基于所述第一图像以及所述文本描述信息输出的预测噪声信息;基于所述预测噪声信息与所述第二图像中的随机噪声确定所述待训练扩散模型当前的损失值;检测所述待训练扩散模型是否满足预设的收敛条件;若否,则根据所述损失值对所述待训练扩散模型的参数进行调整,返回执行所述将所述训练数据集中的训练数据输入至所述待训练扩散模型中的步骤;若是,则判定所述待训练扩散模型训练完毕,获得所述训练后的目标扩展模型
。8.
一种数据处理方法,包括:获取图像生成请求,其中,所述图像生成请求中包括目标物品对应的关联图像以及预设的背景描述信息;根据所述图像生成请求,将所述关联图像中目标物品的边缘部分的像素值调整为预设的第一像素值,将所述关联图像中非目标物品区域的像素值调整为预设的第二像素值,获得控制图像;将所述控制图像以及所述背景描述信息输入至预设的目标扩展模型中,获得所述目标扩展模型输出的与所述目标物品关联的至少一张扩展图像;其中,所述目标扩展模型是基于权利要求1‑7任一项所述的数据处理方法训练获得的
。9.
根据权利要求8所述的方法,所述将所述关联图像中目标物品的边缘部分的像素值调整为预设的第一像素值,将所述关联图像中非目标物品区域的像素值调整为预设的第二像素值,包括:识别所述关联图像中目标物品的显示区域;对所述关联图像进行图像取反操作,获得第二反转图像;将所述第二翻转图像中非目标物品区域设置为第二像素值;将所述第二翻转图像目标物品的显示区域与所述非目标物品区域之间的交界处设置为所述第一像素值,获得所述控制图像
。10.
一种数据处理装置,包括:获取模块,用于获取训练数据集,其中,所述训练数据集中包括多组训练数据,所述训练数据中包括预先进行像素处理的第一图像

包括随机噪声的第二图像以及预设的文本描述信息,所述第一图像中内容主体的边缘部分被配置为预设的第一像素值,所述第一图像中所述内容主体以外的区域被配置为预设的第二像素值,所述第一像素值大于所述第二像素值;训练模块,用于采用所述训练数据集对预设的待训练扩散模型进行训练操作,直至...

【专利技术属性】
技术研发人员:曹超
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1