数据处理方法技术

技术编号：39521370 阅读：13 留言：0更新日期：2023-11-25 19:00

本公开提供了数据处理方法

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、设备、计算机可读存储介质及产品

[0001]本公开涉及人工智能中的深度学习，尤其涉及一种数据处理方法
、
装置
、
设备
、
计算机可读存储介质及产品
。

技术介绍

[0002]拍摄产品宣传图是一项复杂且耗时的工作，为了快速地生成多张产品宣传图，现有技术中一般使用扩散模型进行产品宣传图的生成
。
但是在图像生成过程中，虽然可以通过文本描述控制生成的背景，但经常会出现对产品图自身边缘部分进行随意外扩补充，例如给商品进行延伸，给人多长出一只手等，导致产品主体遭到改变，无法有效进行宣传图生成
。

技术实现思路

[0003]本公开提供了一种用于解决扩散模型在生成目标图像时对输入图像边缘部分进行随意外扩补充的技术问题的数据处理方法
、
装置
、
设备
、
计算机可读存储介质及产品
。
[0004]根据本公开的第一方面，提供了一种数据处理方法，包括：
[0005]获取训练数据集，其中，所述训练数据集中包括多组训练数据，所述训练数据中包括预先进行像素处理的第一图像
、
包括随机噪声的第二图像以及预设的文本描述信息，所述第一图像中内容主体的边缘部分被配置为预设的第一像素值，所述第一图像中所述内容主体以外的区域被配置为预设的第二像素值，所述第一像素值大于所述第二像素值；
[0006]采用所述训练数据集对预设的待训练扩散模型进行...

【技术保护点】

【技术特征摘要】
1.
一种数据处理方法，包括：获取训练数据集，其中，所述训练数据集中包括多组训练数据，所述训练数据中包括预先进行像素处理的第一图像
、
包括随机噪声的第二图像以及预设的文本描述信息，所述第一图像中内容主体的边缘部分被配置为预设的第一像素值，所述第一图像中所述内容主体以外的区域被配置为预设的第二像素值，所述第一像素值大于所述第二像素值；采用所述训练数据集对预设的待训练扩散模型进行训练操作，直至所述待训练扩散模型满足预设的收敛条件，获得训练后的目标扩展模型
。2.
根据权利要求1所述的方法，所述获取训练数据集，包括：获取预设的图像数据集，其中，所述图像数据集中包括多张待处理图像以及各待处理图像对应的文本描述信息，所述待处理图像中包括内容主体区域；针对各待处理图像，识别所述待处理图像中内容主体的显示位置；基于所述内容主体的显示位置对所述内容主体的边缘部分以及所述待处理图像中所述内容主体以外的区域进行像素调整操作，获得所述第一图像；在所述待处理图像中添加随机噪声，获得所述第二图像；将所述待处理图像对应的第一图像
、
第二图像以及所述文本描述信息确定为所述待处理图像对应的训练数据；基于各待处理图像对应的训练数据构建所述训练数据集
。3.
根据权利要求2所述的方法，所述基于所述内容主体的显示位置对所述内容主体的边缘部分以及所述待处理图像中所述内容主体以外的区域进行像素调整操作，获得所述第一图像，包括：基于所述内容主体的显示位置确定所述待处理图像中除所述内容主体以外的非主体区域；将所述非主体区域的像素设置为预设的第二像素值；将所述内容主体的显示区域与所述非主体区域之间的交界处确定为所述内容主体的边缘部分；将所述边缘部分的像素设置为预设的第一像素值
。4.
根据权利要求3所述的方法，所述将所述非主体区域的像素设置为预设的第二像素值，包括：对所述待处理图像进行图像取反操作，获得第一反转图像；将所述第一反转图像中所述非主体区域的像素设置为预设的第二像素值
。5.
根据权利要求2所述的方法，所述待处理图像中包括预设的标注信息，所述标注信息用于标注所述内容主体的显示区域；所述识别所述待处理图像中内容主体的显示位置，包括：基于所述待处理图像对应的标注信息确定待处理图像中内容主体的显示位置；或者，所述识别所述待处理图像中内容主体的显示位置，包括：根据预设的主体识别模型识别所述待处理图像中内容主体的显示位置
。6.
根据权利要求1‑5任一项所述的方法，所述第一像素值为最大像素值，所述第二像素值为预设的负值像素
。7.
根据权利要求1‑5任一项所述的方法，所述采用所述训练数据集对预设的待训练扩
散模型进行训练操作，直至所述待训练扩散模型满足预设的收敛条件，获得训练后的目标扩展模型，包括：将所述训练数据集中的训练数据输入至所述待训练扩散模型中，获得所述待训练扩散模型基于所述第一图像以及所述文本描述信息输出的预测噪声信息；基于所述预测噪声信息与所述第二图像中的随机噪声确定所述待训练扩散模型当前的损失值；检测所述待训练扩散模型是否满足预设的收敛条件；若否，则根据所述损失值对所述待训练扩散模型的参数进行调整，返回执行所述将所述训练数据集中的训练数据输入至所述待训练扩散模型中的步骤；若是，则判定所述待训练扩散模型训练完毕，获得所述训练后的目标扩展模型
。8.
一种数据处理方法，包括：获取图像生成请求，其中，所述图像生成请求中包括目标物品对应的关联图像以及预设的背景描述信息；根据所述图像生成请求，将所述关联图像中目标物品的边缘部分的像素值调整为预设的第一像素值，将所述关联图像中非目标物品区域的像素值调整为预设的第二像素值，获得控制图像；将所述控制图像以及所述背景描述信息输入至预设的目标扩展模型中，获得所述目标扩展模型输出的与所述目标物品关联的至少一张扩展图像；其中，所述目标扩展模型是基于权利要求1‑7任一项所述的数据处理方法训练获得的
。9.
根据权利要求8所述的方法，所述将所述关联图像中目标物品的边缘部分的像素值调整为预设的第一像素值，将所述关联图像中非目标物品区域的像素值调整为预设的第二像素值，包括：识别所述关联图像中目标物品的显示区域；对所述关联图像进行图像取反操作，获得第二反转图像；将所述第二翻转图像中非目标物品区域设置为第二像素值；将所述第二翻转图像目标物品的显示区域与所述非目标物品区域之间的交界处设置为所述第一像素值，获得所述控制图像
。10.
一种数据处理装置，包括：获取模块，用于获取训练数据集，其中，所述训练数据集中包括多组训练数据，所述训练数据中包括预先进行像素处理的第一图像
、
包括随机噪声的第二图像以及预设的文本描述信息，所述第一图像中内容主体的边缘部分被配置为预设的第一像素值，所述第一图像中所述内容主体以外的区域被配置为预设的第二像素值，所述第一像素值大于所述第二像素值；训练模块，用于采用所述训练数据集对预设的待训练扩散模型进行训练操作，直至...

【专利技术属性】
技术研发人员：曹超，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人