图像处理方法、装置、设备及存储介质制造方法及图纸

技术编号：33785417 阅读：12 留言：0更新日期：2022-06-12 14:40

本公开提供一种图像处理方法、装置、设备及存储介质，涉及图像处理技术领域，尤其涉及计算机视觉、深度学习、自然语言处理技术领域。具体实现方案为：获取待处理的样本集，该样本集中的样本包括图像内容和标签内容，在样本集中，确定出用于联合处理的第一样本和至少一个第二样本，确定第一样本和至少一个第二样本是否满足联合处理退出条件，并在响应于第一样本和至少一个第二样本未满足联合处理退出条件，对第一样本和至少一个第二样本分别进行图像内容联合和标签内容联合处理，得到目标样本。该技术方案，通过对第一样本和至少一个第二样本进行联合，提高了样本集的多样性，提高了不同标签内容长度样本数量的均衡性。同标签内容长度样本数量的均衡性。同标签内容长度样本数量的均衡性。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法、装置、设备及存储介质

[0001]本公开涉及图像处理中的计算机视觉、深度学习、自然语言处理
，尤其涉及一种图像处理方法、装置、设备及存储介质。

技术介绍

[0002]数据增广是深度学习中常用的数据预处理方法，主要用于增加数据集的样本，让数据集尽可能的多样化，使得训练的模型具有更强的泛化能力，提升模型精度。
[0003]为了更好的提高训练模型的精度，通常需要样本的文本长度均衡，若样本是图像，则需要提高图像背景的多样化。

技术实现思路

[0004]本公开提供了一种图像处理方法、装置、设备及存储介质。
[0005]根据本公开的第一方面，提供了一种图像处理方法，包括：
[0006]获取待处理的样本集，所述样本集中的样本包括图像内容和标签内容；
[0007]在所述样本集中，确定出用于联合处理的第一样本和至少一个第二样本；
[0008]确定所述第一样本和所述至少一个第二样本是否满足联合处理退出条件；
[0009]响应于所述第一样本和所述至少一个第二样本未满足联合处理退出条件，对所述第一样本和所述至少一个第二样本分别进行图像内容联合和标签内容联合处理，得到目标样本。
[0010]根据本公开的第二方面，提供了一种图像处理装置，包括：
[0011]获取单元，用于获取待处理的样本集，所述样本集中的样本包括图像内容和标签内容；
[0012]样本确定单元，用于在所述样本集中，确定出用于联合处理的第一样本和至少一个第二样本；
[...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法，包括：获取待处理的样本集，所述样本集中的样本包括图像内容和标签内容；在所述样本集中，确定出用于联合处理的第一样本和至少一个第二样本；确定所述第一样本和所述至少一个第二样本是否满足联合处理退出条件；响应于所述第一样本和所述至少一个第二样本未满足联合处理退出条件，对所述第一样本和所述至少一个第二样本分别进行图像内容联合和标签内容联合处理，得到目标样本。2.根据权利要求1所述的方法，其中，所述联合处理退出条件包括如下至少一项：随机数与所述第一样本的概率缩放因子之积大于或等于联合概率阈值；所述第一样本的图像内容宽度和所述至少一个第二样本的图像内容宽度之和大于或等于图像宽度阈值；所述第一样本的标签内容长度和所述至少一个第二样本的标签内容长度之和大于或等于标签内容长度阈值。3.根据权利要求1或2所述的方法，还包括：基于所述样本集中每个样本的标签内容长度，确定所述样本集对应的标签内容长度子集列表；针对所述标签内容长度子集列表中的各标签内容长度子集，确定各标签内容长度子集的概率缩放因子。4.根据权利要求3所述的方法，其中，所述基于所述样本集中每个样本的标签内容长度，确定所述样本集对应的标签内容长度子集列表，包括：确定所述样本集中每个样本的标签内容长度；根据每个样本的标签内容长度，对所述样本集进行样本数量统计，确定出至少一个标签内容长度子集和每个标签内容长度子集内的样本数量；基于每个标签内容长度子集内的样本数量对所述至少一个标签内容长度子集进行排序，确定所述样本集对应的标签内容长度子集列表。5.根据权利要求3或4所述的方法，其中，所述针对所述标签内容长度子集列表中的各标签内容长度子集，确定各标签内容长度子集的概率缩放因子，包括：针对所述标签内容长度子集列表中的每个标签内容长度子集，确定各标签内容长度子集在所述标签内容长度子集列表中的索引编号；根据各标签内容长度子集在所述标签内容长度子集列表中的索引编号、标签内容长度阈值、预置概率缩放因子最大值和预置概率缩放因子最小值，确定各标签内容长度子集的概率缩放因子。6.根据权利要求2至5任一项所述的方法，还包括：确定所述第一样本的标签内容长度；根据所述第一样本的标签内容长度，确定所述第一样本所属的目标标签内容长度子集；根据所述目标标签内容长度子集的概率缩放因子，确定所述第一样本的概率缩放因子。7.根据权利要求1至6任一项所述的方法，还包括：
对所述第一样本和所述至少一个第二样本分别进行数据增广处理，得到增广处理之后的第一样本和增广处理之后的至少一个第二样本。8.根据权利要求1至7任一项所述的方法，还包括：对所述样本集中的样本分别进行数据增广处理，得到增广处理之后的样本集。9.一种图像处理装置，包括：获取单元，用于获取待处理的样本集，所述样本集中的样本包括图像内容和标签内容；样本确定单元，用于在所述样本集中，确定出用于联合处理的第一样本和至少一个第二样本；判定单元，用于确定所述第一样本和所述至少一个第二样本是否满足联合处理退出条件；联合单元，用于响应于所述第一样本和所述至少一个第二样本未满足联合处理退出条...

【专利技术属性】
技术研发人员：郭若愚，杜宇宁，李晨霞，刘其文，赖宝华，于佃海，马艳军，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人