图像处理方法、装置、设备及存储介质制造方法及图纸

技术编号:33785417 阅读:12 留言:0更新日期:2022-06-12 14:40
本公开提供一种图像处理方法、装置、设备及存储介质,涉及图像处理技术领域,尤其涉及计算机视觉、深度学习、自然语言处理技术领域。具体实现方案为:获取待处理的样本集,该样本集中的样本包括图像内容和标签内容,在样本集中,确定出用于联合处理的第一样本和至少一个第二样本,确定第一样本和至少一个第二样本是否满足联合处理退出条件,并在响应于第一样本和至少一个第二样本未满足联合处理退出条件,对第一样本和至少一个第二样本分别进行图像内容联合和标签内容联合处理,得到目标样本。该技术方案,通过对第一样本和至少一个第二样本进行联合,提高了样本集的多样性,提高了不同标签内容长度样本数量的均衡性。同标签内容长度样本数量的均衡性。同标签内容长度样本数量的均衡性。

【技术实现步骤摘要】
图像处理方法、装置、设备及存储介质


[0001]本公开涉及图像处理中的计算机视觉、深度学习、自然语言处理
,尤其涉及一种图像处理方法、装置、设备及存储介质。

技术介绍

[0002]数据增广是深度学习中常用的数据预处理方法,主要用于增加数据集的样本,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力,提升模型精度。
[0003]为了更好的提高训练模型的精度,通常需要样本的文本长度均衡,若样本是图像,则需要提高图像背景的多样化。

技术实现思路

[0004]本公开提供了一种图像处理方法、装置、设备及存储介质。
[0005]根据本公开的第一方面,提供了一种图像处理方法,包括:
[0006]获取待处理的样本集,所述样本集中的样本包括图像内容和标签内容;
[0007]在所述样本集中,确定出用于联合处理的第一样本和至少一个第二样本;
[0008]确定所述第一样本和所述至少一个第二样本是否满足联合处理退出条件;
[0009]响应于所述第一样本和所述至少一个第二样本未满足联合处理退出条件,对所述第一样本和所述至少一个第二样本分别进行图像内容联合和标签内容联合处理,得到目标样本。
[0010]根据本公开的第二方面,提供了一种图像处理装置,包括:
[0011]获取单元,用于获取待处理的样本集,所述样本集中的样本包括图像内容和标签内容;
[0012]样本确定单元,用于在所述样本集中,确定出用于联合处理的第一样本和至少一个第二样本;
[0013]判定单元,用于确定所述第一样本和所述至少一个第二样本是否满足联合处理退出条件;
[0014]联合单元,用于响应于所述第一样本和所述至少一个第二样本未满足联合处理退出条件,对所述第一样本和所述至少一个第二样本分别进行图像内容联合和标签内容联合处理,得到目标样本。
[0015]根据本公开的第三方面,提供了一种电子设备,包括:
[0016]至少一个处理器;以及
[0017]与所述至少一个处理器通信连接的存储器;其中,
[0018]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
[0019]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。
[0020]根据本公开的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
[0021]根据本公开的技术方案,提高了样本集的样本多样性,提高了不同标签内容长度的样本数量的均衡性。
[0022]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0024]图1是本公开实施例所适用的一种应用场景示意图;
[0025]图2是本公开第一实施例提供的图像处理方法的流程示意图;
[0026]图3是第一样本和第二样本的联合处理示意图;
[0027]图4是本公开第二实施例提供的图像处理方法的流程示意图;
[0028]图5是本公开第三实施例提供的图像处理方法的流程示意图;
[0029]图6是本公开实施例提供的一种图像处理装置的结构示意图;
[0030]图7是用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]在介绍本公开的应用背景和技术方案之前,首先介绍一下本公开实施例中可能涉及的几个术语:
[0033]人工智能(Artificial Intelligence,AI):是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
[0034]图像处理:是人工智能领域的重要应用之一,而且,随着深度学习方法在自然图像的分类方面表现出的卓越性能,采用训练得到的模型在图像中对目标特征进行提取和评估,从而实现对目标自动认证的应用越多越多。
[0035]机器学习(Machine Learning,ML):机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
[0036]训练(training)或学习:训练是指一个处理过程,在该处理过程中,一个AI/ML模型学会来执行某项特定的任务(一般通过优化AI/ML模型中的加权值来学会来执行某项特
定的任务)。
[0037]光学字符识别(Optical Character Recognition,OCR)是一项可以将图片信息转换为更易编辑和存储的文本信息的技术。目前被广泛应用于各种场景,如票据识别、银行卡信息识别、公式识别等,此外OCR也帮助了很多下游任务,比如字幕翻译、安全监控等;同时也有助于其他视觉任务,如视频搜索等。
[0038]卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN),主要用于端到端地对不定长的文本序列进行识别,不用先对单个文字进行切割,而是将文本识别转化为时序依赖的序列学习问题,就是基于图像的序列识别。CRNN主要包括卷积层、循环层和转录层,最终实现使用定长输入对不定长的序列的预测。
[0039]数据增广是一种常用的数据预处理方法,其是深度学习中常用的技巧之一,主要用于增加训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力,提升模型精度。常用的数据增广方法主要包括:光照变换、抖动、模糊、随机裁剪、水平/垂直翻转、旋转、缩放、剪切、平移、对比度、噪声等。
[0040]目前,在图像处理
中,数据增广方法一般是对单张图像进行增广,背景和变换处理相对比较单一,没有考虑到不同图像之间的上下文信息,无法使用不同图像融合后的背景信息,当训练的模型应用于复杂的背景时,模型的精度一般较低。而本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,包括:获取待处理的样本集,所述样本集中的样本包括图像内容和标签内容;在所述样本集中,确定出用于联合处理的第一样本和至少一个第二样本;确定所述第一样本和所述至少一个第二样本是否满足联合处理退出条件;响应于所述第一样本和所述至少一个第二样本未满足联合处理退出条件,对所述第一样本和所述至少一个第二样本分别进行图像内容联合和标签内容联合处理,得到目标样本。2.根据权利要求1所述的方法,其中,所述联合处理退出条件包括如下至少一项:随机数与所述第一样本的概率缩放因子之积大于或等于联合概率阈值;所述第一样本的图像内容宽度和所述至少一个第二样本的图像内容宽度之和大于或等于图像宽度阈值;所述第一样本的标签内容长度和所述至少一个第二样本的标签内容长度之和大于或等于标签内容长度阈值。3.根据权利要求1或2所述的方法,还包括:基于所述样本集中每个样本的标签内容长度,确定所述样本集对应的标签内容长度子集列表;针对所述标签内容长度子集列表中的各标签内容长度子集,确定各标签内容长度子集的概率缩放因子。4.根据权利要求3所述的方法,其中,所述基于所述样本集中每个样本的标签内容长度,确定所述样本集对应的标签内容长度子集列表,包括:确定所述样本集中每个样本的标签内容长度;根据每个样本的标签内容长度,对所述样本集进行样本数量统计,确定出至少一个标签内容长度子集和每个标签内容长度子集内的样本数量;基于每个标签内容长度子集内的样本数量对所述至少一个标签内容长度子集进行排序,确定所述样本集对应的标签内容长度子集列表。5.根据权利要求3或4所述的方法,其中,所述针对所述标签内容长度子集列表中的各标签内容长度子集,确定各标签内容长度子集的概率缩放因子,包括:针对所述标签内容长度子集列表中的每个标签内容长度子集,确定各标签内容长度子集在所述标签内容长度子集列表中的索引编号;根据各标签内容长度子集在所述标签内容长度子集列表中的索引编号、标签内容长度阈值、预置概率缩放因子最大值和预置概率缩放因子最小值,确定各标签内容长度子集的概率缩放因子。6.根据权利要求2至5任一项所述的方法,还包括:确定所述第一样本的标签内容长度;根据所述第一样本的标签内容长度,确定所述第一样本所属的目标标签内容长度子集;根据所述目标标签内容长度子集的概率缩放因子,确定所述第一样本的概率缩放因子。7.根据权利要求1至6任一项所述的方法,还包括:
对所述第一样本和所述至少一个第二样本分别进行数据增广处理,得到增广处理之后的第一样本和增广处理之后的至少一个第二样本。8.根据权利要求1至7任一项所述的方法,还包括:对所述样本集中的样本分别进行数据增广处理,得到增广处理之后的样本集。9.一种图像处理装置,包括:获取单元,用于获取待处理的样本集,所述样本集中的样本包括图像内容和标签内容;样本确定单元,用于在所述样本集中,确定出用于联合处理的第一样本和至少一个第二样本;判定单元,用于确定所述第一样本和所述至少一个第二样本是否满足联合处理退出条件;联合单元,用于响应于所述第一样本和所述至少一个第二样本未满足联合处理退出条...

【专利技术属性】
技术研发人员:郭若愚杜宇宁李晨霞刘其文赖宝华于佃海马艳军
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1