图像识别模型的训练与图像识别方法、装置制造方法及图纸

技术编号:30965727 阅读:28 留言:0更新日期:2021-11-25 20:35
本公开提供了一种图像识别模型的训练与图像识别方法、装置、电子设备和可读存储介质,涉及图像处理、深度学习等人工智能技术领域。图像识别模型的训练方法包括:获取多张第一图像;根据所述多张第一图像中的标识图案,生成多张第二图像;根据所述多张第一图像与所述多张第二图像,构建图像集;使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。图像识别方法包括:获取待识别图像;将所述待识别图像输入图像识别模型,得到所述图像识别模型输出的预测分值;在确定所述预测分值大于目标图像阈值的情况下,确定所述待识别图像中包含标识图案。本公开能够降低图像识别模型的训练成本,提升图像识别模型的识别准确性。性。性。

【技术实现步骤摘要】
图像识别模型的训练与图像识别方法、装置


[0001]本公开涉及数据处理
,尤其涉及图像处理、深度学习等人工智能
提供了一种图像识别模型的训练与图像识别方法、装置、电子设备和可读存储介质。

技术介绍

[0002]随着互联网技术的飞速发展,以及大带宽低时延的5G网络技术的逐步落地,短视频的应用场景不断扩大,海量的短视频被上传至各大互联网平台,丰富了人们的生活。
[0003]但是,短视频中可能会存在标识图案,例如特定的旗帜图案、特定的符号图案等。目前主要通过人工审核的方式来识别图像中是否存在标识图案,存在成本较高、效率较低等问题。

技术实现思路

[0004]根据本公开的第一方面,提供了一种图像识别模型的训练方法,包括:获取多张第一图像;根据所述多张第一图像中的标识图案,生成多张第二图像;根据所述多张第一图像与所述多张第二图像,构建图像集;使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。
[0005]根据本公开的第二方面,提供了一种图像识别方法,包括:获取待识别图像;将所述待识别图像输入图像识别模型,得到所述图像识别模型输出的预测分值;在确定所述预测分值大于目标图像阈值的情况下,确定所述待识别图像中包含标识图案。
[0006]根据本公开的第三方面,提供了一种图像识别模型的训练装置,包括:第一获取单元,用于获取多张第一图像;生成单元,用于根据所述多张第一图像中的标识图案,生成多张第二图像;构建单元,用于根据所述多张第一图像与所述多张第二图像,构建图像集;训练单元,用于使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。
[0007]根据本公开的第四方面,提供了一种图像识别装置,包括:第二获取单元,用于获取待识别图像;处理单元,用于将所述待识别图像输入图像识别模型,得到所述图像识别模型输出的预测分值;识别单元,用于在确定所述预测分值大于目标图像阈值的情况下,确定所述待识别图像中包含标识图案。
[0008]根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
[0009]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
[0010]根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
[0011]由以上技术方案可以看出,本实施例通过所获取的包含标识图案的第一图像生成
第二图像的方式,能够增加用于训练的图像集中图像的数量,进而降低了图像识别模型的训练成本,提升了图像识别模型在识别图像中是否存在标识图案时的准确性。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开第一实施例的示意图;
[0015]图2是根据本公开第二实施例的示意图;
[0016]图3是根据本公开第三实施例的示意图;
[0017]图4是根据本公开第四实施例的示意图;
[0018]图5是用来实现本公开实施例的图像识别模型的训练与图像识别方法的电子设备的框图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和机构的描述。
[0020]图1是根据本公开第一实施例的示意图。如图1所示,本实施例的图像识别模型的训练方法,具体可以包括如下步骤:
[0021]S101、获取多张第一图像;
[0022]S102、根据所述多张第一图像中的标识图案,生成多张第二图像;
[0023]S103、根据所述多张第一图像与所述多张第二图像,构建图像集;
[0024]S104、使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。
[0025]本实施例的图像识别模型的训练方法,在根据获取的多张第一图像中的标识图案生成多张第二图像之后,再根据多张第一图像与多张第二图像构建图像集,进而使用所构建的图像集与预设标签训练神经网络模型来得到图像识别模型,使得训练得到的图像识别模型能够识别图像中是否存在标识图案,本实施例通过第一图像生成第二图像的方式,能够增加用于训练的图像集中图像的数量,进而降低了图像识别模型的训练成本,提升了图像识别模型在识别图像中是否存在标识图案时的准确性。
[0026]本实施例在执行S101获取多张第一图像时,可以将从网络中爬取的包含标识图案的图像作为第一图像,多张第一图像中所包含的标识图案为用于标识旗帜、符号、LOGO等不同类型的图案。其中,本实施例中的标识图案可以为特定的标识图案。
[0027]本实施例在执行S101获取多张第一图像之后,可以对多张第一图像进行标签标注,具体为将预设标签作为每张第一图像的标签标注结果,预设标签为1或者0;本实施例还可以对多张第一图像进行位置标注,具体为将框选出第一图像中标识图案的矩形框的坐标值作为位置标注结果。
[0028]本实施例在执行S101获取多张第一图像之后,执行S102根据所获取的多张第一图
像中的标识图案,生成多张第二图像。
[0029]具体地,本实施例在执行S102根据所获取的多张第一图像中的标识图案,生成多张第二图像时,可以采用的可选实现方式为:从所获取的多张第一图像中提取标识图案;将所提取的标识图案,作为前景图像;获取不包含标识图案的图像,作为背景图像;将前景图像与背景图像进行粘贴,将粘贴结果作为第二图像。
[0030]本实施例在执行S102从所获取的多张第一图像中提取标识图案时,可以采用的可选实现方式为:从所获取的多张第一图像中选取第一预设数量的第一图像;从所选取的第一图像中提取标识图案。
[0031]也就是说,本实施例通过从多张第一图像中选取部分第一图像的方式,确保了所生成的第二图像与第一图像之间具有一定的差异,能够提升所构建的图像集中包含图像的丰富性。
[0032]本实施例在执行S102将前景图像与背景图像进行粘贴时,可以直接将不同的前景图像与不同的背景图像进行粘贴,例如将前景图像粘贴在背景图像中的随机位置。
[0033]为了确保第二图像具有较高质量,从而提升神经网络模型的训练效果,本实施例在执行S102将前景图像与背景图像进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,包括:获取多张第一图像;根据所述多张第一图像中的标识图案,生成多张第二图像;根据所述多张第一图像与所述多张第二图像,构建图像集;使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。2.根据权利要求1所述的方法,其中,所述根据所述多张第一图像中的标识图案,生成多张第二图像包括:从所述多张第一图像中提取标识图案;将所提取的标识图案,作为前景图像;获取不包含标识图案的图像,作为背景图像;将所述前景图像与所述背景图像进行粘贴,将粘贴结果作为所述第二图像。3.根据权利要求2所述的方法,其中,所述从所述多张第一图像中提取标识图案包括:从所述多张第一图像中选取第一预设数量的第一图像;从所选取的第一图像中提取所述标识图案。4.根据权利要求2所述的方法,其中,所述将所述前景图像与所述背景图像进行粘贴包括:对所述前景图像进行第一预处理;将所述前景图像的第一预处理结果与所述背景图像进行粘贴。5.根据权利要求1所述的方法,其中,所述根据所述多张第一图像与所述多张第二图像,构建图像集包括:去除所述多张第一图像中用于生成第二图像的第一图像;从剩余的第一图像中选取第二预设数量的第一图像作为测试图像,得到测试集;按照预设比例,将未作为测试集的第一图像与所述多张第二图像划分为训练图像与验证图像,得到训练集与验证集。6.根据权利要求5所述的方法,还包括,在得到所述训练集之后,对所述训练集中的训练图像进行第二预设处理;将训练图像的第二预处理结果进行归一化处理。7.根据权利要求5所述的方法,其中,所述使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型包括:使用所述训练集中的多张训练图像与预设标签,调整所述神经网络模型的模型参数,直至所述神经网络模型收敛;选取在训练过程中满足预设条件的神经网络模型;使用所述验证集中的多张验证图像与预设标签,在所选取的神经网络模型中确定图像识别模型;使用所述测试集中的多张测试图像与预设标签,测试所述图像识别模型的识别性能。8.根据权利要求7所述的方法,其中,所述使用所述训练集中的多张训练图像与预设标签,调整所述神经网络模型的模型参数包括:根据所述训练集中的多张训练图像,得到多张合成图像;使用所述多张合成图像与预设标签,调整所述神经网络模型的模型参数。
9.一种图像识别方法,包括:获取待识别图像;将所述待识别图像输入图像识别模型,得到所述图像识别模型输出的预测分值;在确定所述预测分值大于目标图像阈值的情况下,确定所述待识别图像中包含标识图案;其中,所述图像识别模型是根据权利要求1

8中任一项所述的方法预先训练得到的。10.根据权利要求9所述的方法,其中,获取所述目标图像阈值包括:设置多个图像阈值;获取多张样本图像;将所述多张样本图像输入所述图像识别模型,得到所述图像识别模型针对每张样本图像输出的预测分值;根据所述多张样本图像的预测分值与所述多个图像阈值,得到对应每个图像阈值的召回率和/或误检率;将所述召回率和/或误检率满足预设要求的图像阈值,作为所述目标图像阈值。11.一种图像识别模型的训练装置,包括:第一获取单元,用于获取多张第一图像;生成单元,用于根据所述多张第一图像中的标识图案,生成多张第二图像;构建单元,用于根据所述多张第一图像与所述多张第二图像,构建图像集;训练单元,用于使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。12.根据权利要求11所述的装置,其中,所述生成单元在根据所述多张第一图像中的标识图案,生成多张第二图像时,具体执行:从所述多张第一图像中提取标识图案;将所提...

【专利技术属性】
技术研发人员:崔东林王加明邓天生贠挺于天宝陈国庆林赛群
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1