图像识别模型的训练与图像识别方法、装置、设备和介质制造方法及图纸

技术编号:33392010 阅读:12 留言:0更新日期:2022-05-11 23:09
本发明专利技术公开了一种图像识别模型的训练与图像识别方法、装置、设备和介质。通过获取原始图像集和图像标注文本;将原始图像集和图像标注文本输入样本生成器得到训练样本图像集;将训练样本图像集中的训练样本图像输入初始图像识别模型得到训练样本图像对应的识别结果;将识别结果和训练样本图像中的标注类别输入损失函数得到损失函数值,基于损失函数值对初始图像识别模型的模型参数进行调整,直到损失函数值最小时,输出初始图像识别模型在达到预设条件时的最优模型参数;基于最优模型参数更新初始图像识别模型的模型参数得到目标图像识别模型,能够自动生成图像样本集,适用于图像在不同场景下的识别,提高图像识别的效率和准确率。准确率。准确率。

【技术实现步骤摘要】
图像识别模型的训练与图像识别方法、装置、设备和介质


[0001]本专利技术涉及计算机视觉处理
,尤其涉及一种图像识别模型的训练与图像识别方法、装置、设备和介质。

技术介绍

[0002]当前市场上现金的流通量仍十分巨大,现金的自动识别分类可以帮助金融机构对纸币自动分拣,提高金融机构现金分拣的业务效率。
[0003]目前进行现金自动识别分类的方法一般基于传统模式识别方法,该方法主要是从图像处理的角度来解决现金的识别分类问题,如使用边缘检测、形态学处理等技术,在某些场景下解决了现金识别分类的问题。
[0004]但是传统模式识别的弊端在于需要人工设计合适的特征,当有效采样获取的特征点少时,容易引起误判;且适用场景有限,当光照和色温等场景信息发生变化,所提取的特征可能不适用,需要重新设计合适的特征。

技术实现思路

[0005]本专利技术提供了一种图像识别模型的训练与图像识别方法、装置、设备和介质,以解决传统识别方法适用场景有限、识别准确率低的问题,能够自动生成图像样本集,适用于图像在不同场景下的识别,提高了图像识别的效率和准确率。
[0006]根据本专利技术的一方面,提供了一种图像识别模型的训练方法,包括:
[0007]获取原始图像集和图像标注文本;将所述原始图像集和所述图像标注文本输入样本生成器得到训练样本图像集;
[0008]将所述训练样本图像集中的训练样本图像输入初始图像识别模型得到所述训练样本图像对应的识别结果;
[0009]将所述识别结果和所述训练样本图像中的标注类别输入损失函数得到损失函数值,基于所述损失函数值对所述初始图像识别模型的模型参数进行调整,返回执行将所述训练样本图像集中的训练样本图像输入初始图像识别模型得到所述训练样本图像对应的识别结果的操作,输出所述初始图像识别模型在达到预设条件时的最优模型参数;
[0010]基于所述最优模型参数更新所述初始图像识别模型得到目标图像识别模型。
[0011]根据本专利技术的另一方面,提供了一种图像识别方法,包括:
[0012]获取待识别图像;
[0013]将所述待识别图像输入采用图像识别模型的训练方法训练得到的目标图像识别模型,得到所述待识别图像对应的图像识别结果。
[0014]根据本专利技术的另一方面,提供了一种图像识别模型的训练装置,包括:
[0015]训练样本生成模块,用于获取原始图像集和图像标注文本;将所述原始图像集和所述图像标注文本输入样本生成器得到训练样本图像集;
[0016]识别模块,用于将所述训练样本图像集中的训练样本图像输入初始图像识别模型
得到所述训练样本图像对应的识别结果;
[0017]参数调整模块,用于将所述识别结果和所述训练样本图像中的标注类别输入损失函数得到损失函数值,基于所述损失函数值对所述初始图像识别模型的模型参数进行调整,返回执行将所述训练样本图像集中的训练样本图像输入初始图像识别模型得到所述训练样本图像对应的识别结果的操作,输出所述初始图像识别模型在达到预设条件时的最优模型参数;
[0018]参数更新模块,用于基于所述最优模型参数更新所述初始图像识别模型得到目标图像识别模型。
[0019]根据本专利技术的另一方面,提供了一种图像识别装置,包括:
[0020]图像获取模块,用于获取待识别图像;
[0021]图像识别模块,用于将所述待识别图像输入采用图像识别模型的训练方法训练得到的目标图像识别模型,得到所述待识别图像对应的图像识别结果。
[0022]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0023]至少一个处理器;以及
[0024]与所述至少一个处理器通信连接的存储器;其中,
[0025]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的图像识别模型的训练方法或者图像识别方法。
[0026]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的图像识别模型的训练方法或者图像识别方法。
[0027]本专利技术实施例的技术方案,通过获取原始图像集和图像标注文本;将原始图像集和图像标注文本输入样本生成器得到训练样本图像集;将训练样本图像集中的训练样本图像输入初始图像识别模型得到训练样本图像对应的识别结果;将识别结果和训练样本图像中的标注类别输入损失函数得到损失函数值,基于损失函数值对初始图像识别模型的模型参数进行调整,直到损失函数值最小时,输出初始图像识别模型在达到预设条件时的最优模型参数;基于最优模型参数更新初始图像识别模型的模型参数得到目标图像识别模型,解决传统识别方法适用场景有限、识别准确率低的问题,达到了自动生成图像样本集,适用于图像在不同场景下的识别,提高纸图像识别的效率和准确率的有益效果。
[0028]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0029]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0030]图1是根据本专利技术实施例一提供的一种图像识别模型的训练方法的流程图;
[0031]图2是根据本专利技术实施例二提供的一种图像识别模型的训练方法的流程图;
[0032]图3是根据本专利技术实施例二的一种特征提取网络的结构示意图;
[0033]图4是根据本专利技术实施例三提供的一种图像识别方法的流程图;
[0034]图5是根据本专利技术实施例三提供的一种图像识别模型的训练装置的结构示意图;
[0035]图6是本专利技术实施例四提供的一种图像识别装置的结构示意图;
[0036]图7是实现本专利技术实施例的图像识别模型的训练方法或者图像识别方法的电子设备的结构示意图;
具体实施方式
[0037]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0038]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,其特征在于,包括:获取原始图像集和图像标注文本;将所述原始图像集和所述图像标注文本输入样本生成器得到训练样本图像集;将所述训练样本图像集中的训练样本图像输入初始图像识别模型得到所述训练样本图像对应的识别结果;将所述识别结果和所述训练样本图像中的标注类别输入损失函数得到损失函数值,基于所述损失函数值对所述初始图像识别模型的模型参数进行调整,返回执行将所述训练样本图像集中的训练样本图像输入初始图像识别模型得到所述训练样本图像对应的识别结果的操作,输出所述初始图像识别模型在达到预设条件时的最优模型参数;基于所述最优模型参数更新所述初始图像识别模型得到目标图像识别模型。2.根据权利要求1所述的方法,其特征在于,所述样本生成器包括:标签标注模块和预处理模块;将所述原始图像集和所述图像标注文本输入样本生成器得到训练样本图像集包括:通过所述标签标注模块,基于图像标注文本对所述原始图像集中的各原始图像分别进行标签标注得到标注图像集;其中,所述图像标注文本包括:各原始图像对应的类别标签数据和标注坐标数据;通过所述预处理模块,对所述标注图像集中的各标注图像进行图像缩放处理和/或图像边缘填充处理,得到第一预设尺寸的训练样本图像集。3.根据权利要求1所述的方法,其特征在于,所述初始图像识别模型包括:特征提取网络、区域选择网络和全卷积网络;将所述训练样本图像集中的训练样本图像输入初始图像识别模型得到所述训练样本图像对应的识别结果,包括:通过所述特征提取网络对训练样本图像集中的训练样本图像进行特征提取得到特征图像;通过所述区域选择网络确定所述特征图像的至少一个目标区域;将所述特征图像对应的目标区域输入所述全卷积网络得到所述训练样本图像对应的识别结果。4.根据权利要求3所述的方法,其特征在于,所述特征提取网络包括:逐通道卷积模块、逐点卷积模块和调整模块;其中,所述逐通道卷积模块包括与特征图像的输入通道相同数量的深度卷积核,所述逐点卷积模块包括:预设数量的逐点卷积核;所述调整模块包括:双线性内插单元和最大池化层;相应的,通过所述特征提取网络对所述训练样本图像进行特征提取得到特征图像,包括:通过所述逐通道卷积模块对所述训练样本图像中每一输入通道的像素点进行第一卷积运算得到第一特征图像;通过所述逐点卷积模块对所述第一特征图像中的每一像素点进行第二卷积运算得到第二特征图像;通过所述双线性内...

【专利技术属性】
技术研发人员:张书玉刘佳鑫
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1