图像识别方法、装置、计算机可读存储介质及电子设备制造方法及图纸

技术编号:35952116 阅读:14 留言:0更新日期:2022-12-14 10:45
本发明专利技术公开了一种图像识别方法、装置、计算机可读存储介质及电子设备,涉及人工智能技术领域。其中,该方法包括:获取至少一个视频帧,其中,视频帧中至少包括待识别图像;将待识别图像输入目标识别模型中,输出多个识别结果,其中,目标识别模型是通过向第一识别模型中添加目标网络模块得到的,目标网络模块用于对第一识别模型的网络分支进行扩展,识别结果表征待识别图像属于该识别结果所对应类别的概率;根据多个识别结果确定待识别图像所属的目标类别,并在目标类别满足预设条件的情况下,确定待识别图像为目标图像,其中,目标图像至少包括目标图形徽标。本发明专利技术解决了现有技术中的图像识别模型对图形徽标的识别准确度低的技术问题。的技术问题。的技术问题。

【技术实现步骤摘要】
图像识别方法、装置、计算机可读存储介质及电子设备


[0001]本专利技术涉及人工智能
,具体而言,涉及一种图像识别方法、装置、计算机可读存储介质及电子设备。

技术介绍

[0002]金融机构为了提升自家应用程序的趣味性,推出了一系列活动供用户参与,例如,金融机构在自家应用程序(例如,手机银行APP)上推出增强现实(Augmented Reality,AR)抽奖活动,用户通过应用程序扫一扫身边的金融机构的图形徽标(例如,金融机构的图标),可以参与抽奖活动,达到增强用户体验,提高用户留存率的效果。
[0003]为满足上述需求,出现了一系列用于对图形徽标进行识别的图像识别模型,但是,由于模型需要应用于移动终端,因此,对模型的参数量和性能有一定的要求。目前,在现有技术中采用的图像识别模型虽然参数量较小,但是识别效果差,降低了模型的性能,存在对图形徽标的识别准确度低的问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种图像识别方法、装置、计算机可读存储介质及电子设备,以至少解决现有技术中的图像识别模型对图形徽标的识别准确度低的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种图像识别方法,包括:获取至少一个视频帧,其中,视频帧中至少包括待识别图像;将待识别图像输入目标识别模型中,输出多个识别结果,其中,目标识别模型是通过向第一识别模型中添加目标网络模块得到的,目标网络模块用于对第一识别模型的网络分支进行扩展,识别结果表征待识别图像属于该识别结果所对应类别的概率;根据多个识别结果确定待识别图像所属的目标类别,并在目标类别满足预设条件的情况下,确定待识别图像为目标图像,其中,目标图像至少包括目标图形徽标。
[0007]进一步地,图像识别方法还包括:获取目标样本数据集;根据目标样本数据集对初始识别模型进行训练,得到训练后的识别模型;对训练后的识别模型的目标层网络结构进行融合处理,得到目标识别模型。
[0008]进一步地,图像识别方法还包括:获取第一识别模型,其中,第一识别模型至少包括反向残差结构,反向残差结构至少包括残差结构和串联结构;在残差结构的逐点卷积层与残差结构的深度卷积层之间,添加第一网络模块和第二网络模块,得到第一目标初始网络模块,其中,残差结构的深度卷积层的卷积核尺寸为第一尺寸,第一网络模块由批量归一化层组成,第二网络模块由批量归一化层和卷积核尺寸为第二尺寸的深度卷积层组成;在串联结构中添加第三网络模块,得到第二目标初始网络模块,其中,第三网络模块至少包括第一网络分支和第二网络分支,第一网络分支的深度卷积层的卷积核尺寸为第三尺寸,第二网络分支的深度卷积层的卷积核尺寸为第四尺寸,第一尺寸、第二尺寸、第三尺寸以及第
四尺寸的大小不同;基于第一目标初始网络模块和第二目标初始网络模块,生成初始识别模型。
[0009]进一步地,图像识别方法还包括:对第一网络模块中的批量归一化层进行转换处理,得到第一深度卷积层,其中,第一深度卷积层的卷积核尺寸为第一尺寸;对卷积核尺寸为第二尺寸的深度卷积层进行转换处理,得到第二深度卷积层,其中,第二深度卷积层的卷积核尺寸为第一尺寸;将第二网络模块中的批量归一化层与第二深度卷积层进行融合处理,得到第三深度卷积层,其中,第三深度卷积层的卷积核尺寸为第一尺寸;将第一深度卷积层、第三深度卷积层以及残差结构的深度卷积层进行融合处理,得到目标识别模型。
[0010]进一步地,图像识别方法还包括:获取样本数据集;对样本数据集进行图像增强处理,得到目标样本数据集,其中,图像增强处理至少包括随机混淆增强处理、背景替换增强处理。
[0011]进一步地,图像识别方法还包括:将目标识别模型转换为目标文件,并将目标文件集成至目标平台,其中,目标文件的格式为目标平台能够识别的文件格式。
[0012]进一步地,图像识别方法还包括:响应页面跳转指令,并显示预设页面,其中,预设页面用于引导目标对象参与预设页面上的活动。
[0013]根据本专利技术实施例的另一方面,还提供了一种图像识别装置,包括:获取模块,用于获取至少一个视频帧,其中,视频帧中至少包括待识别图像;处理模块,用于将待识别图像输入目标识别模型中,输出多个识别结果,其中,目标识别模型是通过向第一识别模型中添加目标网络模块得到的,目标网络模块用于对第一识别模型的网络分支进行扩展,识别结果表征待识别图像属于该识别结果所对应类别的概率;确定模块,用于根据多个识别结果确定待识别图像所属的目标类别,并在目标类别满足预设条件的情况下,确定待识别图像为目标图像,其中,目标图像至少包括目标图形徽标。
[0014]根据本专利技术实施例的另一方面,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的图像识别方法。
[0015]根据本专利技术实施例的另一方面,还提供了一种电子设备,该电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现用于运行程序,其中,程序被设置为运行时执行上述的图像识别方法。
[0016]在本专利技术实施例中,采用对第一识别模型进行改进以识别目标图像的方式,首先获取至少一个视频帧,然后将待识别图像输入目标识别模型中,输出多个识别结果,再根据多个识别结果确定待识别图像所属的目标类别,并在目标类别满足预设条件的情况下,确定待识别图像为目标图像。其中,目标图像至少包括目标图形徽标,视频帧中至少包括待识别图像,目标识别模型是通过向第一识别模型中添加目标网络模块得到的,目标网络模块用于对第一识别模型的网络分支进行扩展,识别结果表征待识别图像属于该识别结果所对应类别的概率。
[0017]在上述过程中,通过获取至少一个视频帧,为后续识别目标图像提供了准确的数据基础;通过向第一识别模型中添加目标网络模块,实现了对第一识别模型的改进,可以得到目标识别模型;通过目标识别模型可以实现对目标图像的识别,从而实现了对目标图形
徽标的识别,能够在缩小模型体积的前提下,提升模型的识别精度,提高模型的性能。
[0018]由此可见,通过本专利技术的技术方案,达到了对目标图形徽标准确识别的目的,从而实现了提高图像识别模型对图形徽标的识别准确度的技术效果,进而解决了现有技术中的图像识别模型对图形徽标的识别准确度低的技术问题。
附图说明
[0019]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0020]图1是根据本专利技术实施例的一种可选的图像识别方法的流程图;
[0021]图2是根据本专利技术实施例的一种可选的残差结构的示意图;
[0022]图3是根据本专利技术实施例的一种可选的串联结构的示意图;
[0023]图4是根据本专利技术实施例的一种可选的改进后的残差结构的训练示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取至少一个视频帧,其中,所述视频帧中至少包括待识别图像;将所述待识别图像输入目标识别模型中,输出多个识别结果,其中,所述目标识别模型是通过向第一识别模型中添加目标网络模块得到的,所述目标网络模块用于对所述第一识别模型的网络分支进行扩展,所述识别结果表征所述待识别图像属于该识别结果所对应类别的概率;根据多个所述识别结果确定所述待识别图像所属的目标类别,并在所述目标类别满足预设条件的情况下,确定所述待识别图像为目标图像,其中,所述目标图像至少包括目标图形徽标。2.根据权利要求1所述的方法,其特征在于,通过以下方法生成所述目标识别模型:获取目标样本数据集;根据所述目标样本数据集对初始识别模型进行训练,得到训练后的识别模型;对所述训练后的识别模型的目标层网络结构进行融合处理,得到所述目标识别模型。3.根据权利要求2所述的方法,其特征在于,在根据所述目标样本数据集对初始识别模型进行训练,得到训练后的识别模型之前,所述方法还包括:获取所述第一识别模型,其中,所述第一识别模型至少包括反向残差结构,所述反向残差结构至少包括残差结构和串联结构;在所述残差结构的逐点卷积层与所述残差结构的深度卷积层之间,添加第一网络模块和第二网络模块,得到第一目标初始网络模块,其中,所述残差结构的深度卷积层的卷积核尺寸为第一尺寸,所述第一网络模块由批量归一化层组成,所述第二网络模块由所述批量归一化层和卷积核尺寸为第二尺寸的深度卷积层组成;在所述串联结构中添加第三网络模块,得到第二目标初始网络模块,其中,所述第三网络模块至少包括第一网络分支和第二网络分支,所述第一网络分支的深度卷积层的卷积核尺寸为第三尺寸,所述第二网络分支的深度卷积层的卷积核尺寸为第四尺寸,所述第一尺寸、所述第二尺寸、所述第三尺寸以及所述第四尺寸的大小不同;基于所述第一目标初始网络模块和所述第二目标初始网络模块,生成所述初始识别模型。4.根据权利要求3所述的方法,其特征在于,对所述训练后的识别模型的目标层网络结构进行融合处理,得到所述目标识别模型,包括:对所述第一网络模块中的所述批量归一化层进行转换处理,得到第一深度卷积层,其中,所述第一深度卷积层的卷积核尺寸为所述第一尺寸;对所述卷积核尺寸为第二尺寸的深度卷积层进行转换处理,得到第二深度卷积层,其中,所述第二深...

【专利技术属性】
技术研发人员:刘乙赛罗涛施佳子李艳宇
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1