图像识别方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号:39308150 阅读:10 留言:0更新日期:2023-11-12 15:55
本申请公开了提供一种图像识别方法、装置、计算机可读介质及电子设备,所述方法包括:分别对第一样本图像和第二样本图像进行语义信息提取,得到第一样本图像对应的第一语义信息和第二样本图像对应的第二语义信息;将第一语义信息和第二语义信息进行混合,得到语义混合数据;分别对第一样本图像和第二样本图像进行频域信息提取,得到第一样本图像对应的第一频域信息和第二样本图像对应的第二频域信息;将第一频域信息和第二频域信息进行混合,得到频域混合数据;根据语义混合数据和频域混合数据对预设分类模型进行训练,得到用于确定待识别图像的类别的图像识别模型。本申请技术方案增加了模型训练数据的丰富性,提高了图像识别准确性。准确性。准确性。

【技术实现步骤摘要】
图像识别方法、装置、计算机可读介质及电子设备


[0001]本申请属于图像处理
,具体涉及一种图像识别方法、装置、计算机可读介质及电子设备。

技术介绍

[0002]图像识别是一种利用计算机对图像进行处理、分析和理解,以识别出图像中所包含的目标和对象的技术,基于深度学习算法所开发的模型被广泛用于图像识别。为了得到能够准确进行图像识别的模型,通常需要使用大量的样本图像对模型进行训练。然而,通过这种方式训练得到的模型在进行图像识别时,通常能够对与样本图像具有相似场景的图像进行较为准确的识别,当待识别图像与样本图像之间的场景变化较大时,模型识别的准确性下降,有待改进。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本申请的目的在于提供一种图像识别方法、装置、计算机可读介质及电子设备,以优化相关技术中图像识别准确性不高的问题。
[0005]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0006]根据本申请实施例的一个方面,提供一种图像识别方法,包括:
[0007]分别对第一样本图像和第二样本图像进行语义信息提取,得到所述第一样本图像对应的第一语义信息和所述第二样本图像对应的第二语义信息;
[0008]将所述第一语义信息和所述第二语义信息进行混合,得到语义混合数据;
[0009]分别对所述第一样本图像和所述第二样本图像进行频域信息提取,得到所述第一样本图像对应的第一频域信息和所述第二样本图像对应的第二频域信息;
[0010]将所述第一频域信息和所述第二频域信息进行混合,得到频域混合数据;
[0011]根据所述语义混合数据和所述频域混合数据对预设分类模型进行训练,得到图像识别模型,所述图像识别模型用于确定待识别图像的类别。
[0012]根据本申请实施例的一个方面,提供一种图像识别装置,包括:
[0013]语义信息提取模块,用于分别对第一样本图像和第二样本图像进行语义信息提取,得到所述第一样本图像对应的第一语义信息和所述第二样本图像对应的第二语义信息;
[0014]语义信息混合模块,用于将所述第一语义信息和所述第二语义信息进行混合,得到语义混合数据;
[0015]频域信息提取模块,用于分别对所述第一样本图像和所述第二样本图像进行频域信息提取,得到所述第一样本图像对应的第一频域信息和所述第二样本图像对应的第二频
域信息;
[0016]频域信息混合模块,用于将所述第一频域信息和所述第二频域信息进行混合,得到频域混合数据;
[0017]模型训练模块,用于根据所述语义混合数据和所述频域混合数据对预设分类模型进行训练,得到图像识别模型,所述图像识别模型用于确定待识别图像的类别。
[0018]在本申请的一个实施例中,所述第一语义信息包括第一前景信息和第一背景信息,所述第二语义信息包括第二前景信息和第二背景信息;语义信息混合模块具体用于:
[0019]将所述第一前景信息和所述第二前景信息混合,得到混合前景信息;
[0020]将所述第一背景信息和所述第二背景信息混合,得到混合背景信息;
[0021]将所述混合前景信息和所述混合背景信息混合,得到所述语义混合数据。
[0022]在本申请的一个实施例中,所述第一频域信息包括第一低频信息和第一高频信息,所述第二频域信息包括第二低频信息和第二高频信息;频域信息混合模块具体用于:
[0023]将所述第一低频信息和所述第二低频信息混合,得到混合低频信息;
[0024]将所述第一高频信息和所述第二高频信息混合,得到混合高频信息;
[0025]将所述混合低频信息和所述混合高频信息混合,得到目标混合数据;
[0026]对所述目标混合数据进行频域逆变换,得到所述频域混合数据。
[0027]在本申请的一个实施例中,频域信息提取模块包括:
[0028]频域变换单元,用于对所述第一样本图像进行频域变换,得到所述第一样本图像的频域数据;
[0029]振幅计算单元,用于根据所述第一样本图像的频域数据计算所述第一样本图像的振幅;
[0030]频域信息确定单元,用于根据所述第一样本图像的振幅得到所述第一样本图像对应的第一频域信息。
[0031]在本申请的一个实施例中,所述第一频域信息包括第一低频信息和第一高频信息;所述频域信息确定单元具体用于:
[0032]将所述第一样本图像的振幅的实部作为所述第一样本图像的第一低频信息;
[0033]将所述第一样本图像的振幅的虚部作为所述第一样本图像的第一高频信息。
[0034]在本申请的一个实施例中,模型训练模块包括:
[0035]标签混合单元,用于将所述第一样本图像的第一样本类别标签和所述第二样本图像的第二样本类别标签进行混合,得到混合数据类别标签;
[0036]模型训练单元,用于以所述语义混合数据和所述频域混合数据作为训练数据,以所述混合数据类别标签作为所述训练数据的类别标签,对所述预设分类模型进行训练,得到图像识别模型。
[0037]在本申请的一个实施例中,所述标签混合单元具体用于:
[0038]通过第一权重对所述第一样本类别标签和所述第二样本类别标签进行线性组合,得到第一标签数据;
[0039]通过第二权重对所述第一样本类别标签和所述第二样本类别标签进行线性组合,得到第二标签数据;
[0040]通过第三权重对所述第一标签数据和所述第二标签数据进行线性组合,得到所述
混合数据类别标签。
[0041]根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的图像识别方法。
[0042]根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器执行所述可执行指令使得所述电子设备执行如以上技术方案中的图像识别方法。
[0043]根据本申请实施例的一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上技术方案中的图像识别方法。
[0044]在本申请实施例提供的技术方案中,通过分别对第一样本图像和第二样本图像进行语义信息提取和频域信息提取,并将提取到的第一语义信息和第二语义信息进行混合,得到语义混合数据,以及将提取到的第一频域信息和第二频域信息进行混合,得到频域混合数据,增加了模型训练数据中图像语义信息的丰富性和频域信息的丰富性,使得模型具有更多的学习数据,从而提高图像识别准确性。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:分别对第一样本图像和第二样本图像进行语义信息提取,得到所述第一样本图像对应的第一语义信息和所述第二样本图像对应的第二语义信息;将所述第一语义信息和所述第二语义信息进行混合,得到语义混合数据;分别对所述第一样本图像和所述第二样本图像进行频域信息提取,得到所述第一样本图像对应的第一频域信息和所述第二样本图像对应的第二频域信息;将所述第一频域信息和所述第二频域信息进行混合,得到频域混合数据;根据所述语义混合数据和所述频域混合数据对预设分类模型进行训练,得到图像识别模型,所述图像识别模型用于确定待识别图像的类别。2.根据权利要求1所述的图像识别方法,其特征在于,所述第一语义信息包括第一前景信息和第一背景信息,所述第二语义信息包括第二前景信息和第二背景信息;将所述第一语义信息和所述第二语义信息进行混合,得到语义混合数据,包括:将所述第一前景信息和所述第二前景信息混合,得到混合前景信息;将所述第一背景信息和所述第二背景信息混合,得到混合背景信息;将所述混合前景信息和所述混合背景信息混合,得到所述语义混合数据。3.根据权利要求1所述的图像识别方法,其特征在于,所述第一频域信息包括第一低频信息和第一高频信息,所述第二频域信息包括第二低频信息和第二高频信息;将所述第一频域信息和所述第二频域信息进行混合,得到频域混合数据,包括:将所述第一低频信息和所述第二低频信息混合,得到混合低频信息;将所述第一高频信息和所述第二高频信息混合,得到混合高频信息;将所述混合低频信息和所述混合高频信息混合,得到目标混合数据;对所述目标混合数据进行频域逆变换,得到所述频域混合数据。4.根据权利要求1所述的图像识别方法,其特征在于,对所述第一样本图像进行频域信息提取,得到所述第一样本图像对应的第一频域信息,包括:对所述第一样本图像进行频域变换,得到所述第一样本图像的频域数据;根据所述第一样本图像的频域数据计算所述第一样本图像的振幅;根据所述第一样本图像的振幅得到所述第一样本图像对应的第一频域信息。5.根据权利要求4所述的图像识别方法,其特征在于,所述第一频域信息包括第一低频信息和第一高频信息;根据所述第一样本图像的振幅得到所述第一样本图像对应的第一频域信息,包括:将所述第一样本图像的振幅的实部作为所述第...

【专利技术属性】
技术研发人员:刘浩哲张文天谢金衡李悦翔黄雅雯郑冶枫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1