图像特征提取模型确定方法及装置、图像识别方法及装置制造方法及图纸

技术编号:34841881 阅读:24 留言:0更新日期:2022-09-08 07:39
本公开提供了一种图像特征提取模型确定方法及装置、图像识别方法及装置,涉及人工智能技术领域,尤其涉及计算机视觉技术领域。图像特征提取模型确定的具体实现方案为:获取训练样本集,其中,训练样本集中包括多个训练样本对,每个训练样本对中包括:完整图像和与完整图像对应的遮挡图像;对于每个训练样本对,利用教师模型提取训练样本对中的第一图像特征,并利用学生模型提取训练样本对中的第二图像特征;基于第一图像特征和第二图像特征构建目标损失函数;基于目标损失函数迭代训练学生模型,得到图像特征提取模型,图像特征提取模型用于在图像识别时提取待识别图像的图像特征。征。征。

【技术实现步骤摘要】
图像特征提取模型确定方法及装置、图像识别方法及装置


[0001]本公开涉及人工智能
,尤其涉及计算机视觉
中的一种模型训练方法及装置、图像识别方法及装置。

技术介绍

[0002]模型在训练后需要更改,以创建更紧凑的表示形式,这一过程的主要实现技术包括剪枝和知识蒸馏。其中,知识蒸馏的基本理念,是考虑到较大网络内部存在的稀疏性或冗余性,虽然大规模网络具有较高的表示能力,但如果网络容量未达到饱和,则可以用具有较低表示能力的较小网络表示。模型蒸馏,就是经过训练的卷积神经网络模型将知识转移到参数较少的小规模卷积神经网络模型的过程,即教师模型教导学生模型的过程。目前,相关技术中的蒸馏方法很难保证学生模型具有特征遮挡不变性。

技术实现思路

[0003]本公开提供了一种图像特征提取模型确定方法及装置、图像识别方法及装置。
[0004]根据本公开的一方面,提供了一种图像特征提取模型确定方法,该方法包括:获取训练样本集,其中,训练样本集中包括多个训练样本对,每个训练样本对中包括:完整图像和与完整图像对应的遮挡图像;对于每个训练样本对,利用教师模型提取训练样本对中的第一图像特征,并利用学生模型提取训练样本对中的第二图像特征;基于第一图像特征和第二图像特征构建目标损失函数;基于目标损失函数迭代训练学生模型,得到图像特征提取模型,图像特征提取模型用于在图像识别时提取待识别图像的图像特征。
[0005]根据本公开的另一方面,提供了一种图像识别方法,该方法包括:获取待识别图像;利用目标特征提取模型提取待识别图像的目标图像特征,其中,目标特征提取模型是通过本公开实施例的图像特征提取模型确定方法对学生模型进行训练得到。
[0006]根据本公开的另一方面,提供了一种图像特征提取模型确定装置,该装置包括:第一获取模块,用于获取训练样本集,其中,训练样本集中包括多个训练样本对,每个训练样本对中包括:完整图像和与完整图像对应的遮挡图像;第一提取模块,用于对于每个训练样本对,利用教师模型提取训练样本对中的第一图像特征,并利用学生模型提取训练样本对中的第二图像特征;构建模块,用于基于第一图像特征和第二图像特征构建目标损失函数;训练模块,用于基于目标损失函数迭代训练学生模型,得到目标特征提取模型,目标特征提取模型用于在图像识别时提取待识别图像的图像特征。
[0007]根据本公开的另一方面,提供了一种图像识别装置,该装置包括:第二获取模块,用于获取待识别图像;第二提取模块,用于利用图像特征提取模型提取待识别图像的目标图像特征,其中,图像特征提取模型是通过本公开实施例的图像特征提取模型确定方法对学生模型进行训练得到;识别模块,用于基于目标图像特征确定图像识别结果,并输出图像识别结果。
[0008]根据本公开的另一方面,还提供了一种电子设备,该电子设备包括:至少一个处理
器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开实施例的图像特征提取模型确定方法或本公开实施例的图像识别方法。
[0009]根据本公开的另一方面,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开实施例的图像特征提取模型确定方法或本公开实施例的图像识别方法。
[0010]根据本公开的另一方面,还提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本公开实施例的图像特征提取模型确定方法或本公开实施例的图像识别方法。
[0011]在本公开中,通过对完整图像进行处理得到遮挡图像并组成训练样本对,分别将完整图像和完整图像对应的遮挡图像输入教师模型和学生模型提取对应的图像特征,通过构建目标损失函数使学生模型提取的特征不断逼近教师模型提取的特征,使得最终训练得到的特征提取模型具有特征遮挡不变性,从而提升最终图像识别结果的准确性。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开实施例的一种图像特征提取模型确定方法的流程示意图;
[0015]图2a是根据本公开实施例的一种处理前的完整人脸图像的示意图;
[0016]图2b是根据本公开实施例的一种处理后的遮挡人脸图像的示意图;
[0017]图3是根据本公开实施例的一种模型蒸馏过程的示意图;
[0018]图4是根据本公开实施例的一种图像识别方法的流程示意图;
[0019]图5是根据本公开实施例的一种图像特征提取模型确定装置的结构示意图;
[0020]图6是根据本公开实施例的一种图像识别装置的结构示意图;
[0021]图7是根据本公开实施例的一种电子设备的结构示意图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]图1是根据本公开实施例的一种图像特征提取模型确定方法的流程图。如图1所示,该方法可以包括步骤S102

S108,其中:
[0024]步骤S102,获取训练样本集,其中,训练样本集中包括多个训练样本对,每个训练样本对中包括:完整图像和与完整图像对应的遮挡图像。
[0025]通常,在模型蒸馏过程中,采用的训练样本图像都是随机获取,由于部分图像中可能存在遮挡区域,会对训练效果产生较大影响,很难保证蒸馏得到的学生模型具有特征遮挡不变性。为此,本公开首先对训练样本进行了处理,将完整图像和与该完整图像对应的遮
挡图像组成训练样本对,用于后续的模型训练。
[0026]其中,完整图像指的是没有画面信息丢失的图像,是与后面处理得到的遮挡图像相对而言的,在实际应用过程中,使用直接从图像采集设备或其他存储设备中正常采集的图像即可。
[0027]图像的类型也可以根据模型应用的场景自行选择,例如在行人识别场景中,可以采集多张行人图像;在车辆识别场景中,可以采集多张车辆图像;在人脸识别场景中,可以采集多张人脸图像。
[0028]步骤S104,对于每个训练样本对,利用教师模型提取训练样本对中的第一图像特征,并利用学生模型提取训练样本对中的第二图像特征。
[0029]教师模型和学生模型可以是根据应用场景选择的用于图像特征提取的神经网络模型,教师模型通常为参数较多的大规模卷积神经网络模型,而学生模型则为参数较少的小规模卷积神经网络模型。
[0030]其中,第一图像特征包括:由教师模型提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像特征提取模型确定方法,包括:获取训练样本集,其中,所述训练样本集中包括多个训练样本对,每个所述训练样本对中包括:完整图像和与所述完整图像对应的遮挡图像;对于每个所述训练样本对,利用教师模型提取所述训练样本对中的第一图像特征,并利用学生模型提取所述训练样本对中的第二图像特征;基于所述第一图像特征和所述第二图像特征构建目标损失函数;基于所述目标损失函数迭代训练所述学生模型,得到图像特征提取模型,所述图像特征提取模型用于在图像识别时提取待识别图像的图像特征。2.根据权利要求1所述的方法,其中,所述获取训练样本集包括:获取多张所述完整图像;对于每张所述完整图像,将所述完整图像进行栅格化处理,并以预设方式遮挡所述完整图像中的部分栅格化区域,得到与所述完整图像对应的所述遮挡图像,将所述遮挡图像和所述完整图像组成一个所述训练样本对;将多张所述完整图像对应的多个所述训练样本对构成所述训练样本集。3.根据权利要求2所述的方法,其中,所述将所述完整图像进行栅格化处理,并以预设方式遮挡所述完整图像中的部分栅格化区域包括:将所述完整图像均匀划分为第一数量的栅格化区域;基于预设比例,从所述第一数量的栅格化区域中随机确定第二数量的目标栅格化区域,利用目标颜色覆盖所述目标栅格化区域。4.根据权利要求1所述的方法,其中,所述第一图像特征包括:由所述教师模型提取的所述完整图像的第一完整图像特征和所述遮挡图像的第一遮挡图像特征;所述第二图像特征包括:由所述学生模型提取的所述完整图像的第二完整图像特征和所述遮挡图像的第二遮挡图像特征。5.根据权利要求4所述的方法,其中,所述目标损失函数用于表示以下信息至少之一:所述第一完整图像特征和所述第二完整图像特征之间的差异,所述第一完整图像特征和所述第二遮挡图像特征之间的差异,所述第一遮挡图像特征和所述第二完整图像特征之间的差异,所述第一遮挡图像特征和所述第二遮挡图像特征之间的差异。6.根据权利要求1所述的方法,其中,所述基于所述目标损失函数迭代训练所述学生模型,得到图像特征提取模型包括:依次将所述多个训练样本对分别输入所述教师模型和所述学生模型进行特征提取,并基于所述目标损失函数迭代调整所述学生模型的模型参数,得到所述图像特征提取模型。7.根据权利要求1所述的方法,其中,所述学生模型中包括用于提取所述完整图像的特征的第一特征提取子模型和用于提取所述遮挡图像的特征的第二特征提取子模型,在得到所述图像特征提取模型后,所述方法还包括:获取测试样本图像;将所述测试样本图像输入所述图像特征提取模型,得到特征提取结果,其中...

【专利技术属性】
技术研发人员:杨馥魁
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1