训练方法及装置、指纹识别方法及装置、电子设备制造方法及图纸

技术编号:27976797 阅读:28 留言:0更新日期:2021-04-06 14:11
本发明专利技术涉及一种训练方法及装置、指纹识别方法及装置、电子设备及存储介质,该训练方法包括:对获取到的样本图像集进行特征提取,得到样本特征;对样本特征进行预处理,得到预处理特征;根据预处理特征,计算样本图像集所包括的所有样本对的比对损失之和;计算样本图像集所包括的所有样本对的分类损失之和;根据比对损失之和与分类损失之和进行训练。在训练过程时,相较于传统的训练神经网络模型的方式,多出比对损失之和,可将同类样本之间的距离拉近,并放大不同类样本之间的距离,从而形成多个更为紧凑的特征分布,便于正在被训练的神经网络模型可以充分学习到各类样本之间的边界。

【技术实现步骤摘要】
训练方法及装置、指纹识别方法及装置、电子设备
本申请属于机器学习领域,具体涉及一种训练方法及装置、指纹识别方法及装置、电子设备及存储介质。
技术介绍
在通过训练样本对卷积神经网络模型进行训练后,卷积神经网络模型所要实现的最终效果是对正负样本进行准确的分类。其中,训练样本中由同一个项目或同一个设备所产生的样本称之为同一个域的样本,或同一个样本类型的样本。目前对于卷积神经网络模型的训练,通常依靠与该卷积神经网络模型所对接的项目相同或相似的过往项目所累计的训练数据作为训练样本来进行训练,也就是说,训练样本中可能包括来自于不同域的样本,且每个域的样本均包含正样本以及负样本。训练的过程是针对训练样本的分类损失之和进行学习,从而学习到一个用于区分正负样本的决策面。然而,这种简单复用过往数据进行训练的方式,没有考虑到训练样本中各个域的样本之间的差异,导致决策面可能对某个域的样本过拟合,使得其他域的正负样本之间的特征距离过近,进一步导致训练得到的神经网络模型,能够对过拟合的域的正负样本进行准确区分,却难以对特征距离过近的其他域的正负样本进行准确区分,影响了卷积神经网络模型的泛化性。
技术实现思路
有鉴于此,本申请的目的在于提供一种训练方法及装置、指纹识别方法及装置、电子设备及存储介质,使得训练得到的神经网络模型具有更好的泛化性。本申请的实施例是这样实现的:第一方面,本申请实施例提供一种训练方法,用于对神经网络模型进行训练,所述神经网络模型包括主干网络及比对学习损失网络,所述方法包括:通过所述主干网络对获取到的样本图像集进行特征提取,得到样本特征;通过所述比对学习损失网络对所述样本特征进行预处理,得到预处理特征;根据所述预处理特征,计算得到所述样本图像集所包括的所有样本对的比对损失之和;根据所述样本特征,计算得到所述样本图像集所包括的所有样本的分类损失之和;根据所述比对损失之和及所述分类损失之和,对所述神经网络模型进行训练。本方案所提供的神经网络训练方法,在对神经网络模型进行训练时,相较于传统的训练神经网络模型的方式,多出一个比对损失之和。神经网络模型对该比对损失之和的训练学习时,通过梯度计算,可以解算出用于表征各个样本之间的比对差异的参数。神经网络模型通过对该参数的学习,可以尽可能学习到各个域的同类样本以及各个域的不同类样本之间的比对差异,使得神经网络模型在形成特征空间时,不仅可以考虑正负样本之间的差异,还可以考虑域所带来的差异,从而避免对训练集中的某些特定域的样本过拟合,有利于增强神经网络模型的泛化性。结合第一方面实施例,在一种可能的实施方式中,所述根据所述比对损失之和及所述分类损失之和,对所述神经网络模型进行训练,包括:将所述比对损失之和与所述分类损失之和进行加权求和,并将加权求和后得到的参数在所述神经网络模型内进行反向传播。结合第一方面实施例,在一种可能的实施方式中,所述样本图像集内所包括的每个样本具有样本标签,所述对所述样本特征进行预处理,得到预处理特征,包括:对所述样本图像集所包括的每个样本对应的样本特征进行全局平均池化,得到与所述每个样本对应的全局特征;根据所述每个样本对应的全局特征,计算所述样本图像集所包括的每个样本对对应的特征距离;根据所述每个样本具有的样本标签,计算所述样本图像集的正负样本对掩膜矩阵;所述预处理特征为与所述每个样本对对应的特征距离及所述正负样本对掩膜矩阵。结合第一方面实施例,在一种可能的实施方式中,根据所述每个样本具有的样本标签,计算所述样本图像集的正负样本对掩膜矩阵,包括:基于公式M={mi,j|mi,j=(yi==yj)},计算所述样本图像集的正负样本对掩膜矩阵;其中,若第i个样本的样本标签yi与第j个样本的样本标签yj相同,则第i个样本与第j个样本所组成的样本对为正样本对,所述正样本对在所述正负样本对掩膜矩阵中对应的参数为1;若第i个样本的样本标签yi与第j个样本的样本标签yj不相同,则第i个样本与第j个样本所组成的样本对为负样本对,所述负样本对在所述正负样本对掩膜矩阵中对应的参数为0。结合第一方面实施例,在一种可能的实施方式中,所述计算所述样本图像集所包括的每个样本对对应的特征距离,包括:针对由第i个样本xi与第j个样本xj所组成的样本对,将xi的全局特征中的每个特征与xj的全局特征中的每个特征之间的差的平方进行求和,并将最后得到的和值开方后所得到的值确定为第i个样本xi与第j个样本xj所组成的样本对对应的特征距离。结合第一方面实施例,在一种可能的实施方式中,所述预处理特征为所述样本图像集所包括的每个样本对对应的特征距离及所述样本图像集的正负样本对掩膜矩阵,所述根据所述预处理特征,计算得到所述样本图像集所包括的所有样本对的比对损失之和,包括:将所述样本图像集所包括的所有正样本对的比对损失进行求和,得到正样本对比对损失之和;将所述样本图像集所包括的所有负样本对的比对损失进行求和,得到负样本对比对损失之和;将所述正样本对比对损失之和与所述负样本对比对损失之和进行求和,得到所述比对损失之和;其中,针对所述样本图像集所包括的每个正样本对,该正样本对的比对损失为:该正样本对在所述正负样本对掩膜矩阵中对应的参数与该正样本对对应的特征距离之积;针对所述样本图像集所包括的每个负样本对,该负样本对的比对损失为:该负样本对在所述正负样本对掩膜矩阵中对应的参数与该负样本对的特征距离优化值之积;该负样本对的特征距离优化值是:预设的参数与该负样本对对应的特征距离之差与0中的较大值。结合第一方面实施例,在一种可能的实施方式中,所述根据所述样本特征,计算得到所述样本图像集所包括的所有样本的分类损失之和,包括:根据所述样本特征,计算所述样本图像集所包括的每个样本的交叉熵,并将得到的每个交叉熵进行求和,得到所述分类损失之和。结合第一方面实施例,在一种可能的实施方式中,所述神经网络模型用于识别屏下指纹活体以及异物。第二方面,本申请实施例提供一种训练装置,用于对神经网络模型进行训练,所述神经网络模型包括主干网络以及比对学习损失网络。所述训练装置包括:特征提取模块、预处理模块、计算模块以及训练模块。特征提取模块,用于通过所述主干网络对获取到的样本图像集进行特征提取,得到样本特征;预处理模块,用于通过所述比对学习损失网络对所述样本特征进行预处理,得到预处理特征;计算模块,用于根据所述预处理特征,计算得到所述样本图像集所包括的所有样本对的比对损失之和;所述计算模块,还用于根据所述样本特征,计算得到所述样本图像集所包括的所有样本的分类损失之和;训练模块,用于根据所述比对损失之和及所述分类损失之和,对所述神经网络模型进行训练。结合第二方面实施例,在一种可能的实施方式中,所述训练模块,用于将所述比对损失之和与所述分类损失之和进行加权求和,并将加权求和后得到的参数在所述神经网络模型内进行反向传播。结合第二方面实施例,在一种可能的实施方式中,所述样本图像集内所包括的每个样本具有样本标签,所述预处理模块,用于通过所述比对学习损失网络本文档来自技高网...

【技术保护点】
1.一种训练方法,其特征在于,用于对神经网络模型进行训练,所述神经网络模型包括主干网络及比对学习损失网络,所述方法包括:/n通过所述主干网络对获取到的样本图像集进行特征提取,得到样本特征;/n通过所述比对学习损失网络对所述样本特征进行预处理,得到预处理特征;/n根据所述预处理特征,计算得到所述样本图像集所包括的所有样本对的比对损失之和;/n根据所述样本特征,计算得到所述样本图像集所包括的所有样本的分类损失之和;/n根据所述比对损失之和及所述分类损失之和,对所述神经网络模型进行训练。/n

【技术特征摘要】
1.一种训练方法,其特征在于,用于对神经网络模型进行训练,所述神经网络模型包括主干网络及比对学习损失网络,所述方法包括:
通过所述主干网络对获取到的样本图像集进行特征提取,得到样本特征;
通过所述比对学习损失网络对所述样本特征进行预处理,得到预处理特征;
根据所述预处理特征,计算得到所述样本图像集所包括的所有样本对的比对损失之和;
根据所述样本特征,计算得到所述样本图像集所包括的所有样本的分类损失之和;
根据所述比对损失之和及所述分类损失之和,对所述神经网络模型进行训练。


2.根据权利要求1所述的方法,其特征在于,所述根据所述比对损失之和及所述分类损失之和,对所述神经网络模型进行训练,包括:
将所述比对损失之和与所述分类损失之和进行加权求和,并将加权求和后得到的参数在所述神经网络模型内进行反向传播。


3.根据权利要求1所述的方法,其特征在于,所述样本图像集内所包括的每个样本具有样本标签,所述对所述样本特征进行预处理,得到预处理特征,包括:
对所述样本图像集所包括的每个样本对应的样本特征进行全局平均池化,得到与所述每个样本对应的全局特征;
根据所述每个样本对应的全局特征,计算所述样本图像集所包括的每个样本对对应的特征距离;
根据所述每个样本具有的样本标签,计算所述样本图像集的正负样本对掩膜矩阵;
所述预处理特征为与所述每个样本对对应的特征距离及所述正负样本对掩膜矩阵。


4.根据权利要求3所述的方法,其特征在于,根据所述每个样本具有的样本标签,计算所述样本图像集的正负样本对掩膜矩阵,包括:
若第i个样本的样本标签yi与第j个样本的样本标签yj相同,则第i个样本与第j个样本所组成的样本对为正样本对,所述正样本对在所述正负样本对掩膜矩阵中对应的参数为1;
若第i个样本的样本标签yi与第j个样本的样本标签yj不相同,则第i个样本与第j个样本所组成的样本对为负样本对,所述负样本对在所述正负样本对掩膜矩阵中对应的参数为0。


5.根据权利要求1所述的方法,其特征在于,所述预处理特征为所述样本图像集所包括的每个样本对对应的特征距离及所述样本图像集的正负样本对掩膜矩阵,所述根据所述预处理特征,计算得到所述样本图像集所包括的所有样本对的比对损失之和,包括:
将所述样本图像集所包括的所有正样本对的比对损失进行求和,得到正样本对比对损失之和;
将所述样本图像集所包括的所有负样本对的比对损失进行求和,得到负样本对比对损失之和;
将所述正样本对比对损失之和与所述负样本对比对损失...

【专利技术属性】
技术研发人员:魏思远梁嘉骏
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1