【技术实现步骤摘要】
一种基于新型损失函数的卷积神经网络目标分类方法
本申请涉及信息
,特别是涉及一种基于新型损失函数的卷积神经网络目标分类方法。
技术介绍
目前,神经网络模型在模式识别、自动控制、信号处理、辅助决策、人工智能等众多研究领域取得了广泛的成功,尤其在图像分类方面,已经在我们周围有着广泛的应用,例如,数字识别,衣物分类,人脸识别等。而在神经网络中卷积神经网络对于图像分类具有良好的效果,尤其在人脸识别方面卷积神经网络有着广泛用的应用。在基于卷积神经网络的人脸识别系统中,损失函数作为判断所训练神经网络和训练数据集间契合程度的标准,对人脸识别的实际效果有着重要影响。ArcFace作为目前常用的损失函数,ArcFace在损失函数中引入加角余量,可以增大类间间距,当加角余量取较大值时,加角余量约束也会减小类内距离,从而使人脸识别的效果得到提升。而为了达到好的训练效果,损失函数所取的加角余量较大,从而导致训练数据集所有类的特征中心会远离,特征中心会趋向于均匀分布,这与实际的特征中心在特征空间上散乱分布的情况不符,存在对训练数据集的过 ...
【技术保护点】
1.一种基于新型损失函数的卷积神经网络目标分类方法,其特征在于,应用于模型训练过程,所述方法包括:/n步骤A,获取样本图像的特征向量;/n步骤B,计算所述样本图像的特征向量与各子类特征中心向量间的第一余弦值向量,其中,所述第一余弦值向量包括所述样本图像的特征向量与各子类特征中心向量间的夹角的余弦值;/n步骤C,根据所述第一余弦值向量,确定所述第一余弦值向量的第一夹角,其中,所述第一夹角为所述样本图像的特征向量与目标类特征中心向量间的夹角,所述目标类特征中心向量为所述样本图像对应的正确分类所对应的所述子类特征中心向量;/n步骤D,分别计算所述目标类特征中心向量与各子类特征中心 ...
【技术特征摘要】 【专利技术属性】
1.一种基于新型损失函数的卷积神经网络目标分类方法,其特征在于,应用于模型训练过程,所述方法包括:
步骤A,获取样本图像的特征向量;
步骤B,计算所述样本图像的特征向量与各子类特征中心向量间的第一余弦值向量,其中,所述第一余弦值向量包括所述样本图像的特征向量与各子类特征中心向量间的夹角的余弦值;
步骤C,根据所述第一余弦值向量,确定所述第一余弦值向量的第一夹角,其中,所述第一夹角为所述样本图像的特征向量与目标类特征中心向量间的夹角,所述目标类特征中心向量为所述样本图像对应的正确分类所对应的所述子类特征中心向量;
步骤D,分别计算所述目标类特征中心向量与各子类特征中心向量间夹角的余弦值,将目标类特征中心向量自身相乘的对应项置零,确定其中最大的余弦值对应的夹角值,通过第一预设公式得到动态加角余量;
步骤E,根据所述动态夹角余量与所述第一夹角,通过第二预设公式得到第二夹角,通过对所述第二夹角求余弦,得到第二余弦值,并利用所述第二余弦值替换所述第一余弦值向量中特征向量与所述目标类特征中心向量间的夹角的余弦值,得到第二余弦值向量;
步骤F,将所述第二余弦值向量输入模型的归一化层,通过所述归一化层获取样本图像的特征分布概率;
步骤G,通过预设损失函数,根据所述特征分布概率,计算模型的损失;
步骤H,根据所述模型的损失,对模型的参数进行调整;
步骤I,重复上述步骤A至步骤H,直至所述模型的损失小于预设率阈值时,得到训练好的模型。
2.根据权利要求1所述的方法,其特征在于,所述分别计算所述目标类特征中心向量与各子类特征中心向量间夹角的余弦值,将目标类特征中心向量自身相乘的对应项置零,确定其中最大的余弦值对应的夹角值,通过第一预设公式得到动态加角余量,包括:
分别计算所述目标类特征中心向量与各子类特征中心向量间夹角的余弦值,将目标类特征中心向量自身相乘的对应项置零,确定其中最大的余弦值对应的夹角值,通过公式:
得到动态加角余量,其中,l、s、b是经验值的超参数,θmax为最大的余弦值对应的夹角值,vyi为动态加角余量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述动态夹角余量与所述第一夹角,通过第二预设公式得到第二夹角,通过对所述第二夹角求余弦,得到第二余弦值,并利用所述第二余弦值替换所述第一余弦值向量中特征向量与所述目标类特征中心向量间的夹角的余弦值,得到第二余弦值向量,包括:
根据所述动态加角余量以及所述目标类特征中心向量间的夹角,通过公式:
θ′yi=θyi+vyi
得到第二夹角,其中,vyi为动态加角余量,θyi为特征向量与目标类特征中心向量间的夹角,θyi′为通过第二预设公式求得的第二夹角;
根据第二夹角,通过对所述第二夹角求余弦,得到第二余弦值,并利用所述第二余弦值替换所述第一余弦值向量中特征向量与目标类特征中心向量间的夹角的余弦值,得到第二余弦值向量。
4.根据权利要求1所述的方法,其特征在于,所述通过预设损失函数,根据所述特征分布概率,计算模型的损失,包括:
通过公式:
根据所述特征分布概率,计算模型的损失,其中,L为分类概率的损失,yj为第j个样本图像的实际分类的概率,Sj为第j个样本图像的特征分布概率。
5.一种基于新型损失函数的卷积神经网络目标分类装置,其特征在于,应用于模型训练过程,所述装置包括:
向量获取模块,用于获取样本图像的特征向量;
技术研发人员:焦继超,邓中亮,刘炜伦,莫耀凯,邱德武,焦剑,崔岩松,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。