基于改进SoftMax损失函数的图像相似度计算方法技术

技术编号:19693975 阅读:45 留言:0更新日期:2018-12-08 11:43
本发明专利技术公开了一种基于改进型Soft‑Max损失函数的图像相似度计算方法,图像识别网络中的改进型Soft‑Max层的激活函数采用改进型Soft‑Max激活函数,反向传播过程中采用改进型Soft‑Max损失函数更新网络权值,改进型Soft‑Max损失函数与传统的Soft‑Max损失函数相比增加了通过图像识别网络学习得到的决策边缘;在测试阶段用训练好的图像识别模型对两张测试图像提取特征向量,计算得到特征向量之间的余弦相似度,和设置的图像相似度阈值比较,如果大于等于图像相似度阈值则判定两张图像为同一类图像,如果小于图像相似度阈值则判定两张图像为不同类图像。

【技术实现步骤摘要】
基于改进SoftMax损失函数的图像相似度计算方法
本专利技术属于深度神经网络提取图像特征的深度学习领域,涉及到神经网络、模式识别等技术,尤其涉及到一种基于改进型Soft-Max损失函数的图像相似度计算方法。
技术介绍
图像识别技术是现今人工智能以及模式识别的研究热点,是一种根据观测到的图像对其中的物体进行类别鉴别的生物识别技术。它在航空航天、医学、工业自动化、机器人、及军事等领域都有广泛的应用。随着科技的发展,图像识别的应用范围不断扩大,逐渐从公安刑侦领域,推广到工业邻域,如做激光定位切割、定位打标、定位焊接时非常需要图像识别技术的帮助、自动化生产线物品的分类等,也被广泛应用于安防领域。这些应用是用在现实场景过程中所以对于识别准确率有较高要求,但是现代图像识别技术的一个不足就是识别准确率比较低,现实场景中的图像识别效果及准确率明显偏低,在实时场景中的图像常常受到光照、遮挡等影响,造成图像噪声过大,对于抓拍到的图像存在识别准确率比较低的问题。解决上述问题的关键就是要克服图像识别准确率的问题,本专利技术根据深度神经网络和改进型Soft-Max损失函数训练图像识别模型,提高现实场景下图像识别准确率。目前,深度学习由于其强大的表征能力,提取的特征相比传统方法手工构造的特征具有更强的鲁棒性,因此被广泛应用于图像识别中。用深度学神经网络和传统的Soft-Max损失函数训练的图像识别模型比传统方法训练的模型在识别准确率上要高很多,但是识别准确率还是有待提高。所以要实现高识别准确率的图像识别要通过更有效的解决方法。
技术实现思路
本专利技术克服了现有技术的不足之处,提出了一种基于改进型Soft-Max损失函数的图像相似度计算方法,意在利用改进型Soft-Max损失函数训练出高识别准确率的图像识别模型,提高现实场景中图像识别过程的图像分类正确性。本专利技术为达上述专利技术目的,采用如下技术方案:一种基于改进型Soft-Max损失函数的图像相似度计算方法,其步骤包括:步骤(1):准备图像识别训练数据集和,将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练,所述基于卷积神经网络的图像识别网络中包含卷积层,最大采样层,全连接层,改进型Soft-Max层四种网络层,其中,一个卷积层与一个最大采样层构成一个图像识别子结构,图像识别网络包含N个串联的子结构,图像识别网络的最后三层分别为图像特征层、图像分类层和改进型Soft-Max层,所述图像特征层和图像分类层分别为输出维度是C维和D维的全连接层,C表示图像特征数,D表示图像类别数,改进型Soft-Max层激活函数为:其中,σ(xi)表示在图像识别网络中的改进型Soft-Max层对第i个样本属于正确类别的预测概率值,xi∈Rd表示第i个样本在图像识别网络中的图像特征层的输出值,yi表示第i个样本的图像类别标签,wj表示图像特征层与图像分类层之间的权重的第j列,b表示偏置项,n表示总训练样本的类别数,m表示决策边缘,由网络训练得到。步骤(2):选用改进型Soft-Max损失函数来进行图像识别网络的反向传播更新网络权值,训练得到一个图像识别的模型,所述改进型Soft-Max损失函数计算公式为:进一步地,图像识别网络中的图像特征层和图像分类层之间的反向传播求导公式为:第i个样本的损失函数对决策边缘m求偏导的公式为:第i个样本的损失函数对权重wyi求偏导的公式为:第i个样本的损失函数对偏置项bi求偏导的公式为:第i个样本的损失函数对权重wj求偏导的公式为:其中,Li表示第i个样本的损失值,xi∈Rd表示第i个样本在图像识别网络中的图像特征层的输出值,yi表示第i个样本的图像类别标签,wj表示图像特征层与图像分类层之间的权重的第j列,b表示偏置项,n表示总训练样本的类别数,λ表示权重系数,m表示决策边缘,由网络训练得到。步骤(3):将两张待测试的图像P1和P2利用步骤(2)中得到的图像识别模型进行图像特征的提取,分别得到图像特征向量Pf1和Pf2,通过计算得到Pf1和Pf2之间的余弦相似度Pc,设置图像相似度阈值为Pt,如果Pc≥Pt,则判定图像P1和P2是同一类图像,如果Pc<Pt,则判定图像P1和P2不是同一类图像,所述图像特征为步骤(1)中的图像特征层的输出。与现有技术相比,本专利技术的有益效果体现在:本专利技术采取改进型Soft-Max损失函数的图像相似度计算方法,采用基于深度学习的图像识别网络提取图像特征,使得提取到的特征具有更强的图像特征表达能力,能够有效避免传统手工方法提取的特征由于表征能力不足造成的图像识别准确率不高的问题,图像识别网络中的改进型Soft-Max层的激活函数采用改进型Soft-Max激活函数,反向传播过程中采用改进型Soft-Max损失函数更新网络权值,使得图像特征具有更大的类间距离和更小的类内距离,训练得到图像识别模型;在测试阶段用训练好的图像识别模型对两张测试图像提取特征向量,计算得到特征向量之间的余弦相似度,和设置的图像相似度阈值比较,如果大于等于图像相似度阈值则判定两张图像为同一类图像,如果小于图像相似度阈值则判定两张图像为不同类图像;本专利技术适用于图像识别,能够克服采用基于深度学习的图像识别网络和传统Soft-Max损失函数训练的图像识别模型计算图像相似度存在的识别不准确问题,提高图像识别的准确性。附图说明图1是图像识别网络结构示意图。具体实施方式下面结合附图对本专利技术作进一步说明。如图1所示为图像识别网络结构示意图,本专利技术的基于改进型Soft-Max损失函数的图像相似度计算方法主要包括如下步骤:步骤(1):准备图像识别训练数据集,训练数据集为开源的图像识别数据库ImageNet2012,包括1000个类别的1百多万张图像,将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练,所述基于卷积神经网络的图像识别网络中包含卷积层,最大采样层,全连接层,改进型Soft-Max层四种网络层,其中,一个卷积层与一个最大采样层构成一个图像识别子结构,图像识别网络包含N=34个串联的子结构,图像识别网络的最后三层分别为图像特征层、图像分类层和改进型Soft-Max层,所述图像特征层和图像分类层分别为输出维度是512维和1000维的全连接层,512表示图像特征数,1000表示图像类别数,改进型Soft-Max层激活函数为:其中,σ(xi)表示在图像识别网络中改进型Soft-Max层对第i个样本属于正确类别的预测概率值,xi∈Rd表示第i个样本在图像识别网络中的图像特征层的输出值,yi表示第i个样本的图像类别标签,wj表示图像特征层与图像分类层之间的权重的第j列,b表示偏置项,n=1000表示总训练样本的类别数,m表示决策边缘,由网络训练得到。步骤(2):选用改进型Soft-Max损失函数来进行图像识别网络的反向传播更新网络权值,训练得到一个图像识别的模型,所述改进型Soft-Max损失函数计算公式为:进一步地,图像识别网络中的图像特征层和图像分类层之间的反向传播求导公式为:第i个样本的损失函数对决策边缘m求偏导的公式为:第i个样本的损失函数对权重wyi求偏导的公式为:第i个样本的损失函数对偏置项bi求偏导的公式为:第i个样本的损失函数对权重wj求偏导的公式为本文档来自技高网...

【技术保护点】
1.一种基于改进型Soft‑Max损失函数的图像相似度计算方法,其特征在于按照如下步骤进行:步骤(1):准备图像识别训练数据集,将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练,所述基于卷积神经网络的图像识别网络中包含卷积层,最大采样层,全连接层,改进型Soft‑Max层四种网络层,其中,一个卷积层与一个最大采样层构成一个图像识别子结构,图像识别网络包含N个串联的子结构,图像识别网络的最后三层分别为图像特征层、图像分类层和改进型Soft‑Max层,所述图像特征层和图像分类层分别为输出维度是C维和D维的全连接层,C表示图像特征数,D表示图像类别数,改进型Soft‑Max层激活函数为:

【技术特征摘要】
1.一种基于改进型Soft-Max损失函数的图像相似度计算方法,其特征在于按照如下步骤进行:步骤(1):准备图像识别训练数据集,将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练,所述基于卷积神经网络的图像识别网络中包含卷积层,最大采样层,全连接层,改进型Soft-Max层四种网络层,其中,一个卷积层与一个最大采样层构成一个图像识别子结构,图像识别网络包含N个串联的子结构,图像识别网络的最后三层分别为图像特征层、图像分类层和改进型Soft-Max层,所述图像特征层和图像分类层分别为输出维度是C维和D维的全连接层,C表示图像特征数,D表示图像类别数,改进型Soft-Max层激活函数为:其中,σ(xi)表示在图像识别网络中的改进型Soft-Max层对第i个样本属于正确类别的预测概率值,xi∈Rd表示第i个样本在图像识别网络中的图像特征层的输出值,yi表示第i个样本的图像类别标签,wj表示图像特征层与图像分类层之间的权重的第j列,b表示偏置项,n表示总训练样本的类别数,m表示决策边缘,由网络训练得到;步骤(2):选用改进型Soft-Max损失函数来进行图像识别网络的反向传播更新网络权值,训练得到一个图像识...

【专利技术属性】
技术研发人员:章东平李建超
申请(专利权)人:中国计量大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1