一种人脸检索方法和系统技术方案

技术编号:15725118 阅读:236 留言:0更新日期:2017-06-29 12:37
本发明专利技术涉及一种人脸检索方法和系统,其方法包括:搭建人脸检索的网络构架,对其行优化;根据反向传播的方式调节网络构架中的参数;将各训练样本图片输入调节后的网络构架中生成测试用例;根据sign函数对所述测试用例进行量化计算得到测试用例的二值编码,并通过二值编码计算训练样本图片对之间的汉明距离;根据汉明距离对各训练样本的近似度进行排序,从而完成对人脸检索的网络构架的训练;将待检索人脸图片输入完成训练的人脸检索的网络构架中进行检索,得到近似度排序的待检索人脸图片。本发明专利技术从以上几个方面对网络和输出的特征进行优化,使得在大规模人脸数据库下也能保证在准确率持平或者尽可能小范围降低的情况下能快速进行人脸图像的检索。

【技术实现步骤摘要】
一种人脸检索方法和系统
本专利技术涉及图像人脸检索
,具体涉及一种人脸检索方法和系统。
技术介绍
随着人脸识别方法的不断完善和改进,高识别的人脸识别方法被不断用于各个领域,随之而来的很多搜索引擎也不断推出人脸检索功能,如百度识图等,而不论是这类搜索引擎还是社会安防部门等的检索数据库都在不断的扩大以及更新,很多数据库已经达到了百万级规模,而在这么大规模的数据库中进行检索一张或者一个人的人脸图片仅仅用线性排序进行比对识别的方式,会造成非常大的计算成本,从而大大降低检索效率。那么,如果能研究出一种能够在百万级人脸检索数据库中进行快速准确的检索方法,将对安防部门、公安侦查罪犯、网上购物等社会应用有非常大的帮助。采用深度学习进行人脸检索算法的研究,深度学习网络提取出来的高维特征都是浮点型向量特征,小数据库检索一般采用包含丰富的图片信息的高维特征进行相似度计算排序输出检索结果;而对于大规模数据库,必须特征进行降维有效的进行人脸检索。降维一般分为两种方式:网络外降维和网络内降维。网络外降维,即从网络中提取高维特征,用合适的降维方式如PCA等进行特征降维压缩,这类降维方式比较繁琐,同时在降维过程中会损失掉比较多的图片信息,影响检索精度。网络内降维,即在网络层中完成降维,相比网络外降维方法会简化许多,同时深度网络降维过程中网络通过正向和反向传播不断调整各个层参数以得到图片信息最丰富的特征向量。本专利技术采用的就是网络内降维,一般压缩的维度在几百维,而对于大规模人脸数据库检索,几百维的浮点型向量进行相似度计算,耗费的时间成本很大,不利于进行有效的大规模人脸图像检索。专利
技术实现思路
本专利技术所要解决的技术问题是针对上述现有技术的不足,提供一种人脸检索方法和系统。本专利技术解决上述技术问题的技术方案如下:一种人脸检索方法,包括如下步骤:步骤S1:搭建人脸检索的网络构架,所述网络构架包括池化层、全连接层和损失层,并根据欧式距离对网络构架中的损失层进行优化;步骤S2:根据反向传播的方式调节网络构架中优化的损失层以及全连接层、池化层的参数;步骤S3:将各训练样本图片输入调节后的网络构架中生成测试用例;步骤S4:根据sign函数对所述测试用例进行量化计算得到测试用例的二值编码,通过二值编码计算两两训练样本图片之间的汉明距离,距离越小表示相似度越高,按照距离大小进行升序排序得出最后检索结果;步骤S5:根据汉明距离对各训练样本的近似度进行排序,从而完成对人脸检索的网络构架的训练;步骤S6:将各待检索人脸图片输入完成训练的人脸检索网络构架中进行检索,得到各待检索人脸图片的近似度排序结果。本专利技术的有益效果是:在损失层进行图片对的随机选择比网络外选择图片对更有益于网络训练,根据反向传播的方式微调网络比直接训练网络对网络的性能有很大的提升,通过二值编码计算训练样本图片对之间的汉明距离,由汉明距离得到相似度进行检索,能达到以10的数量级提高检索精度。本专利技术从以上几个方面对网络和输出的特征进行优化,使得在大规模人脸数据库下也能保证在准确率持平或者尽可能小范围降低的情况下能快速进行人脸图像的检索。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,所述步骤S3前还包括将各训练样本图片进行预处理的步骤:将各训练样本图片根据预设规格进行裁剪并对齐处理,再将对齐后的各训练样本图片的格式转换为LMDB(LightingMemory-MappedDatabase)格式。采用上述进一步方案的有益效果是:对训练样本图片进行预处理及格式转换能够为下面的步骤取得更快的处理时间,并且提高处理结果的精度。进一步,所述步骤S1中根据欧式距离对网络构架中的损失层进行优化的具体方法为:对损失层中的损失函数进行正则化项,两两训练样本图片为一组训练样本图片对,训练样本图片对I1,I2的损失函数公式为:其中,Lr(d1,d2,m)为损失值,d1和d2为分别训练样本图片对I1,I2的特征,为训练样本图片对I1,I2特征的欧式距离,γ为控制正则项强度的加权参数,q为边缘阈值参数且q>0,若训练样本图片对I1,I2中两者预设的标签类别相同时则定义m=0,否则定义m=1。采用上述进一步方案的有益效果是:损失函数(Regularloss)将输出的特征进行正则化约束比sigmoid/tanh的范围约束使网络输出的特征保留的信息更多;用欧式距离代替汉明距离可以防止过拟合,提升网络性能,同时由于输出的特征向量是浮点型向量,用欧式距离能减少计算成本,正则化项选择用低阶范数除了可以大大的降低计算成本,通过反向传播能加快网络训练的速度,提升训练进度。可选地,作为本专利技术的一个实施例,所述步骤S2包括:在训练过程中需要进行前向传播和反向传播,在前向传播完成进行反向传播,根据反向传播的方式依次从优化的损失层、全连接层和池化层进行调节:用K表示训练样本图片的数据集中有K对训练样本图片对,利用数据集的损失函数公式依次进行损失层、全连接层和池化层损失值的梯度计算,其中(di,1,di,2)为第i对训练样本图像对的两张图片n维特征向量,设第一项T1为其中预设的标签类别相同的一训练样本图片对得到的损失值,第二项T2为其中预设的标签类别不相同的一训练样本图片对得到的损失值,并利用公式(3)(4)(5)进行损失层、全连接层和池化层参数的调节其中,R为正则化输出向量di,j,i∈(1,k),j=1/2,i为K对训练样本图片对中第i对图像对,j为第i对图像对中第j张图像,γ为控制正则项强度的加权参数,为导数符号。采用上述进一步方案的有益效果是:反向传播以及测试代码中均使用sign函数,将使网络输出的特征与量化之后的二值编码尽可能的保持一致,从而会使量化过程中的特征信息的损失降到最低,以提高检索精度。进一步,所述步骤S3包括:步骤S301:将网络构架中全连接层的节点数设置为预设值n1,将各训练样本图片输入调节后的网络构架中生成初始测试用例;步骤S302:将网络构架中全连接层的节点数n1设置为预设值n2,且n2>n1,来调整初始测试用例,得到调整后的测试用例。通过调整后的测试用例来调整网络构架。采用上述进一步方案的有益效果是:通过测试用例对网络构架进行微调,微调后的网络构架比直接开始训练的损失率下降更平滑更快趋于平稳,且震荡很小。进一步,所述步骤S4包括:从测试用例中提取出近似二值编码,根据sign函数计算公式对近似二值编码进行量化,得到浮点型向量约束在(-1,1)之间的二值编码,其中,di,j为第i对训练样本图片对的特征,j为第i对训练样本图片对中第j张图像;再通过二值编码计算训练样本图片对之间的汉明距离。应理解在本实施例中,汉明距离是使用在数据传输差错控制编码里面的,它表示两个(相同长度)字对应位不同的数量,假设以d(x,y)表示两个字x,y之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。简单来讲就是统计两个字符串不同的bit位的个数,也可以理解成一个字符串换成另一个字符串需要改变的字符的个数。例如:1011101与1001001之间的汉明距离是2。2143896与2233796之间的汉明距离是3。"toned"与"roses"之间的汉明距离是3。采用汉明距离计算-1/1二值编码是因本文档来自技高网
...
一种人脸检索方法和系统

【技术保护点】
一种人脸检索方法,其特征在于,包括如下步骤:步骤S1:搭建人脸检索的网络构架,所述网络构架包括池化层、全连接层和损失层,并根据欧式距离对网络构架中的损失层进行优化;步骤S2:根据反向传播的方式调节网络构架中优化的损失层、全连接层和池化层的参数,得到调节后的网络构架;步骤S3:将各训练样本图片输入调节后的网络构架中生成测试用例;步骤S4:根据sign函数对所述测试用例进行量化,计算得到测试用例的二值编码,通过二值编码计算两两训练样本图片之间的汉明距离;步骤S5:根据汉明距离对各训练样本图片的近似度进行排序,从而完成对人脸检索的网络构架的训练;步骤S6:将各待检索人脸图片输入完成训练的人脸检索网络构架中进行检索,得到各待检索人脸图片的近似度排序结果。

【技术特征摘要】
1.一种人脸检索方法,其特征在于,包括如下步骤:步骤S1:搭建人脸检索的网络构架,所述网络构架包括池化层、全连接层和损失层,并根据欧式距离对网络构架中的损失层进行优化;步骤S2:根据反向传播的方式调节网络构架中优化的损失层、全连接层和池化层的参数,得到调节后的网络构架;步骤S3:将各训练样本图片输入调节后的网络构架中生成测试用例;步骤S4:根据sign函数对所述测试用例进行量化,计算得到测试用例的二值编码,通过二值编码计算两两训练样本图片之间的汉明距离;步骤S5:根据汉明距离对各训练样本图片的近似度进行排序,从而完成对人脸检索的网络构架的训练;步骤S6:将各待检索人脸图片输入完成训练的人脸检索网络构架中进行检索,得到各待检索人脸图片的近似度排序结果。2.根据权利要求1所述的人脸检索方法,其特征在于,所述步骤S3前还包括将各训练样本图片进行预处理的步骤:将各训练样本图片根据预设规格进行裁剪,并进行对齐处理,再将对齐后的各训练样本图片的格式转换为LMDB格式。3.根据权利要求1所述的人脸检索方法,其特征在于,所述步骤S1中根据欧式距离对网络构架中的损失层进行优化的具体方法为:对损失层中的损失函数进行正则化项,两两训练样本图片为一组训练样本图片对,训练样本图片对的损失函数公式为:其中,Lr(d1,d2,m)为损失值,d1和d2为分别训练样本图片对I1,I2的特征,为训练样本图片对特征的欧式距离,γ为控制正则项强度的加权参数,q为边缘阈值参数且q>0,若训练样本图片对中两者预设的标签类别相同时则定义m=0,否则定义m=1。4.根据权利要求3所述的人脸检索方法,其特征在于,所述步骤S2包括:根据反向传播的方式依次从优化的损失层、全连接层和池化层进行调节:用K表示训练样本图片的数据集中有K对训练样本图片对,利用数据集的损失函数公式依次进行损失层、全连接层和池化层损失值的梯度计算,其中(di,1,di,2)为第i对训练样本图像对的两张图片n维特征向量,设第一项T1为其中预设的标签类别相同的一训练样本图片对得到的损失值,第二项T2为其中预设的标签类别不相同的一训练样本图片对得到的损失值,并利用公式(3)(4)(5)进行损失层、全连接层和池化层参数的调节其中,R为正则化输出向量di,j,i∈(1,k),j=1/2,i为K对训练样本图片对中第i对图像对,j为第i对图像对中第j张图像,γ为控制正则项强度的加权参数,为导数符号。5.根,据权利要求1所述的人脸检索方法,其特征在于,所述步骤S3包括:步骤S301:将网络构架中全连接层的节点数设置为预设值n1,将各训练样本图片输入调节后的网络构架中生成初始测试用例;步骤S302:将网络构架中全连接层的节点数n1设置为预设值n2,且n2>n1,来调整初始测试用例,得到调整后的测试用例。6.根据权利要求3-5任一项所述的人脸检索方法,其特征在于,所述步骤S4包括:从测试用例中提取出近似二值编码,根据sign函数计算公式

【专利技术属性】
技术研发人员:蔡晓东曾燕
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1