一种用于足迹图像检索的方法技术

技术编号:24206720 阅读:178 留言:0更新日期:2020-05-20 14:58
本发明专利技术涉及一种用于足迹图像检索的方法,通过ImageNet数据进行模型的预训练,采用预训练之后的模型,将足迹数据进行清洗及扩充预处理操作,划分成多个不同用处的数据集,调整模型的全连接层和分类层,采用预训练好的模型的参数,使用足迹数据集进行模型的再次训练;保存二次训练好的模型,去除其分类层,对图像库和检索库中的图像进行特征提取,形成特征索引库;将三个模型提取到的特征相连接形成融合特征,建立融合特征向量索引库;预先提取好待检索图像库中的图像特征,建立特征向量库,当输入单个足迹图像时,进行检索库和图像库中的距离计算,输出相似度最高的图像。实现足迹图像的识别与检索功能。

A method for footstep image retrieval

【技术实现步骤摘要】
一种用于足迹图像检索的方法
本专利技术涉及一种用于足迹图像检索的方法。
技术介绍
目前,图像检索的研究始于1970年代,起初都是基于文本的图像检索,通过使用文字对图像进行特征描述。在20世纪年代初开始出现基于内容的图像检索,即对图像的颜色和纹理进行分析,并使用诸如支持向量机等浅层分类器技术来提高搜索的准确性。但是这些方法仍然不能解决语义鸿沟的问题。随着深度学习的研究和发展,卷积神经网络[CNN]近年来在图像检索和识别方面表现良好。随着各种类型的图像识别竞赛(例如ImageNet和Kaggle)的举办,卷积神经网络的各种变体模型如AlexNet[12],VGG,GoogLeNet,ResNet和DenseNet等凭借其卓越的识别精度,在计算机视觉领域占据了主导地位,这使得应用卷积神经网络进行图像检索和内容识别具有很高的可靠性。目前,人脸识别技术以及指纹、掌纹自动识别检索技术在警察的刑事案件侦破中的应用已经十分成熟,足迹图像作为犯罪现场的另一个主要痕迹也有着不可忽视的作用。传统的足迹检索与识别方法往往需要耗费大量的人力资源与时间,且大数据量下的人工检索容易出错。因此自动足迹检索系统有着很强的应用需求;然而,在自动足迹匹配系统的研究中,多使用传统的浅层机器学习方法处理足迹图像,这将花费较多的时间,并且准确率也有待提高。
技术实现思路
本专利技术的目的是克服现有技术存在的不足,提供一种用于足迹图像检索的方法。本专利技术的目的通过以下技术方案来实现:一种用于足迹图像检索的方法,特点是:首先通过ImageNet数据进行模型的预训练,采用预训练之后的模型,将足迹数据进行清洗及扩充预处理操作,并划分成多个不同用处的数据集,调整模型的全连接层和分类层,采用预训练好的模型的参数,使用足迹数据集进行模型的再次训练;之后,保存二次训练好的模型,去除其分类层,对图像库和检索库中的图像进行特征提取,形成特征索引库;分别用三个模型提取特征,将三个模型提取到的特征相连接形成融合特征,建立融合特征向量索引库;预先提取好待检索图像库中的图像特征,建立特征向量库,当输入单个足迹图像时,进行检索库和图像库中的距离计算,从而输出相似度最高的图像。进一步地,上述的一种用于足迹图像检索的方法包括以下步骤:a)首先,数据清洗和预处理;足迹图像数据集数据集划分为gallery、query、train、trainall以及val五个部分,从gallery中每个类别中随机选择图像构成query,gallery中的每个类都包含6张以上与待检索图像相似的图像;从trainall的每类中选择一张足迹图像以构成val数据集;对数据进行归一化操作,针对数据集,采用逐样本均值消减方法进行归一化处理;b)然后,调整模型结构并训练模型;修改三个不同模型的全连接层以及全连接层的后续部分,以线性层、批量标准化、线性整流函数和线性层的顺序定义新的全连接层和分类层;在Resnet50和densenet121中,将原来的全连接层修改为512维且增加一新的分类层;VGG19模型中的第一层全连接层被保留,移除其第二个全连接层,且增加一新的分类层,新的分类层的个数根据训练集中的图像类别而定;对新增加的层,参数均用恺明初始化进行参数初始化,其他的参数则是模型在ImageNet上训练预训练的参数;采用的三个模型均在足迹图像数据集上进行训练;c)继而,通过训练好的深度神经网络和集成深度神经网络提取特征并建立特征索引库;足迹图像数据集上训练模型之后,保留网络结构中除分类层以外的所有层,足迹图像库中的每一张图像都经过网络模型进行特征提取;提取完所有图像的特征后,建立足迹图像的特征向量索引库;d)最后,通过距离度量方法计算足迹图像的相似度并且输出检索结果;通过卷积神经网络提取图像特征,建立特征向量,并基于图像的特征向量表示相应的图像,通过计算图像特征向量之间的距离确定图像之间的相似度;采用欧氏距离和余弦距离用作相似图像特征向量的计算,其中欧几里德距离方程式用于测量多维空间中点之间的绝对距离,方程式如下所示:余弦距离使用向量空间中两个向量之间的角度的余弦值来度量两个个体之间的差异,集中两个向量之间的方向差异,公式如下:d)最后,通过距离度量方法计算足迹图像的相似度并且输出检索结果;通过卷积神经网络提取图像特征,建立特征向量,并基于图像的特征向量表示相应的图像,通过计算图像特征向量之间的距离确定图像之间的相似度;采用欧氏距离和余弦距离用作相似图像特征向量的计算,其中欧几里德距离方程式用于测量多维空间中点之间的绝对距离,方程式如下所示:余弦距离使用向量空间中两个向量之间的角度的余弦值来度量两个个体之间的差异,集中两个向量之间的方向差异,公式如下:图像库中有n张图像,通过以下公式进行相似度的计算:Di=||q-Ti||,i∈[1,N]其中,N表示足迹图像库中的数量,q表示待检索图像的特征向量,T表示足迹图像库中第i个足迹图像,D表示不同向量间的距离,采用欧式距离和余弦距离,D的值越小,表明两张图像之间的相似度越高;然后,通过排序算法比较D值,找到并输出最相似的N张图像。进一步地,上述的一种用于足迹图像检索的方法,其中,步骤a),足迹图像数据集由警察机关提供,针对犯罪现场足迹图像,选择高质量的足迹图像用于检索,对其进行数据增强操作,旋转、随机裁剪、灰度值和对比度转换。进一步地,上述的一种用于足迹图像检索的方法,其中,步骤a),足迹图像数据集中,共有91个类别,超过5000张图像。进一步地,上述的一种用于足迹图像检索的方法,其中,步骤a),将大小约为1000×2000像素的输入足迹图调整为128×256,便于特征的提取。进一步地,上述的一种用于足迹图像检索的方法,其中,步骤a),归一化处理,是将输入图像转化为矩阵后,在每个样本上减去数据的统计平均值,即分别计算各图像样本的均值,然后各样本减去其对应的均值,并以平均像素为中心;针对图像数据,归一化方法移除图像的平均亮度值,减少图像背景效果的干扰;图像被转化为张量,并归一化到0~1。进一步地,上述的一种用于足迹图像检索的方法,其中,步骤b)由于图像长度大于宽度,使用自适应均值池化,指定池化内核,自适应平均池化易于图像特征的提取。进一步地,上述的一种用于足迹图像检索的方法,其中,步骤b),训练过程中,设置40轮的迭代,在ImageNet预训练参数的基础上使用SGD方式进行反向传播;使用自适应均值池化,足迹图像的图像长度大于宽度,指定池化内核,自适应平均池化易于实现;训练过程中,在ImageNet预训练参数的基础上使用SGD方式进行反向传播,公式如下:其中,J是SGD需要优化的目标函数,xi,和yi分别代表训练样本和训练样本的标签,θ表示模型参数,权重和偏置;使用动态的学习率,其公式定义如下:其中,lr指当前学习率,本文档来自技高网...

【技术保护点】
1.一种用于足迹图像检索的方法,其特征在于:/n首先通过ImageNet数据进行模型的预训练,采用预训练之后的模型,将足迹数据进行清洗及扩充预处理操作,并划分成多个不同用处的数据集,调整模型的全连接层和分类层,采用预训练好的模型的参数,使用足迹数据集进行模型的再次训练;之后,保存二次训练好的模型,去除其分类层,对图像库和检索库中的图像进行特征提取,形成特征索引库;/n分别用三个模型提取特征,将三个模型提取到的特征相连接形成融合特征,建立融合特征向量索引库;预先提取好待检索图像库中的图像特征,建立特征向量库,当输入单个足迹图像时,进行检索库和图像库中的距离计算,从而输出相似度最高的图像。/n

【技术特征摘要】
1.一种用于足迹图像检索的方法,其特征在于:
首先通过ImageNet数据进行模型的预训练,采用预训练之后的模型,将足迹数据进行清洗及扩充预处理操作,并划分成多个不同用处的数据集,调整模型的全连接层和分类层,采用预训练好的模型的参数,使用足迹数据集进行模型的再次训练;之后,保存二次训练好的模型,去除其分类层,对图像库和检索库中的图像进行特征提取,形成特征索引库;
分别用三个模型提取特征,将三个模型提取到的特征相连接形成融合特征,建立融合特征向量索引库;预先提取好待检索图像库中的图像特征,建立特征向量库,当输入单个足迹图像时,进行检索库和图像库中的距离计算,从而输出相似度最高的图像。


2.根据权利要求1所述的一种用于足迹图像检索的方法,其特征在于:包括以下步骤:
a)首先,数据清洗和预处理;
足迹图像数据集数据集划分为gallery、query、train、trainall以及val五个部分,从gallery中每个类别中随机选择图像构成query,gallery中的每个类都包含6张以上与待检索图像相似的图像;从trainall的每类中选择一张足迹图像以构成val数据集;
对数据进行归一化操作,针对数据集,采用逐样本均值消减方法进行归一化处理;
b)然后,调整模型结构并训练模型;
修改三个不同模型的全连接层以及全连接层的后续部分,以线性层、批量标准化、线性整流函数和线性层的顺序定义新的全连接层和分类层;在Resnet50和densenet121中,将原来的全连接层修改为512维且增加一新的分类层;VGG19模型中的第一层全连接层被保留,移除其第二个全连接层,且增加一新的分类层,新的分类层的个数根据训练集中的图像类别而定;对新增加的层,参数均用恺明初始化进行参数初始化,其他的参数则是模型在ImageNet上训练预训练的参数;采用的三个模型均在足迹图像数据集上进行训练;
c)继而,通过训练好的深度神经网络和集成深度神经网络提取特征并建立特征索引库;
足迹图像数据集上训练模型之后,保留网络结构中除分类层以外的所有层,足迹图像库中的每一张图像都经过网络模型进行特征提取;提取完所有图像的特征后,建立足迹图像的特征向量索引库;
d)最后,通过距离度量方法计算足迹图像的相似度并且输出检索结果;
通过卷积神经网络提取图像特征,建立特征向量,并基于图像的特征向量表示相应的图像,通过计算图像特征向量之间的距离确定图像之间的相似度;采用欧氏距离和余弦距离用作相似图像特征向量的计算,其中欧几里德距离方程式用于测量多维空间中点之间的绝对距离,方程式如下所示:



余弦距离使用向量空间中两个向量之间的角度的余弦值来度量两个个体之间的差异,集中两个向量之间的方向差异,公式如下:



d)最后,通过距离度量方法计算足迹图像的相似度并且输出检索结果;
通过卷积神经网络提取图像特征,建立特征向量,并基于图像的特征向量表示相应的图像,通过计算图像特征向量之间的距离确定图像之间的相似度;采用欧氏距离和余弦距离用作相似图像特征向量的计算,其中欧几里德距离方程式用于测量多维空间中点之间...

【专利技术属性】
技术研发人员:奚雪峰陈扬曾诚张谦程成付保川崔志明
申请(专利权)人:苏州科技大学昆山市公安局
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1