基于流形学习数据压缩哈希的图像检索方法技术

技术编号:11991582 阅读:92 留言:0更新日期:2015-09-02 19:48
本发明专利技术公开了一种基于流形学习数据压缩哈希的图像检索方法,主要解决图像检索中内存占用率大、检索性能低的问题。其实现步骤为:1.提取原始图像特征,并对其作归一化处理;2.将归一化数据划分为训练数据和测试数据;3.对训练数据压缩,得到综合压缩数据;4.对综合压缩数据进行低维嵌入,得到低维的综合压缩数据;5.通过图模型,分别得到综合压缩数据与训练数据、测试数据之间的近邻关系矩阵;6.分别阈值化综合压缩数据与两个近邻关系矩阵的乘积,得到训练数据和测试数据的哈希码;7.根据训练数据和测试数据哈希码之间的汉明距离得到检索结果。本发明专利技术降低了内存消耗,提高图像检索性能,可用于物联网和移动设备图片搜索服务。

【技术实现步骤摘要】

本专利技术属于图像处理领域,更进一步设及大规模图像数据的快速检索方法,可用 于对图像进行二元编码,提高图像检索性能。
技术介绍
随着互联网技术的快速发展W及数字多媒体的广泛应用,大量图像数据应运而 生。海量的图像数据W及图像的复杂性给图像检索带来了巨大的挑战,如何快速准确地检 索出人们需要的图像成为亟待解决的问题,图像检索更是成为了人们关注的焦点。但是传 统的一些图像检索算法无法满足人们日益增长的需求。为了在大数据中高效地检索到有价 值的图像,人们提出了哈希算法。哈希算法将高维图像数据映射到低维汉明空间,使用二进 制编码表示图像。哈希算法既可W降低存储空间,也可W提高检索速度,因此研究基于哈希 的图像检索技术具有重要意义。 天格科技(杭州)有限公司申请的专利"一种基于局部敏感哈希的相似人脸快速 检索方法"(申请号;201310087561. 5,公开号;CN103207898A)公开了一种基于局部敏感哈 希的人脸图像哈希索引方法。该方法通过人脸区域检测、眼睛和嘴己特征检测和特征提取、 肤色检测、人脸肤色分布特征提取等步骤将图像表示为人脸特征向量,然后利用局部敏感 哈希方法对人脸特征向量构建索引,从而提高查询时的速度。该专利申请提出的方法存在 的不足之处是;该方法需要长代码保证高的查准率,但长代码使得查全率降低且耗费更多 的存储空间;另外受随机性的影响,该方法的稳定性也不能令人满意。 大连理工大学提出的专利申请"基于多哈希表映射误差最小化的图像检索方 法"(申请号;201110357850. 3,公开号;CN102508910A)公开了一种基于多哈希表映射误差 最小化的图像检索方法。该方法首先提取图像特征,再计算训练特征的主成分方向并采用 迭代量化法对主成分方向进行优化,将待检索特征和查询特征投影到优化后的主成分方向 上,得到其对应的哈希码;然后对先前训练特征进行能量弱化得到新的训练特征,重复该过 程得到多组哈希码。该方法克服了单哈希表在召回率较高时汉明球半径较大的缺点,又采 用相同哈希码长的多个哈希表,提高了检索的准确率。但是,该方法仍存在两方面的不足: 一方面要通过线性降维方式得到主成分方向,不符合现实中大多数数据的非线性特性,且 后续的迭代优化主成分方向过程会增加算法时间复杂度;另一方面针对大数据,多哈希表 的使用增加了存储空间的占用率。化nchaoGong和SvetlanaLazebnik在文章"IterativeQuantization:A ProcrusteanApproachtoLearningBinaryCodes"(IEEEConferenceonComputer VisionandPatternReco即ition, 2011,pp. 817-824)中提出一种迭代量化方法,该方法 首先对图像提取底层特征,再使用主成分分析方法对底层特征降维,得到低维特征;然后对 低维特征旋转并量化得到图像的编码。该方法使得旋转后的主成分方向的方差尽量保持平 衡,提高了获取哈希编码序列的性能。但是,该方法的前提假设是图像数据服从高斯分布, 而实际数据可能并不服从高斯分布,并且该方法没有考虑图像之间的近邻关系,使得图像 检索的查准率和查全率降低。
技术实现思路
本专利技术的目的在于针对上述已有技术的不足,提出一种基于流形学习数据压缩哈 希的图像检索方法,W节省哈希编码的存储空间,降低检索的时间复杂度,有效提高图像检 索的查准率与查全率。 本专利技术的技术思路是;在训练模式下,对图像训练数据通过随机近邻压缩,得到训 练数据的综合压缩数据集合,根据综合压缩数据集合,运用流形学习方法计算出训练数据 的哈希值,得到图像训练数据哈希编码。在测试模式下,获得测试数据哈希编码,计算测试 数据与训练数据哈希编码间的汉明距离,得到检索结果。[000引根据上述思路,本专利技术的实现步骤如下: (1)调用图像数据库中原始图像,对原始图像数据进行特征提取,得到图像特征数 据; 似对图像特征数据做归一化处理,得到归一化数据矩阵; (3)从归一化数据矩阵中随机选取五分之一的数据矩阵作为图像测试数据矩阵 Vt,其余的数据矩阵作为图像训练数据矩阵Vx;[001引 (4)对图像训练数据矩阵V进行随机近邻压缩,得到图像训练数据矩阵VX的综合 压缩数据矩阵S: 4a)在图像训练数据矩阵V冲随机选取400个数据点,作为图像训练数据矩阵初 始的综合压缩数据矩阵S'; 4b)通过随机近邻压缩算法不断优化图像训练数据矩阵初始的综合压缩数据矩阵 S',得到优化的综合压缩数据矩阵S; (5)对综合压缩数据矩阵S进行t分布随机近邻嵌入,得到低维的综合压缩数据矩 阵Y; (6)构造低维的综合压缩数据矩阵Y和图像训练数据矩阵Vx之间的近邻图,得到 综合压缩数据矩阵Y和图像训练数据矩阵Vx之间的近邻关系矩阵RX; 6a)根据低维的综合压缩数据矩阵Y和图像训练数据矩阵Vx,求得该两个矩阵两 两数据点之间的相似度,并用该些相似度组合成相似度矩阵Zx;[001引6b)对相似度矩阵Zx进行归一化处理,得到综合压缩数据矩阵和图像训练数据矩 阵之间的近邻关系矩阵Rx; (7)将低维的综合压缩数据矩阵Y和图像训练数据矩阵Vx之间的近邻关系矩阵R, 与低维的综合压缩数据矩阵Y进行相乘,得到图像训练数据流形嵌入矩阵Ex;(8)构造低维的综合压缩数据矩阵Y和图像测试数据矩阵Vt之间的近邻图,得到 综合压缩数据矩阵和图像测试数据矩阵之间的近邻关系矩阵Rt;[002U (9)将综合压缩数据矩阵Y和图像测试数据矩阵Vt之间的近邻关系矩阵RT和低 维的综合压缩数据矩阵Y进行相乘,得到图像测试数据流形嵌入矩阵Et;[002引 (10)将图像训练数据流形嵌入矩阵Ex和图像测试数据流形嵌入矩阵ET进行阔值 化,分别得到训练数据矩阵的哈希码Bx和测试数据的哈希码BT; (11)从测试数据矩阵的哈希码Bt中取其中的一个测试数据的哈希码,计算该哈希 码与训练数据矩阵的哈希码Bx之间的汉明距离,得到汉明距离向量;(。)将汉明距离向量中的数值按从小到大的顺序排序,输出对应的原始图像,得 到检索结果。 本专利技术与现有技术相比具有W下优点: 第一,本专利技术由于引入了流形学习方法,使得在低维流形空间中保存了高维数据 的近邻结构,克服了现有技术中图像原有的近邻信息在映射空间中丢失的缺点,改善了哈 希码性能,提高了检索精度。 第二,本专利技术由于运用了数据压缩算法学习到综合压缩数据集来替代原始数据 集,减少了寻找相似最近邻数据点的时间。[002引第=,本专利技术由于采用流形学习获得单组哈希编码,克服了现有技术采用多组哈 希编码而占用内存空间、消耗检索时间的缺点,使得本专利技术所提出的方法在图像检索中效 率更高。【附图说明】 图1为本专利技术的实现流程图; 图2为本专利技术与现有哈希方法在MNIST数据库下查准率-查全率、平均准确率的 实验对比图; 图3为本专利技术与现有哈希方法在CIFAR-10数据库下查准率-查全率、平均准确率 的实验对比图。 具体实施方案W下结合附图,对本专利技术的具体实现方法和技术效果作进一步描述。 参照图1,本专利技术实现步骤如下: 步骤1,获取原始图像。[003引从给定的图像数据库丽1ST或CIFAR-10中本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN104881449.html" title="基于流形学习数据压缩哈希的图像检索方法原文来自X技术">基于流形学习数据压缩哈希的图像检索方法</a>

【技术保护点】
一种基于流形学习数据压缩哈希的图像检索方法,包括如下步骤:(1)调用图像数据库中原始图像,对原始图像数据进行特征提取,得到图像特征数据;(2)对图像特征数据做归一化处理,得到归一化数据矩阵;(3)从归一化数据矩阵中随机选取五分之一的数据矩阵作为图像测试数据矩阵VT,其余的数据矩阵作为图像训练数据矩阵VX;(4)对图像训练数据矩阵VX进行随机近邻压缩,得到图像训练数据矩阵VX的综合压缩数据矩阵S:4a)在图像训练数据矩阵VX中随机选取400个数据点,作为图像训练数据矩阵初始的综合压缩数据矩阵S';4b)通过随机近邻压缩算法不断优化图像训练数据矩阵初始的综合压缩数据矩阵S',得到优化的综合压缩数据矩阵S;(5)对综合压缩数据矩阵S进行t分布随机近邻嵌入,得到低维的综合压缩数据矩阵Y;(6)构造低维的综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻图,得到综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻关系矩阵RX:6a)根据低维的综合压缩数据矩阵Y和图像训练数据矩阵VX,求得这两个矩阵两两数据点之间的相似度,并用这些相似度组合成相似度矩阵ZX;6b)对相似度矩阵ZX进行归一化处理,得到综合压缩数据矩阵和图像训练数据矩阵之间的近邻关系矩阵RX;(7)将低维的综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻关系矩阵RX与低维的综合压缩数据矩阵Y进行相乘,得到图像训练数据流形嵌入矩阵EX;(8)构造低维的综合压缩数据矩阵Y和图像测试数据矩阵VT之间的近邻图,得到综合压缩数据矩阵和图像测试数据矩阵之间的近邻关系矩阵RT;(9)将综合压缩数据矩阵Y和图像测试数据矩阵VT之间的近邻关系矩阵RT和低维的综合压缩数据矩阵Y进行相乘,得到图像测试数据流形嵌入矩阵ET;(10)将图像训练数据流形嵌入矩阵EX和图像测试数据流形嵌入矩阵ET进行阈值化,分别得到训练数据矩阵的哈希码BX和测试数据的哈希码BT;(11)从测试数据矩阵的哈希码BT中取其中的一个测试数据的哈希码,计算该哈希码与训练数据矩阵的哈希码BX之间的汉明距离,得到汉明距离向量;(12)将汉明距离向量中的数值按从小到大的顺序排序,输出对应的原始图像,得到检索结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王秀美丁利杰高新波邓成田春娜王颖韩冰牛振兴
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1