一种基于数据感知的图像哈希方法技术

技术编号：12205426 阅读：183 留言：0更新日期：2015-10-14 19:10

本发明专利技术公开了一种基于数据感知的图像哈希方法，包括：提取图像的特征矢量；对特征矢量进行主成份分析，得到按特征值由大到小排列的特征矢量矩阵；对经过主成份分析之后的特征序列进行顺序测度，得到向量中的值在整个向量中的位置序列矩阵；对向量的位置序列矩阵进行局部保持投影，得到降维后的特征序列；对降维后的特征序列进行二值化处理，得到01比特序列。本发明专利技术方法具有较低的时间复杂度，并且得到的码字具有较高的效率，语义保持性较好，创新性的将主成份分析、顺序测度和局部保持投影结合起来；在局部保持投影中，将顺序测度中的距离度量函数用于构造邻接图，使得投影矩阵能够很好的适用于特征向量，提高了码字的语义保持性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于信息检索
，更具体地，涉及一种基于数据感知的图像哈希方法。
技术介绍
随着计算机网络的发展和数字化处理技术的广泛使用，互联网中的多媒体数据呈现爆炸式增长，使得多媒体数据在网络上的传播变得日益普及。该使得多媒体数据的组织和管理变得十分重要，其中如何在大规模数据集上实施快速相似性搜索是完成上述功能的核也关键技术。目前，相似性搜索技术主要分为基于空间划分的方法和基于哈希的方法。基于空间划分的方法主要采用树形结构对数据进行存储，例如kd-Tree、R-Tree、X-Tree和 SS-Tree。为进行空间的划分，合适的距离测度方法被引入计算向量间的相似性W将特征向量划分到子空间中。但是由于树形结构存在W下问题：当向量维度较高时，需要较多的空间用来表示，使得在树的构建过程需要频繁的分裂并且使得树的高度明显增加；在空间划分的过程中，由于高维数据之间的相关性，使得空间出现重叠现象，因此在查询过程中需要查询更多的子树。为了解决树的该些问题，引入了近似压缩的思想，即在创建索引之前首先对数据进行压缩W减少查询代价，如VA-File。VA-File的基本原理是将原始向量空间划分为不同的子区域，然后利用不同的二进制向量表示映射到相同子区域中的特征向量。对于给定的查询向量，只需要扫描相同子区域内的向量而不需要扫描全部的数据。由于只扫描相同子区域内的向量，使得数据的访问量和时间复杂度大大减小。但是当原始数据集很大时，相同子区域中的数据仍然很多，而且数据划分的算法决定了数据划分的分布，即好的划分算法使得数据划分到每个子区域的...

【技术保护点】
一种基于数据感知的图像哈希方法，其特征在于，包括：第1步，提取图像的特征矢量；第2步，对特征矢量进行主成份分析，得到按特征值由大到小排列的特征矢量矩阵；第3步，对经过主成份分析之后的特征序列进行顺序测度，得到向量中的值在整个向量中的位置序列；第4步，对向量的位置序列进行局部保持投影，得到降维后的特征序列；第5步，对降维后的特征序列进行二值化处理，得到01比特序列。

【技术特征摘要】

【专利技术属性】
技术研发人员：邹复好，周可，陈云鹏，张玉清，郑创伟，谢志成，郑胜，曾宇鹏，
申请(专利权)人：华中科技大学，深圳报业集团，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人