一种海量图像检索的隐私保护索引生成方法技术

技术编号：10367286 阅读：217 留言：0更新日期：2014-08-28 11:10

本发明专利技术公开一种海量图像检索的隐私保护索引生成方法，涉及海量图像检索中的隐私保护问题，将隐私保护融入到图像检索中，本发明专利技术方法建立一种具有隐私保护的图像索引，在保证检索性能的同时，保护用户隐私信息的安全。本发明专利技术首先，提取并优化尺度不变特征转换SIFT和HSV颜色直方图，采用局部保持投影的流形降维方法对特征进行降维，并将降维后的特征数据用于构建词汇树。利用词汇树建立倒排索引结构，本发明专利技术不仅减少了特征的个数，提高了明文域图像检索的速度，更优化了图像检索的性能。本发明专利技术在明文域检索框架的基础上加入隐私保护，利用二元随机编码和随机投影对倒排索引进行双重加密，实现了具有隐私保护的图像索引。

全部详细技术资料下载

【技术实现步骤摘要】
一种海量图像检索的隐私保护索引生成方法
本专利技术涉及海量图像检索中的隐私保护问题，将隐私保护融入到图像检索中，旨在建立一种具有隐私保护的图像索引，在保证检索性能的同时，保护用户隐私信息的安全。
技术介绍
随着现代信息技术的飞速发展，特别是近年来云计算、社交媒体等大规模新型应用的不断推广，图像/视频等数据量迅猛增长。作为对图像/视频资源进行合理利用和有效管理的重要手段，基于内容的海量图像检索技术(CBIR，Content-basedImageRetrieval)也因此成为目前图像检索领域的研究热点。但是，现有的图像搜索技术所关注的是如何设计有效的机制来提高检索的性能，而往往忽略了用户隐私信息的保护等安全性问题。实际上，在各种图像/视频数据中，尤其是社交网络产生的大数据中，包含了各种各样的用户隐私信息，这些隐私信息的泄漏将会给用户带来无法估量的负面影响。存储在服务器端的用户隐私数据通常会受到不可信赖的管理操作或恶意入侵者的攻击，存在着被窃取、泄漏和篡改的巨大风险。为了阻止在图像检索、图像传输和共享过程中频发的侵权行为，需要一种行之有效的隐私保护手段来保证图像信息的安...
一种海量图像检索的隐私保护索引生成方法

【技术保护点】
一种海量图像检索的隐私保护索引生成方法，包括：尺度不变特征转换SIFT和HSV颜色直方图的提取和优化、局部保持投影LPP降维、词汇索引构建以及隐私保护索引生成，其特征在于包括如下步骤：步骤1：SIFT特征和HSV直方图特征的提取和优化，构建图像特征库；步骤1.1：提取SIFT特征；步骤1.2：对SIFT进行合理优化：对SIFT描述符集中的区域进行优化整合，以较少数量的描述符对图像内容进行准确的表征，设定图像中第i个SIFT描述符的横纵坐标分别为Siftdes[i].x，Siftdes[i].y，优化阈值为Topt，优化范围为Ropt；对于任意两个不同的SIFT描述符Siftdes[i]与Sif...

【技术特征摘要】
1.一种海量图像检索的隐私保护索引生成方法，包括：尺度不变特征转换SIFT和HSV颜色直方图的提取和优化、局部保持投影LPP降维、词汇索引构建以及隐私保护索引生成，其特征在于包括如下步骤：步骤1：SIFT特征和HSV直方图特征的提取和优化，构建图像特征库；步骤1.1：提取SIFT特征；步骤1.2：对SIFT进行合理优化：对SIFT描述符集中的区域进行优化整合，以较少数量的描述符对图像内容进行准确的表征，设定图像中第i个SIFT描述符的横纵坐标分别为Siftdes[i].x，Siftdes[i].y，优化阈值为Topt，优化范围为Ropt；对于任意两个不同的SIFT描述符Siftdes[i]与Siftdes[j]，当两点的横坐标和纵坐标的距离均小于优化阈值Topt时，则表示这些点存在于需要优化的范围Ropt内，需要进行优化操作，即：将存在于Ropt内的所有特征点合并成一个特征点，以它们的均值代表该范围内的所有特征点；如果该两点的横坐标距离或者纵坐标距离大于优化阈值Topt时，则表示这些点无需进行优化，优化方法如下：优化后的SIFT特征点个数明显减少，提高检索速度；步骤1.3：提取HSV颜色直方图特征；步骤1.4：利用SIFT特征和HSV直方图特征共同形成图像特征库；步骤2：利用LPP对图像特征进行降维；步骤2.1：构建邻接图，计算图上每个点x的k最邻域点，计算每条边的权重Wij，不相连的边权重为0，否则为1，计算特征向量方法如下：XLpXTa＝λXDdiaXTa其中，图像特征X∈RD×N，N为样本个数，每个样本有D维特征，Ddia是对角矩阵，Dii＝∑jWji；Lp＝Ddia-W，Lp是半正定的拉普拉斯矩阵，W是由权重Wij构成的稀疏对称矩阵；步骤2.2：依据约束条件aTXDdiaXTa＝1，计算最小化函数，方法如下：其中，前d个最小的非零特征值对应的特征向量即为投影矩阵；步骤2.3：利用投影矩阵A＝{ai}∈RD×d(d<D,ai≠0)，找到数据的低维嵌入表示，方法如下：Y＝ATX其中，Y即为降维后的特征向量；步骤3：词汇树索引的构建；步骤3.1：随机的选取K个初始聚类中心Ci；步骤3.2：使用分层K-means，计算聚类中心Ci与每个特征点的距离，并把与聚类中心距离最小的点归到以Ci为聚类中心的类中；步骤3.3：重新计算每个聚类中心Ci；步骤3.4：计算判断聚类中心Ci与所属以Ci为聚类中心的类的特征点之间的距离是否满足...

【专利技术属性】
技术研发人员：卓力，成博，白宇，彭远帆，张燕，张菁，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人