System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 安全高效的跨模态相似度度量方法技术_技高网

安全高效的跨模态相似度度量方法技术

技术编号:40285383 阅读:6 留言:0更新日期:2024-02-07 20:38
本发明专利技术公开了安全高效的跨模态相似度度量方法,具体按照以下步骤实施:步骤1,多模态数据预处理;步骤2,构建分层聚类树,并对分层聚类树进行加密;步骤3,生成查询令牌;步骤4,云服务器遍历加密后的分层聚类树并返回查询结果;步骤5,查询用户解密得到明文数据。本发明专利技术方法解决了现有跨模态检索方法中易遭到适应性选择关键字攻击造成隐私泄露及大规模加密数据集下数据相似性计算低效的问题。

【技术实现步骤摘要】

本专利技术属于跨模态检索,具体涉及安全高效的跨模态相似度度量方法


技术介绍

1、随着计算机、物联网的普及,文本、图像、音频、视频等多种类型数据为主的信息急剧增加,这些数据具备的可用性和重要性日益突显,因此社会及特定场所对高效的跨模态数据检索服务的需求也越来越多。例如在医院,医护人员可以根据病情描述查找病情症状的图片信息。然而在实际应用场景中,存在医生在大规模加密电子医疗记录中查询病人就诊信息低效、高时延的情况;为了节省本地存储资源和计算资源,用户更倾向将海量的多模态数据外包给云服务器,但不安全的云服务器会对用户数据隐私带来风险,因为云服务器可以通过数据信息来推断用户隐私。


技术实现思路

1、本专利技术的目的是提供安全高效的跨模态相似度度量方法,解决了现有跨模态检索方法中易遭到适应性选择关键字攻击造成隐私泄露及大规模加密数据集下数据相似性计算低效的问题。

2、本专利技术所采用的技术方案是,安全高效的跨模态相似度度量方法,具体按照以下步骤实施:

3、步骤1,多模态数据预处理;

4、步骤2,构建分层聚类树,并对分层聚类树进行加密;

5、步骤3,生成查询令牌;

6、步骤4,云服务器遍历加密后的分层聚类树并返回查询结果;

7、步骤5,查询用户解密得到明文数据。

8、本专利技术的特点还在于,

9、步骤1的具体为:数据拥有者利用跨模态哈希检索方法将多模态数据均转换成二进制哈希码y。

10、步骤2的具体过程为:

11、步骤2.1,数据拥有者利用k-modes聚类算法聚类步骤1转换的每个模态数据的哈希码y,得到多个聚类中心,每个聚类中心作为下一次聚类数据继续聚类,从而自下而上构建分层聚类树,分层聚类树中每个树结点保存一个哈希码y,每个模态数据对应一个分层聚类树;

12、步骤2.2,数据拥有者利用算法setup(1λ,1k)生成加密参数;

13、步骤2.3,数据拥有者利用算法enc(msk,y)对步骤2.1中每个树结点上的哈希码y进行加密;

14、步骤2.4,数据拥有者利用对称加密算法aes加密原始多模态数据,将加密后的原始多模态数据和经步骤2.3加密的分层聚类树上传给云服务器保存,并将对称加密算法aes的私钥skaes发给查询用户。

15、步骤2.1中,分层聚类树包括根结点、分支结点和叶子结点,其中每个叶子结点ni代表一个数据对象,包含该对象的哈希码yi和标识符oi,每个哈希码yi对应一个标识符oi;分支结点nj为该分支结点的所有孩子结点的哈希码yi根据k-modes聚类得到的聚类中心。

16、步骤2.2的具体过程为:输入安全参数λ和跨模态哈希码维度k,选择参数q,p,dgσ,保证等式(1)成立;

17、

18、式中,q、p均取整数;表示沿分布取样一个向量e*,表示整数域上方差为的离散高斯分布;表示沿分布取样一个向量e,其中表示方差为σ2的上的离散高斯分布;

19、随机选择一个正整数令q′=t′·q,在zq上设置均匀分布ds,生成一个m维向量和一个矩阵s←ds,从而得到主密钥msk=(u,s)和公共参数pp=(q,p,t′,n,q′),其中,表示沿整数域取样一个m维向量u,s←ds表示沿分布ds取样一个矩阵s,其中ds为均匀分布。

20、步骤2.3的具体过程为:

21、对于每个哈希码y∈{1,-1}k,执行如下操作,生成对应的密文ct;

22、步骤2.3.1,取样一个n维随机向量和一个错误向量由矩阵s的转置矩阵st和随机向量a计算得到一个k维向量b,b=-sta+(q′/p)·y+e,再生成一个m维向量c,c=(b,a),有ttc=(q′/p)·y+e和m=n+k,其中,tt为矩阵t的转置矩阵,表示沿分布取样一个向量e,其中表示方差为σ2的上的离散高斯分布;

23、步骤2.3.2,取样一个错误值计算向量u和向量c的内积再加上取样的错误得到一个值d,d=-<u,c>+e*,其中,表示沿分布取样一个向量e*,表示整数域上方差为的离散高斯分布,<u,c>表示向量u和向量c的内积;

24、步骤2.3.3,返回一个m+1维的密文ct=(d,c),则分层聚类树中的所有结点对应的哈希码yi均被加密成密文ct。

25、步骤3的具体过程为:查询用户利用跨模态哈希检索方法将查询数据均转换成二进制哈希码x,随机选择小于t′的整数,利用基于格的内积函数加密算法的密钥生成算法keygen(msk,x)生成密文sk,sk=u+t·tx,t≤t′,接着将查询令牌token,token=(sk,t)和查询目标数据类型发送给云服务器。

26、云服务器收到查询令牌后,遍历查询模态所对应的加密后的分层聚类树的分支结点,利用基于格的内积函数加密算法的解密算法dec(sk,ct)计算查询数据哈希码x与树结点保存哈希码y的汉明距离hd,找到每层树结点中汉明距离最小的结点,继续查询该汉明距离最小结点的孩子结点,找到最小汉明距离的分支结点,一直到叶子结点的上一层最小汉明距离的结点,将该分支结点所对应孩子结点的标识符oi和原始加密数据返回给用户。

27、汉明距离计算过程为:

28、计算sk和密文ct的内积v,其中符号表示对结果进行四舍五入取整,从而得出sk和密文ct的汉明距离hd,hd=(k-v)/2,k是向量长度。

29、本专利技术的有益效果是:

30、(1)本专利技术利用基于格的内积函数加密算法设计了高安全的相似性度量算法,实现了密文下跨模态哈希码的汉明距离的安全计算,并可以抵抗适应性选择关键字攻击;

31、(2)本专利技术利用k-modes聚类算法构建分层聚类树,在查询时避免遍历整个数据集,将查询时间减少到次线性复杂度,从而提高了效率。

本文档来自技高网...

【技术保护点】

1.安全高效的跨模态相似度度量方法,其特征在于,具体按照以下步骤实施:

2.根据权利要求1所述的安全高效的跨模态相似度度量方法,其特征在于,步骤1的具体为:数据拥有者利用跨模态哈希检索方法将多模态数据均转换成二进制哈希码y。

3.根据权利要求1所述的安全高效的跨模态相似度度量方法,其特征在于,步骤2的具体过程为:

4.根据权利要求3所述的安全高效的跨模态相似度度量方法,其特征在于,步骤2.1中,分层聚类树包括根结点、分支结点和叶子结点,其中每个叶子结点Ni代表一个数据对象,包含该对象的哈希码yi和标识符oi,每个哈希码yi对应一个标识符oi;分支结点Nj为该分支结点的所有孩子结点的哈希码根据k-modes聚类得到的聚类中心。

5.根据权利要求4所述的安全高效的跨模态相似度度量方法,其特征在于,步骤2.2的具体过程为:输入安全参数λ和跨模态哈希码维度k,选择参数q,p,DGσ,DGσ*,保证等式(1)成立;

6.根据权利要求4所述的安全高效的跨模态相似度度量方法,其特征在于,步骤2.3的具体过程为:

7.根据权利要求4所述的安全高效的跨模态相似度度量方法,其特征在于,步骤3的具体过程为:查询用户利用跨模态哈希检索方法将查询数据均转换成二进制哈希码x,随机选择小于t′的整数,利用基于格的内积函数加密算法的密钥生成算法KeyGen(msk,x)生成密文sk,sk=u+t·Tx,t≤t′,接着将查询令牌token,token=(sk,t)和查询目标数据类型发送给云服务器。

8.根据权利要求4所述的安全高效的跨模态相似度度量方法,其特征在于,步骤4的具体过程为:云服务器收到查询令牌后,遍历查询模态所对应的加密后的分层聚类树的分支结点,利用基于格的内积函数加密算法的解密算法Dec(sk,ct)计算查询数据哈希码x与树结点保存哈希码y的汉明距离HD,找到每层树结点中汉明距离最小的结点,继续查询该汉明距离最小结点的孩子结点,找到最小汉明距离的分支结点,一直到叶子结点的上一层最小汉明距离的结点,将该分支结点所对应孩子结点的标识符oi和原始加密数据返回给用户。

9.根据权利要求8所述的安全高效的跨模态相似度度量方法,其特征在于,汉明距离计算过程为:计算sk和密文ct的内积v,其中符号表示对结果进行四舍五入取整,从而得出sk和密文ct的汉明距离HD,HD=(k-v)/2,k是向量长度。

...

【技术特征摘要】

1.安全高效的跨模态相似度度量方法,其特征在于,具体按照以下步骤实施:

2.根据权利要求1所述的安全高效的跨模态相似度度量方法,其特征在于,步骤1的具体为:数据拥有者利用跨模态哈希检索方法将多模态数据均转换成二进制哈希码y。

3.根据权利要求1所述的安全高效的跨模态相似度度量方法,其特征在于,步骤2的具体过程为:

4.根据权利要求3所述的安全高效的跨模态相似度度量方法,其特征在于,步骤2.1中,分层聚类树包括根结点、分支结点和叶子结点,其中每个叶子结点ni代表一个数据对象,包含该对象的哈希码yi和标识符oi,每个哈希码yi对应一个标识符oi;分支结点nj为该分支结点的所有孩子结点的哈希码根据k-modes聚类得到的聚类中心。

5.根据权利要求4所述的安全高效的跨模态相似度度量方法,其特征在于,步骤2.2的具体过程为:输入安全参数λ和跨模态哈希码维度k,选择参数q,p,dgσ,dgσ*,保证等式(1)成立;

6.根据权利要求4所述的安全高效的跨模态相似度度量方法,其特征在于,步骤2.3的具体过程为:

7.根据权利要求4所述的安全高效的跨模态相似度度量方法,其特征在...

【专利技术属性】
技术研发人员:苗银宾张伟杨丽秦婷
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1