System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于切比雪夫距离的档案信息相似度保密度量的编码方法、保密度量方法、存储介质及设备技术_技高网

基于切比雪夫距离的档案信息相似度保密度量的编码方法、保密度量方法、存储介质及设备技术

技术编号:41327792 阅读:7 留言:0更新日期:2024-05-13 15:05
基于切比雪夫距离的档案信息相似度保密度量的编码方法、保密度量方法、存储介质及设备,属于档案信息处理技术领域。为了解决现有的不泄露涉密档案数据隐私的情况下的文档距离度量方案存在计算复杂度高、计算效率差的问题,本发明专利技术将涉密档案中的信息进行特征提取得到特征向量,然后通过降维技术将特征向量映射为二维向量,即分别将第一涉密档案和第二涉密档案中的信息映射为一个平面上的私密点,并进行编码,然后基于NTRU加密算法提出了一种半诚实模型下安全计算切比雪夫距离协议和一种恶意模型下的安全计算切比雪夫距离协议,可以将切比雪夫距离的保密计算转化为保密计算向量的内积,进而实现档案信息相似度保密度量。

【技术实现步骤摘要】

本专利技术属于档案信息处理,具体涉及一种档案信息相似度保密度量方法。


技术介绍

1、伴随着云计算、边缘计算等新一代信息技术的快速发展,全球数据量呈爆发式增长。数据已经成为影响全球竞争的重要战略性资源。然而,现阶段海量的数据分布在不同的组织机构和信息系统中,需要实现跨部门、跨地域、跨系统间的数据共享,才能充分发挥数据价值。但是数据安全与合规问题却对数据共享造成了诸多挑战。安全多方计算(mpc),作为隐私计算的核心技术,为保障数据在安全合规的前提下发挥价值提供了破局思路,它是一个涵盖密码学、人工智能和区块链等众多领域的跨学科技术体系。

2、安全多方计算可以使参与者在不泄露自己隐私数据的情况下,保密地使参与者利用自己的隐私数据联合进行某种运算。最早的安全多方计算问题是在1982年,由计算机科学家姚期智教授提出的百万富翁问题,随后goldreich等研究学者对其进行了深入的研究,安全多方计算研究领域不断扩展,其中包括保密数据挖掘、保密的计算几何和集合问题、保密的科学计算、保密的统计分析问题和保密的数据库查询问题等。这些研究不断地推动安全多方计算向前发展,切实解决了许多实际问题。

3、《secure manhattan distance computation》研究了关于保密计算两点间曼哈顿距离的问题,即在隐私保护的情况下计算两点p(x1,y1)和q(x2,y2)的曼哈顿距离md=|x1-x2|+|y1-y2|。其中的协议1运用一种编码方法和goldwasser-micali公钥加密算法将问题转化为了保密计算两个比特串的海明距离;其中的协议2通过运用另一种编码方法与paillier加密算法相结合,可以保密计算两点间曼哈顿距离问题,且可以防止恶意参与者在关键环节进行欺骗。但是这种方式的计算复杂度高、计算效率差,且元素个数增长对应的增长率高。

4、切比雪夫距离(chebyshevdistance)是一种重要的距离度量方式,切比雪夫距离越远说明档案信息间的差异越大,可以用于聚类、分类、异常检测等机器学习任务中。切比雪夫距离起源于国际象棋中国王的走法,国际象棋棋盘上两个位置间的切比雪夫距离是指国王要从一个位子移至另一个位子需要走的步数。由于王可以往斜前或斜后方向移动一格,因此可以较有效率的到达目的格子,图1是棋盘上所有位置距(3,4)位置的切比雪夫距离。切比雪夫距离也称为l∞距离,是两个n维向量之间的度量,表示这两个向量中各个维度上差值的最大值。设点a(x1,y1)和点b(x2,y2),两个点之间的切比雪夫距离定义为

5、d(x,y)=maxi|xi-yi|=max(|x1-x2|,|y1-y2|)。

6、其中,x和y分别表示两个n维向量,xi和yi分别表示它们在第i个维度上的值。举个例子,如果有两个二维向量x=(1,2)和y=(3,5),则它们之间的切比雪夫距离为:d(x,y)=max(|1-3|,|2-5|)=3。在这个例子中,两个向量的差值的最大值为3,因此它们之间的切比雪夫距离为3。

7、在档案管理系统中,切比雪夫距离主要用于档案数据的相似度度量、分类和聚类,以及评估数据压缩和降维的程度。通过将档案涉密数据的特征表示为向量,计算不同数据之间的切比雪夫距离,从而判断它们的相似程度,这有助于信息检索、聚类分析、异常检测等。通过计算档案之间的切比雪夫距离,可以将相似的档案归为一类,从而实现档案的分类;同时,也可以利用切比雪夫距离度量进行聚类分析,将档案划分为不同的簇,以便更好地管理和组织档案。为了对大量的档案数据进行压缩和降维以节省存储空间和提高处理效率,切比雪夫距离可以作为一种距离度量方法,用于评估数据压缩和降维的效果,从而选择最优的压缩和降维方法。在保护涉密档案隐私的情况下进行切比雪夫距离计算具有重要的理论意义与应用价值。保密计算切比雪夫距离可以更好地管理和组织档案数据,提高涉密档案查询、共享效率和安全性。但是目前缺少针对抗恶意敌手的切比雪夫距离保密计算方案。


技术实现思路

1、本专利技术是为了解决现有的不泄露涉密档案数据隐私的情况下的文档距离度量方案存在计算复杂度高、计算效率差的问题,以及随着元素个数增长对应的增长率高的问题。

2、一种基于切比雪夫距离的档案信息相似度保密度量的编码方法,针对第一涉密档案和第二涉密档案,将涉密档案中的信息进行特征提取得到特征向量,然后通过降维技术将特征向量映射为二维向量,即分别将第一涉密档案和第二涉密档案中的信息映射为一个平面上的私密点,设第一涉密档案和第二涉密档案中的信息分别映射为点s(x1,y1)和t(x2,y2),设坐标的全集u={u1,…,un},其中u1,…,un为n个连续的整数,满足u1<…<un;设点s(x1,y1)和t(x2,y2)满足x1,y1,x2,y2∈u;

3、编码方式1:针对s(x1,y1)中对x1的编码,根据x1和全集u构造一个n维数组a1=(a11,…,a1n),构造方式:假设x1=uk,k∈[1,n]={1,…,n},则令数组的前k个元素为0,后n-k个元素为1,即令a11=,…,=a1k=0,a1(k+1)=,…,=a1n=1;

4、采用相同方式,y1构造的数组为a′1=(a′11,…,a′1n);

5、采用相同方式,x2构造的数组为b1,y2构造的数组为b1′;

6、编码方式2:针对s(x1,y1)中对x1的编码,根据x1和全集u构造一个n维数组a2=(a21,…,a2n),构造方式:假设x1=uk,k∈[1,n]={1,…,n},则令数组的前k个元素为1,后n-k个元素0,即令a21=,…,=a2k=1,a2(k+1)=,…,=a2n=0;

7、采用相同方式,y1构造的数组为a2′=(a2′1,…,a′2n);

8、采用相同方式,x2构造的数组为b2,y2构造的数组为b2′;

9、基于编码方式1和编码方式2,针对第一涉密档案和第二涉密档案分别拥有私密点s(x1,y1)和t(x2,y2)进行编码:

10、对x1先按照编码方式1进行编码,再对x1按照编码方式2进行编码,最终将两个编码顺序拼接得到对应的向量记为a;采用相同的编码方式对y1进行编码得到a′;

11、对x2先按照编码方式2进行编码,再对x2按照编码方式1进行编码,最终将两个编码顺序拼接得到对应的向量记为b;采用相同的编码方式对y1进行编码得到b′;

12、或者,

13、对x1先按照编码方式2进行编码,再对x1按照编码方式1进行编码,最终将两个编码顺序拼接得到对应的向量记为a;采用相同的编码方式对y1进行编码得到a′;

14、对x2先按照编码方式1进行编码,再对x2按照编码方式2进行编码,最终将两个编码顺序拼接得到对应的向量记为b;采用相同的编码方式对y1进行编码得到b′。

15、基于切比雪夫距离的档案信息相似度保密度量方法,包括以下步骤:

1本文档来自技高网...

【技术保护点】

1.一种基于切比雪夫距离的档案信息相似度保密度量的编码方法,其特征在于:针对第一涉密档案和第二涉密档案,将涉密档案中的信息进行特征提取得到特征向量,然后通过降维技术将特征向量映射为二维向量,即分别将第一涉密档案和第二涉密档案中的信息映射为一个平面上的私密点,设第一涉密档案和第二涉密档案中的信息分别映射为点S(x1,y1)和T(x2,y2),设坐标的全集U={u1,…,un},其中u1,…,un为n个连续的整数,满足u1<…<un;设点S(x1,y1)和T(x2,y2)满足x1,y1,x2,y2∈U;

2.基于切比雪夫距离的档案信息相似度保密度量方法,其特征在于:包括以下步骤:

3.一种用于基于切比雪夫距离的档案信息相似度保密度量的计算机存储介质,所述存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现权利要求2所述的基于切比雪夫距离的档案信息相似度保密度量方法。

4.一种基于切比雪夫距离的档案信息相似度保密度量设备,所述设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由处理器加载并执行以实现权利要求2所述的基于切比雪夫距离的档案信息相似度保密度量方法。

5.基于切比雪夫距离的档案信息相似度保密度量方法,其特征在于:包括以下步骤:

6.一种用于基于切比雪夫距离的档案信息相似度保密度量的计算机存储介质,所述存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现权利要求5所述的基于切比雪夫距离的档案信息相似度保密度量方法。

7.一种基于切比雪夫距离的档案信息相似度保密度量设备,所述设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由处理器加载并执行以实现权利要求5所述的基于切比雪夫距离的档案信息相似度保密度量方法。

...

【技术特征摘要】

1.一种基于切比雪夫距离的档案信息相似度保密度量的编码方法,其特征在于:针对第一涉密档案和第二涉密档案,将涉密档案中的信息进行特征提取得到特征向量,然后通过降维技术将特征向量映射为二维向量,即分别将第一涉密档案和第二涉密档案中的信息映射为一个平面上的私密点,设第一涉密档案和第二涉密档案中的信息分别映射为点s(x1,y1)和t(x2,y2),设坐标的全集u={u1,…,un},其中u1,…,un为n个连续的整数,满足u1<…<un;设点s(x1,y1)和t(x2,y2)满足x1,y1,x2,y2∈u;

2.基于切比雪夫距离的档案信息相似度保密度量方法,其特征在于:包括以下步骤:

3.一种用于基于切比雪夫距离的档案信息相似度保密度量的计算机存储介质,所述存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现权利要求2所述的基于切比雪夫距...

【专利技术属性】
技术研发人员:刘新陈威佟梁兰英郭宇罗丹
申请(专利权)人:内蒙古科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1