当前位置: 首页 > 专利查询>清华大学专利>正文

保护数据隐私的DBSCAN算法计算方法及装置制造方法及图纸

技术编号:46062685 阅读:8 留言:0更新日期:2025-08-11 15:48
本申请涉及隐私计算技术领域,特别涉及一种保护数据隐私的DBSCAN算法计算方法及装置,方法包括:将多个数据持有方中的目标数据进行加密处理,将获得的第一秘密分享形式的数据发送至第一计算服务器,并将第二秘密分享形式的数据发送至第二计算服务器;在利用第一计算服务器和第二计算服务器进行目标DBSCAN聚类算法计算之后,确定第一聚类标签结果和第二聚类标签结果,并将第一聚类标签结果和第二聚类标签结果返还至多个数据持有方。本申请可以将数据持有方中的数据以加密形式外包给两个互不共谋的服务器,通过隐私计算技术产生聚类标签,且计算过程中不泄露原始数据,有效的提升隐私保护DBSCAN算法计算效率和安全性。

【技术实现步骤摘要】

本申请涉及隐私计算,特别涉及一种保护数据隐私的dbscan算法计算方法及装置。


技术介绍

1、在聚类算法中,数据规模和数据质量对聚类结果的有效性和准确性有着至关重要的影响,大规模数据集往往能更全面地反映数据分布的真实情况,从而有助于发现更加细致和精确的聚类结构,因此在很多情况下,需要多个数据持有方共享数据进行联合聚类。

2、传统的明文聚类算法需要将全部数据明文集中后进行计算,但是直接共享原始数据往往会暴露敏感信息,甚至会引发隐私泄露风险。出于信息安全和隐私保护及相关法案的考虑,来自多个数据持有方的数据往往不直接公开共享数据,而是需要使用隐私保护技术,使得能够在不暴露具体数据隐私信息的情况下对分布在不同数据源的信息进行聚类。

3、dbscan(density-based spatial clustering of applications with noise)作为一种基于密度的聚类算法,在处理非凸集数据和噪声数据时展现出了独特的优势。然而,其复杂的算法结构和较低的计算效率限制了其在大数据场景下的应用,此外,虽然相关技术中的同态加密、本文档来自技高网...

【技术保护点】

1.一种保护数据隐私的DBSCAN算法计算方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述将多个数据持有方中的目标数据进行加密处理,以获得第一秘密分享形式的数据和第二秘密分享形式的数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述在利用所述第一计算服务器和所述第二计算服务器进行目标DBSCAN聚类算法计算之后,以确定所述第一计算服务器的第一聚类标签结果和所述第二计算服务器的第二聚类标签结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述将所述第一聚类标签结果和所述第二聚类标签结果返还至所述多个数据持有方...

【技术特征摘要】

1.一种保护数据隐私的dbscan算法计算方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述将多个数据持有方中的目标数据进行加密处理,以获得第一秘密分享形式的数据和第二秘密分享形式的数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述在利用所述第一计算服务器和所述第二计算服务器进行目标dbscan聚类算法计算之后,以确定所述第一计算服务器的第一聚类标签结果和所述第二计算服务器的第二聚类标签结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述将所述第一聚类标签结果和所述第二聚类标签结果返还至所述多个数据持有方,包括:

5.根据权利要求1所述的方法,其特征在于,在将所述第一聚类标签结果和所述第二聚类标签结果返还至所述多个数据持有方之...

【专利技术属性】
技术研发人员:刘卓涛刘轩奇
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1