【技术实现步骤摘要】
本申请涉及隐私计算,特别涉及一种保护数据隐私的dbscan算法计算方法及装置。
技术介绍
1、在聚类算法中,数据规模和数据质量对聚类结果的有效性和准确性有着至关重要的影响,大规模数据集往往能更全面地反映数据分布的真实情况,从而有助于发现更加细致和精确的聚类结构,因此在很多情况下,需要多个数据持有方共享数据进行联合聚类。
2、传统的明文聚类算法需要将全部数据明文集中后进行计算,但是直接共享原始数据往往会暴露敏感信息,甚至会引发隐私泄露风险。出于信息安全和隐私保护及相关法案的考虑,来自多个数据持有方的数据往往不直接公开共享数据,而是需要使用隐私保护技术,使得能够在不暴露具体数据隐私信息的情况下对分布在不同数据源的信息进行聚类。
3、dbscan(density-based spatial clustering of applications with noise)作为一种基于密度的聚类算法,在处理非凸集数据和噪声数据时展现出了独特的优势。然而,其复杂的算法结构和较低的计算效率限制了其在大数据场景下的应用,此外,虽然相
...【技术保护点】
1.一种保护数据隐私的DBSCAN算法计算方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述将多个数据持有方中的目标数据进行加密处理,以获得第一秘密分享形式的数据和第二秘密分享形式的数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述在利用所述第一计算服务器和所述第二计算服务器进行目标DBSCAN聚类算法计算之后,以确定所述第一计算服务器的第一聚类标签结果和所述第二计算服务器的第二聚类标签结果,包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述第一聚类标签结果和所述第二聚类标签结果返还
...【技术特征摘要】
1.一种保护数据隐私的dbscan算法计算方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述将多个数据持有方中的目标数据进行加密处理,以获得第一秘密分享形式的数据和第二秘密分享形式的数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述在利用所述第一计算服务器和所述第二计算服务器进行目标dbscan聚类算法计算之后,以确定所述第一计算服务器的第一聚类标签结果和所述第二计算服务器的第二聚类标签结果,包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述第一聚类标签结果和所述第二聚类标签结果返还至所述多个数据持有方,包括:
5.根据权利要求1所述的方法,其特征在于,在将所述第一聚类标签结果和所述第二聚类标签结果返还至所述多个数据持有方之...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。