一种联邦聚类方法、系统及计算机存储介质技术方案

技术编号:37854535 阅读:27 留言:0更新日期:2023-06-14 22:47
本发明专利技术公开一种联邦聚类方法、系统及计算机存储介质。其中,该方法包括:S101,获取发起方的第一数据矩阵、第一聚类中心矩阵,获取多个参与方对应的多个第二数据矩阵、多个第二聚类中心矩阵;S102,将第一数据矩阵、第一聚类中心矩阵、每个第二数据矩阵、每个第二聚类中心矩阵进行拆分拼接,得到多个数据碎片对和多个聚类中心碎片对;S103,根据多个数据碎片对和多个聚类中心碎片对对多个聚类中心碎片对进行更新,得到多个当前更新聚类中心碎片对;S104,重复S103,直至所有当前更新聚类中心碎片的总和与所有上一更新聚类中心碎片的总和的差值小于预设阈值时,得到目标聚类中心碎片。该方法中每个算力提供方只能知道聚类中心的碎片信息,保证数据的隐私性。保证数据的隐私性。保证数据的隐私性。

【技术实现步骤摘要】
一种联邦聚类方法、系统及计算机存储介质


[0001]本专利技术涉及机器学习
,具体而言,涉及一种联邦聚类方法、系统及计算机存储介质。

技术介绍

[0002]现有技术中,每个算力提供方是能够知道数据提供方的聚类中心的数值的,现有技术的联邦聚类方法不具有隐私性。
[0003]针对现有技术中联邦聚类方法不具有隐私性的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例中提供一种联邦聚类方法、系统及计算机存储介质,以解决现有技术中联邦聚类方法不具有隐私性的问题。
[0005]为达到上述目的,一方面,本专利技术提供了一种联邦聚类方法,其中,该方法包括:S101,获取发起方的第一数据矩阵、第一聚类中心矩阵,以及获取多个参与方对应的多个第二数据矩阵、多个第二聚类中心矩阵;S102,将所述第一数据矩阵、所述第一聚类中心矩阵、每个第二数据矩阵、每个第二聚类中心矩阵进行拆分拼接,得到多个数据碎片对和多个聚类中心碎片对;S103,根据所述多个数据碎片对和多个聚类中心碎片对对所述多个聚类中心碎片对进行更新本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种联邦聚类方法,其特征在于,包括:S101,获取发起方的第一数据矩阵、第一聚类中心矩阵,以及获取多个参与方对应的多个第二数据矩阵、多个第二聚类中心矩阵;S102,将所述第一数据矩阵、所述第一聚类中心矩阵、每个第二数据矩阵、每个第二聚类中心矩阵进行拆分拼接,得到多个数据碎片对和多个聚类中心碎片对;S103,根据所述多个数据碎片对和多个聚类中心碎片对对所述多个聚类中心碎片对进行更新,得到多个当前更新聚类中心碎片对;S104,重复所述S103,直至多个当前更新聚类中心碎片对中的所有当前更新聚类中心碎片的总和,与多个上一更新聚类中心碎片对中的所有上一更新聚类中心碎片的总和的差值小于预设阈值时,得到目标聚类中心碎片。2.根据权利要求1所述的方法,其特征在于,所述S102包括:将所述第一数据矩阵、每个第二数据矩阵均拆分为三份并根据特征进行拼接,得到三个数据碎片;以及将所述第一聚类中心矩阵、每个第二聚类中心矩阵均拆分为三份并根据特征进行拼接,得到三个聚类中心碎片;将所述三个数据碎片两两凑对得到三个数据碎片对;以及将所述三个聚类中心碎片两两凑对得到三个聚类中心碎片对。3.根据权利要求2所述的方法,其特征在于,所述S103包括:根据所述三个数据碎片对和三个聚类中心碎片对计算任意样本到任意聚类中心的欧氏距离的平方和,得到三个距离对;根据所述三个距离对计算对应的距离矩阵,并将所述距离矩阵中的每一行的最小值改为1,其余值改为0,以得到三个0

1矩阵碎片对;根据所述三个数据碎片对、所述三个0

1矩阵碎片对计算得到三个当前更新聚类中心碎片对。4.根据权利要求3所述的方法,其特征在于,所述根据所述三个数据碎片对、所述三个0

1矩阵碎片对计算得到三个当前更新聚类中心碎片对包括:将所述三个0

1矩阵碎片对中每个0

1矩阵碎片中的每一列求和,得到三个向量对;根据三个向量对计算得到总向量;根据所述三个数据碎片对、所述三个0

1矩阵碎片对的转置、所述总向量计算得到所述三个当前更新聚类中心碎片对。5.根据权利要求4所述的方法,其特征在于,所述根据所述三个数据碎片对、所述三个0

1矩阵碎片对的转置、所述总向量计算得到所述三个当前更新聚类中心碎片对包括:根据所述三个数据碎...

【专利技术属性】
技术研发人员:张宇兰春嘉
申请(专利权)人:上海零数众合信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1