System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于纵向联邦学习的客户端数据分类方法、装置及设备制造方法及图纸_技高网
当前位置: 首页 > 专利查询>中山大学专利>正文

基于纵向联邦学习的客户端数据分类方法、装置及设备制造方法及图纸

技术编号:41281643 阅读:4 留言:0更新日期:2024-05-11 09:32
本发明专利技术公开了一种基于纵向联邦学习的客户端数据分类方法、装置及设备,包括获取待检测客户端数据集,并将待检测客户端数据集输入至预置纵向联邦学习分类模型,预置纵向联邦学习分类模型包括特征编码模块、特征提纯模块和服务器分类模块;采用特征编码模块对待检测客户端数据集进行数据填充,输出特征嵌入数据集;通过特征提纯模块对特征嵌入数据集进行张量分解,生成低秩恢复张量矩阵;将低秩恢复张量矩阵输入至服务器分类模块进行聚合分类,输出目标分类预测结果;解决了现有的纵向联邦学习数据分类方法会使得联邦学习中的客户端数据缺失的情况,从而导致纵向联邦学习模型的性能大幅度下降的技术问题。

【技术实现步骤摘要】

本专利技术涉及分散式客户端数据处理方法,尤其涉及一种基于纵向联邦学习的数据分类方法、装置及设备。


技术介绍

1、随着智能设备的存储和处理能力不断发展,工业工程中数据科学的重要性逐渐凸显。然而,由于本地客户端的私有数据受到限制,其通用性也受到限制,因此在实际应用中,我们难以采用传统的中心化学习方法来收集散布在各种设备上的数据。联邦学习的出现旨在通过中央服务器协调多个客户端,实现分散式机器学习设置。

2、目前,联邦学习(federal learning,fl)已经成为一种有效的解决方案,可以在不侵犯用户隐私的情况下克服数据孤岛问题,同时保护数据的隐私。最近,纵向联邦学习(vertical federated learning,vfl)引起了大家越来越多的关注,纵向联邦学习是一种涉及不同参与方持有的数据的协作机器学习方法,其中,特征数据按列进行分割,每个参与方拥有各自不同的特征集。在纵向联邦学习保护隐私的前提下,非常适合满足企业需求,并能高效构建卓越的机器学习模型。因此,纵向联邦学习技术已经在实际应用领域中广泛采用,并受到积极的推动。

3、现有的纵向联邦学习数据分类方法中,主要关注处理仅涉及两个客户端之间的情况,没有充分考虑在受到网络传输故障、存储设备故障的影响时,会使得联邦学习中的客户端数据缺失的情况,从而导致纵向联邦学习模型的性能大幅度下降。


技术实现思路

1、本专利技术提供了一种基于纵向联邦学习的客户端数据分类方法、装置及设备,解决了现有的基于纵向联邦学习的客户端数据分类方法会使得联邦学习中的客户端数据缺失的情况,从而导致纵向联邦学习模型的性能大幅度下降的技术问题。

2、本专利技术第一方面提供的一种基于纵向联邦学习的客户端数据分类方法,包括:

3、获取待检测客户端数据集,并将所述待检测客户端数据集输入至预置纵向联邦学习分类模型,所述预置纵向联邦学习分类模型包括特征编码模块、特征提纯模块和服务器分类模块;

4、采用所述特征编码模块对所述待检测客户端数据集进行数据填充,输出特征嵌入数据集;

5、通过所述特征提纯模块对所述特征嵌入数据集进行张量分解,生成低秩恢复张量矩阵;

6、将所述低秩恢复张量矩阵输入至所述服务器分类模块进行聚合分类,输出目标分类预测结果。

7、可选地,所述特征嵌入数据集包括多个特征嵌入矩阵;所述特征编码模块包括填充层和特征抽取器;所述采用所述特征编码模块对所述待检测客户端数据集进行数据填充,输出特征嵌入数据集的步骤,包括:

8、通过填充层采用预置可学习矩阵对所述待检测客户端数据集中的多个数据特征矩阵进行矩阵填充,生成多个客户端数据填充特征矩阵;

9、采用所述特征抽取器对各所述客户端数据填充特征矩阵分别进行特征提取,输出多个特征嵌入矩阵。

10、可选地,所述特征提纯模块包括平均聚合层和多个1×1卷积层;所述通过所述特征提纯模块对所述特征嵌入数据集进行张量分解,生成低秩恢复张量矩阵的步骤,包括:

11、对各所述特征嵌入矩阵进行数据嵌入,生成所述待检测客户端数据集对应的嵌入张量;

12、将所述嵌入张量输入至所述平均聚合层进行多维度平均聚合,输出所述嵌入张量对应的维度嵌入向量;

13、将所述维度嵌入向量分别输入至各所述1×1卷积层进行卷积运算,输出多个秩一向量,其中,秩一向量包括第一秩一向量、第二秩一向量和第三秩一向量;

14、对各所述第一秩一向量、各所述第二秩一向量和各所述第三秩一向量分别进行克罗内克积运算,生成多个秩一张量;

15、对各所述秩一张量进行叠加,输出低秩恢复张量矩阵。

16、可选地,所述服务器分类模块包括聚合层和全局分类器;所述将所述低秩恢复张量矩阵输入至所述服务器分类模块进行聚合分类,输出目标分类预测结果的步骤,包括:

17、采用所述聚合层对所述低秩恢复张量矩阵进行聚合,生成客户维度多方数据;

18、通过所述全局分类器对所述客户维度多方数据进行分类预测,输出目标分类预测结果。

19、可选地,在所述获取待检测客户端数据集,并将所述待检测客户端数据集输入至预置纵向联邦学习分类模型的步骤之前,包括:

20、获取待训练客户端数据集,并将所述待训练客户端数据集输入至初始纵向联邦学习分类模型,输出待训练嵌入张量、待训练低秩恢复张量矩阵和待训练分类预测结果;

21、采用所述待训练嵌入张量、所述待训练低秩恢复张量矩阵和待训练分类预测结果,计算目标损失值;

22、若目标损失值已收敛,则将训练好的所述初始纵向联邦学习分类模型作为所述预置纵向联邦学习分类模型。

23、本专利技术第二方面提供的一种基于纵向联邦学习的客户端数据分类装置,包括:

24、获取模块,用于获取待检测客户端数据集,并将所述待检测客户端数据集输入至预置纵向联邦学习分类模型,所述预置纵向联邦学习分类模型包括特征编码模块、特征提纯模块和服务器分类模块;

25、采用模块,用于采用所述特征编码模块对所述待检测客户端数据集进行数据填充,输出特征嵌入数据集;

26、分解模块,用于通过所述特征提纯模块对所述特征嵌入数据集进行张量分解,生成低秩恢复张量矩阵;

27、分类模块,用于将所述低秩恢复张量矩阵输入至所述服务器分类模块进行聚合分类,输出目标分类预测结果。

28、可选地,所述特征嵌入数据集包括多个特征嵌入矩阵;所述特征编码模块包括填充层和特征抽取器;所述采用模块,包括:

29、矩阵填充子模块,用于通过填充层采用预置可学习矩阵对所述待检测客户端数据集中的多个数据特征矩阵进行矩阵填充,生成多个客户端数据填充特征矩阵;

30、特征提取子模块,用于采用所述特征抽取器对各所述客户端数据填充特征矩阵分别进行特征提取,输出多个特征嵌入矩阵。

31、可选地,所述特征提纯模块包括平均聚合层和多个1×1卷积层;所述分解模块,包括:

32、数据嵌入子模块,用于对各所述特征嵌入矩阵进行数据嵌入,生成所述待检测客户端数据集对应的嵌入张量;

33、平均聚合子模块,用于将所述嵌入张量输入至所述平均聚合层进行多维度平均聚合,输出所述嵌入张量对应的维度嵌入向量;

34、卷积运算子模块,用于将所述维度嵌入向量分别输入至各所述1×1卷积层进行卷积运算,输出多个秩一向量,其中,秩一向量包括第一秩一向量、第二秩一向量和第三秩一向量;

35、克罗内克积运算子模块,用于对各所述第一秩一向量、各所述第二秩一向量和各所述第三秩一向量分别进行克罗内克积运算,生成多个秩一张量;

36、叠加子模块,用于对各所述秩一张量进行叠加,输出低秩恢复张量矩阵。

37、可选地,所述服务器分类模块包括聚合层和全局分类器;所述分类模块,包括:

38、聚合子模块,用于采用所述聚合层本文档来自技高网...

【技术保护点】

1.一种基于纵向联邦学习的客户端数据分类方法,其特征在于,包括:

2.根据权利要求1所述的基于纵向联邦学习的客户端数据分类方法,其特征在于,所述特征嵌入数据集包括多个特征嵌入矩阵;所述特征编码模块包括填充层和特征抽取器;所述采用所述特征编码模块对所述待检测客户端数据集进行数据填充,输出特征嵌入数据集的步骤,包括:

3.根据权利要求2所述的基于纵向联邦学习的客户端数据分类方法,其特征在于,所述特征提纯模块包括平均聚合层和多个1×1卷积层;所述通过所述特征提纯模块对所述特征嵌入数据集进行张量分解,生成低秩恢复张量矩阵的步骤,包括:

4.根据权利要求1所述的基于纵向联邦学习的客户端数据分类方法,其特征在于,所述服务器分类模块包括聚合层和全局分类器;所述将所述低秩恢复张量矩阵输入至所述服务器分类模块进行聚合分类,输出目标分类预测结果的步骤,包括:

5.根据权利要求1所述的基于纵向联邦学习的客户端数据分类方法,其特征在于,在所述获取待检测客户端数据集,并将所述待检测客户端数据集输入至预置纵向联邦学习分类模型的步骤之前,包括:

6.一种基于纵向联邦学习的客户端数据分类装置,其特征在于,包括:

7.根据权利要求6所述的基于纵向联邦学习的客户端数据分类装置,其特征在于,所述特征嵌入数据集包括多个特征嵌入矩阵;所述特征编码模块包括填充层和特征抽取器;所述采用模块,包括:

8.根据权利要求7所述的基于纵向联邦学习的客户端数据分类装置,其特征在于,所述特征提纯模块包括平均聚合层和多个1×1卷积层;所述分解模块,包括:

9.根据权利要求6所述的基于纵向联邦学习的客户端数据分类装置,其特征在于,所述服务器分类模块包括聚合层和全局分类器;所述分类模块,包括:

10.一种电子设备,其特征在于,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-5任一项所述的基于纵向联邦学习的客户端数据分类方法的步骤。

...

【技术特征摘要】

1.一种基于纵向联邦学习的客户端数据分类方法,其特征在于,包括:

2.根据权利要求1所述的基于纵向联邦学习的客户端数据分类方法,其特征在于,所述特征嵌入数据集包括多个特征嵌入矩阵;所述特征编码模块包括填充层和特征抽取器;所述采用所述特征编码模块对所述待检测客户端数据集进行数据填充,输出特征嵌入数据集的步骤,包括:

3.根据权利要求2所述的基于纵向联邦学习的客户端数据分类方法,其特征在于,所述特征提纯模块包括平均聚合层和多个1×1卷积层;所述通过所述特征提纯模块对所述特征嵌入数据集进行张量分解,生成低秩恢复张量矩阵的步骤,包括:

4.根据权利要求1所述的基于纵向联邦学习的客户端数据分类方法,其特征在于,所述服务器分类模块包括聚合层和全局分类器;所述将所述低秩恢复张量矩阵输入至所述服务器分类模块进行聚合分类,输出目标分类预测结果的步骤,包括:

5.根据权利要求1所述的基于纵向联邦学习的客户端数据分类方法,其特征在于,在所述获取待检...

【专利技术属性】
技术研发人员:陈川廖天驰赵思然郑子彬
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1