联合学习系统中的语义学习技术方案

技术编号：37512167 阅读：19 留言：0更新日期：2023-05-12 15:32

提供了一种用于利用语义学习增强的联合学习的方法、计算机系统和计算机程序产品。聚合器可以从分布式计算设备接收集群信息。集群信息可以与分布式计算设备的样本数据中的所识别的集群有关。聚合器可以集成集群信息以定义类别。该集成可以包括识别所识别的集群中的任何冗余集群。类别的数量可以对应于来自分布式计算设备的集群的总数减去任何冗余集群。深度学习模型可以从聚合器发送到分布式计算设备。深度学习模型可以包括具有可以对应于所定义的类别的节点的输出层。聚合器可以接收由分布式计算设备执行的联合学习的结果。联合学习可以训练深度学习模型。可以训练深度学习模型。可以训练深度学习模型。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】联合学习系统中的语义学习

技术介绍

[0001]本专利技术总地涉及深度学习模型领域，具体涉及用于深度学习模型的联合学习(federated learning)。
[0002]在联合学习系统中，一组多个设备或多方一起工作以开发和协作地训练一个深度学习模型，例如预测模型，而不与参与模型训练的其他设备或各方共享或透露个体方的原始数据。因为处理的数据越多，模型将被训练得越好，所以使用多方及其数据进行深度学习训练将导致更好的训练和更好的模型。聚合器从各个设备或各方接收信息，并且编译或聚合该信息以微调深度学习模型。在一些情况下，聚合器对来自各方的信息求平均以便调整深度学习模型。在联合学习系统中，网络中的各种设备的数据可以用于训练模型，而无需设备通过云共享在个体计算设备或电话上的个体原始数据。聚合器可以将经调整的深度学习模型发送到各个设备，而无需这些设备从其他设备接收原始数据。因此，联合学习帮助实现个体设备的原始数据的私密性，同时仍允许多方一起工作以训练深度学习模型。联合学习防止对手还原数据变换以找到与特定方匹配的原始训练数据。
[0003]Bonawitz等人的“Towards Federated Learning At Scale System Design”描述了联合学习(“FL”)是一种分布式机器学习方法，其使得能够训练驻留在诸如移动电话的设备上的大量分散数据。Bonawitz等人还说FL解决了数据的私密性、所有权和本地性(locality)的基本问题。
[0004]Prakash等人的美国专利申请公开号2019/01389...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于联合学习的计算机实现的方法，所述方法包括：经由聚合器从分布式计算设备接收集群信息，其中所述集群信息与所述分布式计算设备的样本数据中的所识别的集群有关，并且其中所述聚合器包括至少一个处理器；经由所述聚合器集成所述集群信息以定义类别，其中所述集成包括识别所述所识别的集群之中的任何冗余集群，并且其中所述类别的数量对应于来自所述分布式计算设备的集群的总数减去任何冗余集群；从所述聚合器向所述分布式计算设备发送深度学习模型，其中所述深度学习模型包括具有节点的输出层，其中所述节点对应于所定义的类别；以及由所述聚合器接收由所述分布式计算设备执行的联合学习的一个或多个结果，其中所述联合学习训练所述深度学习模型。2.根据权利要求1所述的方法，还包括：经由所述聚合器向所述分布式计算设备提供自动编码器；经由所述分布式计算设备的各个计算设备，通过所述自动编码器运行所述各个计算设备的样本数据以产生自动编码器输出；经由所述各个计算设备通过聚类算法运行所述自动编码器输出以从所述样本数据识别所述集群；以及将所述集群信息从所述分布式计算设备发送到所述聚合器。3.根据权利要求1所述的方法，还包括：经由所述分布式计算设备执行所述联合学习。4.根据权利要求1所述的方法，其中每个集群包括质心；其中所述集群信息包括质心信息，其中所述质心信息与所述质心有关；并且其中识别任何冗余集群包括比较所述集群的所述质心的所述质心信息。5.根据权利要求4所述的方法，其中如果两个集群的质心之间的距离小于预定义的阈值，则所述聚合器将所述两个集群定义为冗余的。6.根据权利要求1所述的方法，还包括：经由所述分布式计算设备中的计算设备，根据所述计算设备的语义含义来命名所述类别中的类别。7.根据权利要求2所述的方法，还包括：在所述集群信息被发送到所述聚合器之前，经由所述分布式计算设备匿名化所述集群信息。8.根据权利要求2所述的方法，还包括：由所述聚合器向所述分布式计算设备发送初始自动编码器以供执行；经由所述分布式计算设备顺序训练所述初始自动编码器以生成所述自动编码器；以及将所述自动编码器从所述分布式计算设备中的最后的计算设备发送到所述聚合器。9.根据权利要求8所述的方法，其中所述顺序训练包括：经由所述分布式计算设备中的第一计算设备训练所述初始自动编码器以产生部分训练的自动编码器；将所述部分训练的自动编码器从所述第一计算设备发送到所述分布式计算设备中的第二计算设备；
经由所述第二计算设备训练所述部分训练的自动编码器以产生进一步训练的自动编码器；将所述进一步训练的自动编码器从所述第二计算设备发送到附加计算设备；以及通过所述附加计算设备训练所述进一步训练的自动编码器以产生所述自动编码器，其中所述附加计算设备是所述最后的计算设备。10.根据权利要求8所述的方法，其中所述初始自动编码器是预先训练的自动编码器。11.根据权利要求2所述的方法，还包括：经由所述分布式计算设备中的第一计算设备在所述联合学习期间检查新类别，其中所述检查包括所述第一计算设备向所述自动编码器馈送新样本并且执行异常检测以检测偏离所述类别的所述新样本，并且其中所述偏离超过预定义阈值。12.根据权利要求11所述的方法，还包括：经由所述第一计算设备向所述聚合器通知所述偏离；经由所述聚合器将新类别添加到所述类别以形成新的类别集合，其中所述新类别对应...

【专利技术属性】
技术研发人员：V，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人