联邦机器学习的方法和服务器技术

技术编号：34236240 阅读：20 留言：0更新日期：2022-07-24 08:15

本发明专利技术提供了一种使用至少一个处理器的联邦机器学习的方法，所述方法包括：将当前全局机器学习模型传输到复数个数据源中的每一个；分别从所述复数个数据源接收复数个训练更新，所述复数个训练更新中的每一个由相应的所述数据源响应于接收到的所述全局机器学习模型而生成；并且分别基于接收到的所述复数个训练更新以及与所述复数个数据源相关联的复数个数据质量参数来更新所述当前全局机器学习模型，以生成更新的全局机器学习模型。还提供了用于联邦机器学习的相应的服务器。了用于联邦机器学习的相应的服务器。了用于联邦机器学习的相应的服务器。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】联邦机器学习的方法和服务器

[0001]本专利技术总体上涉及一种联邦机器学习的方法及其服务器。

技术介绍

[0002]有监督的深度学习算法为各种分类任务(例如图像分类任务)提供了最先进的性能。这些任务的传统途径可能包括三个步骤：(a)集中大型数据存储库，(b)获取这些数据的基本事实注释，以及(c)使用基本事实注释来训练卷积神经网络(CNN)进行分类，然而，这个框架带来了重大的实际挑战。
[0003]特别是，数据隐私以及安全问题给创建大型中央数据存储库以进行训练带来了困难。最近的工作已经开发出分散的联邦学习途径，可以在不共享敏感信息的情况下跨多个数据源训练深度学习模型。这些现有的联邦学习途径已经被证明是成功的，但仍然可能存在不准确和/或不可靠的问题，具体取决于它们所训练的数据源。
[0004]因此，需要提供一种联邦机器学习的方法及其系统，以寻求克服或至少改善现有联邦机器学习途径或方法中的一个或多个缺陷，例如但不限于，提高联邦机器学习的准确性和/或可靠性。正是在这种背景下开发了本专利技术。

技术实现思路

[0005]根据本专利技术的第一方面，提供了一种使用至少一个处理器的联邦机器学习的方法，该方法包括：
[0006]将当前全局机器学习模型传输到复数个数据源中的每一个；
[0007]分别从复数个数据源接收复数个训练更新，复数个训练更新中的每一个由相应的数据源响应于接收到的全局机器学习模型而生成；并且
[0008]分别基于接收到的复数个训练更新以及与复数个数据源相关联的...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种使用至少一个处理器的联邦机器学习的方法，所述方法包括：将当前全局机器学习模型传输到复数个数据源中的每一个；分别从所述复数个数据源接收复数个训练更新，所述复数个训练更新中的每一个由相应的所述数据源响应于接收到的所述全局机器学习模型而生成；并且分别基于接收到的所述复数个训练更新以及与所述复数个数据源相关联的复数个数据质量参数来更新所述当前全局机器学习模型，以生成更新的全局机器学习模型。2.根据权利要求1所述的方法，其中，所述复数个训练更新中的每一个是由相应的所述数据源基于接收到的所述全局机器学习模型以及由相应的所述数据源存储的标签数据生成的。3.根据权利要求2所述的方法，其中，所述复数个训练更新中的每一个包括所述当前全局机器学习模型和由相应的所述数据源基于所述当前全局机器学习模型以及由相应的所述数据源存储的标签数据进行训练的本地机器学习模型之间的差异。4.根据权利要求1所述的方法，其中，所述更新所述当前全局机器学习模型包括分别基于与所述复数个数据源相关联的所述复数个数据质量参数确定所述复数个训练更新的加权平均值。5.根据权利要求2所述的方法，其中，所述由相应的所述数据源存储的标签数据包括特征和标签，与相应的所述数据源相关联的数据质量参数包括与所述特征相关联的特征质量参数和与所述标签相关联的标签质量参数中的至少一种。6.根据权利要求5所述的方法，其中，所述复数个数据质量参数中的一个或多个分别基于第一数据质量因子、第二数据质量因子以及第三数据质量因子中的至少一个，其中所述第一数据质量因子涉及对应数据源的质量，所述第二数据质量因子涉及由所述对应数据源存储的标签数据的质量，所述第三数据质量因子涉及数据不确定性的统计推导。7.根据权利要求6所述的方法，其中，所述第一数据质量因子基于以下至少一个：与所述数据源关联的信誉级别，由所述对应数据源存储的标签数据的一个或多个数据注释者的能力级别，以及与用于生成由所述对应数据源存储的标签数据的注释方法的类型相关联的方法值，其中，所述标签数据的特征与图像相关，所述第二数据质量因子基于图像采集特征以及图像中图像伪影水平中的至少一个。8.根据权利要求1所述的方法，还包括：将多个数据源分箱成复数个质量范围；并且从所述多个数据源中选择所述复数个数据源。9.根据权利要求1所述的方法，其中，所述复数个数据质量参数为复数个数据质量指标。10.一种用于联邦机器学习的服务器，包括：存储器，至少一个处理器，通信地耦合到所述存储器并被配置为：将当前全局机器学习模型传输到复数个数据源中的每一个；分别从所述复数个数据源接收复数个训练更新，所述复数个训练更新中的每一个由相应的所述数据源响应于接收到的所述全局机器学习模型而生成；并且分别基于接收...

【专利技术属性】
技术研发人员：P，
申请(专利权)人：新加坡科技研究局，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人