【技术实现步骤摘要】
【国外来华专利技术】垂直分区数据的联邦双随机核学习
[0001]交叉引用
[0002]在本公开的描述中引用和讨论了一些参考文献,其可能包括专利、专利申请和各种出版物。提供此类参考文献的引用和/或讨论仅用于阐明本公开的描述,并不承认任何此类参考文献是本文所述公开的“现有技术”。在说明书中引用和讨论的所有参考文献通过引用整体并入本文,并且与每篇参考文献通过引用单独并入的程度相同。
[0003]本公开总体上涉及联邦学习,具体来说,涉及一种使用核方法对垂直分区数据的大规模隐私保护联邦学习。
技术介绍
[0004]在此提供的背景描述是为了概括地呈现本公开的上下文。在本背景部分描述的范围内,当前署名的专利技术人的工作以及在申请递交时本可以不算作现有技术的描述方面,不以明示或暗示的方式被承认为针对本公开的现有技术。
[0005]联邦学习是一种机器学习技术,可以在多个分散的边缘设备或保存本地数据样本的服务器上训练算法,而无需交换它们的数据样本。然而,以足够的效率、可扩展性和安全性处理大量数据是一项挑战。
[0006]因此,本领域 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种使用机器学习模型进行预测的系统,包括:主动计算设备和与所述主动计算设备通信的至少一个被动计算设备,其中所述主动计算设备和所述被动计算设备中的每个计算设备包括本地数据,所述主动计算设备包括处理器和存储计算机可执行代码的存储设备,所述计算机可执行代码在处理器处执行时被配置为:获取所述机器学习模型的参数;从所述主动计算设备的本地数据中检索实例;对所述实例的随机方向进行采样;计算所述随机方向与所述实例的点积,基于所述点积计算随机特征;计算所述主动计算设备中所述实例的预测值,指示所述至少一个被动计算设备计算所述至少一个被动计算设备中所述实例的预测值,汇总来自所述主动计算设备和所述至少一个被动计算设备的预测值以获取所述实例的最终预测值,其中所述至少一个被动计算设备中所述实例的预测值是基于所述至少一个被动计算设备的本地数据获取的;使用所述实例的最终预测值与所述实例的目标值之间的差和所述随机特征来确定模型系数;使用所述模型系数来更新所述机器学习模型;以及使用所述机器学习模型来预测新实例的值。2.根据权利要求1所述的系统,其中,所述机器学习模型的参数包括恒定的学习率。3.根据权利要求1所述的系统,其中,所述实例由索引表征,所述计算机可执行代码被配置为将所述索引提供给所述至少一个被动客户端计算机,所述主动客户端计算机和所述至少一个被动客户端计算机中的每个客户端计算机被配置为基于所述索引对所述随机方向进行采样。4.根据权利要求3所述的系统,其中,所述随机方向是从高斯分布中采样的。5.根据权利要求1所述的系统,其中,所述随机特征是使用等式计算的,是所述点积,b是随机值。6.根据权利要求5所述的系统,其中,由计算,q是所述主动计算设备和所述至少一个被动计算设备的数量,是q个计算设备中的第个,是第个计算设备中随机方向和实例的点积,是在第个计算设备中生成的随机数,l
′
是所述主动计算设备。7.根据权利要求1所述的系统,其中,使用多次迭代计算所述主动计算设备中所述实例的预测值,所述预测值在所述迭代中使用等式更新,f
l
(x)是所述实例的预测值,α
i
是所述实例的模型系数,是所述随机特征。8.根据权利要求1所述的系统,其中,所述迭代等于或大于2。9.根据权利要求1所述的系统,其中,所述计算机可执行代码被配置为通过使用等式α
j
=(1
‑
γλ)α
j
替换每个先前模型系数来更新所述机器学习模型,其中α
j
是所述先前模型系数中的任何一个,γ是所述机器学习模型的学习率,λ是所述机器学习模型的正则化参数。
10.根据权利要求1所述的系统,其中,所述主动计算设备和所述至少一个被动计算设备之间的通信是通过与所述主动计算设备和所述至少一个被动计算设备通信的协调器计算设备使用树形结构来执行的。11.一种使用机器学习模型进行预测的方法,包括:由主动计算设备获取所述机器学习模型的参数;由所述主动计算设备从所述主动计算设备的本地数据中检索实例;由所述主动计算设备对所述实例的随机方向进行采样;由所述主动计算设备计算所述随机方向与所述实例的点积,基于所述点积计算随机特征;由所述主动计算设备计算所述实...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。