横向联邦学习方法、装置、设备及计算机存储介质制造方法及图纸

技术编号:22262618 阅读:32 留言:0更新日期:2019-10-10 15:05
本发明专利技术涉及人工智能金融科技(Fintech)技术领域,并公开了一种横向联邦学习方法,该方法包括:在进行横向联邦学习时,目标参与者发送第一数据特征集合到横向联邦学习中的协调者,其中,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合,所述多个参与者包括目标参与者;所述目标参与者接收所述协调者反馈的所述总数据特征集合,并根据所述总数据特征集合确定所述目标参与者的目标数据特征集合;所述目标参与者根据所述目标数据特征集合进行模型训练。本发明专利技术还公开了一种横向联邦学习装置、设备和一种计算机存储介质。本发明专利技术提高了横向联邦学习构建的联合模型的质量。

Horizontal federated learning methods, devices, devices and computer storage media

【技术实现步骤摘要】
横向联邦学习方法、装置、设备及计算机存储介质
本专利技术涉及金融科技(Fintech)
,尤其涉及基于人工智能领域的横向联邦学习方法、装置、设备及计算机存储介质。
技术介绍
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。例如,联邦学习,即通过联合不同的参与者进行机器学习的方法,而其中横向联邦学习则是在参与者(如移动终端或者物联网设备)的数据特征重叠较多,用户重叠较少的情况下,取出参与者用户数据特征相同而用户不完全相同的那部分数据进行联合机器学习。但是目前在构建横向联邦学习应用时,只对参与者拥有数据的数据特征取值范围或取值范围相同的那些数据特征进行联合建模,而放弃取值范围或取值集合不同的数据特征。但是这样建模不能充分利用所有的数据特征,会限制横向联邦学习的应用场景,降低横向联邦学习构建的联合模型的质量。因此,如何提高横向联邦学习构建的联合模型的质量成为目前亟待解决的技术问题。
技术实现思路
本专利技术的主要目的在于提出一种横向联邦学习方法、装置、设备及计算机存储介质,旨在提高横向联邦学习构建的联合模型的质量。为实现上述目的,本专利技术提供一种横向联邦学习方法,所述横向联邦学习方法包括如下步骤:在进行横向联邦学习时,目标参与者发送第一数据特征集合到横向联邦学习中的协调者,其中,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合,所述多个参与者包括目标参与者;所述目标参与者接收所述协调者反馈的所述总数据特征集合,并根据所述总数据特征集合确定所述目标参与者的目标数据特征集合;所述目标参与者根据所述目标数据特征集合进行模型训练。可选地,所述根据所述总数据特征集合确定所述目标参与者的目标数据特征集合的步骤,包括:所述目标参与者检测所述总数据特征集合是否和所述第一数据特征集合相同;若所述总数据特征集合和所述第一数据特征集合相同,则将所述总数据特征集合作为所述目标参与者的目标数据特征集合。可选地,所述目标参与者检测所述总数据特征集合是否和所述第一数据特征集合相同的步骤之后,包括:若所述总数据特征集合和所述第一数据特征集合不相同,则获取所述目标参与者中预设的限制条件;所述目标参与者根据所述限制条件在所述总数据特征集合中筛选所述目标参与者的目标数据特征集合。可选地,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合的步骤,包括:所述协调者接收多个参与者发送的第二数据特征集合,并确定所述第二数据特征集合中各子数据特征集合的数据特征类型是否相同;若相同,则所述协调者确定各子数据特征集合的取值集合/范围是否相同;若各所述子数据特征集合的取值集合/范围不相同,则所述协调者将各子数据特征集合中的取值集合/范围进行合并,以生成总数据特征集合。可选地,所述协调者接收多个参与者发送的第二数据特征集合,并确定所述第二数据特征集合中各子数据特征集合的数据特征类型是否相同的步骤之后,包括:若不相同,则所述协调者确定所述第二数据特征集合中各子数据特征集合所属的数据特征类型,并将所属同一数据特征类型的子数据特征集合统一为第三数据特征集合;所述协调者确定所述第三数据特征集合中各子数据特征集合的取值集合/范围是否相同;若所述第三数据特征集合中各子数据特征集合的取值集合/范围不相同,则所述协调者将所述第三数据特征集合中各子数据特征集合的取值集合/范围进行合并,以生成总数据特征集合。可选地,所述若所述第三数据特征集合中各子数据特征集合的取值集合/范围不相同,则所述协调者将所述第三数据特征集合中各子数据特征集合的取值集合/范围进行合并,以生成总数据特征集合的步骤,包括:若所述第三数据特征集合中各子数据特征集合的取值集合/范围不相同,则所述协调者确定所述第三数据特征集合中取值集合/范围不相同的各子数据特征集合的数据数量,并检测所述数据数量是否小于预设数量;若所述数据数量小于预设数量,则所述协调者将所述第三数据特征集合中各子数据特征集合的取值集合/范围进行合并,以生成总数据特征集合。可选地,所述协调者将所述第三数据特征集合中各子数据特征集合的取值集合/范围进行合并,以生成总数据特征集合的步骤,包括:所述协调者将所述第三数据特征集合中各子数据特征集合的取值集合/范围进行合并,以获取合并后的第四数据特征集合;所述协调者确定未进行合并处理的所述第三数据特征集合,并根据未进行合并处理的所述第三数据特征集合和所述第四数据特征集合确定总数据特征集合。此外,为实现上述目的,本专利技术还提供一种横向联邦学习装置,所述横向联邦学习装置包括:发送模块,用于在进行横向联邦学习时,目标参与者发送第一数据特征集合到横向联邦学习中的协调者,其中,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合,所述多个参与者包括目标参与者;接收模块,用于所述目标参与者接收所述协调者反馈的所述总数据特征集合,并根据所述总数据特征集合确定所述目标参与者的目标数据特征集合;训练模块,用于所述目标参与者根据所述目标数据特征集合进行模型训练。此外,为实现上述目的,本专利技术还提供一种横向联邦学习设备,所述横向联邦学习设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的横向联邦学习程序,所述横向联邦学习程序被所述处理器执行时实现如上所述的横向联邦学习方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机存储介质,所述计算机存储介质上存储有横向联邦学习程序,所述横向联邦学习程序被处理器执行时实现如上所述的横向联邦学习方法的步骤。本专利技术通过在进行横向联邦学习时,目标参与者发送第一数据特征集合到横向联邦学习中的协调者,其中,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合,所述多个参与者包括目标参与者;所述目标参与者接收所述协调者反馈的所述总数据特征集合,并根据所述总数据特征集合确定所述目标参与者的目标数据特征集合;所述目标参与者根据所述目标数据特征集合进行模型训练。通过在目标参与者发送第一数据特征集合到协调者,并接收协调者发送的总数据特征集合,再在总数据特征集合中获取目标参与者对应的目标数据特征集合,并根据目标数据特征集合进行模型训练,从而可以让参与者根据自身需求对总数据特征集合进行甄别,得到目标数据特征集合,可以避免参与者接收协调者对各个参与者发送的第二数据特征集合进行操作得到的总数据特征集合,并根据总数据特征集合直接进行模型训练,而影响联合模型的质量的现象发生,从而也提高了横向联邦学习构建的联合模型的质量。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;图2为本专利技术横向联邦学习方法第一实施例的流程示意图;图3为本专利技术横向联邦学习装置的装置模块示意图;图4为本专利技术横向联邦学习方法中合并取值范围集合的场景示意图;图5为本专利技术横向联邦学习的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所本文档来自技高网...

【技术保护点】
1.一种横向联邦学习方法,其特征在于,所述横向联邦学习方法包括如下步骤:目标参与者发送第一数据特征集合到横向联邦学习中的协调者,其中,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合,所述多个参与者包括目标参与者;所述目标参与者接收所述协调者反馈的所述总数据特征集合,并根据所述总数据特征集合确定所述目标参与者的目标数据特征集合;所述目标参与者根据所述目标数据特征集合进行模型训练。

【技术特征摘要】
1.一种横向联邦学习方法,其特征在于,所述横向联邦学习方法包括如下步骤:目标参与者发送第一数据特征集合到横向联邦学习中的协调者,其中,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合,所述多个参与者包括目标参与者;所述目标参与者接收所述协调者反馈的所述总数据特征集合,并根据所述总数据特征集合确定所述目标参与者的目标数据特征集合;所述目标参与者根据所述目标数据特征集合进行模型训练。2.如权利要求1所述的横向联邦学习方法,其特征在于,所述根据所述总数据特征集合确定所述目标参与者的目标数据特征集合的步骤,包括:所述目标参与者检测所述总数据特征集合是否和所述第一数据特征集合相同;若所述总数据特征集合和所述第一数据特征集合相同,则将所述总数据特征集合作为所述目标参与者的目标数据特征集合。3.如权利要求2所述的横向联邦学习方法,其特征在于,所述目标参与者检测所述总数据特征集合是否和所述第一数据特征集合相同的步骤之后,包括:若所述总数据特征集合和所述第一数据特征集合不相同,则获取所述目标参与者中预设的限制条件;所述目标参与者根据所述限制条件在所述总数据特征集合中筛选所述目标参与者的目标数据特征集合。4.如权利要求1所述的横向联邦学习方法,其特征在于,所述协调者接收多个参与者发送的第二数据特征集合,并基于所述第二数据特征集合生成总数据特征集合的步骤,包括:所述协调者接收多个参与者发送的第二数据特征集合,并确定所述第二数据特征集合中各子数据特征集合的数据特征类型是否相同;若相同,则所述协调者确定各子数据特征集合的取值集合/范围是否相同;若各所述子数据特征集合的取值集合/范围不相同,则所述协调者将各子数据特征集合中的取值集合/范围进行合并,以生成总数据特征集合。5.如权利要求4所述的横向联邦学习方法,其特征在于,所述协调者接收多个参与者发送的第二数据特征集合,并确定所述第二数据特征集合中各子数据特征集合的数据特征类型是否相同的步骤之后,包括:若不相同,则所述协调者确定所述第二数据特征集合中各子数据特征集合所属的数据特征类型,并将所属同一数据特征类型的子数据特征集合统一为第三数据特征集合;所述协调者确定所述第三数据特征集合中各子数据特征集合的取值集合/范围是否相同;若所述第三数据特征集合中各子数据特征集合的取...

【专利技术属性】
技术研发人员:程勇衣志昊吴文霞刘洋陈天健
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1