基于联邦学习的金融保险理赔风险模型训练方法及装置制造方法及图纸

技术编号:34125754 阅读:12 留言:0更新日期:2022-07-14 14:10
本发明专利技术提供一种基于联邦学习的金融保险理赔风险模型训练方法及装置,方法包括:中心节点生成同态加密的公钥,并发送给第一参与方P1和第二参与方P

Training method and device of financial and insurance claim risk model based on federal learning

【技术实现步骤摘要】
基于联邦学习的金融保险理赔风险模型训练方法及装置


[0001]本专利技术涉及金融科技
,具体而言,尤其涉及一种基于联邦学习的金融保险理赔风险模型训练方法及装置。

技术介绍

[0002]金融保险理赔风险预测评估领域中,数据集的隐私性以及特征稀缺性限制了训练模型的评估效果。当前,国际与国内形势无时无刻不在发生着巨大变化,世界金融经济体系也在不断地调整。中国国内经济的迅速腾飞给企业、个体用户带来了许许多多的机遇,在这样的背景下,金融行业中的贷款业务也在迅速发展,在其中需要大量评估借贷企业、个体用户的资产风险,根据其风险评估结果给予同等的贷款金额。然而,金融部门在训练评估模型时候只能使用其获取到的有限的用户的信息,例如资产情况、有无信用违约记录等等。事实上,借贷用户的其他信息更能够评估其金融违约的风险。考虑到金融数据的隐私性。如何在保护用户隐私的前提下,获取到用户来自其他企业的数据,来联合训练用户金融保险理赔风险模型,是领域内技术发展亟待攻克的难关。

技术实现思路

[0003]为了解决多参与方共同学习金融保险理赔风险模型所产生的隐私泄露的技术问题,本专利技术提供一种基于联邦学习的金融保险理赔风险模型训练方法及装置。本专利技术将多方的模型进行融合优化,各参与方无需传递和共享原始数据,在数据不出本地的情况下,即可进行数据的联合训练和应用,建立合法合规的金融保险理赔风险模型。
[0004]本专利技术采用的技术手段如下:
[0005]本专利技术公开了一种基于联邦学习的金融保险理赔风险模型训练方法,应用于分布式网络系统,所述分布式网络系统包括m个金融企业参与方以及一个中心节点,所述m个参与方包括第一参与方P1和第二参与方P
i
,其中i=2,3,...,m

1,m,所述第一参与方P1持有数据标签,第二参与方P
i
不持有数据标签;
[0006]所述方法包括以下步骤:
[0007]S1、中心节点生成同态加密的公钥,并将所述公钥分别发送给第一参与方P1和第二参与方P
i

[0008]S2、所述第二参与方P
i
基于自有训练数据计算模型传播参数后,对得到的模型传播参数进行加密得到模型加密聚合参数,并将所述模型加密聚合参数发送至第一参与方P1;
[0009]S3、所述第一参与方P1基于接收到的所有模型加密聚合参数计算模型聚合参数,再将所述模型聚合参数发送给各第二参与方P
i

[0010]S4、所述第一参与方P1和第二参与方P
i
基于模型聚合参数计算各自的参数梯度更新式,并将计算得到的参数梯度更新式发送给中心节点进行解密得到解密后的参数梯度数据,将解密后的参数梯度数据分别回传给第一参与方P1和第二参与方P
i

[0011]S5、所述第一参与方P1和第二参与方P
i
在预先设定的学习率下进行金融保险理赔风险模型参数更新,各参与方根据更新后的模型参数计算新的传播参数;
[0012]S6、反复执行S2

S5,直至达到模型收敛条件则终止迭代。
[0013]本专利技术还公开了一种基于联邦学习的金融保险理赔风险模型训练装置,包括m个金融企业参与方以及一个中心服务器,所述m个参与方包括第一参与方P1和第二参与方P
i
,其中i=2,3,...,m

1,m,所述第一参与方P1持有数据标签,第二参与方P
i
不持有数据标签;
[0014]所述装置包括:
[0015]公钥生成单元,其用于通过中心节点生成同态加密的公钥,并将所述公钥分别发送给第一参与方P1和第二参与方P
i

[0016]模型加密聚合参数计算单元,其用于通过所述第二参与方P
i
基于自有训练数据计算模型传播参数后,对得到的模型传播参数进行加密得到模型加密聚合参数,并将所述模型加密聚合参数发送至第一参与方P1;
[0017]模型聚合参数计算单元,其用于通过所述第一参与方P1基于接收到的所有模型加密聚合参数计算模型聚合参数,再将所述模型聚合参数发送给各第二参与方P
i

[0018]参数梯度数据获取单元,其用于通过所述第一参与方P1和第二参与方P
i
基于模型聚合参数计算各自的参数梯度更新式,并将计算得到的参数梯度更新式发送给中心节点进行解密得到解密后的参数梯度数据,将解密后的参数梯度数据分别回传给第一参与方P1和第二参与方P
i

[0019]模型参数更新单元,其用于通过所述第一参与方P1和第二参与方P
i
在预先设定的学习率下进行金融保险理赔风险模型参数更新,各参与方根据更新后的模型参数计算新的传播参数。
[0020]较现有技术相比,本专利技术具有以下优点:
[0021]传统的金融风险评估方法往往只使用单一企业用户数据进行评估,忽略了用户的其他行为对金融风险的产生起到重大的影响。相比之下,本专利技术考虑到金融风险评估应该考虑到用户多方面行为的特点,使用多方数据集联合训练模型的方式构建一种更科学、高效的金融风险评估方法。能够提到风险预测及理赔金额的精度。
附图说明
[0022]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]图1为本专利技术基于联邦学习的金融保险理赔风险模型训练方法流程图。
[0024]图2为联邦学习原理图。
[0025]图3为纵向联邦学习基本框架。
具体实施方式
[0026]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是
本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0027]联邦学习技术的理念旨在解决存在数据孤岛、隐私泄露情况下多方联合训练模型的问题。联邦学习和分布式计算类似,其本质是一种分布式的机器学习技术,其原理图如图2,联邦学习框架由中心服务器节点和多个客户端节点组成。中心服务器节点负责生成加密秘钥、模型加权聚合工作,各客户端可以是任意的有计算能力的设备(如手机、电脑及物联网设备)。各客户端在中心服务器节点的协助下通过多次迭代得到最优的全局模型。在以上过程中可以应用多种加密技术来保证各客户端的数据不被泄露出去。
[0028]纵向联邦学习作为联邦学习的重要分支,主要用于应对各参与方的用户ID重叠较多而属性特征重叠较少的情况。典型的应用是保本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的金融保险理赔风险模型训练方法,其特征在于,应用于分布式网络系统,所述分布式网络系统包括m个金融企业参与方以及一个中心节点,所述m个参与方包括第一参与方P1和第二参与方P
i
,其中i=2,3,...,m

1,m,所述第一参与方P1持有数据标签,第二参与方P
i
不持有数据标签;所述方法包括以下步骤:S1、中心节点生成同态加密的公钥,并将所述公钥分别发送给第一参与方P1和第二参与方P
i
;S2、所述第二参与方P
i
基于自有训练数据计算模型传播参数后,对得到的模型传播参数进行加密得到模型加密聚合参数,并将所述模型加密聚合参数发送至第一参与方P1;S3、所述第一参与方P1基于接收到的所有模型加密聚合参数计算模型聚合参数,再将所述模型聚合参数发送给各第二参与方P
i
;S4、所述第一参与方P1和第二参与方P
i
基于模型聚合参数计算各自的参数梯度更新式,并将计算得到的参数梯度更新式发送给中心节点进行解密得到解密后的参数梯度数据,将解密后的参数梯度数据分别回传给第一参与方P1和第二参与方P
i
;S5、所述第一参与方P1和第二参与方P
i
在预先设定的学习率下进行金融保险理赔风险模型参数更新,各参与方根据更新后的模型参数计算新的传播参数;S6、反复执行S2

S5,直至达到模型收敛条件则终止迭代。2.根据权利要求1所述的一种基于联邦学习的金融保险理赔风险模型训练方法,其特征在于,S6中达到模型收敛条件包括:将新的传播参数加密后发给第一参与方P1,所述第一参与方P1根据持有的标签计算模型的加密损失函数,再将所述加密损失函数加密后发送给中心节点;所述中心节点对所述加密损失函数进行解密得到损失函数,并根据损失函数判断当前轮次是否达到模型收敛条件。3.根据权利要求1所述的一种基于联邦学习的金融保险理赔风险模型训练方法,其特征在于,在S2中所述模型传播参数根据以下公式计算各自的传播参数:其中,表示对于第j批训练数据batch
j
由第二参与方P
i
计算得到的传播参数,表示第二参与方P
i
的第j个属性特征,表示第二参与方P
i
的第j个属性特征系数。4.根据权利要求1所述的一种基于联邦学习...

【专利技术属性】
技术研发人员:付海燕李宇航李祎郭艳卿刘航王波
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1