基于联邦学习的风险预测方法、模型训练方法及相关设备技术

技术编号:34368742 阅读:60 留言:0更新日期:2022-07-31 10:05
本申请揭示了一种基于联邦学习的风险预测方法、模型训练方法及相关设备,其中方法包括:采用所述目标第一机构对应的第一风险预测模型对目标特征数据进行疾病风险预测得到第一预测结果,第一风险预测模型是根据各个第一机构的各个人群特征数据及各个疾病年龄标签进行横向联邦学习得到的模型;根据目标特征数据确定第二预测结果,第二预测结果是采用预设的第二风险预测模型进行疾病风险预测得到的结果,第二风险预测模型是根据各个第一机构的各个疾病年龄标签和各个第二机构的各个人体生物特征数据进行纵向联邦学习得到的模型;对第一预测结果和第二预测结果进行融合得到目标疾病风险预测结果。从而丰富了用于预测的数据,提高了风险预测的准确性。提高了风险预测的准确性。提高了风险预测的准确性。

Risk prediction method, model training method and related equipment based on federal learning

【技术实现步骤摘要】
基于联邦学习的风险预测方法、模型训练方法及相关设备


[0001]本申请涉及到人工智能
,特别是涉及到一种基于联邦学习的风险预测方法、模型训练方法及相关设备。

技术介绍

[0002]保险出险的风险预测,是保险机构风控的重要环节。随着人工智能技术的发展,人工智能被广泛应用于风险预测,因保险机构数据较少,导致风险预测的准确性较低,而且保险机构出于保护隐私数据和商业机密的原因,不能将人的健康数据和/或出险数据输出到机构外,从而出现数据孤岛分布,导致只能在保险机构内进行模型构建或训练,限制了模型的训练和更新。

技术实现思路

[0003]本申请的主要目的为提供一种基于联邦学习的风险预测方法、模型训练方法及相关设备,旨在解决现有技术的基于人工智能的风险预测应用在保险行业时,存在险预测的准确性较低,只能在保险机构内进行模型构建或训练,限制了模型的训练和更新的技术问题。
[0004]为了实现上述专利技术目的,本申请提出一种基于联邦学习的风险预测方法,所述方法包括:
[0005]获取目标第一机构对应的被评估对象的目标特征数据;
[0006]采用所述目标第一机构对应的第一风险预测模型,对所述目标特征数据进行疾病风险预测,得到第一预测结果,其中,所述第一风险预测模型是根据各个第一机构的各个人群特征数据及各个疾病年龄标签进行横向联邦学习得到的模型;
[0007]根据所述目标特征数据确定第二预测结果,其中,所述第二预测结果是采用预设的第二风险预测模型进行疾病风险预测得到的结果,所述第二风险预测模型是根据各个所述第一机构的各个所述疾病年龄标签和各个第二机构的各个人体生物特征数据进行纵向联邦学习得到的模型;
[0008]对所述第一预测结果和所述第二预测结果进行融合,得到所述被评估对象对应的目标疾病风险预测结果。
[0009]本申请还提出了一种基于纵向联邦学习的模型训练方法,所述方法包括:
[0010]获取第p轮纵向联邦学习的每个第二机构对应的第二客户端发送的第一哈希值集,其中,p是大于0的整数;
[0011]获取第p轮纵向联邦学习的每个第一机构对应的第三客户端发送的第二哈希值集;
[0012]对所述第一哈希值集和所述第二哈希值集进行交集计算,得到哈希值交集;
[0013]根据所述第一哈希值集和所述第二哈希值集,对所述哈希值交集生成哈希值与机构映射表;
[0014]从各个所述第三客户端获取与所述哈希值与机构映射表对应的疾病年龄对应信息初始集;
[0015]根据所述哈希值与机构映射表,对所述疾病年龄对应信息初始集按所述第二机构进行集合划分,得到每个所述第二机构对应的疾病年龄标签集;
[0016]根据各个所述疾病年龄标签集对各个所述第二客户端各自对应的第二初始模型进行纵向联邦学习训练,直至达到预设的纵向联邦学习结束条件,其中,将达到所述纵向联邦学习结束条件的所述第二初始模型作为第二风险预测模型。
[0017]本申请还提出了一种基于联邦学习的风险预测装置,所述装置包括:
[0018]数据获取模块,用于获取目标第一机构对应的被评估对象的目标特征数据;
[0019]第一预测结果确定模块,用于采用所述目标第一机构对应的第一风险预测模型,对所述目标特征数据进行疾病风险预测,得到第一预测结果,其中,所述第一风险预测模型是根据各个第一机构的各个人群特征数据及各个疾病年龄标签进行横向联邦学习得到的模型;
[0020]第二预测结果确定模块,用于根据所述目标特征数据确定第二预测结果,其中,所述第二预测结果是采用预设的第二风险预测模型进行疾病风险预测得到的结果,所述第二风险预测模型是根据各个所述第一机构的各个所述疾病年龄标签和各个第二机构的各个人体生物特征数据进行纵向联邦学习得到的模型;
[0021]目标疾病风险预测结果确定模块,用于对所述第一预测结果和所述第二预测结果进行融合,得到所述被评估对象对应的目标疾病风险预测结果。
[0022]本申请还提出了一种基于纵向联邦学习的模型训练装置,所述装置包括:
[0023]哈希值集确定模块,用于获取第p轮纵向联邦学习的每个第二机构对应的第二客户端发送的第一哈希值集,其中,p是大于0的整数;
[0024]第二哈希值集确定模块,用于获取第p轮纵向联邦学习的每个第一机构对应的第三客户端发送的第二哈希值集;
[0025]哈希值交集确定模块,用于对所述第一哈希值集和所述第二哈希值集进行交集计算,得到哈希值交集;
[0026]哈希值与机构映射表生成模块,用于根据所述第一哈希值集和所述第二哈希值集,对所述哈希值交集生成哈希值与机构映射表;
[0027]疾病年龄对应信息初始集确定模块,用于从各个所述第三客户端获取与所述哈希值与机构映射表对应的疾病年龄对应信息初始集;
[0028]疾病年龄标签集确定模块,用于根据所述哈希值与机构映射表,对所述疾病年龄对应信息初始集按所述第二机构进行集合划分,得到每个所述第二机构对应的疾病年龄标签集;
[0029]纵向联邦学习模块,用于根据各个所述疾病年龄标签集对各个所述第二客户端各自对应的第二初始模型进行纵向联邦学习训练,直至达到预设的纵向联邦学习结束条件,其中,将达到所述纵向联邦学习结束条件的所述第二初始模型作为第二风险预测模型。
[0030]本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0031]本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机
程序被处理器执行时实现上述任一项所述的方法的步骤。
[0032]本申请的基于联邦学习的风险预测方法、模型训练方法及相关设备,其中基于联邦学习的风险预测方法通过获取目标第一机构对应的被评估对象的目标特征数据;采用所述目标第一机构对应的第一风险预测模型,对所述目标特征数据进行疾病风险预测,得到第一预测结果,其中,所述第一风险预测模型是根据各个第一机构的各个人群特征数据及各个疾病年龄标签进行横向联邦学习得到的模型;根据所述目标特征数据确定第二预测结果,其中,所述第二预测结果是采用预设的第二风险预测模型进行疾病风险预测得到的结果,所述第二风险预测模型是根据各个所述第一机构的各个所述疾病年龄标签和各个第二机构的各个人体生物特征数据进行纵向联邦学习得到的模型;对所述第一预测结果和所述第二预测结果进行融合,得到所述被评估对象对应的目标疾病风险预测结果。通过联邦学习,在健康数据和/或出险数据不输出到机构外的情况下,实现了通过多个机构进行模型的训练和更新,提高了风险预测的准确性;通过横向联邦学习得到的第一风险预测模型输出的结果和纵向联邦学习得到的第二风险预测模型输出的结果的融合,丰富了用于预测的数据,进一步提高了风险预测的准确性。
附图说明
[0033]图1为本申请一实施例的基于联邦学习的风险预测方法的流程示意图;
[0034]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的风险预测方法,其特征在于,所述方法包括:获取目标第一机构对应的被评估对象的目标特征数据;采用所述目标第一机构对应的第一风险预测模型,对所述目标特征数据进行疾病风险预测,得到第一预测结果,其中,所述第一风险预测模型是根据各个第一机构的各个人群特征数据及各个疾病年龄标签进行横向联邦学习得到的模型;根据所述目标特征数据确定第二预测结果,其中,所述第二预测结果是采用预设的第二风险预测模型进行疾病风险预测得到的结果,所述第二风险预测模型是根据各个所述第一机构的各个所述疾病年龄标签和各个第二机构的各个人体生物特征数据进行纵向联邦学习得到的模型;对所述第一预测结果和所述第二预测结果进行融合,得到所述被评估对象对应的目标疾病风险预测结果。2.根据权利要求1所述的基于联邦学习的风险预测方法,其特征在于,所述对所述第一预测结果和所述第二预测结果进行融合,得到所述被评估对象对应的目标疾病风险预测结果的步骤,包括:判断所述第二预测结果是否为空;若是,则将所述第一预测结果与预设系数进行相乘,得到所述目标疾病风险预测结果;若否,则对所述第一预测结果和所述第二预测结果进行加权求和,得到所述目标疾病风险预测结果。3.根据权利要求1所述的基于联邦学习的风险预测方法,其特征在于,所述根据所述目标特征数据确定第二预测结果的步骤,包括:判断所述目标特征数据中是否包含人体生物特征数据;若是,将所述目标特征数据中的所述人体生物特征数据输入所述目标第一机构对应的所述第二风险预测模型进行疾病风险预测,得到所述第二预测结果;若否或者所述第二预测结果为空,则从所述目标特征数据中获取对象标识,对获取的所述对象标识进行哈希加密,得到目标哈希值;根据所述目标哈希值从纵向联邦学习云端获取所述第二预测结果。4.根据权利要求3所述的基于联邦学习的风险预测方法,其特征在于,所述根据所述目标哈希值从纵向联邦学习云端获取所述第二预测结果的步骤,包括:将所述目标哈希值发送给所述纵向联邦学习云端;获取所述纵向联邦学习云端根据所述目标哈希值发送的所述第二预测结果,其中,所述纵向联邦学习云端包括:将所述目标哈希值在预设的哈希值与机构映射表中查找所述第二机构,作为命中第二机构,将所述目标哈希值发送给各个所述命中第二机构,获取每个所述命中第二机构发送的与所述目标哈希值对应的单机构预测结果,对各个所述单机构预测结果进行合并,得到所述第二预测结果。5.根据权利要求1所述的基于联邦学习的风险预测方法,其特征在于,所述采用所述目标第一机构对应的第一风险预测模型,对所述目标特征数据进行疾病风险预测,得到第一预测结果的步骤之前,还包括:获取横向联邦学习云端发送的第n轮第i次的横向训练开始信号,其中,n和i均是大于0的整数;
响应第n轮第i次的所述横向训练开始信号,采用与所述目标第一机构对应的本地的第n轮的第一训练样本集,对与所述目标第一机构对应的第一初始模型进行第n轮第i次训练,根据第n轮第i次训练结束的所述第一初始模型提取模型训练样本数量及模型梯度矩阵,作为所述目标第一机构在第n轮第i次的第一样本数量及第一模型梯度矩阵;将所述目标第一机构在第n轮第i次的所述第一样本数量及所述第一模型梯度矩阵发送给所述横向联邦学习云端;获取所述横向联邦学习云端发送的第n轮第i次的第一样本总数及第一云端模型参数矩阵;根据第n轮第i次的所述第一样本总数及所述第一云端模型参数矩阵,对与所述目标第一机构对应的所述第一初始模型进行参数更新;重复执行所述获取横向联邦学习云端发送的第n轮第i次的横向训练开始信号的步骤,直至获取到第n轮的横向训练结束信号;根据第n轮的所述横向训练结束信号携带的所述第一样本总数及第一云端模型参数矩阵,对与所述目标第一机构对应的所述第一初始模型进行参数更新,将参数更新后的与所述目标第一机构对应的所述第一初始模型作为所述目标第一机构对应的所述第一风险预测模型。6.根据权利要求5所述的基于联邦学习的风险预测方法,其特征在于,所述获取所述横向联邦学习云端发送的第n轮第i次的第一样本总数及第一云端模型参数矩阵的步骤,包括:获取所述横向联邦学习云端发送的第n轮第i次的所述第一样本总数及所述第一云端模型参数矩阵,其中,所述横向联邦学习云端包括:获取第n轮第i次的每个所述第一机构对应的第一客户端发送的第一样本数量和第一模型梯度矩阵;将所述第一客户端的数量作为第n轮第i次的第一训练机构数量;将各个所述第一样本数量进行相加,得到第n轮第i次的所述第一样本总数;获取第n轮第i

1次的第一云端模型参数矩阵,根据第n轮第i

1次的所述第一云端模型参数矩阵和第n轮第i次的所述第一训练机构数量、各个所述第一模型梯度矩阵及各个所述第一样本数量,计算第n轮第i次的所述第一云端模型参数矩阵;将第n轮第i次对应的所述第一样本总数及第一云端模型参数矩阵发送给各个所述第一客户端;将i加1,重复执行所述获取第n轮第i次的每个所述第一机构对应的第一客户端发送的第一样本数量和第一模型梯度矩阵的步骤,直至达到预设的横向联邦学习结束条件;若达到所述横向联邦学习结束条件,则向各个所述第一客户端发送第n轮的所述横向训练结束信号。7.根据权利要求6所述的基于联邦学习的风险预测方法,其特征在于,所述横向联邦学习结束条件包括:第n轮横向联邦学习的训练次数满足预设的横向单轮次数,或者,第n轮横向联邦学习的相邻三次的所述第一云端模型参数矩阵的偏差满足预设的横向联邦学习收敛条件;所述横向单轮次数的计算公式H
横向
为:
其中,m是第n轮所述第一训练机构数量,sp_m
横向
[a]是第a个所述第一客户端发送的所述第一样本数量,是对进行向上取整,max是找出最大值;所述第n轮横向联邦学习的相邻三次的所述第一云端模型参数矩阵的偏差满足预设的横向联邦学习收敛条件,具体包括:第n轮第i次的所述第一云端模型参数矩阵与第n轮第i

1次的所述第一云端模型参数矩阵的第一偏差、第n轮第i

1次的所述第一云端模型参数矩阵与第n轮第i

2次的所述第一云端模型参数矩阵的第二偏差均小于预设的横向偏差阈值;所述第n轮第i次的所述第一云端模型参数矩阵与第n轮第i

1次的所述第一云端模型参数矩阵的第一偏差的步骤,包括:将所述第n轮第i次的所述第一云端模型参数矩阵与第n轮第i

1次的所述第一云端模型参数矩阵进行相同位置的向量元素相减,得到第一差值矩阵;对所述第一差值矩阵的每个向量元素进行绝对值计算,得到第一绝对值矩阵;对所述第一绝对值矩阵中的各个向量元素进行平均值计算,得到所述第一偏差。8.一种基于纵向联邦学习的模型训练方法,其特征在于,所述方法包括:获取第p轮纵向联邦学习的每个第二机构对应的第二客户端发送的第一哈希值集,其中,p是大于0的整数;获取第p轮纵向联邦学习的每个第一机构对应的第三客户端发送的第二哈希值集;对所述第一哈希值集和所述第二哈希值集进行交集计算,得...

【专利技术属性】
技术研发人员:张玉君叶颖戴嘉贺
申请(专利权)人:深圳市问渠数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1