续保行为预测模型的联合训练方法、装置及电子设备制造方法及图纸

技术编号:34036319 阅读:20 留言:0更新日期:2022-07-06 12:23
本申请公开了一种续保行为预测模型的联合训练方法、装置及电子设备,其方法包括:构建续保行为预测模型的联合训练网络,联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点;构建训练样本集;将训练样本集输入联合训练网络进行训练,并根据整体损失函数的结果对各续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。本申请利用各观察点续保行为预测模型学习到的“知识”相互协同、辅助训练,提高各观察点续保行为预测模型的精度,且采用联合训练方法,不同时间节点的续保行为预测模型的预测概率空间对齐,便于业务相互比较,制定营销策略。定营销策略。定营销策略。

Joint training method, device and electronic equipment of renewal behavior prediction model

【技术实现步骤摘要】
续保行为预测模型的联合训练方法、装置及电子设备


[0001]本申请涉及人工智能
,具体涉及一种续保行为预测模型的联合训练方法、装置及电子设备。

技术介绍

[0002]随着大数据和人工智能的发展,精准营销模型也得到广泛第应用。在保险行业中,对于一些转化、留存场景中,由于整个转化期较长,转化期间客户特征分布、特征与目标变量的联合分布可能会发生较大变化。为了能得到更好的预测精度,一种可行的方法是选取几个典型的观察点,基于不同的观察点构建数据集,分别建立模型。但这种方法存在很多不足之处,如由于基于不同的观察点独立建模,对于一些客户特征变化不大的样本,几个模型可能会预测出偏差较大的结果;如果不加后处理,几个模型的预测概率空间未对齐到统一的量纲;且各模型也未利用到其他模型学习到的“知识”相互协同、辅助训练。

技术实现思路

[0003]本申请实施例针对上述情况,提出了一种续保行为预测模型的联合训练方法、装置及电子设备,采用跨时点联合建模的方法,借鉴知识蒸馏的思想,在联合训练网络的最终损失函数中,引入一致性损失,促使模型相互学习,提升最终的模型精度。
[0004]第一方面,本申请实施例提供了一种续保行为预测模型的联合训练方法,包括:
[0005]构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;
[0006]构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;
[0007]将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。
[0008]第二方面,本申请实施例还提供了一种续保行为预测模型的联合训练装置,包括:
[0009]模型构建单元,用于构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;
[0010]样本构建单元,用于构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;
[0011]训练单元,用于将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。
[0012]第三方面,本申请实施例还提供了一种电子设备,包括:处理器;以及被安排成存
储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述任一的方法。
[0013]第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行上述任一的方法。
[0014]本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0015]本申请通过构建续保行为预测模型的联合训练网络以及训练用样本集,在联合训练网络中包括多个续保行为预测模型,每个续保行为预测模型对应一个指定时间节点,并且设计了一致性损失函数,各续保行为预测模型的损失函数与该一致性损失函数共同构成了联合训练网络的整体损失函数,以该整体损失函数为基准,作为调整续保行为预测模型的参数调整的基础,采用训练用样本集对续保行为预测模型联合训练网络进行整体训练,得到各个指定时间节点的续保行为预测模型。本申请借鉴知识蒸馏的思想,采用跨时点联合建模的方法,利用各观察点续保行为预测模型学习到的“知识”相互协同、辅助训练,提高各观察点续保行为预测模型的精度,从而实现了对于一些客户特征变化不大的样本,模型也可以输出较为一致的预测;采用联合训练方法,不同时间节点的续保行为预测模型的预测概率空间对齐,便于业务相互比较,制定营销策略。
附图说明
[0016]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0017]图1示出根据本申请的一个实施例的续保行为预测模型的联合训练方法的流程示意图;
[0018]图2示出根据本申请的另一个实施例的续保行为预测模型的联合训练网络的结构示意图;
[0019]图3示出根据本申请的一个实施例的续保行为预测模型的联合训练装置的结构示意图;
[0020]图4为本申请实施例中一种电子设备的结构示意图。
具体实施方式
[0021]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0022]以下结合附图,详细说明本申请各实施例提供的技术方案。
[0023]本申请的构思在于,采用跨时点联合建模的方法,借鉴知识蒸馏的思想,对于同一客户,在最终的损失函数引入一致性损失,促使模型相互学习,提升最终的模型精度。
[0024]图1示出了本申请根据本申请的一个实施例的续保行为预测模型的联合训练方法的流程示意图,从图1可以看出,本申请至少包括步骤S110~步骤S130:
[0025]步骤S110:构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个
续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的。
[0026]随着保险业务的普及,越来越多的个人或公司选择购买保险产品,以给未来的不确定性提供更多的保障。对于保险公司来说,在保用户(已经购买保险产品的用户)在购买的保险产品到期后,会期望在保用户进行续保,即使在保用户有不续保的意愿,保险公司也希望通过对该用户进行行为干预以使其能够续保。
[0027]比如对于医疗险而言,医疗险是一年一续保的,保险产品到期后,该保险失效,用户进行续保,保险公司才会为用户提供下一年的保险服务。对于保险公司而言,是希望用户年年能够如期续保的。通常情况下,续保行为在保险到期前后一段时间内进行续保,保险都是有效的,但是为了提高用户的转化和留存,保险公司会在保险产品到期之前的一段时间提醒用户续保,但是仍然有一部分用户不进行续保,这时保险公司相对这部分不续保用户的行为进行干预,尤其是对本身有一定续保意愿的用户,因此准确预测用户的续保行为或者意愿对保险公司具有很大的意义。
[0028]由于保险的特殊性,将潜在用户转化为成交用户,或者将在保用户本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种续保行为预测模型的联合训练方法,其特征在于,包括:构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。2.根据权利要求1所述的方法,其特征在于,所述指定时间节点的数量为多个,所述整体损失函数L(θ)为:其中,若各所述续保行为预测模型为二分类模型,则若各所述续保行为预测模型为多分类模型,则模型为多分类模型,则表征各所述续保行为预测模型的损失;n表示训练样本数,α表示一致性损失函数的权重,T表示温度超参数,表示当前样本是否属于该任务,表示样本x
j
的本真值,为各续保行为预测模型的输出内容。3.根据权利要求2所述的方法,其特征在于,所述指定时间节点的数量为两个,所述整体损失函数L(θ)为:其中,其中,其中,分别表示样本x1,x2的本真值,为各续保行为预测模型的输出内容。4.根据权利要求1所述的方法,其特征在于,所述多个指定时间节点包括:保单到期时间、保单到期前第一指定时长、保单到期后第二指定时长;所述构建续保行为预测模型的联合训练网络,包括:确定多个指定时间节点;根据指定时间节点的数量,确定续保行为预测模型的数量,以及所述整体损失函数的表达式,形成续保行为预测模型的联合训练网络。
5.根据权利要求1所述的方法,其特征在于,所述构建训练样本集包括:对于一个训练样本,获取其在多个指定时间的用户信息和用户行为,并根据所述用户信息和所述用户行为,确定该用户在多个指定时间节点对应的用户数据以及对应的标注;循环执行所述对于一个训练样本,获取其在多个指定时间的用...

【专利技术属性】
技术研发人员:刘齐
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1