业务预测模型的跨站点迁移方法和装置制造方法及图纸

技术编号:35290938 阅读:14 留言:0更新日期:2022-10-22 12:36
本说明书实施例描述了一种业务预测模型的跨站点迁移方法和装置。根据实施例的方法,首先获取第一站点的第一业务数据,然后对第一业务数据和两个站点的共有特征进行特征处理。进一步利用经过特征处理后得到的特征训练得到第一站点中的第一业务预测模型的模型参数。最后将该模型参数迁移给第二站点,第二站点即可基于该模型参数以及两个站点的共有特征训练第二站点的第二业务预测模型。由于迁移的参数是基于第一站点的数据优化得到的,可以解决第二站点数据量少而无法训练得到高质量模型的问题。而且第一站点仅仅是将模型参数迁移给第二站点的,因此也可以解决由于数据隐私保护无法利用其他站点的数据训练模型的问题。无法利用其他站点的数据训练模型的问题。无法利用其他站点的数据训练模型的问题。

【技术实现步骤摘要】
业务预测模型的跨站点迁移方法和装置


[0001]本说明书一个或多个实施例涉及计算机
,尤其业务预测模型的跨站点迁移方法和装置。

技术介绍

[0002]站点用于实现具体的业务和解决实际的问题,比如在反欺诈、信用识别、风险识别等业务场景中,通过在不同的站点中构建模型以完成不同的任务。
[0003]然而,在对新站点中的模型进行构建时,经常由于该站点的样本数据量太少,而其他站点又对自身的数据具有隐私保护要求,这就导致在新的业务站点中构建高质量的模型极度困难。

技术实现思路

[0004]本说明书一个或多个实施例描述了业务预测模型的跨站点迁移方法和装置,能够降低新站点构建高质量模型的难度。
[0005]根据第一方面,提供了业务预测模型的跨站点迁移方法,所述站点包括:提供迁移模型参数的第一站点,以及需要基于所述迁移模型参数构建第二业务预测模型的第二站点,且所述第一站点与所述第二站点具有共有特征;所述迁移方法应用于所述第一站点,包括:
[0006]获取所述第一站点的第一业务数据;
[0007]对所述第一业务数据和所述共有特征进行特征处理,得到第一融合特征;
[0008]利用所述第一融合特征,训练得到用于实现对第一站点中的业务进行预测的第一业务预测模型的模型参数;
[0009]将所述第一业务预测模型的模型参数迁移给所述第二站点,以由所述第二站点基于该模型参数和所述共有特征训练所述第二站点的第二业务预测模型。
[0010]在一种可能的实现方式中,所述第一业务数据对应至少两个业务事件;
[0011]所述对所述第一业务数据和所述共有特征进行特征处理得到第一融合特征,包括:
[0012]根据所述第一业务数据对应的业务事件,将所述第一业务数据划分为至少两个第一子业务数据;其中,每一个第一子业务数据唯一对应一个业务事件;
[0013]针对每一个业务事件,对该当前业务事件对应的第一子业务数据进行特征提取,得到至少一个对应该当前业务事件的提取特征;
[0014]将对应各个所述业务事件的各提取特征进行融合,得到初级融合特征;
[0015]将所述初级融合特征与所述共有特征进行拼接,得到所述第一融合特征。
[0016]在一种可能的实现方式中,每一个所述业务事件对应至少两个提取特征;
[0017]所述将对应各个所述业务事件的各提取特征进行融合得到初级融合特征,包括:
[0018]针对每个业务事件,计算该业务事件对应的至少两个提取特征所对应的矩阵的
和,得到对应该业务事件的内聚合特征;
[0019]将对应各个业务事件的各内聚合特征进行融合,得到所述初级融合特征。
[0020]在一种可能的实现方式中,所述将对应各个业务事件的各内聚合特征进行融合得到所述初级融合特征,包括:
[0021]针对每个业务事件,均执行:
[0022]利用当前业务事件的内聚合特征,确定该当前业务事件所对应的注意力机制中的权重矩阵;
[0023]根据所述当前业务事件所对应的注意力机制中的权重矩阵,确定该当前业务事件对训练所述第一站点的第一业务预测模型的贡献特征;
[0024]根据所述当前业务事件的贡献特征,确定该当前业务事件对训练所述第一站点的第一业务预测模型的贡献量;
[0025]根据各个业务事件对应的贡献特征和贡献量,确定所述初级融合特征。
[0026]在一种可能的实现方式中,所述利用所述第一融合特征训练得到用于实现对第一站点中的业务进行预测的第一业务预测模型的模型参数,包括:
[0027]获取用于训练所述第一业务预测模型的第一初始模型参数;
[0028]利用所述第一融合特征和所述第一初始模型参数进行迭代运算;
[0029]将达到预设的迭代运算次数后得到的模型参数,确定为所述第一站点中的第一业务预测模型的模型参数。
[0030]在一种可能的实现方式中,所述利用所述第一融合特征和所述第一初始模型参数进行迭代运算,包括:
[0031]利用如下计算式,进行迭代运算:
[0032]Φ
t+1
=Φ
t
‑▽
f(Φ
t

t
)
[0033]其中,t为不小于0的整数,Φ
t+1
用于表征在第t+1次迭代后的模型参数,Φ
t
用于表征在第t次迭代后的模型参数,当t=0时,Φ0为所述第一初始模型参数,θ
t
用于表征在第t次迭代时输入的第一融合特征,

f(
·
)用于表征随机梯度函数。
[0034]根据第二方面,提供了一种业务预测模型的跨站点迁移方法,所述站点包括:提供迁移模型参数的第一站点,以及需要基于所述迁移模型参数构建第二业务预测模型的第二站点,且所述第一站点与所述第二站点具有共有特征;所述迁移方法应用于所述第二站点,包括:
[0035]接收所述第一站点迁移的第一业务预测模型的模型参数;其中,所述第一业务预测模型是基于所述第一站点的第一业务数据和所述共有特征训练得到的;
[0036]获取所述第二站点的第二业务数据,以及所述第二站点的非共有特征;
[0037]利用所述第二业务数据、所述非共有特征、所述共有特征以及所述第一业务预测模型的模型参数,训练所述第二站点的第二业务预测模型。
[0038]在一种可能的实现方式中,所述利用所述第二业务数据、所述非共有特征、所述共有特征以及所述第一业务预测模型的模型参数训练所述第二站点的第二业务预测模型,包括:
[0039]以所述第一业务预测模型的模型参数为训练所述第二站点的第二业务预测模型的初始参数,以所述第二业务数据和所述共有特征为模型训练数据,训练得到所述第二站
点的第一模型参数;以及,
[0040]以预设的第二初始模型参数为训练所述第二节点的第二业务预测模型的初始参数,以所述非共有特征为模型训练数据,训练得到所述第二节点的第二模型参数;
[0041]根据所述第一模型参数和所述第二模型参数构成的集合,得到所述第二站点的第二业务预测模型。
[0042]根据第三方面,提供了一种业务预测模型的跨站点迁移装置,所述站点包括:提供迁移模型参数的第一站点,以及需要基于所述迁移模型参数构建第二业务预测模型的第二站点,且所述第一站点与所述第二站点具有共有特征;所述迁移装置应用于所述第一站点,包括:第一业务数据获取模块、特征处理模块、第一模型训练模块和模型参数迁移模块;
[0043]所述第一业务数据获取模块,配置为获取所述第一站点的第一业务数据;
[0044]所述特征处理模块,配置为对所述第一业务数据获取模块得到的所述第一业务数据和所述共有特征进行特征处理,得到第一融合特征;
[0045]所述第一模型训练模块,配置为利用所述特征处理模块得到的所述第一融合特征,训练得到用于实现对第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.业务预测模型的跨站点迁移方法,所述站点包括:提供迁移模型参数的第一站点,以及需要基于所述迁移模型参数构建第二业务预测模型的第二站点,且所述第一站点与所述第二站点具有共有特征;所述迁移方法应用于所述第一站点,包括:获取所述第一站点的第一业务数据;对所述第一业务数据和所述共有特征进行特征处理,得到第一融合特征;利用所述第一融合特征,训练得到用于实现对第一站点中的业务进行预测的第一业务预测模型的模型参数;将所述第一业务预测模型的模型参数迁移给所述第二站点,以由所述第二站点基于该模型参数和所述共有特征训练所述第二站点的第二业务预测模型。2.根据权利要求1所述的方法,其中,所述第一业务数据对应至少两个业务事件;所述对所述第一业务数据和所述共有特征进行特征处理得到第一融合特征,包括:根据所述第一业务数据对应的业务事件,将所述第一业务数据划分为至少两个第一子业务数据;其中,每一个第一子业务数据唯一对应一个业务事件;针对每一个业务事件,对该当前业务事件对应的第一子业务数据进行特征提取,得到至少一个对应该当前业务事件的提取特征;将对应各个所述业务事件的各提取特征进行融合,得到初级融合特征;将所述初级融合特征与所述共有特征进行拼接,得到所述第一融合特征。3.根据权利要求2所述的方法,其中,每一个所述业务事件对应至少两个提取特征;所述将对应各个所述业务事件的各提取特征进行融合得到初级融合特征,包括:针对每个业务事件,计算该业务事件对应的至少两个提取特征所对应的矩阵的和,得到对应该业务事件的内聚合特征;将对应各个业务事件的各内聚合特征进行融合,得到所述初级融合特征。4.根据权利要求3所述的方法,其中,所述将对应各个业务事件的各内聚合特征进行融合得到所述初级融合特征,包括:针对每个业务事件,均执行:利用当前业务事件的内聚合特征,确定该当前业务事件所对应的注意力机制中的权重矩阵;根据所述当前业务事件所对应的注意力机制中的权重矩阵,确定该当前业务事件对训练所述第一站点的第一业务预测模型的贡献特征;根据所述当前业务事件的贡献特征,确定该当前业务事件对训练所述第一站点的第一业务预测模型的贡献量;根据各个业务事件对应的贡献特征和贡献量,确定所述初级融合特征。5.根据权利要求1所述的方法,其中,所述利用所述第一融合特征训练得到用于实现对第一站点中的业务进行预测的第一业务预测模型的模型参数,包括:获取用于训练所述第一业务预测模型的第一初始模型参数;利用所述第一融合特征和所述第一初始模型参数进行迭代运算;将达到预设的迭代运算次数后得到的模型参数,确定为所述第一站点中的第一业务预测模型的模型参数。6.根据权利要求5所述的方法,其中,所述利用所述第一融合特征和所述第一初始模型
参数进行迭代运算,包括:利用如下计算式,进行迭代运算:其中,t为不小于0的整数,Φ
t+1
用于表征在第t+1次迭代后的模型参数,Φ
t
用于表征在第t次迭代后的模型参数,当t=0时,Φ0为所述第一初始模型参数,θ
t
用于表征在第t次迭代时输入的第一融合特征,

f(
·
)用于表征随机梯度函数。7.业务预测模型的跨站点迁移方法,所述站点包括:提供迁移模型...

【专利技术属性】
技术研发人员:林萧张天翼刘智欣黄涛
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1