一种模型训练的方法以及业务风控的方法及装置制造方法及图纸

技术编号:39047317 阅读:18 留言:0更新日期:2023-10-10 12:00
本说明书公开了一种模型训练的方法以及业务风控的方法及装置,用于隐私保护,在模型训练过程中,通过多种类型的样本对作为训练样本来训练特征表示模型,以使得最终训练出的特征表示模型所输出的特征表示可以同时携带输入到该特征表示模型中的账户信息对应用户是否存在风险的相关信息、该用户所对应的风险类别相关信息、该用户所对应的风控策略的相关信息以及风险类别与风控策略之间的潜在关联,从而使得最终训练出的特征表示模型所输出的特征表示更加准确,进而使得风控系统在根据特征表示模型所输出的特征表示进行风控时,能够得到更加准确的风控结果。到更加准确的风控结果。到更加准确的风控结果。

【技术实现步骤摘要】
一种模型训练的方法以及业务风控的方法及装置


[0001]本说明书涉及互联网
,尤其涉及一种模型训练的方法以及业务风控的方法及装置。

技术介绍

[0002]为了保证用户的信息、隐私数据以及财产安全,现在通常需要风控系统基于用户的账户信息进行业务风控。
[0003]对于目前的风控模式来说,通常是将用户的账户信息输入到人工智能的特征表示模型中,特征表示模型将输出账户信息对应的特征表示,并将该特征表示发送给风控系统,风控系统使用该特征表示进行业务风控。
[0004]然而,目前风控系统进行风控时所使用的特征表示并不能准确的表征出各风险类别与各风控策略之间的潜在关联,从而导致风控系统无法进行准确的风控。

技术实现思路

[0005]本说明书提供一种模型训练的方法以及业务风控的方法及装置,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:
[0007]本说明书提供了一种模型训练的方法,包括:
[0008]获取各账户信息;
[0009]根据所述各账户信息,构建各第一样本对以及各第二样本对,针对每个第一样本对,该第一样本对中包含的两个账户信息对应的风险类别相同,且在历史上基于该两个账户信息所执行的业务被相同风控策略风控,针对每个第二样本对,该第二样本对中包含有存在风险的账户信息以及不存在风险的账户信息;
[0010]针对每个第一样本对,将该第一样本对输入到特征表示模型中,以通过所述特征表示模型,输出该第一样本对中包含的每个账户信息对应的特征表示,以及针对每个第二样本对,将该第二样本对输入到所述特征表示模型中,以通过所述特征表示模型,输出该第二样本对中包含的每个账户信息对应的特征表示;
[0011]以最小化第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及最大化第二样本对中包含的每个账户信息对应的特征表示之间的偏差为优化目标,对所述特征表示模型进行训练,训练后的特征表示模型用于输出账户信息的特征表示,并将输出的特征表示发送给风控系统进行风控。
[0012]可选地,以最小化第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及最大化第二样本对中包含的每个账户信息对应的特征表示之间的偏差为优化目标,对所述特征表示模型进行训练,具体包括:
[0013]根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,以及根据第二样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第二损
失,其中,第一样本对中包含的每个账户信息对应的特征表示之间的偏差越小,所述第一损失越小,第二样本对中包含的每个账户信息对应的特征表示之间的偏差越大,所述第二损失越小;
[0014]根据所述第一损失、所述第一损失对应的权重、所述第二损失以及所述第二损失对应的权重,确定综合损失;
[0015]以最小化所述综合损失为优化目标,对所述特征表示模型进行训练。
[0016]可选地,在根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失之前,所述方法还包括:
[0017]根据所述各账户信息,构建各第三样本对,针对每个第三样本对,该第三样本对中包含的两个账户信息对应的风险类别相匹配;
[0018]针对每个第三样本对,将该第三样本对输入到所述特征表示模型中,以通过所述特征表示模型,输出该第三样本对中包含的每个账户信息对应的特征表示;
[0019]根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,具体包括:
[0020]根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及第三样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,其中,第三样本对中包含的每个账户信息对应的特征表示之间的偏差越小,所述第一损失越小。
[0021]可选地,在根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失之前,所述方法还包括:
[0022]根据所述各账户信息,构建各第四样本对,针对每个第四样本对,在历史上基于该第四样本对中包含的两个账户信息所执行的业务被相同风控策略风控;
[0023]针对每个第四样本对,将该第四样本对输入到所述特征表示模型中,以通过所述特征表示模型,输出该第四样本对中包含的每个账户信息对应的特征表示;
[0024]根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,具体包括:
[0025]根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及第四样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,其中,第四样本对中包含的每个账户信息对应的特征表示之间的偏差越小,所述第一损失越小。
[0026]本说明书提供了一种业务风控的方法,包括:
[0027]获取目标账户信息;
[0028]将所述目标账户信息输入到预先训练的特征表示模型中,以通过所述特征表示模型,输出所述目标账户信息对应的特征表示,所述特征表示模型是通过上述模型训练的方法训练得到的;
[0029]将所述目标账户信息对应的特征表示发送给风控系统,以通过所述风控系统进行风控。
[0030]本说明书提供了一种模型训练的装置,包括:
[0031]获取模块,用于获取各账户信息;
[0032]构建模块,用于根据所述各账户信息,构建各第一样本对以及各第二样本对,针对每个第一样本对,该第一样本对中包含的两个账户信息对应的风险类别相同,且在历史上
基于该两个账户信息所执行的业务被相同风控策略风控,针对每个第二样本对,该第二样本对中包含有存在风险的账户信息以及不存在风险的账户信息;
[0033]输入模块,用于针对每个第一样本对,将该第一样本对输入到特征表示模型中,以通过所述特征表示模型,输出该第一样本对中包含的每个账户信息对应的特征表示,以及针对每个第二样本对,将该第二样本对输入到所述特征表示模型中,以通过所述特征表示模型,输出该第二样本对中包含的每个账户信息对应的特征表示;
[0034]训练模块,用于以最小化第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及最大化第二样本对中包含的每个账户信息对应的特征表示之间的偏差为优化目标,对所述特征表示模型进行训练,训练后的特征表示模型用于输出账户信息的特征表示,并将输出的特征表示发送给风控系统进行风控。
[0035]可选地,所述训练模块具体用于,根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,以及根据第二样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第二损失,其中,第一样本对中包含的每个账户信息对应的特征表示之间的偏差越小,所述第一损失越小,第二样本对中包含的每个账户信息对应的特征表示之间的偏差越大,所述第二损失越小;根据所述第一损失、所述第一损失对应的权重、所述第二损失以及所述第二损失对应的权重,确定综合损失;以最小化本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,包括:获取各账户信息;根据所述各账户信息,构建各第一样本对以及各第二样本对,针对每个第一样本对,该第一样本对中包含的两个账户信息对应的风险类别相同,且在历史上基于该两个账户信息所执行的业务被相同风控策略风控,针对每个第二样本对,该第二样本对中包含有存在风险的账户信息以及不存在风险的账户信息;针对每个第一样本对,将该第一样本对输入到特征表示模型中,以通过所述特征表示模型,输出该第一样本对中包含的每个账户信息对应的特征表示,以及针对每个第二样本对,将该第二样本对输入到所述特征表示模型中,以通过所述特征表示模型,输出该第二样本对中包含的每个账户信息对应的特征表示;以最小化第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及最大化第二样本对中包含的每个账户信息对应的特征表示之间的偏差为优化目标,对所述特征表示模型进行训练,训练后的特征表示模型用于输出账户信息的特征表示,并将输出的特征表示发送给风控系统进行风控。2.如权利要求1所述的方法,以最小化第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及最大化第二样本对中包含的每个账户信息对应的特征表示之间的偏差为优化目标,对所述特征表示模型进行训练,具体包括:根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,以及根据第二样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第二损失,其中,第一样本对中包含的每个账户信息对应的特征表示之间的偏差越小,所述第一损失越小,第二样本对中包含的每个账户信息对应的特征表示之间的偏差越大,所述第二损失越小;根据所述第一损失、所述第一损失对应的权重、所述第二损失以及所述第二损失对应的权重,确定综合损失;以最小化所述综合损失为优化目标,对所述特征表示模型进行训练。3.如权利要求2所述的方法,在根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失之前,所述方法还包括:根据所述各账户信息,构建各第三样本对,针对每个第三样本对,该第三样本对中包含的两个账户信息对应的风险类别相匹配;针对每个第三样本对,将该第三样本对输入到所述特征表示模型中,以通过所述特征表示模型,输出该第三样本对中包含的每个账户信息对应的特征表示;根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,具体包括:根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及第三样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,其中,第三样本对中包含的每个账户信息对应的特征表示之间的偏差越小,所述第一损失越小。4.如权利要求2或3所述的方法,在根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失之前,所述方法还包括:根据所述各账户信息,构建各第四样本对,针对每个第四样本对,在历史上基于该第四
样本对中包含的两个账户信息所执行的业务被相同风控策略风控;针对每个第四样本对,将该第四样本对输入到所述特征表示模型中,以通过所述特征表示模型,输出该第四样本对中包含的每个账户信息对应的特征表示;根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,具体包括:根据第一样本对中包含的每个账户信息对应的特征表示之间的偏差,以及第四样本对中包含的每个账户信息对应的特征表示之间的偏差,确定第一损失,其中,第四样本对中包含的每个账户信息对应的特征表示之间的偏差越小,所述第一损失越小。5.一种业务风控的方法,包括:获取目标账户信息;将所述目标账户信息输入到预先训练的特征表示模型中,以通过所述特征表示模型,输出所述目标账户信息对应的特征表示,所述特征表示模型是通过如权利要求1~4任一项所述的方法训练得到的;将所述目标账户信息对应的特征表示发送给风控系统,以通过所述风控系统进行风控。6.一种模型训练的装置,包括:获取模块,用于获取各账户信息;构建模块,用于根据所述各账户信息...

【专利技术属性】
技术研发人员:魏政
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1