流量分发模型的训练方法、流量分发方法及装置制造方法及图纸

技术编号:30366653 阅读:41 留言:0更新日期:2021-10-16 17:36
本公开提供了一种流量分发模型的训练方法,可以应用于金融领域和人工智能领域。该流量分发模型的训练方法包括:获取初始样本数据集,初始样本数据集中的初始样本包括用户信息以及与用户信息对应的历史流量分发信息;基于初始样本数据,根据预设规则生成训练样本数据集,训练样本数据集中的训练样本包括用户特征数据以及与用户特征数据对应的历史流量分发数据,训练样本数据集还包括与训练样本对应的标签信息,标签信息表征历史流量分发成功结果;利用训练样本数据集训练待训练的流量分发模型,得到训练完成的流量分发模型。本公开还提供了一种流量分发方法、流量分发模型的训练装置、流量分发装置、设备、存储介质和程序产品。品。品。

【技术实现步骤摘要】
流量分发模型的训练方法、流量分发方法及装置


[0001]本公开涉及金融领域和人工智能
,更具体地涉及一种流量分发模型的训练方法、流量分发方法、装置、设备、介质和程序产品。

技术介绍

[0002]在金融机构或银行信贷业务场景中,当客户来金融机构(简称流量方)授信做贷款,流量方一方面可以自行对客户做授信、放款,另一方面也可以将该客户转发给其合作出资方银行(简称资方银行),资方银行会根据流量方提供的客户信息(主要是客户征信方面的信息)对该客户进行授信评估,评估通过后则进行放款,流量方从中获取引流分发手续费收益。
[0003]目前大多数流量方采用凭人工经验设定的引流分发规则,例如根据客户的金额需求、利率意愿、手续费收益等规则设计引流分发规则,一方面导致客户的引流分发成功率不高,普遍在60%左右,造成客户资源的浪费,从而带来的客户体验不佳;另一方面,人为经验不可靠,常常需要手工调整规则,导致人力成本提升,且无法满足资方银行的引流分发客户数量需求,从而导致流量方的引流分发收益有限。

技术实现思路

[0004]鉴于上述问题,本公开提供了流量分发模型的训练方法、流量分发方法、装置、设备、介质和程序产品。
[0005]根据本公开的第一个方面,提供了一种流量分发模型的训练方法,包括:
[0006]获取初始样本数据集,其中,上述初始样本数据集中的初始样本包括用户信息以及与上述用户信息对应的历史流量分发信息;
[0007]基于上述初始样本数据集,根据预设规则生成训练样本数据集,其中,上述训练样本数据集中的训练样本包括用户特征数据以及与上述用户特征数据对应的历史流量分发数据,其中,上述训练样本数据集还包括与上述训练样本对应的标签信息,上述标签信息表征上述历史流量分发成功结果;
[0008]利用上述训练样本数据集训练待训练的流量分发模型,得到训练完成的流量分发模型。
[0009]根据本公开的实施例,上述基于上述初始样本数据,根据预设规则生成训练样本数据集包括:
[0010]将上述初始样本数据集与预先配置的特征整合表进行匹配,生成第一样本数据集,其中,上述第一样本数据集包括与同一用户对应的多个第一样本;
[0011]对上述第一样本数据集进行数据整合,生成第二样本数据集,其中,上述第二样本数据集中的每个第二样本对应一个用户;
[0012]对上述第二样本数据集进行数据处理,生成上述训练样本数据集。
[0013]根据本公开的实施例,上述第二样本包括第一预设字符信息;
[0014]上述对上述第二样本数据集进行数据处理,生成上述训练样本数据集包括:
[0015]利用独热编码算法处理上述第二样本数据集中的第二样本,以便将上述第二样本中的上述第一预设字符信息转换为第二预设字符信息,生成第三样本数据集;
[0016]对上述第三样本数据集中的第三样本进行数据标准化处理,生成上述训练样本数据集。
[0017]根据本公开的实施例,上述利用上述训练样本数据集训练待训练的流量分发模型,得到训练完成的流量分发模型包括:
[0018]将上述训练样本数据集划分为训练集和验证集;
[0019]利用上述训练集训练上述待训练的流量分发模型,得到待验证的流量分发模型;
[0020]将上述验证集输入上述待验证的流量分发模型,输出预测流量分发结果;
[0021]根据上述预测流量分发结果和上述标签信息得到验证结果,在上述验证结果满足预设条件的情况下,输出训练完成的流量分发模型,其中,上述验证结果表征上述预测流量分发结果与上述标签信息的匹配程度。
[0022]根据本公开的实施例,上述待训练的流量分发模型包括基于LightGBM算法框架构建得到的模型,其中,在训练上述待训练的流量分发模型时,使用梯度提升迭代决策树算法。
[0023]根据本公开的实施例,上述用户信息包括用户基本信息、用户金融特征信息以及用户法律特征信息。
[0024]根据本公开的第二个方面,提供了一种流量分发方法,包括:
[0025]获取待分发样本信息,其中,上述待分发样本信息包括用户信息;
[0026]根据上述待分发样本信息生成待分发样本数据,其中,上述待分发样本数据包括用户数据;
[0027]将上述待分发样本数据输入流量分发模型,输出流量分发结果,上述流量分发结果表征将上述用户信息分发给多个流量接收方中的目标流量接收方,其中,上述流量分发模型由本公开实施例提供的流量分发模型的训练方法训练得到。
[0028]本公开的第三方面提供了一种流量分发模型的训练装置,包括:
[0029]第一获取模块,用于获取初始样本数据集,其中,上述初始样本数据集中的初始样本包括用户信息以及与上述用户信息对应的历史流量分发信息;
[0030]第一生成模块,用于基于上述初始样本数据集,根据预设规则生成训练样本数据集,其中,上述训练样本数据集中的训练样本包括用户特征数据以及与上述用户特征数据对应的历史流量分发数据,其中,上述训练样本数据集还包括与上述训练样本对应的标签信息,上述标签信息表征上述历史流量分发成功结果;以及
[0031]训练模块,用于利用上述训练样本数据集训练待训练的流量分发模型,得到训练完成的流量分发模型。
[0032]本公开的第四方面提供了一种流量分发装置,包括:
[0033]第二获取模块,用于获取待分发样本信息,其中,上述待分发样本信息包括用户信息;
[0034]第二生成模块,用于根据上述待分发样本信息生成待分发样本数据,其中,上述待分发样本数据包括用户数据;
[0035]分发模块,用于将上述待分发样本数据输入流量分发模型,输出流量分发结果,上述流量分发结果表征将上述用户信息分发给多个流量接收方中的目标流量接收方,其中,上述流量分发模型由本公开实施例提供的流量分发模型的训练方法训练得到。
[0036]本公开的第五方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述流量分发模型的训练方法和流量分发方法。
[0037]本公开的第六方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述流量分发模型的训练方法和流量分发方法。
[0038]本公开的第七方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述流量分发模型的训练方法和流量分发方法。
附图说明
[0039]通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
[0040]图1示意性示出了根据本公开实施例的流量分发模型的训练方法、流量分发方法、流量分发模型的训练装置和流量分发装置的应用场景图;
[0041]图2示意性示出了根据本公开实施例的流量分发模型的训练方法的流程图;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流量分发模型的训练方法,包括:获取初始样本数据集,其中,所述初始样本数据集中的初始样本包括用户信息以及与所述用户信息对应的历史流量分发信息;基于所述初始样本数据集,根据预设规则生成训练样本数据集,其中,所述训练样本数据集中的训练样本包括用户特征数据以及与所述用户特征数据对应的历史流量分发数据,其中,所述训练样本数据集还包括与所述训练样本对应的标签信息,所述标签信息表征所述历史流量分发成功结果;利用所述训练样本数据集训练待训练的流量分发模型,得到训练完成的流量分发模型。2.根据权利要求1所述的方法,其中,所述基于所述初始样本数据,根据预设规则生成训练样本数据集包括:将所述初始样本数据集与预先配置的特征整合表进行匹配,生成第一样本数据集,其中,所述第一样本数据集包括与同一用户对应的多个第一样本;对所述第一样本数据集进行数据整合,生成第二样本数据集,其中,所述第二样本数据集中的每个第二样本对应一个用户;对所述第二样本数据集进行数据处理,生成所述训练样本数据集。3.根据权利要求2所述的方法,其中,所述第二样本包括第一预设字符信息;所述对所述第二样本数据集进行数据处理,生成所述训练样本数据集包括:利用独热编码算法处理所述第二样本数据集中的第二样本,以便将所述第二样本中的所述第一预设字符信息转换为第二预设字符信息,生成第三样本数据集;对所述第三样本数据集中的第三样本进行数据标准化处理,生成所述训练样本数据集。4.根据权利要求1所述的方法,其中,所述利用所述训练样本数据集训练待训练的流量分发模型,得到训练完成的流量分发模型包括:将所述训练样本数据集划分为训练集和验证集;利用所述训练集训练所述待训练的流量分发模型,得到待验证的流量分发模型;将所述验证集输入所述待验证的流量分发模型,输出预测流量分发结果;根据所述预测流量分发结果和所述标签信息得到验证结果,在所述验证结果满足预设条件的情况下,输出训练完成的流量分发模型,其中,所述验证结果表征所述预测流量分发结果与所述标签信息的匹配程度。5.根据权利要求4或1所述的方法,其中,所述待训练的流量分发模型包括基于LightGBM算法框架构建得到的模型,其中,在训练所述待训练的流量分发模型时,使用梯度提升迭代决策树算法。6.根据权...

【专利技术属性】
技术研发人员:詹振国李文举徐春艳
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1