模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:31238811 阅读:22 留言:0更新日期:2021-12-08 10:25
本申请公开了一种模型训练方法、装置、设备及存储介质,方法包括:获取第一出行样本;获取特征提取模型;通过特征提取模型对第一出行样本进行处理,得到出行特征向量,并通过第一分类模型对出行特征向量进行处理,得到第一预测信息;根据第一预测信息和第一出行样本对应的标记信息,分别更新特征提取模型和第一分类模型,得到第一风控模型。本申请公开的模型训练方法、装置、设备及存储介质能够提高训练得到的第一风控模型的准确性。到的第一风控模型的准确性。到的第一风控模型的准确性。

【技术实现步骤摘要】
模型训练方法、装置、设备及存储介质


[0001]本申请涉及金融科技(尤其深度学习、大数据)
,尤其涉及一种模型训练方法、装置、设备及存储介质。

技术介绍

[0002]风控模型可以用于从能够获取到的数据中尽可能的挖掘信用信息,实现预测借款人的信用贷款。比如当借款人缺乏银行信用卡的数据时,可以通过风控模型从借款人的航旅出行数据中挖掘其是否具备较好的信用资质,从而预测借款人的信用贷款。
[0003]在相关技术中,例如在使用风控模型预测借款人的信用贷款之前,通常需要对风控模型进行训练。目前的训练方法包括:在采集得到出行数据之后,工作人员根据工作经验对出行数据进行加工处理,得到出行偏好特征(反映用户的出行规律和出行偏好),并采用出行偏好特征对风控模型进行训练。
[0004]在上述相关技术中,采用根据工作经验对出行数据进行加工处理得到的出行偏好特征对风控模型进行训练,使得训练得到的风控模型的准确性较差。

技术实现思路

[0005]本申请的主要目的在于提供一种模型训练方法、装置、设备及存储介质,旨在解决相关技术中,采用根据工作经验对出行数据进行加工处理得到的出行偏好特征对风控模型进行训练,导致训练得到的风控模型的准确性较差的问题。
[0006]为实现上述目的,本申请提供一种模型训练方法,模型训练方法包括:获取第一出行样本;获取的特征提取模型;通过特征提取模型对第一出行样本进行处理,得到出行特征向量,并通过第一分类模型对出行特征向量进行处理,得到第一预测信息;根据第一预测信息和第一出行样本对应的标记信息,分别更新特征提取模型和第一分类模型,得到第一风控模型。
[0007]本申请提供一种模型训练装置,包括:第一获取模块、第二获取模块和处理模块;其中,第一获取模块,用于获取第一出行样本;第二获取模块,用于获取特征提取模型;处理模块,用于通过特征提取模型对第一出行样本进行处理,得到出行特征向量,并通过第一分类模型对出行特征向量进行处理,得到第一预测信息;处理模块,还用于根据第一预测信息和第一出行样本对应的标记信息,分别更新特征提取模型和第一分类模型,得到第一风控模型。
[0008]本申请提供一种电子设备,电子设备包括:处理器、以及与所述处理器连接的存储器;所述存储器存储模型训练程序;处理器执行所述存储器存储的模型训练程序,以实现如上的模型训练方法。
[0009]本申请提供一种计算机可读存储介质,计算机可读存储介质上存储有模型训练程序,模型训练程序被处理器执行时实现如上的模型训练方法。
[0010]本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行
时实现如上的模型训练方法。
[0011]本申请公开了一种模型训练方法、装置、设备及存储介质,该方法包括:获取第一出行样本;获取特征提取模型;通过特征提取模型对第一出行样本进行处理,得到出行特征向量,并通过第一分类模型对出行特征向量进行处理,得到第一预测信息;根据第一预测信息和第一出行样本对应的标记信息,分别更新特征提取模型和第一分类模型,得到第一风控模型。在上述方法中,通过特征提取模型对第一出行样本进行处理,得到出行特征向量,能够实现深度挖掘第一出行样本的内在特征,避免采用根据工作经验进行加工处理得到的出行偏好特征对风控模型进行训练,提高训练得到的第一风控模型的准确性。
附图说明
[0012]图1为本申请实施例提供的应用场景示意图;
[0013]图2为本申请实施例提供的模型训练方法的流程示意图一;
[0014]图3为本申请实施例提供的兴趣点轨迹的示意图;
[0015]图4为本申请实施例提供的一种得到样本向量的示意图;
[0016]图5为本申请实施例提供的另一种得到样本向量的示意图;
[0017]图6为本申请实施例提供的训练初始特征提取模型得到特征提取模型的流程示意图一;
[0018]图7为本申请实施例提供的预训练结构示意图一;
[0019]图8为本申请实施例提供的预训练结构示意图二;
[0020]图9为本申请实施例提供的采用第一样本集和第二样本集更新特征提取模型的流程示意图;
[0021]图10为本申请实施例提供的预训练结构示意图三;
[0022]图11为本申请实施例提供的模型训练装置的结构示意图;
[0023]图12为本申请实施例提供的电子设备的结构示意图。
[0024]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0025]目前,工作人员通常根据工作经验对采集得到的出行数据进行加工处理,得到出行偏好特征(例如用户半年内到访某一类型场所的频次等),并采用出行偏好特征、学历特征、收入水平特征、工作状态特征等对风控模型进行训练。虽然通过人工提取的出行偏好特征部分反映了用户的出行规律和偏好,然而在提取过程丢失了出行轨迹的内在特征(例如到访顺序,到访时间等),因此采用上述方法得到出行偏好特征对风控模型进行训练,使得训练得到的风控模型的准确性较差。
[0026]在本申请中,为了提高训练得到的风控模型的准确性,专利技术人想到通过模型对出行数据进行深度挖掘,得到能够包括出行轨迹内在特征的特征向量,并通过特征向量对风控模型进行训练,从而提高训练得到的风控模型的准确性。
[0027]下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围
完整的传达给本领域的技术人员。
[0028]图1为本申请实施例提供的应用场景示意图。如图1所示,包括:特征提取模型和第一分类模型。
[0029]特征提取模型可以用于提取出行样本的出行特征向量,并向第一分类模型提供出行特征向量。
[0030]第一分类模型可以用于对出行特征向量、学历特征、收入水平特征、以及工作状态特征等进行分类处理,得到第一预测信息。
[0031]在得到第一预测信息之后,可以根据第一预测信息和出行样本对应的标记信息,更新特征提取模型和第一分类模型,以得到第一风控模型。
[0032]在本申请中,由于特征提取模型能够深度挖掘出行样本的内在特征,因此可以提高训练得到的第一风控模型的准确性。
[0033]下面结合具体实施例对本申请提供的模型训练方法进行说明。需要说明的是,本申请将针对根据出行特征向量出行样本更新特征提取模型和第一分类模型进行说明,对根据学历特征、收入水平特征、工作状态特征等更新特征提取模型和第一分类模型的过程不再说明。
[0034]图2为本申请实施例提供的模型训练方法的流程示意图一。如图2所示,该方法包括:
[0035]S201、获取第一出行样本。
[0036]本申请实施例的执行主体可以为电子设备,也可以为设置在电子设备中的模型训练装置,该模型训练装本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取第一出行样本;获取特征提取模型;通过所述特征提取模型对所述第一出行样本进行处理,得到出行特征向量,并通过第一分类模型对所述出行特征向量进行处理,得到第一预测信息;根据所述第一预测信息和所述第一出行样本对应的标记信息,分别更新所述特征提取模型和所述第一分类模型,得到第一风控模型。2.根据权利要求1所述的方法,其特征在于,所述获取特征提取模型,包括:获取多个第二出行样本,所述第二出行样本包括地点类别向量;对所述多个第二出行样本中的至少一个第二出行样本中的地点类别向量进行扰动,得到至少一个第三出行样本;采用所述至少一个第三出行样本和其他第二出行样本,训练初始特征提取模型,得到所述特征提取模型;所述其他第二出行样本包括所述多个第二出行样本中除所述至少一个第三出行样本之外的其他样本。3.根据权利要求2所述的方法,其特征在于,所述地点类别向量中包括多个地点类别元素;所述对所述多个第二出行样本中的至少一个第二出行样本中的地点类别向量进行扰动,得到至少一个第三出行样本,包括:针对所述至少一个第二出行样本中的每个第二出行样本包括的地点类别向量,从所述地点类别向量包括的多个地点类别元素中随机选择目标地点类别元素;对所述目标地点类别元素进行扰动,得到至少一个第三出行样本。4.根据权利要求2所述的方法,其特征在于,所述采用所述至少一个第三出行样本和其他第二出行样本,训练初始特征提取模型,得到所述特征提取模型之后,还包括:根据每个第二出行样本对应的用户标识,对所述多个第二出行样本进行分类处理,得到第一样本集和第二样本集;采用所述第一样本集和所述第二样本集,更新所述特征提取模型;所述通过所述特征提取模型对所述第一出行样本进行处理,得到出行特征向量,包括:通过更新后的所述特征提取模型对所述第一出行样本进行处理,得到出行特征向量。5.根据权利要求4所述的方法,其特征在于,所述采用所述第一样本集和所述第二样本集,更新所述特征提取模型,包括:分别将所述第一样本集和所述第二样本集中包括的样本输入所述特征提取模型中,得到第二特征向量,并将所述第二特征向量中包括的多个元素中具有预设标识的元素输入第二分类模型中,得到预测标识,预测标识指示第一样本集和所述第二样本集中包括的样本是否对应同一用户标识;根据所述预测标识与所述第一样本集和所述第二样本集中的样本对应的真实标识,确定第二损失函数;根据所述第二损失函数,更新所述特征提取模型。6.根据权利要求2

5中任一项所述的方法,其特征在于,所述至少一个第三出行样本和其他第二出行样本组合成的样本集中包括多批样本,每批样本包括出行样本;所述采用所述至少一个第三出行样本和其他第二出行样本,训练初始特征提取模型,
得到所述特征提取模型,包括:从第一批样本开始,对出行样本包括的属性向量进行叠加,得到样本向量,所述属性向量包括时间向量、日期向量、地点类别向量和城市向量;将所述样本向量输入所述初始特征提取模型中,得到第一特征向量;将所述第一特征向量包括的多个元素中具有目标标识的元素输入第三分类模型中,得到预测地点类别;所述目标标识为进行扰动的地点类别元素对应的标识或者预先设定的地点类别元素对应的标识;根据所述预测地点类别和出行样本中包括的真实地点类别,确定第一损失函数;根据所述第一损失函数,确定所述特征提取模型。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一损失函数,确定所述特征提取模型,包括:根据所述第一损失函数,分别更新所述初始特征提取模型和所述第三分类模型,得到更新后的初始特征提取模型和更新后的第三分类模型;判断所述更新后的初始特征提取模型是否处于收敛状态;若所述更新后的初...

【专利技术属性】
技术研发人员:何元钦
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1