模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：31238811 阅读：22 留言：0更新日期：2021-12-08 10:25

本申请公开了一种模型训练方法、装置、设备及存储介质，方法包括：获取第一出行样本；获取特征提取模型；通过特征提取模型对第一出行样本进行处理，得到出行特征向量，并通过第一分类模型对出行特征向量进行处理，得到第一预测信息；根据第一预测信息和第一出行样本对应的标记信息，分别更新特征提取模型和第一分类模型，得到第一风控模型。本申请公开的模型训练方法、装置、设备及存储介质能够提高训练得到的第一风控模型的准确性。到的第一风控模型的准确性。到的第一风控模型的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、设备及存储介质

[0001]本申请涉及金融科技(尤其深度学习、大数据)
，尤其涉及一种模型训练方法、装置、设备及存储介质。

技术介绍

[0002]风控模型可以用于从能够获取到的数据中尽可能的挖掘信用信息，实现预测借款人的信用贷款。比如当借款人缺乏银行信用卡的数据时，可以通过风控模型从借款人的航旅出行数据中挖掘其是否具备较好的信用资质，从而预测借款人的信用贷款。
[0003]在相关技术中，例如在使用风控模型预测借款人的信用贷款之前，通常需要对风控模型进行训练。目前的训练方法包括：在采集得到出行数据之后，工作人员根据工作经验对出行数据进行加工处理，得到出行偏好特征(反映用户的出行规律和出行偏好)，并采用出行偏好特征对风控模型进行训练。
[0004]在上述相关技术中，采用根据工作经验对出行数据进行加工处理得到的出行偏好特征对风控模型进行训练，使得训练得到的风控模型的准确性较差。

技术实现思路

[0005]本申请的主要目的在于提供一种模型训练方法、装置、设备及存储介质，旨在解决相关技术中，采用根据工作经验对出行数据进行加工处理得到的出行偏好特征对风控模型进行训练，导致训练得到的风控模型的准确性较差的问题。
[0006]为实现上述目的，本申请提供一种模型训练方法，模型训练方法包括：获取第一出行样本；获取的特征提取模型；通过特征提取模型对第一出行样本进行处理，得到出行特征向量，并通过第一分类模型对出行特征向量进行处理，得到第一预测信息；根据第一预测信息和第一出行样...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取第一出行样本；获取特征提取模型；通过所述特征提取模型对所述第一出行样本进行处理，得到出行特征向量，并通过第一分类模型对所述出行特征向量进行处理，得到第一预测信息；根据所述第一预测信息和所述第一出行样本对应的标记信息，分别更新所述特征提取模型和所述第一分类模型，得到第一风控模型。2.根据权利要求1所述的方法，其特征在于，所述获取特征提取模型，包括：获取多个第二出行样本，所述第二出行样本包括地点类别向量；对所述多个第二出行样本中的至少一个第二出行样本中的地点类别向量进行扰动，得到至少一个第三出行样本；采用所述至少一个第三出行样本和其他第二出行样本，训练初始特征提取模型，得到所述特征提取模型；所述其他第二出行样本包括所述多个第二出行样本中除所述至少一个第三出行样本之外的其他样本。3.根据权利要求2所述的方法，其特征在于，所述地点类别向量中包括多个地点类别元素；所述对所述多个第二出行样本中的至少一个第二出行样本中的地点类别向量进行扰动，得到至少一个第三出行样本，包括：针对所述至少一个第二出行样本中的每个第二出行样本包括的地点类别向量，从所述地点类别向量包括的多个地点类别元素中随机选择目标地点类别元素；对所述目标地点类别元素进行扰动，得到至少一个第三出行样本。4.根据权利要求2所述的方法，其特征在于，所述采用所述至少一个第三出行样本和其他第二出行样本，训练初始特征提取模型，得到所述特征提取模型之后，还包括：根据每个第二出行样本对应的用户标识，对所述多个第二出行样本进行分类处理，得到第一样本集和第二样本集；采用所述第一样本集和所述第二样本集，更新所述特征提取模型；所述通过所述特征提取模型对所述第一出行样本进行处理，得到出行特征向量，包括：通过更新后的所述特征提取模型对所述第一出行样本进行处理，得到出行特征向量。5.根据权利要求4所述的方法，其特征在于，所述采用所述第一样本集和所述第二样本集，更新所述特征提取模型，包括：分别将所述第一样本集和所述第二样本集中包括的样本输入所述特征提取模型中，得到第二特征向量，并将所述第二特征向量中包括的多个元素中具有预设标识的元素输入第二分类模型中，得到预测标识，预测标识指示第一样本集和所述第二样本集中包括的样本是否对应同一用户标识；根据所述预测标识与所述第一样本集和所述第二样本集中的样本对应的真实标识，确定第二损失函数；根据所述第二损失函数，更新所述特征提取模型。6.根据权利要求2
‑
5中任一项所述的方法，其特征在于，所述至少一个第三出行样本和其他第二出行样本组合成的样本集中包括多批样本，每批样本包括出行样本；所述采用所述至少一个第三出行样本和其他第二出行样本，训练初始特征提取模型，
得到所述特征提取模型，包括：从第一批样本开始，对出行样本包括的属性向量进行叠加，得到样本向量，所述属性向量包括时间向量、日期向量、地点类别向量和城市向量；将所述样本向量输入所述初始特征提取模型中，得到第一特征向量；将所述第一特征向量包括的多个元素中具有目标标识的元素输入第三分类模型中，得到预测地点类别；所述目标标识为进行扰动的地点类别元素对应的标识或者预先设定的地点类别元素对应的标识；根据所述预测地点类别和出行样本中包括的真实地点类别，确定第一损失函数；根据所述第一损失函数，确定所述特征提取模型。7.根据权利要求6所述的方法，其特征在于，所述根据所述第一损失函数，确定所述特征提取模型，包括：根据所述第一损失函数，分别更新所述初始特征提取模型和所述第三分类模型，得到更新后的初始特征提取模型和更新后的第三分类模型；判断所述更新后的初始特征提取模型是否处于收敛状态；若所述更新后的初...

【专利技术属性】
技术研发人员：何元钦，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人