数据分析模型的生成方法技术

技术编号:39576357 阅读:6 留言:0更新日期:2023-12-03 19:27
本公开的实施例公开了数据分析模型的生成方法

【技术实现步骤摘要】
数据分析模型的生成方法、生成装置和电子设备


[0001]本公开的实施例涉及大数据风控
,具体涉及数据分析模型的生成方法

生成装置和电子设备


技术介绍

[0002]现有的大数据风控技术,广泛应用在客户的贷中风险评估

在实际应用中,通常会通过客户过去一段时间的历史行为数据

基础数据

交易数据等,去训练模型后,预测客户未来一定时间段内的逾期的风险

其中,以树模型为代表
(

XGBOOST)
,根据客户历史信息不断迭代的做用户分群

从而将风险控制在利润最大化的水平

[0003]然而,专利技术人发现,虽然现有树模型方法直接预测客户在未来的风险是有效的,但是树模型通常只能做二分类模型

这样不利于进一步提高模型对客户的风险区分能力

[0004]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息


技术实现思路

[0005]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述

本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围

[0006]本公开的一些实施例提出了数据分析模型的生成方法

数据分析模型的生成装置

电子设备

计算机可读介质和计算机程序产品,来解决以上
技术介绍
部分提到的技术问题中的一项或多项

[0007]第一方面,本公开的一些实施例提供了一种数据分析模型的生成方法,包括:对获取的对象原始数据进行处理,生成包括样本对象属性信息和样本对象标签的训练样本数据,其中,样本对象标签包括主标签和至少一个表示样本对象在预设时间段内状态的副标签;根据训练样本数据中的样本对象标签,设置基于多任务学习框架的数据分析模型中的参数;利用训练样本数据对数据分析模型进行训练

[0008]在一些实施例中,对获取的对象原始数据进行处理,生成包括样本对象属性信息和样本对象标签的训练样本数据,包括:对获取的对象原始数据进行筛选处理,得到样本对象的属性信息;基于样本对象在预设时间段内执行价值转移操作的情况,对样本对象进行打标,得到样本对象的主标签和至少一个副标签

[0009]在一些实施例中,基于样本对象在预设时间段内执行价值转移操作的情况,对样本对象进行打标,包括:根据样本对象在预设时间段内是否逾期执行目标价值转出操作,且逾期时长达到设定时长,对样本对象进行主标签打标;根据样本对象在预设时间段内是否执行目标价值转入操作,对样本对象进行副标签打标

[0010]在一些实施例中,根据训练样本数据中的样本对象标签,设置基于多任务学习框架的数据分析模型中的参数,包括:根据训练样本数据中包含的样本对象标签的数量,设置
多任务学习框架中任务的数量,以及为每个任务设置对应的门控网络;根据样本对象标签中主标签的数量,设置多任务学习框架中塔层的数量,其中,塔层的数量为主标签数量的整数倍;基于各塔层的输出值,确定以设置好的多任务学习框架构建的数据分析模型的输出值

[0011]在一些实施例中,基于各塔层的输出值,确定以设置好的多任务学习框架构建的数据分析模型的输出值,包括:采用贝叶斯公式,确定多任务学习框架中各塔层输出值的乘积,以作为数据分析模型的输出值,其中,数据分析模型的输出值用于表征对象为主标签的概率

[0012]在一些实施例中,利用训练样本数据对数据分析模型进行训练,包括:根据训练样本数据中样本对象的主标签

以及表征在预设时间段内是否执行目标价值转入操作的副标签,确定数据分析模型的损失值;根据损失值调整数据分析模型的相关参数,以继续训练

[0013]在一些实施例中,该方法还包括:利用测试样本数据对训练完成的数据分析模型进行测试;采用接收者操作特征曲线下方的面积的方法,根据数据分析模型的输出值,来确定模型的测试迭代次数

[0014]在一些实施例中,该方法还包括:利用训练完成的数据分析模型对目标对象进行分析预测,得到目标对象的预测结果;根据预测结果,确定目标对象的服务配置数据;以及向目标对象提供服务配置数据所指示的应用服务

[0015]第二方面,本公开的一些实施例提供了一种数据分析模型的生成装置,包括:训练数据生成单元,被配置成对获取的对象原始数据进行处理,生成包括样本对象属性信息和样本对象标签的训练样本数据,其中,样本对象标签包括主标签和至少一个表示样本对象在预设时间段内状态的副标签;模型参数设置单元,被配置成根据训练样本数据中的样本对象标签,设置基于多任务学习框架的数据分析模型中的参数;模型训练单元,被配置成利用训练样本数据对数据分析模型进行训练

[0016]在一些实施例中,训练数据生成单元进一步被配置成对获取的对象原始数据进行筛选处理,得到样本对象的属性信息;基于样本对象在预设时间段内执行价值转移操作的情况,对样本对象进行打标,得到样本对象的主标签和至少一个副标签

[0017]在一些实施例中,训练数据生成单元进一步被配置成根据样本对象在预设时间段内是否逾期执行目标价值转出操作,且逾期时长达到设定时长,对样本对象进行主标签打标;根据样本对象在预设时间段内是否执行目标价值转入操作,对样本对象进行副标签打标

[0018]在一些实施例中,模型参数设置单元进一步被配置成根据训练样本数据中包含的样本对象标签的数量,设置多任务学习框架中任务的数量,以及为每个任务设置对应的门控网络;根据样本对象标签中主标签的数量,设置多任务学习框架中塔层的数量,其中,塔层的数量为主标签数量的整数倍;基于各塔层的输出值,确定以设置好的多任务学习框架构建的数据分析模型的输出值

[0019]在一些实施例中,模型参数设置单元进一步被配置成采用贝叶斯公式,确定多任务学习框架中各塔层输出值的乘积,以作为数据分析模型的输出值,其中,数据分析模型的输出值用于表征对象为主标签的概率

[0020]在一些实施例中,模型训练单元进一步被配置成根据训练样本数据中样本对象的
主标签

以及表征在预设时间段内是否执行目标价值转入操作的副标签,确定数据分析模型的损失值;根据损失值调整数据分析模型的相关参数,以继续训练

[0021]在一些实施例中,该生成装置还包括模型测试单元,被配置成利用测试样本数据对训练完成的数据分析模型进行测试;采用接收者操作特征曲线下方的面积的方法,根据数据分析模型的输出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种数据分析模型的生成方法,包括:对获取的对象原始数据进行处理,生成包括样本对象属性信息和样本对象标签的训练样本数据,其中,所述样本对象标签包括主标签和至少一个表示所述样本对象在预设时间段内状态的副标签;根据所述训练样本数据中的样本对象标签,设置基于多任务学习框架的数据分析模型中的参数;利用所述训练样本数据对所述数据分析模型进行训练
。2.
根据权利要求1所述的生成方法,其中,所述对获取的对象原始数据进行处理,生成包括样本对象属性信息和样本对象标签的训练样本数据,包括:对获取的对象原始数据进行筛选处理,得到样本对象的属性信息;基于所述样本对象在预设时间段内执行价值转移操作的情况,对所述样本对象进行打标,得到所述样本对象的主标签和至少一个副标签
。3.
根据权利要求2所述的生成方法,其中,所述基于所述样本对象在预设时间段内执行价值转移操作的情况,对所述样本对象进行打标,包括:根据所述样本对象在预设时间段内是否逾期执行目标价值转出操作,且逾期时长达到设定时长,对所述样本对象进行主标签打标;根据所述样本对象在预设时间段内是否执行目标价值转入操作,对所述样本对象进行副标签打标
。4.
根据权利要求1所述的生成方法,其中,所述根据所述训练样本数据中的样本对象标签,设置基于多任务学习框架的数据分析模型中的参数,包括:根据所述训练样本数据中包含的样本对象标签的数量,设置多任务学习框架中任务的数量,以及为每个任务设置对应的门控网络;根据所述样本对象标签中主标签的数量,设置所述多任务学习框架中塔层的数量,其中,所述塔层的数量为主标签数量的整数倍;基于各所述塔层的输出值,确定以设置好的所述多任务学习框架构建的数据分析模型的输出值
。5.
根据权利要求4所述的生成方法,其中,所述基于各所述塔层的输出值,确定以设置好的所述多任务学习框架构建的数据分析模型的输出值,包括:采用贝叶斯公式,确定所述多任务学习框架中各塔层输出值的乘积,以作为所述数据分析模型的输出值,其中,所述数据分析模型的输出值用于表征对象为主标签的概率
...

【专利技术属性】
技术研发人员:王逸聪雷鹏郑邦祺
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1