数据分析模型的生成方法技术

技术编号：39576357 阅读：6 留言：0更新日期：2023-12-03 19:27

本公开的实施例公开了数据分析模型的生成方法

全部详细技术资料下载

【技术实现步骤摘要】
数据分析模型的生成方法、生成装置和电子设备

[0001]本公开的实施例涉及大数据风控
，具体涉及数据分析模型的生成方法
、
生成装置和电子设备
。

技术介绍

[0002]现有的大数据风控技术，广泛应用在客户的贷中风险评估
。
在实际应用中，通常会通过客户过去一段时间的历史行为数据
、
基础数据
、
交易数据等，去训练模型后，预测客户未来一定时间段内的逾期的风险
。
其中，以树模型为代表
(
如
XGBOOST)
，根据客户历史信息不断迭代的做用户分群
。
从而将风险控制在利润最大化的水平
。
[0003]然而，专利技术人发现，虽然现有树模型方法直接预测客户在未来的风险是有效的，但是树模型通常只能做二分类模型
。
这样不利于进一步提高模型对客户的风险区分能力
。
[0004]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解，并因此，其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息
。

技术实现思路

[0005]本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述
。
本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围
。
[0006]本公开的一些实施...

【技术保护点】

【技术特征摘要】
1.
一种数据分析模型的生成方法，包括：对获取的对象原始数据进行处理，生成包括样本对象属性信息和样本对象标签的训练样本数据，其中，所述样本对象标签包括主标签和至少一个表示所述样本对象在预设时间段内状态的副标签；根据所述训练样本数据中的样本对象标签，设置基于多任务学习框架的数据分析模型中的参数；利用所述训练样本数据对所述数据分析模型进行训练
。2.
根据权利要求1所述的生成方法，其中，所述对获取的对象原始数据进行处理，生成包括样本对象属性信息和样本对象标签的训练样本数据，包括：对获取的对象原始数据进行筛选处理，得到样本对象的属性信息；基于所述样本对象在预设时间段内执行价值转移操作的情况，对所述样本对象进行打标，得到所述样本对象的主标签和至少一个副标签
。3.
根据权利要求2所述的生成方法，其中，所述基于所述样本对象在预设时间段内执行价值转移操作的情况，对所述样本对象进行打标，包括：根据所述样本对象在预设时间段内是否逾期执行目标价值转出操作，且逾期时长达到设定时长，对所述样本对象进行主标签打标；根据所述样本对象在预设时间段内是否执行目标价值转入操作，对所述样本对象进行副标签打标
。4.
根据权利要求1所述的生成方法，其中，所述根据所述训练样本数据中的样本对象标签，设置基于多任务学习框架的数据分析模型中的参数，包括：根据所述训练样本数据中包含的样本对象标签的数量，设置多任务学习框架中任务的数量，以及为每个任务设置对应的门控网络；根据所述样本对象标签中主标签的数量，设置所述多任务学习框架中塔层的数量，其中，所述塔层的数量为主标签数量的整数倍；基于各所述塔层的输出值，确定以设置好的所述多任务学习框架构建的数据分析模型的输出值
。5.
根据权利要求4所述的生成方法，其中，所述基于各所述塔层的输出值，确定以设置好的所述多任务学习框架构建的数据分析模型的输出值，包括：采用贝叶斯公式，确定所述多任务学习框架中各塔层输出值的乘积，以作为所述数据分析模型的输出值，其中，所述数据分析模型的输出值用于表征对象为主标签的概率
...

【专利技术属性】
技术研发人员：王逸聪，雷鹏，郑邦祺，
申请(专利权)人：京东科技控股股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人