一种基于树模型特征衍生的风险评估方法、装置和电子设备制造方法及图纸

技术编号:27593587 阅读:17 留言:0更新日期:2021-03-10 10:12
本发明专利技术公开了一种基于树模型特征衍生的风险评估方法,用于评估用户的金融风险,其特征在于,包括:获取与用户关联的移动终端的应用列表信息并对其进行独热编码,形成与用户关联的独热编码特征;将独热编码特征代入树特征衍生模型以获取与用户关联的独热编码衍生特征;构建机器学习模型,使用历史用户的独热编码衍生特征及其金融表现数据训练该机器学习模型;将新用户的独热编码衍生特征输入训练好的机器学习模型,计算该新用户的风险评分。本发明专利技术评估的授信风险结果准确率高,稳定性较好,在建模和特征维护方面,投入的人力少,节省资源,效果显著。效果显著。效果显著。

【技术实现步骤摘要】
一种基于树模型特征衍生的风险评估方法、装置和电子设备


[0001]本专利技术涉及计算机信息处理领域,具体而言,涉及一种基于树模型特征衍生的风险评估方法、装置、电子设备及计算机可读介质。

技术介绍

[0002]消费金融领域,在用户充分授权的前提下,对用户的应用程序(APP)数据进行充分挖掘并用以风险控制可以区分出一定比例的高风险用户。目前传统的应用变量挖掘主要是对应用程序进行分类统计,然后刻画用户画像;或者根据不同时期应用程序安装卸载的变化情况来刻画用户的风险变化;或者根据安装的应用程序风险等级来衍生相关的入模变量。上述方法可以衍生出具有一定风险区分度的变量,但是这些方法普遍存在维护难度比较大,投入的人力较多,衍生变量的质量较大程度依赖于挖掘者对业务的了解程度、维护成本高、稳定性不理想等。

技术实现思路

[0003]为了解决在风险评估中存在的上述缺陷进而实现稳定准确高效的评估,本专利技术提供了一种基于树模型特征衍生的风险评估方法、装置、电子设备及计算机可读介质。
[0004]本专利技术的一个方面提供一种基于树模型特征衍生的风险评估方法,用于评估用户的金融风险,包括:获取与用户关联的移动终端的应用列表信息并对其进行独热编码,形成与所述用户关联的独热编码特征;将所述独热编码特征代入树特征衍生模型以获取与所述用户关联的独热编码衍生特征;构建机器学习模型,使用历史用户的独热编码衍生特征及其金融表现数据训练该机器学习模型;将新用户的独热编码衍生特征输入所述训练好的机器学习模型,计算该新用户的风险评分。r/>[0005]根据本专利技术的优选实施方式,所述获取与用户关联的移动终端的应用列表信息并对其进行独热编码,进一步包括:获取多个应用的用户覆盖度;建立应用集合,使得所述应用集合中的各应用的所述用户覆盖度大于预定值;将用户的用用安装列表与所述应用集合比较以获得所述与用户关联的独热编码特征。
[0006]根据本专利技术的优选实施方式,所述建立应用集合,使得所述应用集合中的各应用的所述用户覆盖度大于预定值,进一步包括:按照所述用户覆盖度由大到小的顺序对所述多个应用排序形成序列;选取所述序列中排名在前预设数量的应用作为应用集合中的应用。
[0007]根据本专利技术的优选实施方式,根据应用列表信息进行独热编码,形成与所述用户关联的独热编码特征,进一步包括:根据所述应用安装列表信息获得应用安装数量,根据应
用安装数量是否超过预定值进行独热编码,获得所述与用户关联的独热编码特征。
[0008]根据本专利技术的优选实施方式,根据应用列表信息进行独热编码,形成与所述用户关联的独热编码特征,进一步包括:根据所述应用安装列表信息获得特定类型的应用安装数量,根据该特定类型的应用安装数量是否超过预定值进行独热编码,获得所述与用户关联的独热编码特征。
[0009]根据本专利技术的优选实施方式,所述将独热编码特征代入树特征衍生模型以获取与所述用户关联的独热编码衍生特征,进一步包括:构建树特征衍生模型;将所述独热编码特征打散并代入所述树特征衍生模型;获取独热编码衍生特征。
[0010]根据本专利技术的优选实施方式,所述树特征衍生模型进一步包括多个树模型构成的组合模型。
[0011]根据本专利技术的优选实施方式,所述树模型为xgboost模型或LightGBM模型。
[0012]根据本专利技术的优选实施方式,所述独热编码衍生特征为一维稀疏向量。
[0013]根据本专利技术的优选实施方式,所述机器学习模型进一步包括:逻辑回归模型或因子分解机。
[0014]本专利技术的第二方面提供一种基于树模型特征衍生的风险评估装置,包括:信息获取模块,用于获取与用户关联的移动终端的应用列表信息;信息编码模块,用于对所述应用列表信息进行独热编码,形成与所述用户关联的独热编码特征;特征衍生模块,用于将所述独热编码特征代入树特征衍生模型以获取与所述用户关联的独热编码衍生特征;模型训练模块,用于构建机器学习模型,使用历史用户的独热编码衍生特征及其金融表现数据训练该机器学习模型;评估模块,用于将新用户的独热编码衍生特征输入所述训练好的机器学习模型,计算该新用户的风险评分。
[0015]根据本专利技术的优选实施方式,所述信息编码模块进一步包括:覆盖度获取单元,用于获取多个应用的用户覆盖度;集合建立单元,用于建立应用集合,使得所述应用集合中的各应用的所述用户覆盖度大于预定值;比较单元,用于将用户的用用安装列表与所述应用集合比较以获得所述与用户关 联的独热编码特征。
[0016]根据本专利技术的优选实施方式,所述集合建立单元进一步包括:排序组件,用于按照所述用户覆盖度由大到小的顺序对所述多个应用排序形成序列;筛选组件,用于选取所述序列中排名在前预设数量的应用作为应用集合中的应用。
[0017]根据本专利技术的优选实施方式,所述信息编码模块进一步包括:计数单元,用于根据所述应用安装列表信息获得应用安装数量;第一特征提取单元,用于根据应用安装数量是否超过预定值进行独热编码,获得所述与用户关联的独热编码特征。
[0018]根据本专利技术的优选实施方式,所述信息编码模块进一步包括:分类计数单元,用于根据所述应用安装列表信息获得特定类型的应用安装数量;第二特征提取单元,用于根据该特定类型的应用安装数量是否超过预定值进行独热编码,获得所述与用户关联的独热编码特征。
[0019]根据本专利技术的优选实施方式,所述特征衍生模块进一步包括:树模型构建单元,用
于构建树特征衍生模型;代入单元,用于将所述独热编码特征打散并代入所述树特征衍生模型;特征获取单元,用于获取独热编码衍生特征。
[0020]根据本专利技术的优选实施方式,所述树模型构建单元用于构建由多个树模型构成的组合模型。
[0021]根据本专利技术的优选实施方式,所述树模型为xgboost模型或LightGBM模型。
[0022]根据本专利技术的优选实施方式,所述独热编码衍生特征为一维稀疏向量。
[0023]根据本专利技术的优选实施方式,所述模型训练模块利用逻辑回归模型或因子分解机进行机器学习训练。
[0024]本专利技术的第三方面提供一种电子设备,其中,该电子设备包括:处理器;以及,存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述的方法。
[0025]本专利技术的第四方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现上述的方法。
[0026]本专利技术的技术方案,具有如下有益效果:本专利技术通过获取与用户关联的移动终端的应用列表信息并对其进行独热编码,形成与所述用户关联的独热编码特征,将所述独热编码特征代入树特征衍生模型以获取与所述用户关联的独热编码衍生特征,构建机器学习模型,使用历史用户的独热编码衍生特征及其金融表现数据训练该机器学习模型,将新用户的独热编码衍生特征输入所述训练好的机器学习模型,计算该新用户的风险评分从而得到待授信用户的授信风险,变量挖掘简单,变量衍生效果好,易于实现,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于树模型特征衍生的风险评估方法,用于评估用户的金融风险,其特征在于,包括:获取与用户关联的移动终端的应用列表信息并对其进行独热编码,形成与所述用户关联的独热编码特征;将所述独热编码特征代入树特征衍生模型以获取与所述用户关联的独热编码衍生特征;构建机器学习模型,使用历史用户的独热编码衍生特征及其金融表现数据训练该机器学习模型;将新用户的独热编码衍生特征输入所述训练好的机器学习模型,计算该新用户的风险评分。2.根据权利要求1所述的方法,其特征在于,所述获取与用户关联的移动终端的应用列表信息并对其进行独热编码,进一步包括:获取多个应用的用户覆盖度;建立应用集合,使得所述应用集合中的各应用的所述用户覆盖度大于预定值;将用户的用用安装列表与所述应用集合比较以获得所述与用户关联的独热编码特征。3.根据权利要求2所述的方法,其特征在于,所述建立应用集合,使得所述应用集合中的各应用的所述用户覆盖度大于预定值,进一步包括:按照所述用户覆盖度由大到小的顺序对所述多个应用排序形成序列;选取所述序列中排名在前预设数量的应用作为应用集合中的应用。4.根据权利要求3中任一项所述的方法,其特征在于,根据应用列表信息进行独热编码,形成与所述用户关联的独热编码特征,进一步包括:根据所述应用安装列表信息获得应用安装数量,根据应用安装数量是否超过预定值进行独热编码,获得所述与用户关联的独热编码特征。5.根据权利要求4中任一项所述的方法,其特征在于,根据应用列表信息进行独热编码,形成与所述用户关联的独热编码特征,进一步包括:根据所述...

【专利技术属性】
技术研发人员:姚王照
申请(专利权)人:北京淇瑀信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1