风险画像模型构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39060837 阅读:16 留言:0更新日期:2023-10-12 19:53
本发明专利技术涉及数据分析技术领域,提供一种风险画像模型构建方法、装置、电子设备及存储介质,该方法包括:获取基础客户数据集,所述基础客户数据集包括:客户基本信息,所述客户基本信息包括:客户个人信息和还款信息;基于所述还款信息中的历史还款记录确定客户的风险标签数据集;对所述基础客户数据集进行数据特征衍生,得到目标客户数据集;基于所述风险标签数据集和目标客户数据集训练至少两种树类子模型,以得到所述风险画像模型,所述风险画像模型的输出以至少两种所述树类子模型的输出按各自预设权重加权求和得到。本发明专利技术的方法构建的风险画像模型预测准确度及可靠性更高。建的风险画像模型预测准确度及可靠性更高。建的风险画像模型预测准确度及可靠性更高。

【技术实现步骤摘要】
风险画像模型构建方法、装置、电子设备及存储介质


[0001]本专利技术涉及数据分析
,尤其涉及一种风险画像模型构建方法、装置、电子设备及存储介质。

技术介绍

[0002]风险画像是对用户或客户的风险评估结果,例如:对客户贷款是否会逾期的评估结果。目前,风险画像的评估大多利用事先构建的风险画像模型进行评估,风险画像模型是基于大量的客户数据特征采用机器学习的方式构建的,例如:评分卡模型。评分卡模型是有监督学习中模型,传统的评分卡模型大多基于逻辑回归算法实现,运算速度快,可解释性强,但对于大规模的客户数据特征无法有效的利用与操作,客户数据特征的部分信息学习不到,即会存在信息丢失的现象,从而导致最终构建的风险画像模型对客户的风险预测准确度和可靠性低。

技术实现思路

[0003]本专利技术提供一种风险画像模型构建方法、装置、电子设备及存储介质,用以解决现有技术中的风险画像模型对客户的风险预测准确度和可靠性低的问题。
[0004]本专利技术提供一种风险画像模型构建方法,包括:
[0005]获取基础客户数据集,所述基础客户数据集包括:客户基本信息,所述客户基本信息包括:客户个人信息和还款信息;
[0006]基于所述还款信息中的历史还款记录确定客户的风险标签数据集;
[0007]对所述基础客户数据集进行数据特征衍生,得到目标客户数据集;
[0008]基于所述风险标签数据集和目标客户数据集训练至少两种树类子模型,以得到所述风险画像模型,所述风险画像模型的输出以至少两种所述树类子模型的输出按各自预设权重加权求和得到。
[0009]根据本专利技术提供的一种风险画像模型构建方法,基于所述还款信息中的历史还款记录确定客户的风险标签数据集,包括:
[0010]提取所述还款信息中的历史还款记录;
[0011]对历史还款记录中的每一个还款周期,若当前还款周期往后的N≥1个还款周期内出现过还款逾期行为,则将当前还款周期的标签置为真,否则置为假,从而确定客户的风险标签数据集,其中,N≥1。
[0012]根据本专利技术提供的一种风险画像模型构建方法,在基于所述风险标签数据集和目标客户数据训集练至少两种树类子模型之前,还包括:
[0013]采用无监督学习模型对所述目标客户数据训集进行特征衍生,以得到所述目标客户数据训集中每个客户数据项的异常指数,并将所述异常指数作为对应客户数据项的特征字段加入到所述目标客户数据训集中。
[0014]根据本专利技术提供的一种风险画像模型构建方法,所述无监督学习模型包括孤立森
林模型。
[0015]根据本专利技术提供的一种风险画像模型构建方法,所述至少两种树类子模型为三种树类子模型,包括:随机森林子模型、LightGBM子模型和CatBoost子模型,且三个子模型的输出权重分别为0.25~0.32、0.33~0.42和0.33~0.42。
[0016]根据本专利技术提供的一种风险画像模型构建方法,所述基础客户数据集还包括:消费信用和互金信息,所述客户基本信息还包括:客户购买产品的产品工作数据。
[0017]根据本专利技术提供的一种风险画像模型构建方法,在基于所述风险标签数据集和目标客户数据集训练至少两种树类子模型之前,还包括:
[0018]对所述目标客户数据集中的所述消费信用和互金信息的数据特征进行降维。
[0019]本专利技术还提供一种风险画像模型构建装置,包括:
[0020]数据获取模块,用于获取基础客户数据集,所述基础客户数据集包括:客户基本信息,所述客户基本信息包括:客户个人信息和还款信息;
[0021]标签确定模块,用于基于所述还款信息中的历史还款记录确定客户的风险标签数据集;
[0022]特征衍生模块,用于对所述基础客户数据集进行数据特征衍生,得到目标客户数据集;
[0023]模型训练模块,用于基于所述风险标签数据集和目标客户数据集训练至少两种树类子模型,以得到所述风险画像模型,所述风险画像模型的输出以两种所述树类子模型的输出按各自预设权重加权求和得到。
[0024]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述的风险画像模型构建方法。
[0025]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的风险画像模型构建方法。
[0026]本专利技术提供的风险画像模型构建方法、装置、电子设备及存储介质,通过获取基础客户数据集,所述基础客户数据集包括:客户基本信息和还款信息;基于所述还款信息中的历史还款记录确定客户的风险标签数据集;对所述基础客户数据集进行数据特征衍生,得到目标客户数据集;基于所述风险标签数据集和目标客户数据集训练至少两种树类子模型,以得到所述风险画像模型,所述风险画像模型的输出以至少两种所述树类子模型的输出按各自预设权重加权求和得到。本专利技术中,由于对基础客户数据集进行数据特征衍生,得到表征客户更多特征的目标客户数据集,而且采用至少两种树类子模型构建风险画像模型,树类子模型相对于传统的以逻辑回归为基础的模型,在基于目标客户数据集学习训练时不存在信息丢失现象,使得训练完成的风险画像模型预测客户是否逾期的概率的准确度及可靠性更高。
附图说明
[0027]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些
附图获得其他的附图。
[0028]图1是本专利技术提供的风险画像模型构建方法的流程示意图;
[0029]图2是本专利技术提供的风险画像模型构建装置的结构示意图;
[0030]图3是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0031]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0032]本专利技术实施例的一种风险画像模型构建方法,如图1所示,包括:
[0033]步骤S110:获取基础客户数据集,所述基础客户数据集包括:客户基本信息,所述客户基本信息包括:客户个人信息和还款信息。对于采购产品的行业,例如:采购工程机械设备(如:挖掘机等),客户个人信息包括:客户ID、年龄、资产规模、拥有的产品数量、机器吨位、采购总金额、复购率及其它客户属性等客户个人信息。还款信息指的是客户从购买产品开始,到还款结束,每个还款周期的还款情况,具体包括:约定的还款周期、购机首付款比例、还款金额和是否逾期等信息。
[0034]步骤S120:基于所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险画像模型构建方法,其特征在于,包括:获取基础客户数据集,所述基础客户数据集包括:客户基本信息,所述客户基本信息包括:客户个人信息和还款信息;基于所述还款信息中的历史还款记录确定客户的风险标签数据集;对所述基础客户数据集进行数据特征衍生,得到目标客户数据集;基于所述风险标签数据集和目标客户数据集训练至少两种树类子模型,以得到所述风险画像模型,所述风险画像模型的输出以至少两种所述树类子模型的输出按各自预设权重加权求和得到。2.根据权利要求1所述的风险画像模型构建方法,其特征在于,基于所述还款信息中的历史还款记录确定客户的风险标签数据集,包括:提取所述还款信息中的历史还款记录;对历史还款记录中的每一个还款周期,若当前还款周期往后的N个还款周期内出现过还款逾期行为,则将当前还款周期的标签置为真,否则置为假,从而确定客户的风险标签数据集,其中,N≥1。3.根据权利要求1所述的风险画像模型构建方法,其特征在于,在基于所述风险标签数据集和目标客户数据训集练至少两种树类子模型之前,还包括:采用无监督学习模型对所述目标客户数据训集进行特征衍生,以得到所述目标客户数据训集中每个客户数据项的异常指数,并将所述异常指数作为对应客户数据项的特征字段加入到所述目标客户数据训集中。4.根据权利要求2所述的风险画像模型构建方法,其特征在于,所述无监督学习模型包括孤立森林模型。5.根据权利要求1所述的风险画像模型构建方法,其特征在于,所述至少两种树类子模型为三种树类子模型,包括:随机森林子模型、LightGBM子模型和CatBoost子...

【专利技术属性】
技术研发人员:卢阳光齐绪强李亚文
申请(专利权)人:三一重机有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1