一种用户响应信息预测模型建立方法及信息预测方法技术

技术编号:30137017 阅读:18 留言:0更新日期:2021-09-23 14:49
本文属于人工智能领域,具体涉及一种用户响应信息预测模型建立方法及信息预测方法,所述预测模型建立方法包括:获取指定用户的属性数据和贷款数据,所述指定用户表示满足预设条件的贷款用户,所述贷款数据至少包括贷款利率;根据所述指定用户的贷款数据,按照预设的转换规则得到每个指定用户针对每种数据类型的入模变量;将所述指定用户的属性数据及其对应的全部数据类型的入模变量带入到初始训练模型中进行训练,得到目标预测模型,通过该目标预测模型可以实现基于用户分层的原理对用户针对贷款信息的响应结果,提高预测的准确性和可靠性。和可靠性。和可靠性。

【技术实现步骤摘要】
一种用户响应信息预测模型建立方法及信息预测方法


[0001]本文属于人工智能领域,具体涉及一种用户响应信息预测模型建立方法及信息预测方法。

技术介绍

[0002]当前,小微企业或个体用户的信贷需求逐渐受到商业银行的关注,为了开发优质信贷市场,支持小微企业的生产建设,商业银行不断深入了解小微企业的贷款需求,小微企业信贷规模也随之扩大。
[0003]但是,企业的贷款意愿并非一层不变,而会随着市场、企业发展、银行贷款利率、还款政策发生改变,在贷款申请被成功批准后,仍会出现长时间不开户、或开户后长时间不支用的情况,一种可能是客户对贷款的需求不强烈,另一种可能是客户在申请成功后,贷款意愿发生了改变。如果能够在客户申请成功时,对客户和贷款的信息进行分析,识别出那些可能发生额度响应不及时的客户,有针对性地对该类客户进行服务,就能吸引这部分客户开户并支用,而现有技术中并没有针对用户额度响应的预测的技术方案,从而很难对用户进行准确的分类以及后续针对性的服务。因此如何准确的对用户的响应结果进行准确预测成为目前亟需解决的技术问题。

技术实现思路

[0004]针对现有技术的上述问题,本文的目的在于,提供一种用户响应信息预测模型建立方法及信息预测方法,能够提高用户对贷款信息响应结果预测的准确性。
[0005]为了解决上述技术问题,本文的具体技术方案如下:
[0006]一方面,本文提供一种用户响应信息预测模型建立方法,所述方法包括:
[0007]获取指定用户的属性数据和贷款数据,所述指定用户表示满足预设条件的贷款用户,所述贷款数据至少包括贷款利率;
[0008]根据所述指定用户的贷款数据,按照预设的转换规则得到每个指定用户针对每种数据类型的入模变量;
[0009]将所述指定用户的属性数据及其对应的全部数据类型的入模变量带入到初始训练模型中进行训练,得到目标预测模型。
[0010]进一步地,所述指定用户的属性数据包括响应用户和非响应用户;
[0011]所述响应用户包括在贷款申请成功后第一时间内开户且支用的用户;
[0012]所述非响应用户包括在贷款申请成功后第一时间内未开户,或在第二时间内未支用的用户,其中所述第一时间小于所述第二时间。
[0013]进一步地,所述根据所述指定用户的贷款数据,按照预设的转换规则得到每个指定用户针对每种数据类型的入模变量,包括:
[0014]根据所述指定用户的贷款数据,按照预设衍生规则得到衍生数据;
[0015]对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据;
[0016]按照预设的转换规则,对所述预处理数据进行转换,得到每个指定用户针对每种数据类型的入模变量。
[0017]进一步地,所述根据所述指定用户的贷款数据,按照预设衍生规则得到衍生数据,包括:
[0018]确定衍生数据类型及其衍生规则;
[0019]确定与所述衍生数据类型对应的至少一种贷款数据;
[0020]根据所述衍生数据类型及其对应的贷款数据,结合该衍生数据类型的衍生规则,生成所述衍生数据。
[0021]作为可选地,所述衍生规则至少包括以下中的一种:数据透传、数据统计描述和数据分类聚合。
[0022]进一步地,所述对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据,包括:
[0023]计算每种数据类型的数据缺失率,所述缺失率表示多个用户中缺失该数据类型的用户数和全部用户数之比;
[0024]判断所述缺失率是否超过第一阈值;
[0025]若所述缺失率超过第一阈值,则删除该缺失率对应的数据类型,以获得更新后的预处理数据。
[0026]进一步地,所述对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据,包括:
[0027]针对每种数据类型,按照第一预设分箱规则对数据进行分箱处理;
[0028]根据分箱后的数据,按照预设数据稳定度计算公式计算每种数据类型的稳定度;
[0029]判断所述稳定度是否超过第二阈值;
[0030]若所述稳定度没有超过所述第二阈值,则删除该稳定度对应的数据类型,以获得更新后的预处理数据。
[0031]进一步地,所述预设数据稳定度计算公式为:
[0032][0033]其中,PSIj为第j个数据类型的稳定度,i为该数据类型的第i个分箱,A
i
为第i个分箱中实际数据数量和全部数据数量之比,E
i
为第i个分箱中理论样本数量和全部样本数量之比。
[0034]进一步地,所述对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据,包括:
[0035]计算任意两种数据类型之间的相关系数;
[0036]判断所述相关系数是否超过第三阈值;
[0037]若所述相关系数超过所述第三阈值,则删除该相关系数对应的两种数据类型中的一个,以获得更新后的预处理数据。
[0038]进一步地,所述对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据,包括:
[0039]针对每种数据类型,按照第二预设分箱规则对数据进行分箱处理,所述第二预设分箱规则中响应用户比例在各分箱中呈单调分布;
[0040]对每个分箱进行标准化编码,并计算每个分箱对应的标准化转换值;
[0041]根据每个分箱对应的标准化转换值,以及每个分箱中响应用户和非响应用户的比例,计算得到每个分箱的信息值;
[0042]根据每个分箱的信息值,计算得到所述数据类型的信息值;
[0043]判断所述数据类型的信息值是否超过第四阈值;
[0044]若所述数据类型的信息值没有超过所述第四阈值,则删除该数据类型,以获得更新后的预处理数据。
[0045]进一步地,所述第二预设分箱规则通过如下步骤确定:
[0046]针对每种数据类型,按照第二初始预设分箱规则对数据进行分箱处理;
[0047]计算各个分箱中响应用户比例,所述响应用户比例为所述分箱中响应用户的数量与该分箱中全部用户数量之比;
[0048]判断各个分箱中的所述响应用户比例是否单调;
[0049]若是,则将所述第二初始预设分箱规则标记为第二预设分箱规则;
[0050]若否,则调整分箱规则,直到调整后各个分箱中响应用户比例呈单调,从而将调整后的分箱规则标记为第二预设分箱规则。
[0051]进一步地,所述若否,则调整分箱规则,直到调整后各个分箱中响应用户比例呈单调,从而将调整后的分箱规则标记为第二预设分箱规则,进一步包括:
[0052]获取调整分箱规则次数;
[0053]当所述调整分箱规则次数超过第五阈值时,则停止调整分箱规则,并删除所述数据类型,以获得更新后的预处理数据。
[0054]进一步地,所述按照预设的转换规则,对所述预处理数据进行转换,得到每个指定用户针对每种数据类型的入模变量,包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户响应信息预测模型建立方法,其特征在于,所述方法包括:获取指定用户的属性数据和贷款数据,所述指定用户表示满足预设条件的贷款用户,所述贷款数据至少包括贷款利率;根据所述指定用户的贷款数据,按照预设的转换规则得到每个指定用户针对每种数据类型的入模变量;将所述指定用户的属性数据及其对应的全部数据类型的入模变量带入到初始训练模型中进行训练,得到目标预测模型。2.根据权利要求1所述的方法,其特征在于,所述指定用户的属性数据包括响应用户和非响应用户;所述响应用户包括在贷款申请成功后第一时间内开户且支用的用户;所述非响应用户包括在贷款申请成功后第一时间内未开户,或在第二时间内未支用的用户,其中所述第一时间小于所述第二时间。3.根据权利要求1所述的方法,其特征在于,所述根据所述指定用户的贷款数据,按照预设的转换规则得到每个指定用户针对每种数据类型的入模变量,包括:根据所述指定用户的贷款数据,按照预设衍生规则得到衍生数据;对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据;按照预设的转换规则,对所述预处理数据进行转换,得到每个指定用户针对每种数据类型的入模变量。4.根据权利要求3所述的方法,其特征在于,所述根据所述指定用户的贷款数据,按照预设衍生规则得到衍生数据,包括:确定衍生数据类型及其衍生规则;确定与所述衍生数据类型对应的至少一种贷款数据;根据所述衍生数据类型及其对应的贷款数据,结合该衍生数据类型的衍生规则,生成所述衍生数据。5.根据权利要求4所述的方法,其特征在于,所述衍生规则至少包括以下中的一种:数据透传、数据统计描述和数据分类聚合。6.根据权利要求3所述的方法,其特征在于,所述对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据,包括:计算每种数据类型的数据缺失率,所述缺失率表示多个用户中缺失该数据类型的用户数和全部用户数之比;判断所述缺失率是否超过第一阈值;若所述缺失率超过第一阈值,则删除该缺失率对应的数据类型,以获得更新后的预处理数据。7.根据权利要求3所述的方法,其特征在于,所述对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据,包括:针对每种数据类型,按照第一预设分箱规则对数据进行分箱处理;根据分箱后的数据,按照预设数据稳定度计算公式计算每种数据类型的稳定度;判断所述稳定度是否超过第二阈值;若所述稳定度超过所述第二阈值,则删除该稳定度对应的数据类型,以获得更新后的
预处理数据。8.根据权利要求7所述的方法,其特征在于,所述预设数据稳定度计算公式为:其中,PSI
j
为第j个数据类型的稳定度,i为该数据类型的第i个分箱,A
i
为第i个分箱中实际数据数量和全部数据数量之比,E
i
为第i个分箱中理论样本数量和全部样本数量之比。9.根据权利要求3所述的方法,其特征在于,所述对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据,包括:计算任意两种数据类型之间的相关系数;判断所述相关系数是否超过第三阈值;若所述相关系数超过所述第三阈值,则删除该相关系数对应的两种数据类型中的一个,以获得更新后的预处理数据。10.根据权利要求3所述的方法,其特征在于,所述对所述指定用户的贷款数据和衍生数据进行预清洗处理,以生成预处理数据,包括:针对每种数据类型,按照第二预设分箱规则对数据进行分箱处理,所述第二预设分箱规则中响应用户比例在各分箱中呈单调分布;对每个分箱进行标准化编码,并计算每个分箱对应的标准化转换值;根据每个分箱对应的标准化转换值,以及每个分箱中响应用户和非响应用户的比例,计算得到每个分箱的信息值;根据每个分箱的信息值,计算得到所述数据类型的信息值;判断所述数据类型的信息值是否超过第四阈值;若所述数据类型的信息值没有超过所述第四阈值,则删除该数据类型,以获得更新后的预处理数据。11.根据权利要求10所述的方法,其特征在于,所述第二预设分箱规则通过如下步骤确定:针对每种数据类型,按照...

【专利技术属性】
技术研发人员:谭伊姝
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1