System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于黑名单特征组合分析的方法技术_技高网

用于黑名单特征组合分析的方法技术

技术编号:40207292 阅读:4 留言:0更新日期:2024-02-02 22:18
本发明专利技术公开了一种用于黑名单特征组合分析的方法,包括以下步骤:步骤1、数据提取和特征工程,将内部和外部数据进行扩展组合生成新的特征;步骤2、对特征进行初步的等频分箱,并微调以确保分箱的单调性,选择最佳分箱并计算特征的i v值,通过iv值排序筛选出一批高相关性的特征进行分析;步骤3、进行分箱组合,获取客户标签;步骤4、判断客户标签,采用该方法进行全平台综合分析,分析在特殊分箱组合下,是否存在某个区间不良客户有明显聚集。

【技术实现步骤摘要】

本专利技术涉及消费金融技术应用领域,具体涉及一种用于黑名单特征组合分析的方法


技术介绍

1、通过对客户数据进行深入分析和挖掘,得出客户的风险水平,以便金融机构能够更好地评估和控制风险,保障自身的利益。

2、目前,数据挖掘和风险控制技术已经相对成熟,有许多经典的算法和模型可以用于特征工程、分箱和风险评估。同时,随着大数据技术的发展和应用,数据的获取和处理能力也得到了大幅提升,为
技术介绍
的应用提供了更好的条件。

3、现有技术中依然存在以下技术问题:

4、1、数据质量问题:数据的准确性、完整性和一致性对于
技术介绍
的应用至关重要,但在实际应用中,由于数据来源的多样性和数据收集的限制,数据质量问题仍然存在。

5、2、特征选择问题:在大规模数据中选择有意义和相关的特征是一个挑战,需要考虑特征的重要性和相关性,以及特征之间的复杂关系。

6、对于此,我们亟需提供一种黑名单特征组合分析方法。


技术实现思路

1、为解决上述技术问题,本专利技术提供了一种用于黑名单特征组合分析的方法,采用该方法进行全平台综合分析,分析在特殊分箱组合下,是否存在某个区间不良客户有明显聚集。

2、本专利技术的技术方案是:一种用于黑名单特征组合分析的方法,包括以下步骤:

3、步骤1、数据提取和特征工程,将内部和外部数据进行扩展组合生成新的特征;

4、步骤2、对特征进行初步的等频分箱,并微调以确保分箱的单调性,选择最佳分箱并计算特征的iv值,通过iv值排序筛选出一批高相关性的特征进行分析;

5、步骤3、进行分箱组合,获取客户标签;

6、步骤4、判断客户标签。

7、进一步的,其中步骤1中的内部数据涵盖客户行为的整个生命周期,包括授信、贷款、贷余、还款、逾期和结清。

8、进一步的,其中步骤1中的外部数据为征信报告。

9、进一步的,其中扩展组合包括单一扩展和多维度扩展;单一扩展包括设计时间扩展,其中设计时间扩展包括特定时间内的借款次数和某个特征的最大、最小、平均值、方差;多维度扩展为相关特征之间的组合,包括借款和还款之间的组合。

10、进一步的,其中特征包括基础信息、借款意愿、还款意愿、还款能力、提前还款、逾期情况、还款历史、公共信息和授信信息。

11、进一步的,其中步骤2中的分箱单调性微调指合并两个箱子或从一个箱子内部划出两个箱子。

12、进一步的,其中步骤2中特征的iv值计算包括:计算每个分箱中不良客户和好客户的占比;计算不良客户占比和好客户占比之间的差值a;计算好客户占比相对于不良客户占比的百分比b;每个箱子的iv值等于a乘以inb,特征的iv值为所有分箱的iv值之和;

13、其中in为自然对数e的对数函数。

14、进一步的,其中步骤3中的分箱组合指不同特征之间的分箱组合,根据不良客户占比和left值的阈值,选择占比和left值超过阈值的分箱组合作为客户标签。

15、进一步的,重复执行步骤1至步骤3一次,当两次的客户标签一致时,进行客户标签判断。

16、本专利技术的有益技术效果是:

17、1、对全平台不良客户分析,可以找到共性特征。

18、2、由于通过特征组合、调整下,提高了分析的精确度。

19、3、对特征在保证整体效果的前提下,去挖掘某个分箱下的属性。

20、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。

本文档来自技高网...

【技术保护点】

1.一种用于黑名单特征组合分析的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的用于黑名单特征组合分析方法,其特征在于,其中步骤1中的内部数据涵盖客户行为的整个生命周期,包括授信、贷款、贷余、还款、逾期和结清。

3.根据权利要求2所述的用于黑名单特征组合分析方法,其特征在于,其中步骤1中的外部数据为征信报告。

4.根据权利要求3所述的用于黑名单特征组合分析方法,其特征在于,其中扩展组合包括单一扩展和多维度扩展;单一扩展包括设计时间扩展,其中设计时间扩展包括特定时间内的借款次数和某个特征的最大、最小、平均值、方差;多维度扩展为相关特征之间的组合,包括借款和还款之间的组合。

5.根据权利要求4所述的用于黑名单特征组合分析方法,其特征在于,其中特征包括基础信息、借款意愿、还款意愿、还款能力、提前还款、逾期情况、还款历史、公共信息和授信信息。

6.根据权利要求1所述的用于黑名单特征组合分析方法,其特征在于,其中步骤2中的分箱单调性微调指合并两个箱子或从一个箱子内部划出两个箱子。

7.根据权利要求6所述的用于黑名单特征组合分析方法,其特征在于,其中步骤2中特征的iv值计算包括:计算每个分箱中不良客户和好客户的占比;计算不良客户占比和好客户占比之间的差值a;计算好客户占比相对于不良客户占比的百分比b;每个箱子的iv值等于a乘以Inb,特征的iv值为所有分箱的iv值之和;

8.根据权利要求1所述的用于黑名单特征组合分析方法,其特征在于,其中步骤3中的分箱组合指不同特征之间的分箱组合,根据不良客户占比和left值的阈值,选择占比和left值超过阈值的分箱组合作为客户标签。

9.根据权利要求1所述的用于黑名单特征组合分析方法,其特征在于,重复执行步骤1至步骤3一次,当两次的客户标签一致时,进行客户标签判断。

...

【技术特征摘要】

1.一种用于黑名单特征组合分析的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的用于黑名单特征组合分析方法,其特征在于,其中步骤1中的内部数据涵盖客户行为的整个生命周期,包括授信、贷款、贷余、还款、逾期和结清。

3.根据权利要求2所述的用于黑名单特征组合分析方法,其特征在于,其中步骤1中的外部数据为征信报告。

4.根据权利要求3所述的用于黑名单特征组合分析方法,其特征在于,其中扩展组合包括单一扩展和多维度扩展;单一扩展包括设计时间扩展,其中设计时间扩展包括特定时间内的借款次数和某个特征的最大、最小、平均值、方差;多维度扩展为相关特征之间的组合,包括借款和还款之间的组合。

5.根据权利要求4所述的用于黑名单特征组合分析方法,其特征在于,其中特征包括基础信息、借款意愿、还款意愿、还款能力、提前还款、逾期情况、还款历史、公共信息和授信信息。

...

【专利技术属性】
技术研发人员:饶梓义伏玄羽王志雄陈阳
申请(专利权)人:苏银凯基消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1