System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 目标对象的指标数据处理方法、装置及计算机设备制造方法及图纸_技高网

目标对象的指标数据处理方法、装置及计算机设备制造方法及图纸

技术编号:40198198 阅读:8 留言:0更新日期:2024-01-27 00:02
本申请涉及一种目标对象的指标数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,可用于金融领域中的异常指标监控。其中,该方法包括:获取目标对象的业务数据和业务类型,根据业务类型将业务数据划分为多个维度的样本数据,提取样本数据的目标特征变量,再对该变量进行分箱并计算证据权重,将业务数据、业务类型、证据权重输入预设的评分模型,通过模型可以得到目标对象的业务指标数据。这样,由于根据业务类型进行划分,可以采纳多个维度的用户业务数据,还可以根据业务类型调整不同维度在输出指标中所占的权重,提高了业务指标数据的准确性,从而可以更加准确地预测目标对象在业务中出现异常的可能性。

【技术实现步骤摘要】

本公开涉及人工智能领域,尤其涉及一种目标对象的指标数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、随着数字化时代的来临,许多平台掌握着大量与自身业务相关的用户数据,为预防可能出现的用户违约等异常风险,可以采取异常指标预测策略对用户数据进行分析,根据不同的指标对用户发生违约失信等异常风险行为的可能性进行预估,对异常风险管控具有重大意义。用户异常风险预测是信息化时代信用消费的保障和基础,可以被广泛地应用于个人信贷、信用卡、保险理赔等金融业务中,为信用政策的制定、分析、评估、优化提供量化支持。

2、目前,业务数据的异常指标处理主要通过人工方式审核,业务人员通过采集用户资料、信用调查等方式综合判定用户的风险程度。然而,这种人工审核方式过度依赖于审核人员的业务经验,缺乏统一标准,预测结果波动性较大,且人工处理速度较慢,效率低下。


技术实现思路

1、基于此,针对上述技术问题,提供一种目标对象的指标数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。本公开的技术方案如下:

2、根据本公开实施例的一个方面,提供一种目标对象的指标数据处理方法,包括:

3、获取目标对象的业务数据并确定所述业务数据对应的业务类型;

4、根据所述业务类型将所述业务数据划分为多个维度的样本数据;

5、通过预设算法提取每个维度中样本数据的目标特征变量;

6、对所述目标特征变量进行分箱处理,并计算每个分箱中数据的证据权重;

7、将所述业务数据、所述业务类型、所述证据权重输入至预设的评分模型,经所述评分模型输出所述目标对象的业务指标数据。

8、在其中一个实施例中,所述通过预设算法提取每个维度中样本数据的目标特征变量包括:

9、通过预设算法对所述样本数据进行特征提取,得到多项特征变量;

10、根据单变量特征选择法从所述多项特征变量中确定目标特征变量。

11、在其中一个实施例中,所述根据单变量选择法从所述多项特征变量中确定目标特征变量包括:

12、计算每项特征变量与所述样本数据所属维度的相关系数;

13、根据所述相关系数对所述多项特征变量进行特征排序,并将排在前n个的特征变量作为目标特征变量;其中,n为正整数。

14、在其中一个实施例中,所述对所述目标特征变量进行分箱处理,并计算每个分箱中数据的证据权重包括:

15、按照等距划分法对所述目标特征变量进行分箱操作,得到多个分箱;

16、利用预设的样本分类模型确定每个分箱中的正常样本数和风险样本数;

17、计算每个分箱中正常样本数与所有分箱中正常样本总数的比值,得到每个分箱的正常样本占比;

18、计算每个分箱中风险样本数与所有分箱中风险样本总数的比值,得到每个分箱的风险样本占比;

19、计算所述正常样本占比与所述风险样本占比的比值,得到证据权重。

20、在其中一个实施例中,在根据所述业务类型将所述业务数据划分为多个维度的样本数据之前,还包括:

21、检测所述业务数据中的缺失值、异常值;

22、对所述缺失值、异常值进行数据清洗和数据填充。

23、在其中一个实施例中,所述评分模型为逻辑回归模型。

24、根据本公开实施例的另一方面,提供一种目标对象的指标数据处理装置,包括:

25、数据获取模块,用于获取目标对象的业务数据并确定所述业务数据对应的业务类型;

26、维度划分模块,用于根据所述业务类型将所述业务数据划分为多个维度的样本数据;

27、变量提取模块,用于通过预设算法提取每个维度中样本数据的目标特征变量;

28、分箱模块,用于对所述目标特征变量进行分箱处理,并计算每个分箱中数据的证据权重;

29、指标输出模块,用于将所述业务数据、所述业务类型、所述证据权重输入至预设的评分模型,经所述评分模型输出所述目标对象的业务指标数据。

30、根据本公开实施例的另一方面,还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

31、根据本公开实施例的另一方面,还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

32、根据本公开实施例的另一方面,还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

33、本公开实施例提供的技术方案中,可以获取目标对象的业务数据和业务类型,并可以根据业务类型将业务数据划分为多个维度的样本数据,通过算法提取每个维度样本数据的目标特征变量,再对该变量进行分箱并计算证据权重,将业务数据、业务类型、证据权重输入预设的评分模型,通过模型可以得到目标对象的业务指标数据。这样,由于预先根据业务类型进行维度划分,可以采纳多个维度的用户业务数据,且评分模型可以根据业务类型调整不同维度在输出指标中所占的权重,提高了业务指标数据的准确性,从而可以更加准确地预测目标对象在业务中出现异常的可能性。

34、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种目标对象的指标数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述通过预设算法提取每个维度中样本数据的目标特征变量包括:

3.根据权利要求2所述的方法,其特征在于,所述根据单变量选择法从所述多项特征变量中确定目标特征变量包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述目标特征变量进行分箱处理,并计算每个分箱中数据的证据权重包括:

5.根据权利要求1所述的方法,其特征在于,在根据所述业务类型将所述业务数据划分为多个维度的样本数据之前,还包括:

6.根据权利要求1所述的方法,其特征在于,所述评分模型为逻辑回归模型。

7.一种目标对象的指标数据处理装置,其特征在于,包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种目标对象的指标数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述通过预设算法提取每个维度中样本数据的目标特征变量包括:

3.根据权利要求2所述的方法,其特征在于,所述根据单变量选择法从所述多项特征变量中确定目标特征变量包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述目标特征变量进行分箱处理,并计算每个分箱中数据的证据权重包括:

5.根据权利要求1所述的方法,其特征在于,在根据所述业务类型将所述业务数据划分为多个维度的样本数据之前,还包括:

6.根据权利要求1所...

【专利技术属性】
技术研发人员:童楚婕
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1