核卡预测方法、装置、设备及存储介质制造方法及图纸

技术编号：40839347 阅读：2 留言：0更新日期：2024-04-01 15:05

本发明专利技术属于数据处理技术领域，公开了一种核卡预测方法、装置、设备及存储介质。本发明专利技术采用多个滑动采样窗口分别对信用卡数据中的属性数据和信用卡数据中的使用数据进行扫描，基于得到的多个属性片段数据和多个使用片段数据确定高维表征向量；将高维表征向量分别输入至多个catboost子模型和多个目标森林子模型，根据各catboost子模型的分类概率向量、各目标森林子模型的分类概率向量以及预设均方差权重方式进行核卡预测，得到核卡预测结果。通过上述方式，通过对信用卡数据进行有效的特征挖掘，确保了重要信息的完整性，加快了模型的收敛速度，同时大幅度提升了信用卡核卡的预测结果，并有效提升了模型的整体性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理，尤其涉及一种核卡预测方法、装置、设备及存储介质。

技术介绍

1、目前，多采用深度森林算法，解决信用卡核卡预测这一典型的二分类问题，现有的深度森林方案主要包含两个阶段：多粒度扫描阶段、级联森林阶段，且相较于深度网络，深度森林算法调参量小、模型受参数影响小、对样本量的要求也远低于深度神经网络。但是，这种方式无法在模型初始阶段针对含有大量类别型变量的数据中进行有效的特征挖掘，难以挖掘两端特征的表征信息，同时收敛速度慢，导致预测结果准确率较低。

2、上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

1、本专利技术的主要目的在于提供一种核卡预测方法、装置、设备及存储介质，旨在解决现有技术在进行核卡预测时，无法进行有效的特征挖掘，同时预测准确率低的技术问题。

2、为实现上述目的，本专利技术提供了一种核卡预测方法，所述方法包括以下步骤：

3、在获取到待预测用户的信用卡数据时，采用多个滑动采样窗口分别对所述信用卡数据中的属性数据和所述信用卡数据中的使用数据进行扫描，得到所述属性数据的多个属性片段数据和所述使用数据的多个使用片段数据；

4、基于各属性片段数据和各使用片段数据确定所述待预测用户的高维表征向量；

5、将所述高维表征向量分别输入至多个catboost子模型和多个目标森林子模型，得到各catboost子模型的分类概率向量和各目标森林子模型的分类概率向量；

7、可选地，所述基于各属性片段数据和各使用片段数据确定所述待预测用户的高维表征向量，包括：

8、将多个属性片段数据和多个使用片段数据分别输入至catboost子模型、随机森林子模型以及极端随机森林子模型，得到各属性片段数据的多个子模型分类概率向量和各使用片段数据的多个子模型分类概率向量；

9、将各属性片段数据的子模型分类概率向量进行拼接，得到各属性片段数据的拼接向量维度；

10、将各使用片段数据的子模型分类概率向量进行拼接，得到各使用片段数据的拼接向量维度；

11、基于各属性片段数据的拼接向量维度和各使用片段数据的拼接向量维度确定所述待预测用户的高维表征向量。

12、可选地，所述基于各属性片段数据的拼接向量维度和各使用片段数据的拼接向量维度确定所述待预测用户的高维表征向量，包括：

13、分别从所述信用卡数据的属性数据和所述信用卡数据的使用数据中进行特征抽取，得到多个抽取片段数据；

14、将多个抽取片段数据进行拼接，得到多个拼接片段数据；

15、将多个拼接片段数据分别输入至catboost子模型、随机森林子模型以及极端随机森林子模型，得到各拼接片段数据的拼接子模型概率向量；

16、基于各拼接片段数据的拼接子模型概率向量、各属性片段数据的拼接向量维度以及各使用片段数据的拼接向量维度确定所述待预测用户的高维表征向量。

17、可选地，所述根据各catboost子模型的分类概率向量、各目标森林子模型的分类概率向量以及预设均方差权重方式进行核卡预测，得到所述待预测用户的核卡预测结果，包括：

18、根据预设均方差权重方式对各catboost子模型的分类概率向量进行加权平均，确定第一概率向量；

19、根据所述预设均方差权重方式对各目标森林子模型的分类概率向量进行加权平均，确定第二概率向量；

20、根据所述第一概率向量、所述第二概率向量以及高维表征向量进行向量聚合，确定聚合特征向量；

21、根据所述聚合特征向量、各catboost子模型以及各目标森林子模型进行核卡预测，得到所述待预测用户的核卡预测结果。

22、可选地，所述根据预设均方差权重方式对各catboost子模型的分类概率向量进行加权平均，确定第一概率向量，包括：

23、根据各catboost子模型的分类概率向量确定各catboost子模型的同类概率；

24、根据各catboost子模型的同类概率和各catboost子模型的模型权重确定各catboost子模型的权重同类概率；

25、根据各catboost子模型的权重同类概率进行均值计算，确定第一概率向量。

26、可选地，所述根据各catboost子模型的分类概率向量、各目标森林子模型的分类概率向量以及预设均方差权重方式进行核卡预测，得到所述待预测用户的核卡预测结果之后，还包括：

27、获取各catboost子模型的评价指标和各目标森林子模型的评价指标；

28、采用预设极值方式分别对各catboost子模型的多个评价指标和各目标森林子模型的多个评价指标进行处理，得到各catboost子模型的多个处理指标和各目标森林子模型的多个处理指标；

29、根据各catboost子模型的多个处理指标和各目标森林子模型的多个处理指标确定综合评价模型，并对所述综合评价模型进行存储。

30、可选地，所述根据各catboost子模型的多个处理指标和各目标森林子模型的多个处理指标确定综合评价模型，包括：

31、根据各catboost子模型的多个处理指标和各目标森林子模型的多个处理指标进行指标均值计算，确定各处理指标的指标均值；

32、根据各处理指标的指标均值进行方差计算，确定各处理指标的指标方差；

33、根据各处理指标的指标方差确定各处理指标的权重；

34、根据各catboost子模型的多个处理指标和各目标森林子模型的多个处理指标进行矩阵构建，确定指标矩阵；

35、根据所述指标矩阵和各处理指标的权重确定综合评价模型。

36、此外，为实现上述目的，本专利技术还提出一种核卡预测装置，所述核卡预测装置包括：

37、扫描模块，用于在获取到待预测用户的信用卡数据时，采用多个滑动采样窗口分别对所述信用卡数据中的属性数据和所述信用卡数据中的使用数据进行扫描，得到所述属性数据的多个属性片段数据和所述使用数据的多个使用片段数据；

38、处理模块，用于基于各属性片段数据和各使用片段数据确定所述待预测用户的高维表征向量；

39、所述处理模块，还用于将所述高维表征向量分别输入至多个catboost子模型和多个目标森林子模型，得到各catboost子模型的分类概率向量和各目标森林子模型的分类概率向量；

40、预测模块，用于根据各catboost子模型的分类概率向量、各目标森林子模型的分类概率向量以及预设均方差权重方式进行核卡预测，得到所述待预测用户的核卡预测结果。

41、此外，为实现上述目的，本专利技术还提出一种核卡预测设备，所述核卡预测设备包括：存储器、处本文档来自技高网...

【技术保护点】

1.一种核卡预测方法，其特征在于，所述核卡预测方法，包括：

2.如权利要求1所述的核卡预测方法，其特征在于，所述基于各属性片段数据和各使用片段数据确定所述待预测用户的高维表征向量，包括：

3.如权利要求2所述的核卡预测方法，其特征在于，所述基于各属性片段数据的拼接向量维度和各使用片段数据的拼接向量维度确定所述待预测用户的高维表征向量，包括：

4.如权利要求1所述的核卡预测方法，其特征在于，所述根据各catboost子模型的分类概率向量、各目标森林子模型的分类概率向量以及预设均方差权重方式进行核卡预测，得到所述待预测用户的核卡预测结果，包括：

5.如权利要求4所述的核卡预测方法，其特征在于，所述根据预设均方差权重方式对各catboost子模型的分类概率向量进行加权平均，确定第一概率向量，包括：

6.如权利要求1至5中任一项所述的核卡预测方法，其特征在于，所述根据各catboost子模型的分类概率向量、各目标森林子模型的分类概率向量以及预设均方差权重方式进行核卡预测，得到所述待预测用户的核卡预测结果之后，还包括：

>7.如权利要求6所述的核卡预测方法，其特征在于，所述根据各catboost子模型的多个处理指标和各目标森林子模型的多个处理指标确定综合评价模型，包括：

8.一种核卡预测装置，其特征在于，所述核卡预测装置包括：

9.一种核卡预测设备，其特征在于，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的核卡预测程序，所述核卡预测程序配置为实现如权利要求1至7中任一项所述的核卡预测方法。

10.一种存储介质，其特征在于，所述存储介质上存储有核卡预测程序，所述核卡预测程序被处理器执行时实现如权利要求1至7任一项所述的核卡预测方法。

...

【技术特征摘要】

1.一种核卡预测方法，其特征在于，所述核卡预测方法，包括：

2.如权利要求1所述的核卡预测方法，其特征在于，所述基于各属性片段数据和各使用片段数据确定所述待预测用户的高维表征向量，包括：

6.如权利要求1至5中任一...

【专利技术属性】
技术研发人员：谷建泽，赵雨，孙苑苑，樊巧云，李树春，方海贝，陆天珺，
申请(专利权)人：中国移动通信集团江苏有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人