System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种风险识别方法、系统、存储介质和电子设备技术方案_技高网

一种风险识别方法、系统、存储介质和电子设备技术方案

技术编号:39945688 阅读:6 留言:0更新日期:2024-01-08 22:54
本发明专利技术涉及风险识别技术领域,具体公开一种风险识别方法、系统、存储介质和电子设备,所述方法包括:获取目标风控场景下的多个用于风险识别训练的目标训练数据;基于多个目标训练数据,对预设风险识别模型进行训练,得到目标风险识别模型;将所述目标风控场景下的待测数据输入至所述目标风险识别模型,得到风险识别结果。本发明专利技术能够提高风险识别的精准度,具备更好的外推能力和泛化性。

【技术实现步骤摘要】

所属的技术人员知道,本专利技术可以实现为方法、系统、存储介质和电子设备。因此,本专利技术可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram),只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。尽管上面已经示出和描述了本专利技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本专利技术的限制,本领域的普通技术人员在本专利技术的范围内可以对上述实施例进行变化、修改、替换和变型。


技术介绍

1、传统的风险识别模型存在两方面的问题:第一,样本数量过少且高维稀疏会降低模型预测的准确性。在数据量较小的情况下,模型容易陷入过拟合状态,无法对新的数据集进行有效预测,即泛化能力弱。第二,针对数值预测的风控管理,若数据属性不能较好地表征真实回归结果,模型交叉验证的偏差较大,将导致整体模型预测效果偏低,精度下降。

2、因此,亟需提供一种技术方案解决上述问题。


技术实现思路

1、为解决上述技术问题,本专利技术提供了一种风险识别方法、系统、存储介质和电子设备

2、第一方面,本专利技术提供一种风险识别方法,该方法的技术方案如下:

3、获取目标风控场景下的多个用于风险识别训练的目标训练数据;

4、基于多个目标训练数据,对预设风险识别模型进行训练,得到目标风险识别模型;

5、将所述目标风控场景下的待测数据输入至所述目标风险识别模型,得到风险识别结果。

6、本专利技术的一种风险识别方法的有益效果如下:

7、本专利技术的方法能够提高风险识别的精准度,具备更好的外推能力和泛化性。

8、在上述方案的基础上,本专利技术的一种风险识别方法还可以做如下改进。

9、在一种可选的方式中,获取目标风控场景下的多个用于风险识别训练的目标训练数据的步骤,包括:

10、采集所述目标风控场景下的多个用于风险识别训练的第一训练数据;

11、对所有的第一训练数据进行数据清洗,得到多个第二训练数据;

12、对每个第二训练数据分别进行特征工程化处理,得到多个目标训练数据。

13、在一种可选的方式中,所述预设风险识别模型为lightgbm树模型;基于多个目标训练数据,对预设风险识别模型进行训练,得到目标风险识别模型的步骤,包括:

14、构建所述lightgbm树模型的超参数搜索空间,并设置所述lightgbm树模型的迭代轮数和迭代误差阈值;

15、在每次迭代轮数中,利用满足预设条件的目标训练数据进行奇偶交替迭代特征回归预测,以在所述超参数搜索空间中,对所述lightgbm树模型的超参数进行修正,直至达到所述迭代轮数时,得到所述目标风险识别模型;其中,所述预设条件为:当前迭代轮数及之前每轮迭代中均大于迭代误差阈值。

16、在一种可选的方式中,构建所述lightgbm树模型的超参数搜索空间的步骤,包括:

17、利用近似贪心策略,构建所述lightgbm树模型的所述超参数搜索空间。

18、在一种可选的方式中,还包括:

19、将每个目标训练数据在多轮迭代中的训练预测值进行合并,得到每个目标训练数据的最终预测值;

20、利用所有的最终预测值对所述目标风险识别模型进行模型评估;

21、将所述目标风控场景下的待测数据输入至所述目标风险识别模型,得到风险识别结果的步骤,包括:

22、当所述目标风险识别模型的风险识别精度超过预设值时,将所述目标风控场景下的待测数据输入至所述目标风险识别模型,得到所述风险识别结果。

23、在一种可选的方式中,还包括:

24、当所述风险识别结果超过风险阈值时,输出预警信息。

25、第二方面,本专利技术提供一种风险识别系统,该系统的技术方案如下:

26、包括:获取模块、训练模块和识别模块;

27、所述获取模块用于:获取目标风控场景下的多个用于风险识别训练的目标训练数据;

28、所述训练模块用于:基于多个目标训练数据,对预设风险识别模型进行训练,得到目标风险识别模型;

29、所述识别模块用于:将所述目标风控场景下的待测数据输入至所述目标风险识别模型,得到风险识别结果。

30、本专利技术的一种风险识别系统的有益效果如下:

31、本专利技术的系统能够提高风险识别的精准度,具备更好的外推能力和泛化性。

32、在上述方案的基础上,本专利技术的一种风险识别系统还可以做如下改进。

33、在一种可选的方式中,所述获取模块具体用于:

34、采集所述目标风控场景下的多个用于风险识别训练的第一训练数据;

35、对所有的第一训练数据进行数据清洗,得到多个第二训练数据;

36、对每个第二训练数据分别进行特征工程化处理,得到多个目标训练数据。

37、第三方面,本专利技术提供的一种存储介质的技术方案如下:

38、存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如本专利技术的任一种风险识别方法的步骤。

39、第四方面,本专利技术的一种电子设备的技术方案如下:

40、包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序所述处理器执行所述程序时实现如本专利技术的任一种风险识别方法的步骤。

41、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。

本文档来自技高网...

【技术保护点】

1.一种风险识别方法,其特征在于,包括:

2.根据权利要求1所述的风险识别方法,其特征在于,获取目标风控场景下的多个用于风险识别训练的目标训练数据的步骤,包括:

3.根据权利要求1所述的风险识别方法,其特征在于,所述预设风险识别模型为LightGBM树模型;基于多个目标训练数据,对预设风险识别模型进行训练,得到目标风险识别模型的步骤,包括:

4.根据权利要求3所述的风险识别方法,其特征在于,构建所述LightGBM树模型的超参数搜索空间的步骤,包括:

5.根据权利要求4所述的风险识别方法,其特征在于,还包括:

6.根据权利要求1至5任一项所述的风险识别方法,其特征在于,还包括:

7.一种风险识别系统,其特征在于,包括:获取模块、训练模块和识别模块;

8.根据权利要求7所述的风险识别系统,其特征在于,所述获取模块具体用于:

9.一种存储介质,其特征在于,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如权利要求1至6中任一项所述的风险识别方法。

10.一种电子设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的风险识别方法的步骤。

...

【技术特征摘要】

1.一种风险识别方法,其特征在于,包括:

2.根据权利要求1所述的风险识别方法,其特征在于,获取目标风控场景下的多个用于风险识别训练的目标训练数据的步骤,包括:

3.根据权利要求1所述的风险识别方法,其特征在于,所述预设风险识别模型为lightgbm树模型;基于多个目标训练数据,对预设风险识别模型进行训练,得到目标风险识别模型的步骤,包括:

4.根据权利要求3所述的风险识别方法,其特征在于,构建所述lightgbm树模型的超参数搜索空间的步骤,包括:

5.根据权利要求4所述的风险识别方法,其特征在于,还包括:

6...

【专利技术属性】
技术研发人员:杨建雄杜志高
申请(专利权)人:北京思特奇信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1