System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种风险预测方法、装置、电子设备及存储介质制造方法及图纸_技高网

一种风险预测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40502015 阅读:7 留言:0更新日期:2024-02-26 19:29
本发明专利技术公开了一种风险预测方法、装置、电子设备及存储介质,对制度条文进行分词处理得到条文分词结果,将条文分词结果通过一层全连接层映射成预设词向量维度的矩阵得到制度条文词向量,确定制度条文对应的制度范围标签和风险点标签,并进行处理后得到标签向量,将标签向量拼接到制度条文词向量的起始位置得到矩阵词向量,将矩阵词向量输入至TextCNN网络,预测得到制度条文的风险类别。本发明专利技术通过将制度范围标签和风险点标签对应的标签向量拼接到制度条文词向量的起始位置,增加了数据范围属性,便于TextCNN网络重点处理制度条文中的风险点相关词语,进行风险类别预测计算,有效避免了在制度条文数量多的情况下查询效率低的问题。

【技术实现步骤摘要】

本专利技术涉及风险预测,更具体的说,涉及一种风险预测方法、装置、电子设备及存储介质


技术介绍

1、随着金融行业的发展,银行监督机构的管理规定也不断的完善和更替。面对监管机构新发布的监管条例,需要确定商业银行内部是否有相应的制度条文去防控风险事件的发生。现有方案通常是将商业银行数据库中存储的制度条文与新发布的监管条例进行匹配来确定是否存在风险事件。

2、然而,商业银行数据库中的制度条文是海量的,与此同时,制度条文通常是以长文本的形式存储在商业银行数据库中,在进行长文本的检索和匹配时,需要耗费很长时间,查询效率低。


技术实现思路

1、有鉴于此,本专利技术公开一种风险预测方法、装置、电子设备及存储介质,以采用深度学习方法进行风险类别预测计算,替代传统数据库制度条文搜索方式,从而有效避免在制度条文数量多的情况下查询效率低的问题,提高系统的响应性能。

2、一种风险预测方法,包括:

3、对制度条文进行分词处理得到条文分词结果,所述条文分词结果中各个词语之间的顺序按照在所述制度条文中的相对位置依次排列;

4、将所述条文分词结果通过一层全连接层映射成预设词向量维度的矩阵,得到制度条文词向量;

5、确定所述制度条文对应的制度范围标签和风险点标签;

6、对所述制度范围标签和所述风险点标签进行处理得到标签向量;

7、将所述标签向量拼接到所述制度条文词向量的起始位置,得到矩阵词向量;

8、将所述矩阵词向量输入至textcnn网络,预测得到所述制度条文的风险类别。

9、可选的,所述对制度条文进行分词处理得到条文分词结果,包括:

10、当所述制度条文中有标点符号时,将所述标点符号单独划分成一个词语,其中,所述词语在所述条文分词结果中的相对位置与所述标点符号在所述制度条文中的相对位置相同。

11、可选的,所述对所述制度范围标签和所述风险点标签进行处理得到标签向量,包括:

12、采用语言模型bert分词方法对所述制度范围标签和所述风险点标签进行分词处理,得到标签分词结果;

13、将所述标签分词结果输入至bert模型中,并在所述bert模型的最后一层加入所述预设词向量维度的全连接层,得到所述标签向量。

14、可选的,所述将所述矩阵词向量输入至textcnn网络,预测得到所述制度条文的风险类别,包括:

15、利用所述textcnn网络中的卷积网路对所述矩阵词向量进行卷积计算,得到特征矩阵;

16、对所述特征矩阵采用最大值池化处理,得到目标特征矩阵;

17、采用逻辑回归方法对所述目标特征矩阵按照所述制度条文各风险点级别标签进行分类,得到各所述风险点级别标签发生的概率值;

18、将最大概率值对应的目标风险点级别标签确定为所述制度条文的所述风险类别。

19、一种风险预测装置,包括:

20、分词处理单元,用于对制度条文进行分词处理得到条文分词结果,所述条文分词结果中各个词语之间的顺序按照在所述制度条文中的相对位置依次排列;

21、条文词向量确定单元,用于将所述条文分词结果通过一层全连接层映射成预设词向量维度的矩阵,得到制度条文词向量;

22、标签确定单元,用于确定所述制度条文对应的制度范围标签和风险点标签;

23、标签向量确定单元,用于对所述制度范围标签和所述风险点标签进行处理得到标签向量;

24、矩阵词向量确定单元,用于将所述标签向量拼接到所述制度条文词向量的起始位置,得到矩阵词向量;

25、风险类别预测单元,用于将所述矩阵词向量输入至textcnn网络,预测得到所述制度条文的风险类别。

26、可选的,所述分词处理单元具体用于:

27、当所述制度条文中有标点符号时,将所述标点符号单独划分成一个词语,其中,所述词语在所述条文分词结果中的相对位置与所述标点符号在所述制度条文中的相对位置相同。

28、可选的,所述标签向量确定单元具体用于:

29、采用语言模型bert分词方法对所述制度范围标签和所述风险点标签进行分词处理,得到标签分词结果;

30、将所述标签分词结果输入至bert模型中,并在所述bert模型的最后一层加入所述预设词向量维度的全连接层,得到所述标签向量。

31、可选的,所述风险类别预测单元包括:

32、卷积计算子单元,用于利用所述textcnn网络中的卷积网路对所述矩阵词向量进行卷积计算,得到特征矩阵;

33、池化处理子单元,用于对所述特征矩阵采用最大值池化处理,得到目标特征矩阵;

34、分类子单元,用于采用逻辑回归方法对所述目标特征矩阵按照所述制度条文各风险点级别标签进行分类,得到各所述风险点级别标签发生的概率值;

35、风险类别确定子单元,用于将最大概率值对应的目标风险点级别标签确定为所述制度条文的所述风险类别。

36、一种电子设备,所述电子设备包括:存储器和处理器;

37、所述存储器用于存储至少一个指令;

38、所述处理器用于执行所述至少一个指令以实现上述所述的风险预测方法。

39、一种计算机可读存储介质,所述计算机可读存储介质存储至少一个指令,所述至少一个指令被处理器执行时实现上述所述的风险预测方法。

40、从上述的技术方案可知,本专利技术公开了一种风险预测方法、装置、电子设备及存储介质,对制度条文进行分词处理得到条文分词结果,将条文分词结果通过一层全连接层映射成预设词向量维度的矩阵得到制度条文词向量,确定制度条文对应的制度范围标签和风险点标签,并对制度范围标签和风险点标签进行处理得到标签向量,将标签向量拼接到制度条文词向量的起始位置得到矩阵词向量,将矩阵词向量输入至textcnn网络,预测得到制度条文的风险类别。本专利技术通过将制度范围标签对应的标签向量拼接到制度条文词向量的起始位置,增加了数据的范围属性,通过将风险点标签对应的标签向量拼接到制度条文词向量的起始位置,便于textcnn网络重点处理制度条文中的风险点相关词语,以便采用深度学习方法进行风险类别预测计算,替代传统数据库制度条文搜索方式,从而有效避免了在制度条文数量多的情况下查询效率低的问题,提高了系统的响应性能。

本文档来自技高网...

【技术保护点】

1.一种风险预测方法,其特征在于,包括:

2.根据权利要求1所述的风险预测方法,其特征在于,所述对制度条文进行分词处理得到条文分词结果,包括:

3.根据权利要求1所述的风险预测方法,其特征在于,所述对所述制度范围标签和所述风险点标签进行处理得到标签向量,包括:

4.根据权利要求1~3任意一项所述的风险预测方法,其特征在于,所述将所述矩阵词向量输入至TextCNN网络,预测得到所述制度条文的风险类别,包括:

5.一种风险预测装置,其特征在于,包括:

6.根据权利要求5所述的风险预测装置,其特征在于,所述分词处理单元具体用于:

7.根据权利要求5所述的风险预测装置,其特征在于,所述标签向量确定单元具体用于:

8.根据权利要求5~7任意一项所述的风险预测装置,其特征在于,所述风险类别预测单元包括:

9.一种电子设备,其特征在于,所述电子设备包括:存储器和处理器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1~4任意一项所述的风险预测方法。

...

【技术特征摘要】

1.一种风险预测方法,其特征在于,包括:

2.根据权利要求1所述的风险预测方法,其特征在于,所述对制度条文进行分词处理得到条文分词结果,包括:

3.根据权利要求1所述的风险预测方法,其特征在于,所述对所述制度范围标签和所述风险点标签进行处理得到标签向量,包括:

4.根据权利要求1~3任意一项所述的风险预测方法,其特征在于,所述将所述矩阵词向量输入至textcnn网络,预测得到所述制度条文的风险类别,包括:

5.一种风险预测装置,其特征在于,包括:

6.根...

【专利技术属性】
技术研发人员:田荟双王宇轩罗纪杰
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1